Текст книги "Введение в теоретическую лингвистику"
Автор книги: Джон Лайонз
Жанр:
Языкознание
сообщить о нарушении
Текущая страница: 19 (всего у книги 61 страниц) [доступный отрывок для чтения: 22 страниц]
Описывая конкретный язык, лингвист должен так или иначе установить пределы грамматичности. На его решение провести соответствующие границы (если решение принимается сознательно, путем выбора из представляющихся альтернатив) обычно оказывают влияние два следующие основные фактора. Первый может быть назван законом «снижения рентабельности». Классификация слов по их дистрибутивным свойствам может, вообще говоря, быть гораздо более детальной, чем это представлялось возможным или даже желательным традиционным грамматикам. Однако рано или поздно в своем стремлении исключить положительно неприемлемые предложения при помощи все более дробной классификации составляющих их слов исследователь столкнется с такой ситуацией, когда он вынужден будет устанавливать все новые и новые правила, каждое из которых будет иметь отношение к очень небольшому количеству предложений; при этом придется устанавливать такое большое количество пересекающихся классов слов, что может быть утрачено какое бы то ни было подобие общности. Именно это мы имеем в виду, говоря о законе «снижения рентабельности»: в определенный момент (вопрос о том, когда именно наступает этот момент, заслуживает специального рассмотрения и обсуждения) сложность правил становится слишком «дорогостоящей» относительно их «производительности»; каждое начинает охватывать сравнительно небольшое число приемлемых и неприемлемых предложений. Второй фактор является, впрочем, не менее важным. В связи с тем, что предложения описываемого языка столь многочисленны (как мы увидим в дальнейшем, может оказаться желательным – как с теоретической, так и с практической точки зрения – считать их число бесконечным), нельзя надеяться с определенностью решить для каждого порожденного грамматикой предложения, является ли оно приемлемым или неприемлемым. На самом деле, описывая какой-либо язык, сразу же приходится сталкиваться с разногласиями среди носителей этого языка относительно приемлемости предложений, порождаемых правилами, которые были ориентировочно установлены исследователем. Таким образом, существует реальная и, возможно, неустранимая проблема недетерминированности в отношении приемлемости и неприемлемости. Это, по-видимому, должно привести к заключению, что грамматическая структура языка в конечном счете не детерминирована. Дело не только в том, что лингвисты по-разному понимают, что составляет оптимальную степень общности правил, и по-разному оценивают приемлемость тех или иных классов предложений. Дополнительная трудность заключается в том, что порождение одной серии предложений определенного типа может чрезвычайно затруднить порождение другой серии предложений иного типа в рамках теории, установленной для первой серии предложений. Некоторые из возникающих при этом проблем будут упомянуты ниже (см. § 8.3.6 и сл.). Наблюдающийся в настоящее время прогресс в развитии грамматической теории, возможно, уменьшит число подобных проблем или даже вовсе устранит их; но пока это еще довольно трудные проблемы. Таким образом, мы можем вновь сформулировать как общий принцип грамматической теории (на который не повлияет ничто, сказанное в последующих главах о природе и способе действия грамматических правил) следующий факт: ответить на вопрос, является ли то или иное сочетание слов грамматичным или неграмматичным, можно только обратившись к конкретной системе правил, которая или порождает его (и таким образом определяет как грамматичное), или же не порождает (и тем самым определяет как неграмматичное). Большинство теоретиков грамматики, включая и тех, кто внес наибольший вклад в развитие трансформационной грамматики (в частности, Хомский), по-видимому, отвергает этот принцип. Они предполагают, что грамматическая структура языка детерминирована, и носители языка знают ее «интуитивно» (или «неявно»). Это представляется чрезмерно сильным допущением. Несомненно, носители языка согласятся, что определенные наборы высказываний «сходны» или «однородны» или «различны» в том или ином отношении. Эти интуитивные представления в той мере, в какой они могут быть установлены, составляют важную часть данных лингвиста; и он может описывать их, выделяя разные виды приемлемости (или правильности) и разные виды связи между предложениями. Но он не обязан предполагать, что существует какое-либо прямое соответствие между «интуитивными» представлениями говорящих и утверждениями, сделанными лингвистом.
Не следует преувеличивать разницу в мнениях среди лингвистов по этому вопросу. Утверждать, что грамматическая структура языка в конечном счете не детерминирована – не то же самое, что утверждать, что никакая часть грамматической структуры не является детерминированной. Можно представить себе много сочетаний слов (например: *They likes she, *The dog bite the man и т. д.), которые все лингвисты сразу охарактеризуют не только как неприемлемые, но также и как «неграмматичные» (не обязательно формулируя при этом ряд грамматических правил). Можно считать, что их непосредственная реакция основана на «интуитивном» знании грамматической структуры литературного английского языка; с равным успехом можно говорить, что законы построения высказываний, нарушаемые рассматриваемыми сочетаниями, носят столь общий характер, что они получат отражение в любой грамматике литературного английского языка. Однако предложения, подчиняющиеся менее общим законам, могут в разных описаниях характеризоваться как грамматичные или неграмматичные неодинаковым образом. И во всяком случае здесь «интуитивные» представления лингвистов и носителей языка ненадежны и противоречивы.
4.2.12. «ГРАММАТИЧНОСТЬ» И «ОСМЫСЛЕННОСТЬ»Как мы видели ранее в настоящем разделе, кажется целесообразным говорить о различных видах приемлемости. Традиционное разграничение между «грамматичностью» и «осмысленностью» (не говоря уже о других видах приемлемости, упомянутых ранее) не затрагивается выводом, к которому мы только что пришли: что пределы грамматики в конечном счете не детерминированы; или, скорее, что каждая грамматика сама определяет свои границы и в этом смысле делает их детерминированными. Когда мы говорим, что определенное высказывание неграмматично (по отношению к конкретной грамматике), мы не подразумеваем при этом, что оно также неприемлемо по иным причинам. О некоторых неприемлемых сочетаниях слов мы будем говорить, что они грамматичны, но бессмысленны; о других – что, хотя они и грамматичны, и осмысленны, они обычно не встречаются, так как ситуация, «выражаемая» ими, вряд ли может возникнуть. Еще об одном классе сочетаний слов мы были бы склонны сказать, что они и неграмматичиы, и бессмысленны. На одном конце «континуума» приемлемости должны находиться определенные сочетания слов, приемлемость или неприемлемость которых объясняется только с помощью грамматики (ср. Не gives 'Он дает', They give 'Они дают' vs. *Не give, *They gives). На другом конце этого континуума грамматическое описание бесполезно. Но найдется много высказываний, при описании которых имеют смысл как грамматическое объяснение, так и объяснение, апеллирующее к значению составляющих их слов; и именно этот факт делает в значительной степени обоснованными «понятийные» определения некоторых грамматических классов в тех или иных языках («глаголы движения», «существительное мужского рода», «локативное словосочетание» и т. п.). Мы вернемся к вопросу о коррелятивности между грамматической и семантической классификацией слов в следующем разделе.
4.2.13. ТЕРМИН «ГЕНЕРАТИВНЫЙ» («ПОРОЖДАЮЩИЙ»)Но прежде мы должны сказать еще несколько слов о терминах «порождать» (или «генерировать») и «генеративный», поскольку их часто понимают неправильно. Прежде всего следует подчеркнуть негативный момент: генеративная грамматика – не обязательно трансформационная грамматика (см. §6.6.1). Термины «генеративный» и «трансформационный» часто смешивают, потому что их в одно и то же время ввел в лингвистический обиход Хомский. (Примерно в том же значении, что и Хомский, термин «трансформационный» употреблял также и Хэррис.) Хомский и его последователи обычно вкладывают в термин «генеративный» одновременно два различных смысла: (i) «проективный» (или «предиктивный») и (ii) «эксплицитный» («формальный» vs. «неформальный»). В этом разделе он использовался как в одном, так и в другом понимании.
Первоначально он был введен в значении «проективный» (или «предиктивный»): он должен был относиться к любому множеству грамматических правил, которые эксплицитно или имплицитно описывали данный корпус предложений, «проецируя» их на большее множество предложений или рассматривая их как «выборку» из этого множества. Грамматика такого типа является «предиктивной» в том смысле, что она устанавливает грамматическую правильность не только «реальных», но и «потенциальных» предложений. Важно понять, что большинство грамматик, когда-либо написанных за всю историю лингвистики, являются генеративными в первом значении этого термина. Не стоило бы специально указывать на это, если бы не тот факт, что различие между предиктивностью и прескриптивностью, то есть предписыванием норм «правильного употребления», не всегда принимается во внимание (ср. § 1.4.3).
Но впоследствии в этом разделе мы пользовались термином «генеративный» в несколько особом значении «эксплицитного» (ср. «порождать», «характеризовать» в § 4.2.8). Оно близко к одному из значений, в котором термин «порождать» используется в математике, и, действительно, заимствован из нее. Рассмотрим, оставляя в стороне технические детали, следующее утверждение: «Число 2 порождает множество или ряд чисел 2, 4, 8, 16, 32, ...» Это бесконечное множество чисел может быть упорядочено, как это сделано выше, в последовательность «возрастающих степеней 2», где число 2 – основание данного ряда. Каждому числу, порождаемому этим основанием, удовлетворяет некоторое значение функции 2n (где 2 – основание, а n – переменная, принимающая натуральные значения 1, 2, 3, 4, ...). Каждое число, как бы велико оно ни было, либо принадлежит множеству, порождаемому в определенном выше смысле числом 2, либо не принадлежит; вопрос о том, принадлежит ли оно этому множеству («степеней 2»), в принципе разрешим. Разрешающая процедура для любого данного числа может иметь следующий вид: порождается рассматриваемый ряд вплоть до числа, равного или большего по величине данного числа; затем данное число проверяется на идентичность с каждым из чисел, порождаемых основанием. Таким образом мы могли бы определить, например, что 9 не принадлежит этому множеству, поскольку оно не равно ни 2, ни 4, ни 8, ни 16 (первое число ряда, большее 9). Кроме того, чтобы подчеркнуть аналогию с грамматикой, можно сказать, что каждому числу этого множества при порождении ставится в соответствие его «структурное описание»: «структурное описание 64, например, – это 2n, где n = 6». Когда мы говорим, что грамматика порождает предложения языка, мы подразумеваем, что она составляет систему правил (к которым прилагается словарь), сформулированных таким образом, что они дают в принципе разрешающую процедуру для любого сочетания элементов языка (назовем их в этом случае «словами») в смысле, более или менее близком вышеупомянутому.
Кроме того, грамматика не только «решает», является ли некоторое данное сочетание грамматически правильным или нет (порождая или не порождая сочетание символов, которое может быть проверено на «идентичность» с рассматриваемым высказыванием), но она снабжает каждое грамматически правильное сочетание по крайней мере одним структурным описанием. (Ниже мы увидим, что предложения более чем с одним структурным описанием определяются как грамматически неоднозначные; см. § 6.1.3.)
Это второе, более или менее близкое к математическому, значение термина «порождать» предполагает применительно к грамматике строгую и точную характеристику природы грамматических правил и способа их действия: оно предполагает формализацию грамматической теории. На протяжении этого раздела наша интерпретация термина «формальная грамматика» перешла, таким образом, от противопоставления «формальный» vs. «понятийный» к противопоставлению «формальный» vs. «неформальный». Этот переход отражает историческое развитие грамматической теории за последние десять или пятнадцать лет.
4.2.14. «ДИСТРИБУЦИЯ» И «ПРОЦЕДУРЫ ОТКРЫТИЯ» *Принципы дистрибуционного анализа (определяющего противопоставление «формальная» vs. «понятийная» грамматика) наиболее тщательно и широко были рассмотрены Хэррисом, особенно в книге «Методы структурной лингвистики» (опубликованной в 1951 г., но написанной несколькими годами раньше). Хэррис и другие американские лингвисты того времени разработали эти принципы в рамках «процедурной» лингвистики, то есть определенного набора исходных представлений относительно природы лингвистической теории и методики, которые не всеми были приняты в то время и пользуются еще меньшей популярностью сейчас. В частности, предполагалось, что основная задача структурной лингвистики состоит в определении методики или процедуры, которая может применяться к корпусу засвидетельствованных высказываний и, при минимальном использовании суждений информанта относительно «тождеств» и «различий», может гарантировать получение из самого корпуса правил грамматики. По этой причине термины «дистрибуция» и «структуралистский» стали в силу чисто исторических причин связываться с той точкой зрения, согласно которой можно сформулировать «процедуры открытия» для установления правил конкретных грамматик на основе засвидетельствованных высказываний. Должно быть ясно, что термин «дистрибуция» используется в этой книге без подобных побочных импликаций. Следует также понять, что труды Хэрриса и его коллег с их сильной тенденцией к точной формулировке дистрибуционных принципов послужили основанием, на котором была построена генеративная грамматика со времени публикации работы Хомского «Синтаксические структуры» в 1957 г.
4.3. ГРАММАТИКА И СЛОВАРЬ
4.3.1. АНАЛИЗ И СИНТЕЗКак мы уже видели в предыдущем разделе, каждая грамматика предполагает некоторый словарь (или лексикон), в котором слова языка классифицируются в соответствии с их вхождением в дистрибуционные классы, упоминаемые в грамматических правилах.
Как грамматику, так и словарь можно рассматривать с двух различных точек зрения, в зависимости от того, занимается ли лингвист анализом («распознаванием») корпуса высказываний или синтезом («образованием») грамматически правильных предложений. Хотя из соображений практического удобства считается, что словарь и грамматика организованы до некоторой степени различным образом в соответствии с тем, используются ли они для «распознавания» или «образования», важно понять, что сами по себе они нейтральны по отношению к этому разграничению. Любой корпус засвидетельствованных предложений может быть удовлетворительно описан лишь как «выборка» из предложений, порождаемых грамматикой (см. § 4.2.8). Таким образом, генеративная и «описательная» грамматика не противопоставляются друг другу.
Однако тот факт, что грамматика нейтральна в принципе по отношению к анализу и синтезу, не означает, что принятие одной, а не другой точки зрения не имеет никаких практических последствий. Если грамматика предназначается для синтеза, удобно организовать словарь так, чтобы можно было легко найти все элементы некоторого класса слов для замены любым из них соответствующего символа класса (например, N), что предполагается правилами лексической субституции (см. § 4.3.2). Очевидный способ сделать это – организовать лексикон как множество списков, обладающих следующей формой:
N = {man, boy, chimpanzee, . . .}.
С другой стороны, если мы занимаемся анализом данного текста, будет легче работать с эталонным списком, в котором слова упорядочены в соответствии с некоторым принципом (например, по алфавиту), что позволит нам быстро найти любые отдельные слова, встречающиеся в анализируемом предложении, и распознать их грамматические свойства, например:
beauty 'красота': Существительное
die 'игральная кость; умирать': Существительное, Глагол
warm 'теплый; греть': Прилагательное, Глагол.
Наши обычные словари принадлежат к этому второму типу. Традиционные грамматики обычно не составляли списков первого типа, за исключением списков для «неправильных» форм (которые. они могли записывать в грамматике, так же как и перечислять в алфавитном порядке в словаре). Они допускали возможность построения списков слов для целей «синтеза» на основе значения отдельных слов и определений «частей речи». Некоторые современные генеративные грамматики, или грамматические очерки, предусматривают частичные списки для каждого класса слов в отдельности (мы рассмотрим природу этих списков ниже). Различие между двумя видами словаря не принципиально, а касается, скорее, удобства. Современные генеративные грамматики упомянутого типа более заинтересованы в установлении грамматических классов, требуемых для описания рассматриваемого ими языка, нежели в исчерпывающей классификации всех слов в этом языке. Если все слова языка не классифицированы соответствующим образом в словаре, грамматика не будет генеративной в смысле «эксплицитности» (см. § 4.2.13).
Одно из следствий принятия точки зрения анализа, а не синтеза заключается в следующем. Если лингвист знает, что его описание отдельного языка будет использовано только для анализа зафиксированного материала (например, в некоторых проектах автоматического анализа письменных текстов для создания машинного перевода или библиотечного каталога и поиска информации), он может позволить себе менее исчерпывающую классификацию словаря и менее полное грамматическое описание языка.
Например, есть много английских существительных, оканчивающихся на ness (например, goodness 'доброта', correctness 'правильность' и т. д.). Большинство из них, как и два приведенных здесь примера, могут быть «образованы» от прилагательных (например, good 'хороший', correct 'правильный' и т. д.). Не вдаваясь здесь в природу «словообразования» (см. § 5.4.2), мы можем считать одно слово, существительное, образованным от другого, прилагательного, с помощью следующей формулы: Ax + ness = Ny. (Это можно прочесть следующим образом: «Любое слово, состоящее из члена класса слов Аx и ness, является членом класса слов Ny».) Поскольку это весьма продуктивное словообразовательное правило английского языка, можно решить, что его следует включить в грамматику; и все слова, оканчивающиеся на ness, которые можно образовать с помощью этой формулы, могут быть изъяты из словаря.
Если же мы занимаемся синтезом, мы должны решить, какие прилагательные принадлежат классу Аx; например, включает ли этот класс слова true 'верный' и strong 'сильный' с тем, чтобы trueness и strongness (в дополнение к truth 'правда' и strength 'сила' или вместо них) порождались как грамматичные или исключались как неграмматичные. Но грамматика «распознавания» не нуждается в решении этого вопроса. Эта грамматика могла бы вполне довольствоваться более общим правилом A + ness = Ny («Любое слово, встречающееся в предложении в позиции, в которой допустимо Ny, и которое можно разложить на А и ness, должно быть принято программой распознавания»). Если бы trueness и strongness встретились в анализируемом тексте, они были бы проанализированы и признаны грамматичными; если нет, то данный вопрос не релевантен. (Слова truth и strength были бы перечислены в словаре или анализировались бы на основе иных правил. Использованный здесь пример взят из действительной программы вычислительной машины, которая успешно анализировала очень многие английские деривационные образования.)
С различием точек зрения не связано никакое принципиальное различие. Формула A + ness = Ny порождает одно и то же множество слов, используется ли она для анализа или синтеза (предполагается, что она относится к одному и тому же списку прилагательных). Но, занимаясь исключительно анализом, можно позволить себе некоторые вольности. Можно намеренно порождать (в абстрактном, математическом значении – и именно в этом значении следует всегда понимать этот термин) множество предложений, которое включало бы ряд подлежащих исключению предложений, исходя из предположения, что они так или иначе не встретятся. Исключение предложений, которые предположительно не встретятся, значительно увеличило бы «затраты» (см. § 4.2.11). Этот принцип «эффективности затрат» часто применяется при автоматическом анализе языка с помощью компьютера, поскольку принцип «снижения рентабельности» имеет весьма прямую экономическую интерпретацию (в виде дополнительного времени, необходимого для программирования, излишних затрат времени компьютера и т. д.).
Следует, впрочем, учесть возможность неправильного понимания соотношения анализа и синтеза. Тот факт, что грамматика нейтральна по отношению к анализу и синтезу, не означает, что анализ – это просто нечто обратное синтезу (или vice versa). Не следует, например, полагать, что программа вычислительной машины могла бы проходить «сверху вниз» по набору правил (и от грамматики к словарю) при «образовании» предложений и «снизу вверх по тому же набору правил (и от словаря к грамматике) при «рас познавании» конкретного корпуса материала. Как «образование», так и «распознавание», производится ли оно говорящими и слушающими или компьютером, предназначенным для моделирования их речевого «поведения», по-видимому, предусматривают «обратную связь» между этими двумя процессами (см. § 3.2.9). В исследовании этой проблемы с психологической точки зрения достигнуты пока лишь незначительные успехи; некоторые «психолингвистические» исследования были неудачными из-за непонимания того факта, что «генеративный» («порождающий») не означает «производящий». Отсюда этот предостерегающий абзац.