Текст книги "Введение в теоретическую лингвистику"
Автор книги: Джон Лайонз
Жанр:
Языкознание
сообщить о нарушении
Текущая страница: 20 (всего у книги 61 страниц) [доступный отрывок для чтения: 22 страниц]
Теперь мы можем вернуться к обсуждению структуры словаря. Для простоты будем по-прежнему опираться на наше весьма простое представление о грамматических правилах. Хотя оно будет пересмотрено в последующих главах, этот пересмотр не окажет влияния на сделанные здесь общие утверждения. Итак, вернемся к первому правилу, использованному в предыдущем разделе:
Σ1 : T + N + V + T + N,
и к предполагаемым им классам слов:
T = {the}
N = {man, dog, chimpanzee, . . .}
V = {bites, eats, opens, . . .}.
Процесс лексической субституции (подстановка конкретных слов на позиции, установленные соответствующим грамматическим правилом; см. § 4.2.9) можно описать следующим образом: каждый случай появления символа грамматического класса в структурном описании предложения заменяется на любой член означенного класса, причем этот член берется из списка данного класса, приведенного в словаре. (Когда все символы грамматических классов заменены, или «переписаны», посредством многократного применения принципа лексической субституции, на «выходе» генеративной системы получается предложение, снабженное соответствующим структурным описанием.) Операция лексической субституции может быть формализована посредством следующего правила:
Х → х|х ∈ Х.
«Замени X, где X – переменная, принимающая значение всех грамматических классов, упоминаемых в генеративной системе (например, Т, N или V), на х, где х – любой член класса X». Последовательное применение этого правила лексической субституции превратит T + N + V + T + N в некоторое предложение типа The dog bites the man, как это представлено деревом на рис. 5. (Заметим, что различие между той частью «выхода», которая выводится из грамматического правила, и частью, полученной из словаря, представлено на дереве различием между сплошной и прерывистой линией. В настоящей работе мы будем везде придерживаться этого удобного соглашения.)
Рис. 5.
Поскольку правила лексической субституции действуют одинаковым образом, независимо от «значения», принимаемого Х-ом, мы можем рассматривать списки слов как множество правил, прилагаемых к грамматике, и таким образом обойтись без обобщенного правила лексической субституции. Принимая эту точку зрения (которую мы вскоре пересмотрим), мы следуем практике Хомского и других авторов первых работ по генеративной грамматике. Мы можем, следовательно, организовать словарь так, чтобы он принял следующую форму:
T → {the}
N → {man, dog, chimpanzee, . . .}
V → {bites, eats, opens, . . .}.
Стрелки можно интерпретировать как инструкцию заменить (или «переписать») элемент, находящийся слева от стрелки, на один из элементов, перечисленных справа от стрелки, например: 'y → z' означало бы «замени у на z (при условиях, определяющих систему правил)». Любая система правил, каждое из которых представлено в такой форме (способ их действия будет более подробно рассмотрен в гл. 6), называется системой подстановки (или системой правил подстановки).
Теперь используем стрелку подстановки также и для грамматического правила и объединим грамматическое правило и правила лексической субституции в одну систему:
(1) Σ1 → T + N + V + T + N
(2) T → {the}
(3) N → {man, dog, chimpanzee, . . .}
(4) V → {bites, eats, opens, . . .}.
Это весьма простая генеративная грамматика, которую мы расширим, с тем чтобы она учитывала некоторые результаты деления классов слов на определенные подклассы.
В предыдущем разделе мы отмечали, что в рамках допущений, принятых нами при рассмотрении формальной грамматики, любая переклассификация слов в словаре производит не подклассы исходных более широких классов, а совершенно не связанные друг с другом новые классы. С грамматической точки зрения этот недостаток может быть исправлен посредством введения добавочных правил, а именно:
N → {Na, Nb, Nc}
V → {Vd, Ve, Vf}.
Теперь мы должны внести поправки в правила лексической субституции (увеличив их число). Таким образом, новая система, включающая грамматику и словарь, примет следующий вид:
(1) Σ1 → T + N + V + T + N
(2) N → {Na, Nb, Nc}
(3) V → {Vd, Ve, Vf}
(4) Na → {man, dog, chimpanzee, . . .}
(5) Nb → {banana, door, milk, . . .}
(6) Nc → {fact, meaning, structure, . . .}
(7) Vd → {eats, bites, frightens, . . .}
(8) Vd → {recognizes, . . .}
(9) Vf → {determines, . . .}.
Эта система правил формализует в пределах грамматики тот факт, что Na, Nb и Nc представляют собой подклассы N (члены этих подклассов – «существительные»), а Vd, Ve,и Vf – подклассы V (члены – «глаголы»). Следовательно, в целях формализации этого факта наша система вводит дополнительный «слой» грамматической структуры (ср. рис. 6, представляющий дополнительный «слой» посредством ветвей «дерева», связывающих N и Na и V и Vd). Однако это происходит за счет того, что система допускает в качестве грамматически правильных те самые сочетания подклассов, для запрещения которых и предназначался процесс субклассификации. (В вышеприведенном наборе правил нет никаких ограничений, препятствующих тому, чтобы избрать, скажем, Nb для заполнения второй позиции при Vd в третьей позиции и Nc в пятой позиции.)
Рис. 6.
Речь идет здесь о принципе синтагматической обусловленности, или совместимости, между одним и другим подклассом слов, то есть о том, что обычно называют лексической селекцией. На данном этапе мы занимаемся структурой словаря и не будем вдаваться в грамматические аспекты этой проблемы. Допустим просто, что в принципе возможна такая формализация (использующая контекстно-связанные правила; см. § 6.5.1), которая позволила бы нам сохранить понятие субклассификации, выраженное в правилах (2) и (3), и тем не менее порождать желаемые сочетания подклассов.
4.3.3. ГРАММАТИЧЕСКИЕ ПРИЗНАКИ *Теперь мы можем представить себе все более и более дробную классификацию словаря языка (вплоть до «снижения рентабельности»). Грамматику можно расширить, например, таким образом, чтобы она включала такие добавочные правила, как
Na → {Na1, Na2}
Nb → {Nb1, Nb2}
Na1 → {Na11, Na12}
и т. д.
Каждое последующее выделение подклассов такого рода предполагает увеличение числа правил лексической субституции. Более того, очевидно, что эта формализация основывается на весьма частном (и, как мы увидим, ошибочном) предположении относительно грамматической структуры языка. Эти правила делят весь словарь на иерархически упорядоченные классы и подклассы (см. рис. 7) так, что Na11 и Na12 полностью принадлежат Na1; Na1 полностью принадлежит Na, а Na полностью принадлежит N и т. д. Это предположение лежало в основе первых генеративных грамматик, принявших подстановочную систему формализации (введенную в лингвистику Хомским).
Рис. 7.
Оно неудовлетворительно по двум причинам. Во-первых, оно ведет к увеличению числа отдельных списков в словаре при соответственно высокой степени многократного вхождения (см. § 4.2.10). Во-вторых, и это более важно, оно делает формулировку грамматических правил более сложной, чем этого требуют «факты». Цитируя Хомского: «Трудность состоит в том, что такая субкатегоризация [то есть выделение подклассов в словаре] обычно не является строго иерархической, а включает в себя перекрестную классификацию. Так, например, существительные в английском языке делятся на Имена Собственные (John, Egypt) и Имена Нарицательные (boy 'мальчик', book 'книга') и бывают Человеческими (John, boy) и Нечеловеческими (Egypt, book)... Но если субкатегоризация задана правилами подстановки, то какое-то из этих различий должно доминировать, и тогда другое нельзя будет сформулировать естественным образом». Например, если класс существительных сначала делится на Собственные Имена существительные и Нарицательные Имена существительные, затем каждое из них в свою очередь подразделяется на подклассы «Человеческий» и «Нечеловеческий», единственный способ сформулировать правило, относящееся ко всем «Человеческим существительным», – это отнести его к обоим совершенно не связанным классам «Собственные Человеческие» и «Нарицательные Человеческие» (поскольку в словаре нет списка «Человеческих Имен существительных»). Как пишет далее Хомский, «по мере углубления разложения [т. е. с каждой последующей субклассификацией] проблемы такого рода становятся столь значительными, что указывают на серьезную неадекватность грамматики, которая состоит только из правил подстановки». Мы не будем рассматривать предлагаемое Хомским исправление грамматических правил для решения этих проблем: в настоящей главе мы имеем дело с очень простой системой. Что касается словаря, то результат «перекрестной классификации» ясен. Предполагается, что каждое слово должно быть «индексировано» таким образом, чтобы можно было подобрать, например, любое «человеческое» существительное (независимо от того, «собственное» оно или «нарицательное»), любое «конкретное» существительное (независимо от того, «одушевленное» оно или «неодушевленное») и т. д. С этим типом классификации, или «индексирования», обычно связывают специальный термин признак (ср. в известной мере аналогичное использование термина «признак» в фонологии). Мы предполагаем, что каждое слово должно быть приведено в словаре (который уже не может теперь иметь вид системы правил подстановки, включенной в грамматику) вместе с набором признаков, например:
boy : [нарицательное], [человеческое], [мужской род], ...
door : [нарицательное], [неодушевленное], ...
Правило или правила лексической субституции придется, следовательно, формулировать так, чтобы можно было подобрать отдельное слово согласно одному или более указанным признакам. На каком этапе в системе порождения будут применяться правила лексической субституции – это спорный вопрос. Следует отметить, однако, что, хотя мы отказались от словаря, представленного в виде набора правил вида Na → {boy,...}, наше более общее правило остается в силе (см. § 4.3.2):
Х → х|х ∈ Х.
(«замени X на х, где х – член класса слов X»). Различие в том, что теперь X – это класс слов, удовлетворяющих специальной признаковой характеристике. Так, если порождаемое грамматикой предложение предусматривает «нарицательное, человеческое» существительное «мужского рода», то X —это класс, состоящий из всех слов лексикона, содержащих в качестве грамматических признаков [на-рицательность], [человечность], [мужской род], например boy. Однако списка членов этого сложного класса не существует.
4.3.4. ИМПЛИКАЦИИ КОНГРУЭНТНОСТИ ГРАММАТИЧЕСКОЙ И СЕМАНТИЧЕСКОЙ КЛАССИФИКАЦИИТеперь мы можем перейти к следующему вопросу. Хотя этот вопрос почти не имеет отношения к пониманию генеративной грамматики, как она излагалась до сих пор в опубликованных работах, он начинает приобретать определенное значение в связи с некоторыми недавними предложениями, касающимися формализации семантики. Как мы увидим в последующих главах, есть серьезные основания полагать, что слияние грамматики и семантики приведет к некоторому сближению между «формальной» и «понятийной» грамматикой. По этой причине особенно важно не упустить из виду некоторые общие положения.
Термины, которые мы использовали для обозначения признаков, упоминавшихся в предыдущем абзаце («собственное», «нарицательное», «одушевленное», «мужской род» и т. п.), трактовались как грамматические. Мы не отказались от того принципиального положения, согласно которому подобные термины, обозначая классы, упоминаемые в грамматических правилах, представляют собой условные наименования классов, основанных, как мы согласились считать, на дистрибуции. Однако эти условные наименования (по происхождению связанные с «понятийной» грамматикой) явно несут определенные семантические импликации. Мы уже упоминали о конгруэнтности, или взаимном соответствии, которое наблюдается в разной степени между грамматической и семантической структурой языка; и мы вернемся к этому вопросу позже. Так, можно полагать, что большинство грамматически «одушевленных» существительных будет обозначать людей или животных, что большинство существительных «мужского рода» будет обозначать мужчин и т. д. Нередко, однако, между классификацией слов, использующей такие признаки, как «одушевленность» или «мужской род», и классификацией, основанной на значении слов, могут наблюдаться противоречия (ср. гл. 7). Это давно признано и является главной причиной, в связи с которой большинство лингвистов отказалось от «понятийной» грамматики.
В то же время следует ясно понимать, что при достаточно полном описании языка в словарь должны включаться как грамматические, так и семантические сведения о каждом приведенном в нем слове.
Семантическую информацию, возможно, следует организовать таким образом, чтобы во всех тех случаях, когда между грамматической и семантической классификацией наблюдается соответствие, было бы возможным вывести часть грамматической информации (требуемой для действия грамматических правил) из описания значения слова. Предположим, например, что слово man приводится в словаре вместе с описанием его значения (в какой бы то ни было форме), и, кроме того, предположим, что из этих сведений можно вывести посредством соответствующего правила, что денотатом man (по крайней мере в одном из значений) является взрослый человек мужского пола (NB: из этого не следует, что значение man – это 'взрослый, человек, мужского пола': эта оговорка существенна в свете того, что будет сказано в главах по семантике). При таком условии мы можем вывести из этого грамматическую характеристику слова man, включающую признаки [мужской род], [человечность], что имплицирует [одушевленность] и т. д. Это – грамматическая классификация, так как она предназначена для объяснения таких дистрибуционных фактов, как употребление форм who 'кто' vs. which 'который, что'; he, him, his 'он, ему, его...' vs. she, her 'она, ее' vs. it, its 'оно, его' и т. д. Например, *The man which came... или *The man washed her own shirt должны быть отвергнуты как неприемлемые и, как мы полагаем, неграмматичные.
Может показаться на первый взгляд, что предложение выводить грамматическую классификацию слова из описания его значения противоречит принципам формальной грамматики, изложенным в предыдущем разделе. Это не так, если мы будем соблюдать следующее важное условие: из сферы действия любого общего правила, установленного для выведения грамматических признаков из содержащегося в лексиконе описания значения слова, должны быть явным образом (путем специальной пометы) исключены слова с противоречащим признаком. Предположим, например, что все слова, обозначающие людей, обладают грамматическим признаком [человечность], имплицирующим также признак [одушевленность], и, кроме того, что они принадлежат к [мужскому роду], если обозначают лиц мужского пола, и к [женскому роду], если обозначают лиц женского пола. Это общий закон, применяемый в том случае, если данному слову не приписана в словаре противоречащая грамматическая характеристика. Теперь мы констатируем (и допустим, что мы располагаем соответствующим грамматическим аппаратом для формализации этого утверждения), что [неодушевленность] противоречит [одушевленности]. Поскольку слову man в словаре не приписаны никакие противоречащие грамматические признаки, переход семантической информации в грамматическую будет подчиняться действию общих правил.
Но слово child 'дитя' могло бы войти в словарь с признаком [неодушевленность], с тем чтобы допустить такие предложения, как The child ate its dinner 'Ребенок съел свой обед'. Впрочем, сразу же понятно, что факты значительно более сложны, чем предполагает эта простая методика. Такие предложения, как The child ate his dinner и The child ate her dinner, также приемлемы. Мы могли бы, следовательно, ввести разграничение между признаками [неодушевленность] и [средний род]. Обычно [неодушевленность] (независимо от того, включен ли этот признак в грамматическую информацию или выведен для отдельного слова из анализа его значения) имплицирует [средний род]; а [одушевленность] имплицирует либо [мужской род], либо [женский род], причем, если слово не определено как одно или другое, выбор рода произволен. Но можно было бы рассмотреть возможность приписать слову child как признак [одушевленность], так и признак [средний род]. В этом случае мы должны сформулировать грамматические правила таким образом, чтобы наличие признака [средний род] не препятствовало выбору местоимения he или she, исходя из признака [одушевленность], и, наоборот, чтобы наличие [одушевленности] не мешало выбрать местоимение it, исходя из признака [средний род]. Ситуация, в действительности, значительно более запутана, чем мы здесь показали. Но дополнительные сложности не затрагивают общих принципов.
Только что упомянутое предложение до сих пор (насколько мне известно) не было осуществлено в какой-либо из опубликованных работ. Но оно обладает несомненными достоинствами, и его осуществление, возможно, явится результатом тех достижений, которые наблюдаются в последнее время в «компонентной» семантике (см. § 10.5.1 и сл.). В то же время следует подчеркнуть не только то, что это предложение носит в настоящее время весьма умозрительный характер, но и что любая попытка его осуществить повлекла бы за собой довольно радикальный пересмотр тех способов формализации генеративной грамматики, которые были разработаны Хомским и его последователями. Другие авторы, склонные по иным причинам полагать, что такой пересмотр необходим, выдвинули за последнее время различные конкретные предложения; они будут упомянуты в примечаниях, прилагаемых к последним разделам этой книги. Однако в основной части книги мы будем следовать (быть может, за исключением частных вопросов) главной линии развития теории генеративной грамматики, как она была намечена Хомским и теми, кто с ним связан наиболее тесно.
4.3.5. РЕЗЮМЕВ этой главе мы ввели понятие «генеративной грамматики»; касаясь грамматических правил, мы намеренно упростили изложение, чтобы сосредоточиться на более общих принципах. Мы также поддерживали ту точку зрения, что предложения строятся посредством простой операции извлечения слов из словаря (в соответствии с их грамматической характеристикой) и сочетания их в последовательность. Кроме того, мы не проводили последовательного разграничения между «предложением» и «высказыванием», поскольку исходили из молчаливого предположения, что грамматика (дополненная фонологическими правилами и правилами фонетической интерпретации в терминах звуковой субстанции) порождает предложения, «тождественные» потенциальным высказываниям языка. Все эти моменты будут модифицированы в течение следующих двух глав. Прежде чем вернуться к дальнейшему рассмотрению генеративной модели, мы должны обсудить природу предложений и других грамматических единиц.
5. Грамматические единицы
5.1. ВВЕДЕНИЕ
5.1.1. СЛОВА, ПРЕДЛОЖЕНИЯ, МОРФЕМЫ, СЛОВОСОЧЕТАНИЯ И НЕСАМОСТОЯТЕЛЬНЫЕ ПРЕДЛОЖЕНИЯ [32]32В оригинале употребляется термин clause, который не имеет эквивалента в русской лингвистической литературе. Его значение разъяснено в настоящем разделе. – Прим. ред.
[Закрыть]
Традиционная лингвистическая теория оперирует двумя основными единицами лингвистического описания – словом и предложением. Обе эти единицы получают практическое признание в разных системах письма. Например, в различных алфавитных системах, используемых европейскими языками, как и многими другими языками мира, предложения отделяются друг от друга посредством специальных знаков препинания (точка, вопросительный знак, восклицательный знак) и заглавными буквами, употребляемыми в начале первого слова каждого предложения; внутри предложений слова отделяются друг от друга пробелами. Ввиду этого образованный человек, не являющийся профессионалом-лингвистом, знаком с терминами «слово» и «предложение» и свободно употребляет их, говоря о языке. До сих пор мы употребляли термины «слово» и «предложение», не определяя и не поясняя их. Теперь мы должны проанализировать эти термины в свете общих принципов, рассмотренных в предыдущей главе, не упуская из виду тот смысл, который вкладывается в термины «слово» и «предложение» в повседневном употреблении и в традиционной грамматической теории.
По причинам, которые будут раскрыты ниже в этой главе, классические грамматики не делали предметом своего специального внимания расчленение слов на более мелкие элементы. Однако ясно, что по крайней мере во многих языках такие элементы существуют. Например, английское слово unacceptable 'неприемлемый' состоит из трех более мелких единиц, каждая из которых имеет специфическую дистрибуцию: un, accept и able. Кроме того, это минимальные единицы в том смысле, что их нельзя дальше разложить на единицы дистрибуционных классов английского языка. Такие минимальные единицы грамматического анализа, из которых могут состоять слова, обычно называют морфемами.
Таким образом, нам предстоит рассмотреть в этой главе три различные единицы грамматического описания: предложения, слова и морфемы. Между словом и предложением грамматисты обычно выделяют две другие единицы: словосочетания и несамостоятельные предложения (clauses). Различие между двумя последними единицами традиционно описывается примерно следующим образом: любая группа слов, грамматически эквивалентная отдельному слову и не имеющая собственного подлежащего и сказуемого, есть словосочетание [33]33
Опять же в оригинале употребляется термин «phrase» ('фраза'), относительно которого выше, в примечании было сказано, что этот термин более или менее близок термину «словосочетание» и также ниже разъяснен в настоящем разделе. – Прим. ред.
[Закрыть]; с другой стороны, группа слов с собственным подлежащим и сказуемым, если она включена в большее предложение, есть несамостоятельное предложение. На практике при анализе конкретных предложений разграничение между словосочетаниями и несамостоятельными предложениями было не всегда достаточно ясным и последовательным. Теоретически традиционное различие между словосочетаниями и несамостоятельными предложениями сводится к разграничению между словоподобными и фразоподобными группами слов внутри предложений; само же предложение, как мы увидим, традиционно определялось в терминах «подлежащего» и «сказуемого». Словосочетания и несамостоятельные предложения традиционной грамматики являются, таким образом, производными единицами, определяемыми в терминах их грамматической эквивалентности первичным единицам, словам и предложениям. Мы лишь мимоходом коснемся в этой книге вопроса о словосочетаниях и несамостоятельных предложениях с точки зрения современной грамматической теории (но ср. § 5.5.1, 6.2.10).
Отношения между этими пятью единицами грамматического анализа (в языках, для которых устанавливаются все пять) есть отношение композиции. Если мы назовем предложение «высшей» единицей, а морфему «низшей», мы можем расположить все пять единиц на шкале рангов (предложение, несамостоятельное предложение, словосочетание, слово, морфема), считая, что единицы высшего ранга составлены из единиц низшего ранга. Или же мы можем сказать, что единицы высшего ранга можно анализировать (или расчленять) на единицы низшего ранга.
Многие книги о языке уделяли раньше большое место обсуждению вопроса о том, какая из двух традиционных первичных единиц грамматического описания – слово или предложение – должна рассматриваться как «основная»: идентифицирует ли грамматист прежде всего слова и затем описывает структуру предложений в терминах допустимых сочетаний слов или же он начинает с выделения предложений в своем материале и затем расчленяет эти предложения на составляющие слова? Мы не будем рассматривать здесь этот вопрос. Пока допустим, что грамматика языка нейтральна по отношению к тому, направляется ли исследование «снизу вверх» или «сверху вниз» по шкале рангов, точно так же, как она нейтральна к разграничению анализа и синтеза (см. § 4.3.1).