Текст книги "Введение в теоретическую лингвистику"
Автор книги: Джон Лайонз
Жанр:
Языкознание
сообщить о нарушении
Текущая страница: 18 (всего у книги 61 страниц) [доступный отрывок для чтения: 22 страниц]
На этой стадии изложения следует подчеркнуть, что мы все еще исходим из предположения, что предложения состоят из слов, а слова состоят из фонологических единиц (или букв, если мы имеем дело с письменным языком). Оба этих предположения ниже будут видоизменены. (Обоснование стало бы несколько более сложным, но не потеряло бы силы, если бы мы уточнили их и теперь.) Следует также упомянуть, что, хотя из нашего изложения могло сложиться впечатление, будто грамматическое описание, будучи независимым от фонологического анализа, все же непременно следует за ним, это не обязательно должно быть так (ср. § 3.3.16). Мы устанавливаем грамматику и фонологию как теоретически различные уровни лингвистической структуры. Но фонологическая и грамматическая структура конкретных языков обычно взаимосвязаны (различным образом и в различной степени). В задачу лингвиста, описывающего тот или иной язык, входит объяснение этой взаимосвязи – там, где она имеется (наряду с объяснением возможной взаимозависимости между грамматической и семантической структурой языка).
4.2.8. ПРОСТОЙ ПРИМЕР ДИСТРИБУЦИОННОГО АНАЛИЗАМы еще далеки от того, чтобы прийти к удовлетворительному представлению о лингвистическом описании. Мы еще не сказали, в частности, как определяются приемлемые сочетания слов. Перечисление списком всех приемлемых последовательностей слов совершенно невозможно, поскольку, как мы видели, ни один естественный язык нельзя рассматривать как ограниченное множество предложений. В случае замкнутого корпуса материала можно было бы, конечно, составить список всех фонологически (или орфографически) различных предложений и затем решать вопрос о приемлемости, справляясь в этом списке. Но это было бы малоинтересно в том смысле, что ничего не давало бы для нашего понимания способности носителя языка производить «новые» предложения; это не было бы к тому же и самым экономным способом описать данный текст. Если продолжить рассмотрение этого вопроса, мы поймем, по какой причине.
В достаточно большой и представительной выборке из предложений какого-либо языка дистрибуции разных слов будут в значительной мере совпадать. Например, вместо milk 'молоко' можно поставить beer 'пиво', water 'вода', gin 'джин' и т. п. не только в I drink a pint of milk; этот же ряд слов мог бы появиться и во многих других окружениях, в которых может встретиться milk. Аналогично, слова they 'они', we 'мы' и you 'вы' могут заменить I 'я', a buy 'покупать', take 'брать', order 'заказывать' и т. д. могут заменить drink 'пить' во многих других окружениях, кроме нашего предложения. Слова, которые, как правило, способны заменять друг друга в целом ряде различных предложений, можно сгруппировать на этом основании в дистрибуционные классы.
Допустим, что нам необходимо проанализировать корпус материала, состоящий из следующих 17 «предложений»: ab, ar, pr, qab, dpb, aca, pca, pcp, qar, daca, qaca, dacp, dacqa, dacdp, qpcda, acqp, acdp. Разными буквами обозначены разные слова: условная запись используется из соображений общности, а также чтобы пояснить, что на данном этапе мы обходимся без непосредственного привлечения семантики. (Впрочем, это может вызвать известные сомнения, поскольку мы исходим из того, что приемлемость сохраняется при операции замены, а понятие «приемлемости» включает «осмысленность». Мы, однако, стремимся разграничить «грамматическую правильность» и «осмысленность», хотя еще не достигли этого.) Мы видим, что а и р имеют некоторые общие окружения (ср. -r, pc-, dac-), так же как b и r (ср. a-, qa-) и d и q (ср. dac-a, -аса, ас-р), но что с имеет уникальную дистрибуцию (а-а, р-а, р-р, qa-a, da-a, da-p и т. д.) в том смысле, что ни в одном окружении, в котором встречается с, не встречается никакое другое слово. Теперь поместим а и р в класс X и поставим классный показатель X всюду, где встретятся а или р (предложения, которые отличаются только тем, что в одном из них представлено а, там, где в другом представлено р, будут сведены нашими формулами в один класс предложений): Xb, Xr (ar, pr), qXb, dXb, ХсХ (аса, рса, рср), qXr, qXcX, dXcX (daca, dacp), dxcqX, dXcdX, qXcdX, XcqX, XcdX. Теперь сгруппируем b и r в дистрибуционный класс Y, a d и q – в класс Z. Подставив Y вместо b и r, a Z вместо d и q, получим: (1) XY (Хb, Xr); (2) ZXY (qXb, qXr, dXb); (3) ХсХ; (4) ZXcX (qXcX, dXcX); (5) ZXcZX (dXcqX, dXcdX, qXcdX); (6) XcZX (XcqX, XcdX). Таким образом, мы можем описать предложения нашего корпуса в терминах шести структурных формул, определяющих приемлемые последовательности классов слов (с является одноэлементным классом). Эти формулы являются линейными (в смысле, который мы поясним ниже; см. §6.1.1).
Пока мы можем удовлетвориться описанием предложений нашего корпуса в терминах их линейной структуры, то есть на языке следующих формул или правил:
(1) XY
(2) ZXY
(3) XcX
(4) ZXcX
(5) ZXcZX
(6) XcZX.
Можно считать, что каждое из этих правил описывает отдельный тип предложения. (Тот факт, что можно свести эти типы предложений к подтипам, привлекая принципы структуры составляющих, не релевантен на данном этапе изложения; см. § 6.1.2 и сл.) Заметим, что эта система правил удовлетворительно объясняет приемлемость семнадцати предложений корпуса (она определяет их как грамматичные). Но это достигается только путем включения имеющихся предложений в общее множество из 48 предложений в качестве его элементов. (Число 48 получается после применения формулы, приведенной в § 2.3.8, к каждому из шести типов предложения и суммирования результатов.) Имеется 2 × 2 = 4 предложения типа (1), 2 × 2 × 2 = 8 предложений типа (2), 2 × 1 × 2 = 4 предложения типа (3), 16 предложений типа (4), 8 – типа (5) и 8 – типа (6). 4 + 8 + 4 + 16 + 8 + 8 = 48. Поэтому язык, описываемый такой грамматикой, содержит ровно 48 предложений. Тридцать одно не встречающееся предложение можно допустить в качестве приемлемых или исключить, если мы почему-либо решим, что они должны быть исключены посредством дополнительных правил, запрещающих определенные сочетания отдельных слов. Дополнительные правила, очевидно, весьма усложнят «грамматику». Следовательно, наиболее экономным способом описания данного текста будет такой, который представит его как случайную выборку из 17 предложений, являющихся подмножеством общего множества из 48 предложений, которые и составляют язык. «Грамматика», построенная нами для описания этого текста, является генеративной в описанном выше смысле (см. § 4.2.2). Мы будем говорить, что она порождает, или характеризует, язык текста, приписывая каждому из имеющихся в «выборке» предложений (так же как и тем, которых нет в «выборке») особое структурное описание: pr – это предложение структуры XY, pcda – структуры XcZX и т. д.
Этот ограниченный искусственный язык, использованный нами в качестве примера, содержит всего семь слов, а корпус включает лишь семнадцать простых предложений (из сорока восьми, порождаемых грамматикой). В случае естественных языков ситуация, без сомнения, оказывается значительно более сложной. Число слов выражается в десятках тысяч; их дистрибуционная классификация будет не столь простой и, несомненно, не сможет быть осуществлена только что проиллюстрированным способом. Кроме того, нам придется описывать целый ряд различных типов предложений, в том числе предложения значительной степени сложности. Однако эти факты не затрагивают самого принципа. Слова естественного языка могут быть сгруппированы в дистрибуционные классы (что всегда и делалось составителями грамматик на практике, как мы увидим ниже); дистрибуционные классы, установленные для конкретных позиций в предложениях одного типа, оказываются обычно действительными и для конкретных позиций в других, более сложных типах предложений. Грамматика, как она здесь понимается, есть не что иное, как описание предложений языка в терминах сочетаемостных свойств слов (а также словосочетаний и т. д.), определяемых их принадлежностью к тому или иному дистрибуционному классу. Это род алгебры, в которой в качестве «переменных» выступают словесные классы, а в качестве «постоянных», или «значений», принимаемых этими переменными в конкретных предложениях, – индивидуальные слова.
Чтобы понять, что речь идет в принципе о такого рода описании, которое обычно называется «грамматическим», нам достаточно интерпретировать приведенный выше пример применительно к английскому языку. Пусть a = men 'мужчины', р = women 'женщины', b = live 'живут', r = die 'умирают', c = love 'любят', d = old 'старый (~ые, ~ых)', q = young 'молодой (~ые, ~ых)'. Другими словами, пусть класс X включает все те слова, которые обычно обозначаются как 'существительные во множественном числе'; пусть Y символизирует класс «непереходных глаголов», с – класс «переходных глаголов» и Z – класс «прилагательных». Наше утверждение о допустимых сочетаниях классов слов означает, что такие предложения, как Men die, Old men love young women и т. д., которые описывались традиционной грамматикой как случаи «субъектно-предикатной» конструкции, грамматически приемлемы, тогда как *Die men или *Old love young men women и т.п. неприемлемы.
4.2.9. ГРАММАТИЧЕСКИЕ КЛАССЫВ традиционной грамматической теории «части речи» (существительные, глаголы, прилагательные и т. д.) определялись – явным образом – в «понятийных» терминах («существительное – это название лица, места или вещи» и т. п.). Но, как мы увидим ниже (см. § 7.6.1 и сл.), рассматривая «части речи», традиционные грамматики нередко смешивали две различные проблемы. Первая, которая нас здесь и занимает, – это вопрос об определении условий, при которых можно считать, что данное слово принадлежит к тому или иному грамматическому классу: «Является ли слово men членом класса X или же класса Y?» На деле это всегда определялось на основе дистрибуции слова – возможности его встречаемости в предложениях в связи с наличием в тех же предложениях других слов. В этом смысле современная лингвистика лишь признала в грамматической теории дистрибуционный принцип, которым традиционные грамматики всегда руководствовались' на практике. Таким образом, «формальная» грамматика отличается от «понятийной» теоретическим признанием указанного принципа. Вторая проблема имеет отношение к наименованию грамматических классов (установленных – что касается составляющих их элементов – на «формальной» основе): «Уместно ли называть X классом «существительных»?» С точки зрения «формальной» грамматики, всякое обозначение так же хорошо, как и любое другое; и традиционные термины «существительное», «глагол», «прилагательное» и т. д. не более и не менее удовлетворяют этой цели, чем любые другие термины.
Ниже мы увидим, что возможно определить такие термины, как «существительное» или «глагол», способом, который будет учитывать их традиционную, «понятийную» интерпретацию и в то же время сделает их пригодными для «формального» анализа разных языков. Но мы не преследуем такой цели на данном этапе. Пока мы допустим, что термины «существительное», «глагол», «прилагательное» и т. п. и другие грамматические термины не имеют никакой «понятийной» (или универсальной) значимости, но имеют в виду устанавливаемые на основе дистрибуционных критериев грамматические классы, которым можно дать любое произвольное обозначение.
Теперь мы в состоянии предварительным образом рассмотреть разграничение между «грамматичностью» и «осмысленностью». (Мы не раз будем возвращаться к этому вопросу ниже.) Для простоты мы ограничимся здесь рассмотрением одного класса английских предложений (который мы опишем намеренно упрощенным образом). Рассматриваемый класс можно проиллюстрировать следую-щими, как мы полагаем, приемлемыми, примерами:
(1) The dog bites the m an 'Собака кусает человека'.
(2) The chimpanzee eats the banana 'Шимпанзе ест банан'.
(2) The wind opens the door 'Ветер открывает дверь'.
(4) The linguist recognizes the fact 'Лингвист признает факт'.
(5) The meaning determines the structure 'Значение определяет структуру'.
(6) The woman undresses the child 'Женщина раздевает ребенка'.
(7) The wind frightens the child 'Ветер пугает ребенка'.
(8) The child drinks the milk 'Ребенок пьет молоко'.
(9) The dog sees the meat 'Собака видит мясо'.
В традиционном грамматическом описании английского языка все эти предложения были бы определены как простые предложения субъектно-предикатной структуры. Кроме того, утверждалось бы, что (во всех примерах класса предложений, которым мы сейчас занимаемся) подлежащим является словосочетание (то есть единица, составленная из более чем одного слова), состоящее из Артикля (здесь the 'определенный артикль') и Существительного (например, dog), и что подлежащее (как это обычно бывает в английском языке) предшествует сказуемому; что сказуемым является словосочетание, состоящее из (переходного) Глагола (например, bites) и следующего за ним прямого дополнения, которое является словосочетанием, состоящим из Артикля и Существительного (например, man). О проиллюстрированном выше классе предложений может быть сделано много других утверждений: что подлежащее и глагол согласуются в «числе» (это означает, что если подлежащее-существительное стоит в единственном числе, глагол также будет встречаться в единственном числе, но если подлежащее-существительное стоит во множественном числе, то и глагол будет представлен во множественном числе; ср.: The dog bites vs. The dogs bite 'Собаки кусают'); что глагол «изменяется» по «временам» (то есть bites стоит в «настоящем времени», bit – это соответствующее «прошедшее время» данного глагола и т. д.). Все эти разнообразные утверждения можно более или менее удовлетворительно истолковать в рамках «формальной» грамматики (см. главным образом главы 7 и 8). Пока, однако, мы будем оперировать только тремя классами слов: артиклями, существительными и глаголами. Артикль можно рассматривать как одноэлементный класс, содержащий слово the; сокращенно обозначим его здесь как Т. Класс существительных и класс глаголов, сокращенно обозначаемые как N и V, содержат несколько тысяч слов, включая те, которые фигурируют в перечисленных выше «реальных» предложениях:
N = {dog, man, chimpanzee, banana, wind, door, linguist, fact, meaning, structure, child, milk, meat, . . .}
V = {bites, eats, opens, recognizes, determines, undresses, frightens, drinks, sees, ...}
Задав эту пробную дистрибуционную классификацию английских слов (заметим, что мы тем самым ограничиваемся рассмотрением предложений, в которых встречаются существительные только в «единственном числе» и глаголы только в «настоящем времени»), мы можем предложить следующее грамматическое правило (которое приобретает исключительно линейную структуру; ср. § 6.1.1):
Σ1 : T + N + V + T + N.
Знак Σ ('сигма') обозначает «предложение»: мы используем греческую букву, а не латинское S (практика современных лингвистических работ не является единообразной в этом отношении), чтобы подчеркнуть различие в теоретическом статусе предложений и единиц, из которых строятся предложения, например слов (ср. гл. 5). Числовой индекс при Σ означает, что это правило описывает только один класс предложений. Выбор числа совершенно произволен. Правило можно прочесть следующим образом: «Любое сочетание слов, которое получается в результате того, что на место символов Т, N и V в каждой позиции линейной формулы T + N + V + T + N подставляется любой элемент соответствующего класса, выбранный наугад из списка слов, содержащегося в лексиконе языка, представляет собой предложение типа 1». Грамматическое правило предполагает таким образом не только лексикон (или словарь), в котором всем словам языка придается соответствующая грамматическая классификация – N, V или Т, – но также одно или несколько правил лексической субституции для замены символов словесных классов словами. Существование таких правил мы здесь можем принять без доказательства: мы рассмотрим их в следующем разделе. Предложенное выше грамматическое правило вместе с соответствующими списками членов грамматических классов определяет все предложения в нашей «выборке» как грамматичные, со структурным описанием T + N + V + T + N.
Мы сказали, что N и V могут содержать несколько тысяч членов. Чтобы упростить арифметические выкладки и получить, однако, некоторые разумные показания относительно количества английских предложений, порождаемых единственным правилом, которое было приведено выше, допустим, что каждый из двух классов N и V содержит ровно тысячу (103) элементов. При этом условии предложенное правило порождает ни больше, ни меньше как 1 × 103 × 103 × 1 × 103 = 109 (тысячу миллионов) предложений, имеющих одну и ту же структурную характеристику. Это только одно правило, и оно описывает очень простой класс очень коротких английских предложений.
Речь идет, таким образом, об очень емком правиле – емком в том смысле, что оно несомненно порождает огромное число приемлемых предложений. Но оно, возможно, слишком емкое, поскольку оно также порождает (и определяет как грамматичные) очень многие предложения, которые не прошли бы испытание на приемлемость в нормальных условиях. (Ограничение «в нормальных условиях», какой бы неопределенный характер ни носило его практическое применение, не может быть опущено. Например, многие «обычно» неприемлемые «предложения» намеренно включаются в контекст лингвистических обсуждений или употребляются в сходных «ненормальных» условиях.) Поскольку все предложения, порождаемые вводимым нами правилом, тем самым определяются как грамматичные, мы должны либо внести в правило соответствующие коррективы, так, чтобы исключить некоторое количество предложений, которые мы рассматриваем как неприемлемые, либо дать объяснение их неприемлемости, если она поддается объяснению в общем описании языка, например в терминах несовместимости значений отдельных подклассов слов (или каким-нибудь иным способом). Как мы увидим, на самом деле эти два варианта не исключают друг друга. Но сначала рассмотрим, к чему ведет первая возможность в рамках «формальной» грамматики.
4.2.10. ВЫДЕЛЕНИЕ ПОДКЛАССОВ (СУБКЛАССИФИКАЦИЯ)Один очевидный путь внесения корректив в предложенный грамматический анализ – это разбить N и V на подклассы и формулировать не одно новое правило, а целое множество разных правил. Поэтому вновь разобьем слова на классы следующим образом:
Na= {dog, man, chimpanzee, linguist, child, wind, ...}
Nb = {banana, door, milk, meat, ...}
Nc = {fact, meaning, structure, ...}
Vd = {eats, bites, frightens, undresses, sees, ...}
Ve = {recognizes, determines, sees, eats, ,..}
Vf = {determines, ...}.
Прежде чем продолжать, следует подчеркнуть ряд моментов в связи с данной переклассификацией. Во-первых, в принципе несущественно, каким образом мы пришли к данной классификации. Здесь не предполагается, что лингвистическая теория может или должна давать набор процедур для определения, или «установления», дистрибуционных классов, упоминаемых в грамматических правилах. Имеет значение вопрос о том, дает ли лингвисту именно одна, а не другая классификация возможность сформулировать серию правил таким образом, чтобы общее множество предложений, порождаемых грамматикой, включало максимальное число приемлемых предложений и минимальное число неприемлемых предложений. (Имеются дополнительные соображения, которые мы обсудим ниже в связи с разграничением «сильной» и «слабой» адекватности; см. § 6.5.7. Здесь их можно не принимать во внимание.) Второй заслуживающий упоминания момент заключается в том, что новые подклассы, несмотря на употребление индексов, оказываются теперь совершенно не связанными друг с другом. Иными словами, Na, Nb и Nc являются подклассами N только в том «несущественном» смысле, что мы от первоначальной пробной грамматической классификации перешли к последующей пробной классификации. В принципе же мы построили совершенно новую классификацию словаря и совершенно новую грамматику описываемого языка. Как мы увидим в следующем разделе, возможно пересмотреть понятие дистрибуционной классификации, которым мы сейчас оперируем, таким образом, чтобы Na, Nb и Nc можно было рассматривать как подклассы более широкого класса N, a Vd, Ve, Vf – как подклассы V. Наконец, следует отметить, что мы ввели определенное количество случаев многократного вхождения: слово determines встречается как в классе Ve, так и в классе Vf , а слово sees – как в классе Vd, так и в классе Ve. Независимо от того, какие возражения может вызвать двойная классификация этих слов, она имеет еще то нежелательное следствие, что в рамках предполагаемой ею модели sees в предложении типа The child sees the banana 'Ребенок видит банан' представляет собой, с грамматической точки зрения, совершенно другой элемент, нежели sees в таких предложениях, как The child sees the meaning 'Ребенок понимает [букв, видит] смысл'. Мы еще вернемся к этому вопросу в следующем разделе. Новая классификация рассматриваемых слов предполагает замену прежнего правила целым множеством правил (следует заметить, что каждое из них определяет совершенно особый тип предложения):
a) Σ1 : T + Na + Vd + T + Na (ср. The dog bites the man)
b) Σ2 : T + Na + Vd + T + Nb (cp. The chimpanzee eats the banana)
c) Σ3 : T+ Na + Ve + T + Nc (cp. The linguist recognizes the fact)
d) Σ4 : T + Nc + Vf + T + Nc (cp. The meaning determines the structure).
Хотя этих четырех правил достаточно, чтобы породить девять предложений из нашей «выборки» (и очень многие другие), очевидно, что теперь потребуются еще какие-то правила, описывающие другие предложения, состоящие из употребляемых в «выборке» слов, которые мы были бы склонны рассматривать как приемлемые (The banana frightens the linguist [букв. 'Банан пугает лингвиста'] и т. п.). Мы приглашаем читателя построить некоторые дополнительные правила, а также продолжить приведенные выше списки слов.
Самым важным моментом, возникающим в связи с пересмотром грамматических правил, является то, что заново определяются границы между грамматичными и неграмматичными предложениями английского языка. Такие сочетания слов, как *The banana bites the meaning, *The structure drinks the chimpanzee и т. п., которые, согласно нашему предположению, являются неприемлемыми как английские высказывания, теперь определяются как неграмматичные. С другой стороны, существует много других неприемлемых высказываний, которые допускаются правилами как грамматичные: *The chimpanzee drinks the door, *The dog undresses the wind и т. Д.
В принципе мы могли бы надеяться постепенно сделать классификацию слов и систему правил все более и более подробными, внося все новые и новые исправления, до тех пор пока наша грамматика не будет способна порождать максимальное число приемлемых предложений и минимальное число неприемлемых предложений. С каждой последующей модификацией – и в этом теоретическое значение данного примера – границы грамматичное очерчиваются для описываемого языка заново. С «формальной» (vs. «понятийной») точки зрения, грамматичность – это не более чем приемлемость в той мере, в какой она может быть описана с помощью определенного множества правил и определенной классификации лексических и грамматических элементов языка. (Пока разграничение между «лексическими» и «грамматическими» элементами, вкравшееся в данную формулировку, можно игнорировать: «лексические и грамматические элементы» можно понимать как «слова».)