Текст книги "Введение в теоретическую лингвистику"
Автор книги: Джон Лайонз
Жанр:
Языкознание
сообщить о нарушении
Текущая страница: 12 (всего у книги 61 страниц) [доступный отрывок для чтения: 22 страниц]
Этот теоретический идеал никогда не достигается на практике. Прежде всего вероятности появления единиц обыкновенно находятся между величинами ряда 1, 1/2, 1/4, 1/8, 1/16, . . . , 1/2m, а не соответствуют им в точности. Например, вероятность появления отдельной единицы может быть равна 1/5, поэтому она может передавать log2 5 – приблизительно 2,3 – бита информации. Но в субстанции не бывает различия, измеряемого числом 0,3; субстанциальные различия абсолютны в поясненном выше смысле (см. § 2.2.10). Если же мы используем три знака для отождествления единицы с вероятностью появления в 1/5, мы тем самым введем избыточность в субстанциальную реализацию. (Среднюю избыточность системы можно сделать сколь угодно малой; математическая теория связи занимается-главным образом этой задачей. Но нам здесь нет необходимости вдаваться в более специальные подробности.) Важным является то, что некоторая степень избыточности на самом деле желательна в любой системе связи. Причина состоит здесь в том, что, какая бы среда ни использовалась в целях передачи информации, она будет подвержена разнообразным непредсказуемым природным помехам, которые уничтожат или исказят часть сообщения и таким образом приведут к потере информации. Если бы система была свободна от избыточности, потеря информации была бы невосполнима. Инженеры связи обозначают случайные помехи в среде или канале связи термином шумы. Оптимальная система для отдельного канала такова, что в ней ровно столько избыточности, сколько требуется, чтобы получатель мог восстановить информацию, потерянную из-за шумов. Заметим, что термины «канал» и «шумы» следует толковать в самом общем смысле. Их применение не ограничивается акустическими системами и тем более системами, созданными инженерами (телефон, телевизор, телеграф и т. п.). Искажения в почерке, получающиеся при письме в движущемся поезде, можно также причислить к «шумам»; сюда же относятся искажения, возникающие в речи при насморке, в состоянии опьянения, от рассеянности или ошибок памяти и т. п. (Опечатки – это одно из следствий воздействия шумов при «кодировании» письменного языка; читатель часто не замечает их, потому что избыточность, характерная для большей части письменных предложений, достаточна для того, чтобы нейтрализовать искажающее влияние случайных ошибок. Опечатки более существенны в цепочке знаков, любая комбинация которых a priori возможна. С этим на практике считаются бухгалтеры, которые умышленно вводят в свои книги избыточную информацию, требуя баланса сумм в разных колонках. Обычай ставить сумму к выплате на чеках и прописью и цифрами позволяет банкам обнаружить, если не исправить, многие ошибки, вызванные шумами того или иного рода.) Что же касается устной речи, то термин «шум» включает любой источник искажения или непонимания, относится ли он к недостаткам речевой деятельности говорящего и слушающего или к акустическим условиям физической среды, в которой производятся высказывания.
2.4.6. КРАТКОЕ ИЗЛОЖЕНИЕ ОСНОВНЫХ ПРИНЦИПОВ ТЕОРИИ ИНФОРМАЦИИС начала 1950-х гг. теория связи (или теория информации) оказывает большое влияние на множество других наук, в том числе на лингвистику. Основные ее принципы можно резюмировать следующим образом:
(i) Вся коммуникация основывается на возможности выбора, или селекции, из множества альтернатив. В главе, посвященной семантике, мы увидим, что этот принцип дает нам толкование термина «значимый» (в одном из смыслов): языковая единица любого уровня не обладает значением в некотором данном контексте, если она полностью предсказуема в этом контексте.
(ii) Информационное содержание изменяется обратно пропорционально вероятности. Чем более предсказуема единица, тем меньше значения она несет. Этот принцип хорошо согласуется с мнением стилистов о том, что клише (или «избитые выражения» и «мертвые метафоры») менее действенны, чем более «оригинальные» обороты речи.
(iii) Избыточность субстанциальной реализации языковой единицы (ее «кодирования») измеряется разницей между количеством отличительных признаков субстанции, требуемых для ее отождествления, и ее информационным содержанием. Определенная степень избыточности необходима для противодействия шумам. Наше предшествующее рассуждение об устойчивости субстанции, в которой реализуется язык, и о необходимости некоторого «запаса прочности», позволяющего различать реализации контрастирующих элементов, можно также подвести под более общий принцип избыточности (ср. § 2.2.10).
(iv) Язык будет более эффективным (с точки зрения теории информации), если синтагматическая длина единиц будет обратно пропорциональна вероятности их появления. То, что в языке действительно имеет силу подобный принцип, подтверждается тем фактом, что наиболее употребительные слова и выражения обычно бывают более короткими. Это было сначала эмпирическим наблюдением, а не дедуктивным (подлежащим проверке) выводом из определенных теоретических предпосылок; в дальнейшем для выражения связи между длиной и частотой употребления была выработана специальная формула, известная как «закон Ципфа» (по имени ее автора). (Мы не будем приводить здесь «закон Ципфа» или обсуждать его математическую и лингвистическую основу; он подвергся видоизменениям в последующих работах.) В то же время следует признать, что длина слова в буквах или звуках (в том смысле, в каком мы употребляли термин «звук» до сих пор) не обязательно служит непосредственной мерой синтагматической длины. Этот чрезвычайно важный момент (к которому мы еще вернемся) не всегда подчеркивался в статистических исследованиях языка.
2.4.7. ДИАХРОНИЧЕСКИЕ ИМПЛИКАЦИИ *Поскольку язык развивается во времени и «эволюционирует», удовлетворяя изменяющиеся потребности общества, его можно рассматривать как гомеостатическую (или «саморегулирующуюся») систему; при этом состояние языка в каждый данный момент «регулируется» двумя противоположными принципами. Первый из них (иногда называемый принципом «наименьшего усилия») заключается в тенденции увеличить до предела эффективность системы (в том смысле, в каком слово «эффективность» толковалось выше); его действие заключается в приближении синтагматической длины слов и высказываний к теоретическому идеалу. Другой принцип заключается в «стремлении быть понятым»; он тормозит действие принципа «наименьшего усилия» путем введения избыточности на разных уровнях. Следует, таким образом, ожидать стремления сохранить, при изменяющихся условиях общения, обе тенденции в равновесии. Из того, что среднее количество шумов постоянно для разных языков и разных стадий развития одного языка, следует, что степень избыточности языка постоянна. К несчастью, нельзя (по крайней мере в настоящее время) проверить гипотезу о том, что языки сохраняют оба названных противоположных принципа в «гомеостатичееком равновесии». (Мы рассмотрим этот вопрос ниже.) Тем не менее эта гипотеза является многообещающей. Ее вероятность поддерживается «законом Ципфа», а также тенденцией (отмеченной задолго до начала теоретико-информационной эры) к замене слов более длинными (и более «яркими») синонимами, особенно в разговорном языке, в тех случаях, когда частое употребление тех или иных слов лишает их «силы» (снижая их информационное содержание). Крайняя быстрота смены жаргонных выражений объясняется именно этим.
Так же можно объяснить явление «омонимического конфликта» и его диахроническое разрешение (с большой полнотой проиллюстрированное Жильероном и его последователями). «Омонимический конфликт» может возникнуть тогда, когда принцип «наименьшего усилия», действуя совместно с другими факторами, обусловливающими звуковые изменения, приводит к снижению или уничтожению «запаса прочности», необходимого для различения субстанциальных реализаций двух слов, и таким образом к образованию омонимии. (Термин «омонимия» в наши дни обычно употребляется и по отношению к омофонии, и по отношению к омографии; ср. § 1.4.2. В данном случае имеется в виду, конечно, омофония.) Если омонимы более или менее равновероятны в большом числе контекстов, «конфликт» обычно разрешается путем замены одного из этих слов. Хорошо известным примером служит исчезновение в современном английском литературном языке слова quean (первоначально означавшего 'женщина', а затем – 'распутница' или 'проститутка'), которое вступило в «конфликт» со словом queen 'королева' в результате утраты существовавшего ранее различия между гласными, представленными орфографически как еа и ее. Наиболее известным из специальной литературы примером омонимического конфликта является, вероятно, случай со словами, означающими 'кот' и 'петух' в диалектах юго-западной Франции. Различавшиеся как cattus и gallus в латинском языке, оба слова в результате звуковых изменений слились в [gat]. «Конфликт» был разрешен путем замены слова [gat] = 'петух' различными другими словами, в том числе местными вариантами слов faisan ('фазан') или vicaire ('викарий'). Использование второго из них, по-видимому, основано на уже существовавшей ранее в «жаргонном» употреблении связи между 'петухом' и 'викарием'. Теме «омонимия» посвящена весьма богатая литература (см. библиографию в конце книги).
2.4.8. УСЛОВНЫЕ ВЕРОЯТНОСТИ ПОЯВЛЕНИЯКак мы видели, появление отдельной единицы (звука или буквы, единицы выражения, слова и т. п.) может быть полностью или частично детерминировано контекстом. Теперь мы должны внести ясность в понятие контекстуальной детерминированности (или обусловленности) и вывести те импликации, которые оно имеет для лингвистической теории. Для простоты мы сначала ограничим свое внимание рассмотрением контекстуальной детерминированности, действующей в пределах синтагматически связанных единиц одного уровня языковой структуры; другими словами, мы в данный момент пренебрежем тем очень важным моментом, что комплексы единиц низшего уровня реализуют единицы высшего уровня, которые сами имеют контекстуально детерминированные вероятности.
Мы будем употреблять символы х и у как переменные, каждая из которых обозначает отдельную единицу или синтагматически связанную группу единиц; кроме того, мы допустим, что х и у сами находятся в синтагматической связи. (Например, на уровне единиц выражения х может обозначать /b/ или /b/ + /i/, а у – /t/ или /i/ + /t/; на уровне слов х может обозначать men 'мужчины' или old 'старые' + men, а у – sing 'петь' или sing + beautifully 'прекрасно'.) Как х, так и у имеют среднюю a priori вероятность появления – рх и ру соответственно. Подобным образом сочетание х + у имеет среднюю вероятность появления, которую мы обозначим как pху.
В предельном случае статистической независимости между х и у вероятность сочетания х + у будет равна произведению вероятностей х и у: рху = рх × ру. Этот фундаментальный принцип теории вероятности можно проиллюстрировать посредством простого числового примера. Рассмотрим числа от 10 до 39 (включительно) и обозначим через х и у цифры 2 и 7 в первой и второй позиции их десятичного представления: сочетание x и у будет, таким образом, обозначать число 27. В пределах рассматриваемого ряда чисел (исходя из предположения, что все 30 чисел равновероятны) рх = 1/3 и py = 1/10. Если бы мы «задумали число между 10 и 39» и попросили бы кого-нибудь отгадать задуманное число, его шанс угадать правильно (без помощи другой информации) был бы один из тридцати: рхy = 1/30. Но допустим, что мы сказали ему, что это число кратно 3. Ясно, что его шанс правильно отгадать вырастает до 1/10. С нашей точки зрения, более существенно (поскольку мы рассматриваем вероятность появления одного знака в контексте другого) то, что выбор одного из двух знаков не является больше статистически независимым от выбора другого. Вероятность у, если дано, что х = 2, равна 1/3, поскольку только три числа кратны 3 в данном ряду (21, 24, 27); а вероятность x, если дано, что у = 7, равна 1, поскольку только одно число в пределах данного ряда оканчивается на 7 и кратно 3. Можно обозначить эти равенства как py (x) = 1/3 и рх (у) = 1. Условная вероятность появления у в контексте х равна 1/3, а условная вероятность х при данном у равна 1. (Два выражения «в контексте» и «при данном» следует понимать как эквивалентные; оба употребительны в работах по статистической лингвистике.) Обобщая этот пример: если рх (у) = рх (то есть если вероятность х в контексте у равна его априорной, необусловленной, вероятности), то х является статистически независимым от у; если же вероятность появления х увеличивается или уменьшается с появлением у, то есть если рх (у) > рх или рх (у) > рх, то х «положительно» или «отрицательно» обусловлен у. Крайним случаем «положительной» обусловленности является, конечно, полная избыточность при рх (у) = 1 (у предполагает х), а крайним случаем «отрицательной» обусловленности – «невозможность», то есть рх (у) = 0 (у исключает х). Важно иметь в виду, что контекстуальная обусловленность может быть и «положительной» и «отрицательной» (в том смысле, в каком эти термины здесь употребляются), а также что вероятность х при данном у не всегда, а точнее, лишь в редких случаях, равна вероятности у при данном х.
Необходимым условием того, чтобы результаты какого бы то ни было статистического исследования представляли интерес для лингвистики, является разграничение между различными видами обусловленности. Как мы видели выше, синтагматические отношения могут быть линейными или нелинейными; поэтому и обусловленность может быть линейной или нелинейной. Если х и у линейно связаны, то при любой рх (у) мы имеем дело с прогрессивной обусловленностью в тех случаях, когда у предшествует х, и с регрессивной в тех случаях, когда у следует за х. Независимо от того, является ли обусловленность прогрессивной или регрессивной, х и у могут непосредственно соседствовать (находиться рядом в линейно упорядоченном синтагматическом комплексе); в этом случае, если х обусловлен у, мы говорим о переходной (transitional) обусловленности. Многие популярные описания статистической структуры языка склонны изображать дело так, будто условные вероятности, действующие на всех уровнях языковой структуры, непременно предполагают линейную, переходную и прогрессивную обусловленность. Это, разуме ется, не так. Например, условная вероятность появления определенного существительного в качестве субъекта или объекта при определенном глаголе в латыни не зависит от относительного порядка, с каким слова встречаются во временной последовательности (ср. § 2.3.5); употребление префиксов un– и in– в английском языке (в таких словах, как unchanging 'неизменный' и invariable 'неизменный') регрессивно обусловлено; возможность появления определенной единицы выражения в начале слова может быть «положительно» или «отрицательно» обусловлена наличием некоторой единицы выражения в конце слова (или наоборот) и т. д.
Конечно, в принципе можно подсчитать условную вероятность любой единицы относительно любого контекста. Существенно, однако, правильно выбрать контекст и направление обусловленности (то есть, скажем, подсчитывать рх (у), а не рy (x)) в свете того, что уже известно об общей синтагматической структуре языка. (Определенный класс единиц X может предполагать или допускать появление единиц другого, синтагматически связанного с ним класса Y на определенном по отношению к нему месте (и может также исключать возможность появления единиц третьего класса Z). При условии, что это так, можно подсчитать условную вероятность отдельного члена класса Y). Результаты будут иметь статистический интерес тогда, и только тогда, когда рх (у) или рy (x) будут существенно отличаться от рх и рy.
2.4.9. ПОЗИЦИОННЫЕ ВЕРОЯТНОСТИ АНГЛИЙСКИХ СОГЛАСНЫХ *Вероятности можно также подсчитывать для отдельных структурных позиций. Например, в таблице 4 для каждого из 12 согласных устной английской речи приводятся 3 ряда вероятностей: (i) априорная вероятность, средняя для всех позиций; (ii) вероятность в позиции начала слова перед гласными; (iii) вероятность в позиции конца слова после гласных.
Таблица 4
Вероятности некоторых английских согласных в различных позициях в слове
[t] | 0,070 | 0,072 | 0,105 |
[n] | 0,063 | 0,042 | 0,127 |
[l] | 0,052 | 0,034 | 0,034 |
[d] | 0,030 | 0,037 | 0,039 |
[h] | 0,026 | 0,065 | - |
[m] | 0,026 | 0,058 | 0,036 |
[k] | 0,025 | 0,046 | 0,014 |
[v] | 0,019 | 0,010 | 0,048 |
[f] | 0,017 | 0,044 | 0,010 |
[b] | 0,016 | 0,061 | 0,0005 |
[p] | 0,016 | 0,020 | 0,008 |
[g] | 0,015 | 0,027 | 0,002 |
Можно заметить существенные различия частотностей отдельных согласных в разных позициях в слове. Например, из перечисленных единиц [v] – наименее частая в позиции начала слова, но третья по частотности в позиции конца слова; с другой стороны, [b] – третья по частотности единица в начальной позиции слова, но наименее частая в позиции конца слова (за исключением [h], который вообще не встречается на конце. NB: мы говорим о звуках, а не буквах). Другие (как [t]) имеют высокую вероятность или (как [g] и [р]) низкую вероятность для обеих позиций. Также заметим, что диапазон колебаний между наивысшей и наименьшей вероятностью больше для конца слова, чем для начала. Факты этого рода получают отражение в описании статистической структуры фонологических слов английского языка.
Выше мы говорили (в связи с «законом Ципфа»; см. § 2.4.6), что число звуков или букв в слове не является непосредственной мерой его синтагматической длины, определяемой в терминах теории информации. Причина этого, конечно, в том, что не все звуки или буквы равновероятны в одном контексте. Если бы вероятность фонологического или орфографического слова была прямо связана с вероятностями составляющих его элементов выражения, можно было бы получить вероятность слова перемножением вероятностей элементов выражения для каждой структурной позиции в слове. Например, если х в два раза вероятнее у в начальной позиции, а а вдвое вероятнее b в конечной позиции, можно ожидать, что хра будет встречаться в два раза чаще, чем yra или xpb, и в четыре раза чаще, чем ypb. Но это предположение не оправдывается в конкретных случаях, что ясно из рассмотрения нескольких английских слов. Элементы выражения, реализуемые посредством [k] и [f], более или менее равновероятны в начале слова, но слово call встречается намного чаще, чем fall (как показывают различные опубликованные частотные списки для английских слов); хотя элемент, реализуемый посредством [t], имеет вероятность появления в конечной позиции слова почти в 50 раз большую, чем вероятность элемента, реализуемого посредством [g], слово big встречается примерно в 4 раза чаще, чем bit, и т. д.
Вероятности для начальной и конечной позиций, используемые для этих расчетов (см. табл. 4), основаны на анализе связного текста. Это означает, что частота появления определенного согласного, встречающегося в относительно небольшом количестве высокочастотных слов, может превысить частоту появления другого согласного, встречающегося в очень большом количестве низкочастотных слов (ср. замечания, сделанные в § 2.4.1 в связи с понятием «функциональной нагрузки»). Согласный [ð], который встречается в начале таких английских слов, как the, then, their, them и т. д., иллюстрирует эффект такого перевеса. В начальной позиции это наиболее частый из всех согласных с вероятностью около 0,10 (ср. вероятность 0,072 для [t], 0,046 для [k] и т. д.). Но этот согласный встречается только в горсточке разных слов (менее чем в тридцати в современном языке). Напротив, начальное [k] мы находим во многих сотнях разных слов, хотя вероятность его появления в связном тексте более чем в два раза меньше, чем вероятность появления [ð]. Сравнение всех английских слов, реализуемых как согласный + гласный + согласный (что само по себе является весьма обычной структурой для английских фонологических слов), показывает, что вообще существует больше слов с высокочастотным начальным и конечным согласным, чем слов с низкочастотным начальным и конечным согласным, и что первые к тому же обычно имеют большую частоту появления. В то же время следует подчеркнуть, что некоторые слова значительно более частотны или значительно менее частотны, чем можно было бы предсказать, исходя из вероятностей составляющих их элементов выражения.
2.4.10. «СЛОИ» ОБУСЛОВЛЕННОСТИХотя до сих пор мы рассматривали вопрос о контекстуальной детерминированности по отношению к условным вероятностям, существующим среди единиц одного уровня, ясно, что появление того или иного элемента выражения в весьма значительной степени определяется контекстуальной вероятностью фонологического слова, в которое он входит. Например, каждое из трех слов, записываемых как book, look и took, характеризуется частой встречаемостью: они отличаются друг от друга фонологически (и орфографически) только начальным согласным.
С точки зрения грамматической структуры английского языка вероятность контраста между этими тремя словами в реальных высказываниях относительно мала (и совершенно не связана с вероятностями начальных согласных). Слово took отличается от двух других в ряде отношений, прежде всего тем, что оно реализует прошедшее время глагола. Поэтому оно более свободно, чем look и book, появляется рядом с такими словами и словосочетаниями, как yesterday 'вчера' или last year 'в прошлом году' (для look и book фонологические слова, соответствующие took, – это слова, записываемые как looked и booked); далее, в качестве подлежащего при took может выступать he 'он', she 'она' или it 'оно' или существительное в единственном числе (he took 'он взял' и т. п., но не he look или he book и т. п.); и, наконец, оно не может встречаться после to (например, I am going to took неприемлемо). Но слова book и look также отличаются друг от друга грамматически. Каждое из них может быть употреблено как существительное или глагол в соответствующем контексте (следует помнить, что фонологическое слово может быть реализацией более чем одного грамматического слова; см. § 2.2.11). Хотя look гораздо чаще встречается как глагол ('смотреть'), a book – как существительное ('книга'), это различие менее существенно по сравнению с такими грамматическими фактами не статистической природы, как то, что в качестве глагола слово book (то есть 'заказать' и т. п.), в отличие от look, может иметь при себе существительное или именное словосочетание в функции прямого дополнения (I will book my seat 'Я закажу место', Не is going to book my friend for speeding 'Он собирается привлечь к ответственности моего друга за превышение скорости'; слово look здесь невозможно); look же обычно требует «предложного сочетания» (I will look into the matter 'Я рассмотрю [этот] предмет'; букв, 'я буду смотреть в [этот] предмет', They never look at me 'Они никогда не смотрят на меня'; слово book здесь невозможно). По-видимому, в большинстве английских высказываний, произносимых говорящими в повседневной речи, смешение слов book и look исключается в силу грамматических ограничений того или иного рода. И это совершенно типично для минимально-контрастирующих фонологических слов в английском языке.
Но рассмотрим теперь относительно небольшое множество высказываний, в которых как book, так и look грамматически приемлемы. Носителю английского языка совсем не трудно представить себе такие высказывания; при случае они могут быть произведены или услышаны. Примером могло бы служить I looked for the theatre 'Я искал театр': I booked for the theatre 'Я резервировал место в театре'. Можно допустить, в интересах доказательства, что слушающему было «передано» в этих высказываниях, без значительных искажений из-за «шумов» в «канале», все, за исключением начальных согласных слов booked или looked. В этом случае слушающий столкнется с необходимостью предсказать, основываясь на избыточностях в языке и учитывая ситуацию высказывания, которое из двух слов имел в виду говорящий. (Для простоты предположим, что cooked 'стряпал' и т. п. невозможны или весьма маловероятны в данной ситуации.) Хотя можно предположить, что looked встречается намного чаще, чем booked, в любой представительной выборке английских высказываний, однако нам совершенно ясно, что появление theatre значительно повышает вероятность слова booked. Очень трудно сказать, какое из слов – booked или looked – вероятнее в сочетании с for the theatre, но в той или иной конкретной ситуации выбор одного из них может оказаться детерминированным в большей степени, нежели другого. Это очевидно из сопоставления следующих двух, более длинных высказываний:
(i) I looked for the theatre, but I couldn't find it. 'Я искал театр, но не нашел его'.
(ii) I booked for the theatre, but I lost the tickets. 'Я резервировал место в театре, но потерял билеты'.
Слово booked, по-видимому, контекстуально исключено в (i), а looked – в (ii). Однако и сама ситуация, включающая предшествующий разговор, может также вводить разнообразные «пресуппозиции», детерминирующая сила которых не ниже, чем у слов but и couldn't find в (i) и but и tickets в (ii). Если это так, то эти пресуппозиции уже «обусловят» то, что слушающий «предскажет» (то есть, собственно говоря, услышит) looked, а не booked (или наоборот) в более коротком «обрамлении» I -ooked for the theatre. Пока что можно обозначить эти вероятности, выводимые из совместного появления одного слова с другим и «пресуппозиций» конкретной ситуации высказывания, как «семантические». (В последующих главах мы выделим различные уровни приемлемости внутри того, что здесь мы относим к «семантике».)
Наш пример был сильно упрощен: мы выделили только три уровня обусловленности (фонологический, грамматический и семантический) и исходили из того, что только одна единица выражения теряется, или искажается, из-за «шумов». Эти упрощения, однако, не затрагивают общего вывода. Если обратиться к рассмотрению конкретных высказываний, это приведет к признанию того, что семантические вероятности важнее грамматических, а грамматические важнее фонологических. Поскольку невозможно (по крайней мере при настоящем состоянии лингвистических исследований) выделить все семантически релевантные факторы внешних ситуаций, в которых фигурируют отдельные высказывания, оказывается также невозможным подсчитать вероятность, а потому и информационное содержание какой-либо их части. Это один из моментов, который уже подчеркивался нами, когда речь шла о функциональной нагрузке и теории информации (см. § 2.4.1).