Текст книги "Фреймы для представления знаний"
Автор книги: Марвин Минский
сообщить о нарушении
Текущая страница: 4 (всего у книги 12 страниц)
2.2. Рассуждение
Лингвистическая деятельность человека требует от него использования образований более крупных, чем те, которые могут быть описаны с помощью грамматических правил, а это в еще большей степени затрудняет понимание вопросов, связанных с разграничением синтаксиса и семантики. Рассмотрим следующую басню (У.Чейф, 1972):
«Жили-были волк и ягненок. Однажды увидел волк, что ягненок пьет воду из реки, и появилось у него желание съесть ягненка. Решил он найти себе хоть какое-то оправдание и, несмотря на то, что сам находился выше по течению, обвинил ягненка в том, что тот взбалтывает воду и не дает ему пить…»
Чтобы понять этот отрывок, надо ясно представить себе, что волк лжет! Чтобы понять ключевую фразу "несмотря на то, что...", надо знать, что жидкость не может двигаться вверх по течению, а это, в свою очередь, требует от нас понимания самих слов "вверх по течению". В рамках декларативной, основанной на исчислении предикатов логической системы фразу "выше по течению" можно задать в виде некоторой формулы, например:
[А находится выше по течению, чем В] / [Событие Т.B А поток мутный] => [Существует [Событие U.В В поток мутный]] / [U позже Т].
Однако более полное определение было бы гораздо сложнее. Например, как записать тот факт, что потоки воды, перемещая какие-либо предметы, обычно не изменяют их расположения относительно друг друга? Логик мог бы попытаться доказать его, исходя из достаточно сложной совокупности "локальных" аксиом и соответствующих правил индуктивного вывода. Представим эти знания с помощью особой структуры данных, которая автоматически переориентирует связи пространственных описаний с терминалов одного фрейма на терминалы другого в рамках одной и той же системы фреймов. И хотя это может рассматриваться как некоторый вид логики, здесь используются определенные механизмы такие же, как и для пространственного мышления.
Во многих случаях нам приходится иметь дело с изменяющимися во времени ситуациями или причинно следственными отношениями. Так, концепции «течение реки» может соответствовать система фреймов, аналогичная той, что показана на рис.2-1, где S1, S2 и S3 обозначают отдельные абстрактные участки реки. Если волк в соответствии с ранее рассмотренной схемой находится слева, а ягненок от него – справа, то S1, S2 и S3 «двигаются» мимо них также слева направо. Наше воображение именно так представляет себе эту картину, а для ее изменения требуются некоторые умственные усилия. Допустим, что участки реки S1, S2 или S3 видны только тогда, когда они располагаются прямо против волка или ягненка. Если последний взбалтывал воду на участке S3, то система фреймов укажет на то, что, поскольку этот участок перестанет быть видимым и не будет находиться вблизи волка, его претензии к ягненку безосновательны. Более подробная система могла бы иметь промежуточные фреймы, но ни для одного из них участок реки возле волка не был бы загрязнен.
Существует еще много нюансов, в которых следует разобраться. Что означает слово "взбалтывал" и почему это мешало волку пить? В обычных условиях с помощью элементов S могут быть представлены просто какие-то плавающие предметы, однако здесь S3 взаимодействует со словом «взбалтывал» и в результате получается нечто противоречащее действию «пить». Или такой вопрос: было ли доказано, что взбалтывание воды в реке обусловливает присутствие грязи в воде на участке S3, или же это указывается в одном из заранее заготовленных значений данного действия?
Почти любое событие, действие, изменение, перемещение объектов или даже передача информации в первом приближении могут быть представлены обобщенным событием в виде системы, состоящей из двух фреймов. Система фреймов может иметь пробелы для действующих лиц (агентов), инструментов, побочных явлений, предварительных условий, обобщенных траекторий, но, в отличие от переходных глаголов в теориях формальных грамматик, здесь имеется дополнительная возможность в явном виде представлять возможные изменения. Чтобы проверить, понял ли кто-либо то или иное событие "ли действие, можно построить соответствующую ему пару фреймов типа "до-после".
Однако использование подобных пар фреймов для представления ситуационных изменений совсем небезошибочно, поскольку ссылки на эти пары фреймов не адекватны описанию различий между ними. Это вызывает неудобства при таких видах деятельности, как планирование или проведение абстрактных рассуждений, поскольку не существует явных точек включения в подобные структуры информации о трансформациях. В развитие этого варианта можно ввести пары узлов, указывающие на соответствующие терминалы: в этом случае мы получили бы структуры, подобные "записям сходства" П.Уинстона(1970). Кроме того, можно поместить на верхний уровень системы фреймов данные, несущие в себе информацию о различиях между фреймами в парах "до-после", выраженных в более общем виде.
В своей работе по теории "семантической зависимости" Р.Шенк(1972) пытается найти смысловое представление для сложных утверждений, таких, например, как «Сэм верит в то, что Джон дурак». В этих предложениях предмет, на который направлено действие, не может быть представлен как реальный физический объект. Это, однако, не снимает вопроса о «концептуализации» этого предмета и представлении его с помощью ситуаций подобно тому, как это выглядит при разборе следующего диалога:
– Не хотите ли Вы кусочек шоколада?
– Нет, я только что съел трубочку с мороженым.
Р.Шенк считает достаточным наличие ограниченного набора "основных концептуализации" и типов связей между ними для того, чтобы с их помощью представлять смысл сложных высказываний. Я затрудняюсь сказать, насколько правилен этот подход, например, можно ли с его помощью описать такое явление, как "поток".
Теория Р.Шенка включает в себя идею "концептуальных атрибутов", которые напоминают некоторые из наших терминалов фреймов, однако в ней сделана попытка представить результаты действий не с помощью отношений между парами фреймов, а в виде явных абстракций. Это порождает свои проблемы; например, было бы интересно узнать, достаточно ли одной (или даже нескольких) абстрактной концепции "причинам для работы системы "убеждений" или нет. Явно недостаточной выглядит попытка представить причинную связь с помощью некоторого условия или действия, необходимого для того, чтобы произошло какое-то событие. Не вдаваясь более в детали, я полагаю, что как только в рамках теории Р.Шенка будут разработаны некоторые проверки выполнимости действий, она станет мощным средством для представления знаний.
Работа Дж.Уилкса(1973а) по "семантике предпочтений" тоже, видимо богата идеями относительно того, как создавать структуры, подобные фреймам, из более простых элементов. Его предложения в отношении предпочтений объединяют в себе особые пути, при помощи которых можно было бы представлять задания отсутствия и процедуры, согласованные с более крупными фрагментами рассуждений. Я полагаю, что система Дж.Уилкса интересна еще и тем, что она отчетливо показывает нам способы, с помощью которых можно проводить некоторые полезные неформальные рассуждения, а также раскрывает механизм псевдодедукции, основанный на шаблонном принципе построения всей системы и на текущих процессах без привлечения тщательно разработанной формальной логической системы или без излишней заботы о непротиворечивости в рассуждениях.
Р.Абельсон(1973) работает над проблемами представления еще более сложных видов деятельности. Основываясь на элементах, подобных элементам Р.Шенка, он разрабатывает схемы, в которых взаимодействие различных понятий ведет к образованию сложных "предписаний" (scripts), т. е. ажурных или решетчатых сценариев в тщательно разработанных системах "убеждений". С их помощью он пытается отразить даже такие взаимодействия, как представление одного человека о той роли, которую он играет в планах другого действующего лица.
В своей работе Д.Макдермотт(1974) рассмотрел многие вопросы, связанные с представлением знаний. В его схеме для выработки правдоподобных заключений любые утверждения не просто принимаются на веру, но подлежат проверке, осуществляемой процессами, которые выражают "сомнения" и "убеждения"; по существу, данные, наличие которых предполагается по умолчанию (или поскольку они правдоподобны), сохраняются благодаря механизмам изменения убеждений, действующих, когда последние, зависимые предположения уже включены в работу. Д.Макдермотт особенно выделяет те вопросы, которые связаны с устранением ошибок, возникающих в любой системе в процессе поиска неформальных и правдоподобных заключений.
2.3. Смысловая структура рассуждений
«Слова... могут отражать качественные и относительные черты некоторой ситуации в их наиболее общем виде, как, впрочем, и описывать, вероятно, даже более удовлетворительно, ее особенности. Именно это обусловливает внутреннюю связь языка с процессами мышления. В психологическом плане восстановление любой имевшей место в прошлом ситуации выполняется для преодоления трудностей на базе прошлого опыта... Не следует, однако, думать, что человек, попавший в затруднительное положение, воссоздает более или менее подходящую ситуацию (и на ее основе находит для себя решение) без какого-либо поиска и выявления принципов перехода от одной ситуации к другой».
Ф.Бартлетт (1932)
Анализ предложений с помощью «глубинных падежей», разрабатываемых, например, С.Филмором(1968) и М.Селс-Мурсиа(1972), проводится с помощью структур, чем-то напоминающих фреймы. Сгруппированные главным образом вокруг глагола части предложения используются для того, чтобы заполнить конкретными данными пробелы в подобной фрейму структуре этого глагола с учетом различных вариантов возможного включения предлогов в это предложение. Для анализа предложений имеет смысл использовать именно те структуры, доминирующее положение, в которых принадлежит глаголам, поскольку именно это и происходит на практике.
Однако при более обширном анализе, выходящем за рамки отдельного предложения, такие структуры часто теряют свою самостоятельность и включаются в более крупные фрагменты рассуждении. Темой какого-либо отрывка из повествования в равной мере могут быть картина или действие, характеристика персонажа или то, что ой делает. Таким образом, при понимании рассуждения синтез глагольной структуры с конкретным заданием ее падежей может быть необходимым, но лишь преходящим этапом. По мере понимания предложения отдельные субструктуры следует объединять в расширяющих фреймах-картинах для того, чтобы построить на их основе еще более крупную картину. Действие, основное в некотором предложении, может, например, стать вспомогательным для характеристики одного из героев всего рассказа.
Я не предлагаю придерживаться концепции, утверждающей, скажем, что глаголы описывают локальные (в рамках отдельных предложений) структуры, а существительные – структуры глобальные, состоящие из отдельных параграфов или пунктов, хотя в первом приближении она могла бы оказаться полезной. Любая концепция может быть построена с помощью различных лингвистических представлений. Но обсуждаемая нами проблема не сводится к проблеме существительных или глаголов. Важно понимать, что преходящие семантические структуры, построенные во время синтаксического анализа (т.е. те структуры, которые лингвисты именуют "глубинными структурами" предложений), не идентичны более крупным (и более "глубоким") структурам, образующимся по мере того, как к ним подключаются связанные друг с другом лингвистические объекты.
Мне бы не хотелось, чтобы подобный акцент на имеющие лишь местное значение (или предметные) суперфреймы приводил к мысли о том, что между лингвистическими и нелингвистическими представлениями имеются коренные отличия. При более детальном рассмотрении этого вопроса станет, по-видимому, ясно, что существенная часть понимания и проведения рассуждении на основе здравого смысла во многом напоминает преобразования лингвистических структур и манипуляции ими. Фреймы, связанные со смыслом слов, будь то существительные, глаголы или другие части речи, несомненно, являются центрами концентрированного представления знаний о том, как связаны между собой различные предметы и явления, каким образом они используются и как они друг с другом взаимодействуют. Можно получить значительные преимущества в том случае, если бы удалось создать механизмы, в которых эти одинаковые структуры применялись бы для реализации процессов мышления, так и для понимания естественного языка.
Представим себе ориентированный на фреймы сценарий, который представляет собой структуру для понимания смысла повествований. В начале чтения какого-нибудь рассказа о нем известно очень мало, фактически только то, что это рассказ, но даже и этих скудных сведений на первых порах оказывается достаточно. Обычный фрейм рассказа в общем случае включает в себя пробелы, которые надо заполнить сведениями об окружающей обстановке, главных героях, основном событии, морали и т. д. И в самом деле, в любом правильно построенном повествовании вначале идет речь о действующих лицах и той среде, в которой будет развиваться действие; так, в басне о волке и ягненке сразу же говорится о двух непримиримых субъектах, находящихся у реки (это и есть окружающая обстановка), а затем указаны мотивы для соответствующего поведения волка. Слова "найти хоть какое-то оправдание" подготавливают нас к тому, что волк, видимо, сделает какие-то ложные утверждения.
Анализ каждого предложения следует проводить только до тех пор, пока содержащиеся в нем сведения могут быть полезны для заполнения более крупных структур. Таким образом, в терминалах расширяющейся смысловой структуры накапливаются указатели и дескрипторы, которые сообщают о дальнейших путях конкретизации заданий отсутствия. Терминал, с которым связан маркер "лицо женского рода", не сможет использовать такие задания, где присутствуют местоимения мужского рода. Я полагаю, что именно этим следует объяснить невозможность конкретизации терминалов фрейма стены с помощью заданий типа "стул" или "стол". По мере того, как продолжается рассказ, информация (когда это возможно) передается фреймам боле< высоких уровней для углубления и конкретизации сценария. В некоторых случаях к терминалу фрейма удается присоединить целый субфрейм, например описание одного из героев рассказа. Это может случиться тогда, когда терминал фрейма-рассказа согласуется с указателем верхнего уровня фрейма анализируемого предложения. Данные, содержащиеся в других предложениях, могут вместе с тем приводить и к образованию противоречивых ситуаций. Но что произойдет, если не удастся осуществить передачу данных на более высокий уровень, поскольку собеседник ожидал услышать рассказ другого" типа и не располагает терминалами, с помощью которых можно было бы усвоить новую порцию данных?
Будем продолжать считать, что у нашего собеседника в действительности имеется большое количество фреймов-рассказов, связанных между собой структурами поиска информации, которые будут нами рассмотрены позднее. Тогда первым шагом явится попытка включить новую информацию в текущий фрейм-рассказ. Если это не удается, следует выработать сообщение об ошибке, например: "здесь нет места для животного", что заставит заменить используемый фрейм другим, скажем, фреймом-рассказом о животных. Все предыдущие задания терминалов могут сохраниться, если у нового фрейма типы терминалов будут теми же самыми. Если же многие задания не подходят, следует попытаться применить другой, новый фрейм-рассказ. Если и здесь мы терпим неудачу, то есть два пути: либо начать все с начала и пытаться всю структуру строить заново (видимо, это самая важная интеллектуальная задача), либо полностью отказаться от дальнейших попыток и забыть все то, что было сделано для понимания рассказа. Это обычная реакция на неизвестные ранее формы повествования! Человек не может хорошо учиться, если разрывы между известным для него и неизвестным слишком велики: рассказы о животных не будут фактически понятны до тех пор, пока не сформированы персональные фреймы для волка, лисы, медведя и т. д.
Таким образом, при проведении рассуждении многочисленные фреймы и субфреймы объединяются в сети поиска информации. Атрибутивная или описательная информация может быть представлена с помощью простых структур, однако действия, временные последовательности, разъяснения и другие сложные вещи требуют более отработанных механизмов представления знаний. Мы должны признать, что все основные, очень трудные вопросы, относящиеся и к эпистемологии, и к лингвистике, концентрируются вокруг одной проблемы: как отыскать те способы, с помощью которых можно будет согласовывать сведения, поступающие от различных источников информации.
2.4. Перевод
Перевод дает возможность наблюдать механизм конкретизации заданий отсутствия в работе. При переводе басни о волке и ягненке с английского языка на японский требуется упомянуть о том месте у реки, где находятся действующие лица, хотя этого не требуется в английском варианте. В английском языке необходимо указывать время, хотя бы сказав «однажды...».
В японском языке принято характеризовать как место действия (хотя бы с помощью расплывчатой фраз "в некотором месте..."), так и время его свершения.
Я считаю, что сведения и о месте действия, и о его времени нужны людям для их более глубоких смысловых фреймов независимо от того, на каком языке они говорят. Следовательно, как только переводчик полностью поймет какое-нибудь предложение, задания отсутствия обеих типов сразу же будут в его распоряжении. Хорошие переводчики-синхронисты говорят так быстро, что можно лишь удивляться тому, как много могут они понять еще до того, как начнут говорить. Наша теория доказывает, что это не такое уж большое достижение, ибо если еще до того момента, как процесс согласования полностью завершит свою работу, будет найден подходящий фрейм, то все его задания отсутствия становятся доступными и могут быть включены в работу.
Перевод басни "Волк и ягненок" на японский язык, выполненный в соответствии с вполне приемлемой и поверхностной структурой, может выглядеть следующим образом:
Однажды в некотором месте на реке ягненок, пьющий воду, увидел волка, и этот волк этого ягненка съел под предлогом...
В японском языке более естественно сказать о том, что именно пил ягненок, чем-то, что он пил. В этом заключается один из способов, с помощью которых язык воздействует на процесс мышления: каждое особое лингвистическое правило концентрирует внимание на заполнении терминалов определенного типа. Если для какого-то человека привычным и связанным с действием пить является понятие "вода", то оно является заранее заготовленным значением для структуры, представляющей это действие. Заполнение этим понятием задания отсутствия будет вполне допустимым, если, например, в разговоре встретится фрейм действия "пить", участвующий в формировании структуры выходного предложения (фразы). Конечно, если утоление жажды происходит в непосредственной близости от реки, следует позаботиться о наличии каких-то дополнительных механизмов связи понятий "пить" и "река" с помощью понятия "вода". Кажется ясным, что если в каком-либо фрейме имеется пробел для представления одного из видов жидкости, утоляющей жажду, и этот пробел слабо связан со всей структурой, то он может быть легко вытеснен данным того же типа, сильно связанным с субфреймом, который подключается к исходному фрейму.
2.5. Активная и пассивная формы интеллектуальной деятельности
Традиционно видение и воображение рассматриваются как «пассивная» и «активная» формы восприятия. Действительно, в процессе зрительного восприятия (видения) человек анализирует картину с помощью выявленных в процессе сбора информации данных; это ограничивает его возможности уже потому, что преобладающим здесь выступает не поиск непротиворечивого и правдоподобного описания наблюдаемой сцены, а стремление согласовать «объективную» визуальную информацию с выбранным для целей представления фреймом. Воображение рисует нам значительно более разнообразнее картины, поскольку в этом случае задачей является подбор таких заданий терминалов, которые удовлетворяли бы нашим внутренним и, следовательно, изменяемым целям.
В языковых формах общения напрашивается аналогичное противопоставление. Если человек слушает своего собеседника, что предполагает проведение грамматического разбора, то для понимания текста ему требуется выстраивать отдельные слова в конструкции, отвечающие правилам грамматики и соответствующие как общему содержанию разговора, так и намерениям говорящего; это, конечно, резко уменьшает возможное число вариантов конкретизации заданий терминалов. Значительно большую свободу выбора предоставляет нам речь. Существует огромное число различных способов образования из отдельных фреймов предложений. Для выражения поставленных перед собой целей, будь то желание сообщить какую-либо информацию, убедить или ввести кого-то в заблуждение.
Подобные разграничения, однако, весьма опасны. Во многих случаях речь представляет собой прямой перевод данных, представленных в семантических структурах, в последовательность слов, тогда как слушание требует выполнения сложных и обширных построений для решения, в частности, проблемы понимания. Проведем аналогию между визуальным фреймом комнаты и фреймом, представляющим собой группу существительного в предложении при проведении рассуждении. И в том и в другом случае одна часть терминальных заданий является обязательной, а другая – нет. Например, стены в комнате совсем не должны быть чем-либо украшены, но каждый подвижный предмет не может не иметь соответствующих типов опор. Группа существительного может не содержать определителя числа, но не может обойтись без самого существительного или заменяющего его местоимения. Поверхностная структура оставляет человеку весьма ограниченный выбор вариантов, поскольку необходимым является в одном случае учет всех слов, включенных в предложения, а в другом – всех ключевых признаков анализируемых сцен.
При изучении языковых форм общения так же, как и процессов зрительного восприятия, совсем не следует ограничиваться рассмотрением только лишь поверхностных структур. У человека имеется множество вариантов для включения знаний в семантическую структуру или результатов действий в текущий контекст. Любой предмет характеризуется не только формой, но и своей историей. Присутствие его в данном месте и в данное время обычно не только чем-то обусловлено, но и несет в себе разную смысловую нагрузку, например, выступает как признак изменения отношений или как ключ к разгадке какой-то тайны.
Любое предложение может быть по-разному понято. При этом речь идет не о случайных (и во многом несущественных) двусмысленностях грамматического разбора, а о преднамеренно разных интерпретациях. Также как любую комнату можно рассматривать из разных мест, так и любое утверждение может быть проанализировано с различных точек зрения по тем вопросам, которые в нем затрагиваются. Это видно из следующего примера, каждое предложение которого имеет свои структурные особенности:
Он ударил по мячу.
По мячу ударили.
Сегодня имели место некоторым удары.
Поскольку такие варианты формально напоминаю? синтаксические активно-пассивные операции в трансформационных грамматиках, человек может не заметить различия в их смысловых значениях. Мы выбираем нужный нам вариант в соответствии с тематическими вопросами, т.е. в зависимости от того, что нас интересует: то, что сделал «он», или то, куда мог исчезнуть мяч, или то, что кто-то его повредил, и т.д. Наиболее просто ответить на такие вопросы, если заострить внимание на их существе и вызвать фрейм, относящийся главным образом именно к данной теме.
В соответствии с традиционными положениями теории трансформационных грамматик такие альтернативные фреймы не могут существовать независимо друг от друга, ибо они являются производными от одной глубинной структуры. Если, однако, допустить их не связанное друг с другом присутствие в долговременной памяти, можно получить определенные выгоды, подключив к каждому фрейму информацию о том, как его следует использовать. Впрочем, существуют (и на это справедливо указывают лингвисты) систематические "регулярности", которые свидетельствуют, что подобные трансформации могут практически с той же легкостью применяться и к незнакомым глаголам; все это уменьшает целесообразность отдельного существования таких альтернативных фреймов. У меня создалось впечатление, что теоретики-трансформационисты склонны верить в наличие особых центральных механизмов для управления изменения "семантической перспективы", хотя ясно, что разнообразие особенностей, связанных с отдельными словами, делает это технически маловероятным. Теория, разработанная в соответствии с излагаемыми в данной работе взглядами, должна предусматривать, что всякий раз, когда человек встречается с неизвестным ему употреблением слова (или самим словом), он использует процесс согласования для того, чтобы догадаться, правильно оно или ошибочно, к чему оно ближе всего, а затем приспосабливает систему трансформации внимания к этому слову. Я не могу сейчас указать, с помощью каких экспериментов можно было бы выявить различие между рассмотренными выше предположениями, но оно мне кажется важным.
Одни читатели могут возразить, что не следовало бы всё настолько усложнять, поскольку мы хотим объяснить лишь то, каким образом люди могут так быстро понимать предложения, другие – утверждать, что нам нужна более простая теория. Важно, однако, помнить следующее: на то, чтобы что-то понять, часто требуются минуты, часы или даже столетия.