Текст книги "Фреймы для представления знаний"
Автор книги: Марвин Минский
сообщить о нарушении
Текущая страница: 3 (всего у книги 12 страниц)
1.8. Перспективы и перемена точек наблюдений
«Умственные способности, необходимые для координации перспективных изображений, оказываются полностью сформированными у ребенка обычно к 8-9 годам и проявляются в следующих довольно независимых друг от друга формах. Во-первых, каждому положению наблюдателя соответствует определенная совокупность отношений между видимыми предметами, например, отношения „слева – справа“ или „спереди – сзади“... Они зависят от проекций и сечений, соответствующих плоскости изображения для данного наблюдателя (т. е. от перспективы). Во время этого последнего подэтапа шаг за шагом выявляется характер соответствия между точкой наблюдения и перспективой. Во-вторых, между каждой перспективой, связанной с данным положением наблюдателя, и любыми другими перспективами также существует соответствие, выражаемое особыми изменениями в отношениях типа „слева-справа“, „спереди-сзади“ и, следовательно, изменениями соответствующих проекций и сечений. Это соответствие между всеми возможными точками наблюдений обусловливает координацию перспектив... хотя еще только в элементарной форме».
Ж. Пиаже, Б. Инельдер (1956)
Когда мы двигаемся по комнате, очертания находящихся в ней предметов изменяются. Каким образом можно предвидеть или компенсировать эти изменения без полного повторного анализа всей сцены? Эффект от движения глаз и поворота головы довольно прост; предметы перемещаются в рамках видимой области пространства, но не меняют при этом своих очертаний; однако изменение позиции наблюдения является причиной значительных перемен, которые зависят как от угла, так и от относительных расстояний между предметом и наблюдателем. Эта проблема особенно важна для животных, двигающихся с большой скоростью, так как у них модель внешней среды должна быть образована различными, частично проанализированными видами изображений. Видимо, эта потребность, пусть даже в самом примитивном своём варианте, послужила главным стимулом к эволюционному развитию систем фреймов, а позже и других символьных механизмов.
Если имеется обычная комната, то перемещение вдоль пунктирной линии (рис.1.6) вызывает упорядоченное изменение в очертаниях четырехугольных стен. Прямоугольник, находящийся в непосредственной близости от стены, должен трансформироваться точно так же, как и сама стена. Если на левой стене в центре вычертить прямоугольник, то будет казаться, что он находится перед стеной, поскольку человек предполагает, что любой такой четырехугольник есть на самом деле прямоугольник и, следовательно, он должен лежать в плоскости, проектируемой аналогичным образом. На рис.1.7а оба прямоугольника, казалось бы, выглядят одинаково, однако тот прямоугольник, что находится справа, не согласуется с маркерами терминала для субфрейма "левый прямоугольник" (которые, например, требуют, чтобы левая сторона была длиннее правой).
Таким образом, этот прямоугольник, представленный с помощью фрейма «центральный прямоугольник», кажется нам выдвинутым вперед и параллельным центральной стене.
Итак, необходимо не просто присвоить четырехугольнику метку «прямоугольный», но и сделать то же самое для определенного фрейма, входящего в систему фреймов «прямоугольники». Двигаясь по стрелке (рис.1.7а), можно ожидать, что любая трансформация, применимая к системе верхнего уровня, будет применима и к любой из ее подсистем (рис.1.7б). Аналогично последовательность эллиптических проекций окружности на плоскость изображения содержит конгруэнтные и потому визуально неоднозначные пары, что и показано на рис.1.8. Но, поскольку предметы обычно располагаются в плоскости стен, мы предполагаем, что эллипс левой стены будет находиться слева на плоскости изображения, и что он подвержен тем же трансформациям, что и сама стена. Если предсказание не подтвердится, мы, очевидно, будем весьма удивлены.
Правдоподобно ли, что ограниченная, качественная, знаковая система может служить инструментом для адекватного представления перспективных преобразований. Люди все время недооценивают свои возможности по восприятию образов, например, в таком вопросе, какпереосмысливание пространственных отношений, при изменении точки наблюдения. Уже отмечалось, что люди, считающие себя обладателями хорошего пространственного видения, часто допускают качественные ошибки при описании вращения простого многоцветного куба. И даже, в тех случаях, когда мы в действительности способны высказать точные метрические суждения об объектах видимой сцены, мы не всегда делаем это; например, лишь немногих людей заставит задуматься изображение несуществующей реально пирамиды, показанной на рис.1.9. Это не пространственное изображение (перспектива) любой усеченной пирамиды. Если эта фигура была бы пирамидой, то все три ее ребра в своем продолжении сошлись бы в одной точке. Имея достаточный опыт, люди, без сомнения, могут высказывать более точные суждения, но для этого не требуются какие-либо другие механизмы. Если для выполнения некоторой работы непрофессионал использует десять фреймов, то специалист может применить тысячу и, таким образом, получить совсем иной порядок ее исполнения.
В любом случае для правильного предсказания изменений перспективы в наших системах необходимо, чтобы трансформация на верхнем уровне вызывала соответствующие трансформации в системах субфреймов. В первом приближении этого можно добиться с помощью одинаковых названий трансформаций. Тогда действия «двигаться вправо», заданное для фрейма комнаты, будет вызывать то же самое действие и для объектов, связанных с субфреймами стен этой комнаты.
Поскольку, однако, эта схема имеет серьезный дефект, то она и рассматривается здесь только лишь в качестве "первого приближения". Действительно, если вы стоите около левой стены и двигаетесь вдоль нее вперед, то предметы, расположенные вблизи этой стены, испытывают значительную трансформацию типа "двигаться-вправо", фронтальная стена подвергнется преобразованию типа "приблизиться", а правая стена испытывает трансформацию типа "двигаться влево". Таким образом, вопрос о правильном предсказании изменений перспективы оказывается далеко не таким легким, чтобы его можно было решить простым переносом типов операций более низкие уровни системы.
1.9. Заслонения
Когда мы двигаемся вправо, крупный предмет, находящийся в центре на переднем плане, вероятно, левой своей стороной будет заслонять любой более удаленный предмет. При планировании перемещений человек должен иметь возможность предвидеть некоторые из этих изменений. Часть предметов может стать невидимой, а другая их часть – видимой. В нашем исходном примере куба проблемы заслонения не существует, поскольку это тело является полностью выпуклым; исчезновение целой грани и всех ее связей может быть легко восстановлено по данным, содержащимся на верхнем уровне. Однако в комнате, которую обычно следует рассматривать как тело вогнутой формы, отдельные элементы объектов, относящиеся к различным терминалам, могут заслонять друг друга. Рассмотрим в этой связи две экстремальные стратегии.
Локальные группы предметов. Так же, как и с различными видами одиночных объектов, при рассмотрении знакомых групп частично загораживающих друг друга предметов можно воспользоваться специальной системой фреймов, соответствующей данной конфигурации объектов исходного изображения. Для примера рассмотрим сцену, состоящую из стола и стула (рис.1.10 и табл.1.1).
Если к фрейму, представляющему эту сцену применить те же, что и ранее, трансформации перспектив, то это позволит в первом приближении решить проблему заслонения.
Такой подход хорош для компактных, заранее известных групп объектов, но он не дает нужных результатов в тех случаях, когда одни предметы загораживают от дельные детали других объектов, расположенных в углублениях комнаты. Для технических применений простота данной схемы не компенсирует частые ошибки, возникающие при ее использовании, однако, как теория человеческих действий она может быть достаточно хорошей.
Отметим, что умственная деятельность, направленная на выяснение заслонений, протекает медленно и ее не следует стремиться объяснить на основании упрощенных представлений, связанных главным образом со скоростью выполнения операций.
Глобальная система заслонений. Более глубокая стратегия должна предусматривать, чтобы все фреймы пространственных изображений (перспектив) дополняющая единую, центральную систему фреймов зрительного восприятия образов. Терминалы такой системы должны ответствовать отдельным элементам внутреннего представления пространства среды, а трансформации – определять выявленные законы перспективы, согласно которым одни элементы по-разному заслоняют другие для различных точек наблюдения.
Если на самом деле у человека существовала бы такая макросистема, то была бы она врожденной или же сформировалась в результате обучения? Приведенная выше цитата из работы Ж.Пиаже и Б.Инельдер служит подтверждением тому, что дети до десятилетнего возраста не обладают подобными макроструктурами.
1.10. Образы и системы фреймов
«Каждый человек охотно согласится с тем, что между двумя видами ощущений – непосредственными, когда человек, например, страдает от сильной жары или ему приятно разливающееся по всему телу тепло, и ощущениями, воскрешаемыми в памяти или предвкушаемыми благодаря своему воображению, имеется значительное различие. Эти наши способности могут имитировать восприятия органов чувств, но с их помощью невозможно достигнуть силы и живости первоначального чувства... Самая яркая мысль все. же слабее самого притупленного ощущения».
Д. Хьюм (1963)
Теория зрительного восприятия должна быть, по нашему мнению, одновременно и теорией воображения, поскольку и та, и другая имеют одни и те же конечные цели: конкретизацию заданий терминалов фреймов. Каждый из нас согласится с Д.Хьюмом в том, что имеется различие между зрительным восприятием и ощущениями. Д.Хьюм утверждает, что это различие проистекает вследствие того, что восприятие по своей природе является мгновенным и непосредственным, тогда как вызываемые в памяти образы получаются рекомбинацией заполненных «впечатлений», а при хранении, поиске и преобразованиях этих структур каким-то Образом теряется их выразительность. Я предполагаю, что зрительное восприятие кажется более живым, нежели воображение, ибо его задания менее подвижны. Они более стойко сопротивляются попыткам других процессов изменить их. Для того чтобы изменить описание непосредственно видимой сцены, наша система зрительного восприятия, вероятно, будет вынуждена изменить эту сцену – ни больше и ни меньше. Для человеческой фантазии, конечно же, подобных жестких ограничений не существует.
В то же время сами "зрительные" задания не являются абсолютно негибкими; любой может научиться в уме изменять, представленную на чертеже изометрию куба. Существуют так называемые "двусмысленные" фигуры, которые можно легко описать различным образом. В этом случае изменение фрейма равнозначно изменению "описательной точки зрения", причем действие или преобразование носит символьный, а не физический характер. В любом случае существуют такие психические состояния, при которых фантазии менее гибки, чем "непосредственные восприятия", а иногда даже и более "ярки".
1.11. Априорное означивание
Как мы уже упоминали, целью работы механизмов восприятия и воображения является конкретизация заданий терминалов фреймов, при этом воображение оставляет человеку больший простор для выбора деталей и различных вариантов этих заданий. По-видимому, фреймы никогда не хранятся в долговременной памяти с незаданными значениями своих терминалов. Каждый терминал фрейма в действительности непрочно связан со своими заданиями отсутствия, которые чаще всего бывают полезны, но иногда могут препятствовать процессу поиска нужного фрейма.
Так, если вам скажут: "Джон ударил ногой по мячу", то, видимо, вы не думаете о каком-то чисто абстрактном мяче, а представите себе вполне определенные его характеристики: размер, цвет, массу, которые, однако, пока еще неизвестны. Возможно, что возникший в вашей памяти образ чем-то напоминает вам самый первый мяч или тот, которым вас больно ушибли, или, может быть, тот самый последний мяч, который вы держали в своих руках. В любом случае вашему воображению недостает остроты (эффекта "присутствия"), поскольку те процессы, которые контролируют ход согласования и оказывают влияние на непрочно связанные с терминалами задания отсутствия, только лишь подтверждают или отвергают их пригодность и не имеют связи с реальной действительностью.
Задания отсутствия должны оказывать тонкие, идеосинкразическне воздействия на те мыслительные операции, с помощью которых человек проводит аналогии, делает обобщения и вырабатывает суждения, особенно когда внешние влияния на них достаточно слабы. При правильном выборе эти стереотипы могут служить в качестве хранилища ценных набросков планов, в противном случае они могут образовывать наборы иррациональных данных парализирующего действия.
1.12. Системы фреймов и конкретные мыслительные операции Пиаже
«Каковы в действительности условия, необходимые для формирования формального мышления? Ребенок должен в уме не только оперировать с предметами, иными словами, мысленно выполнять возможные над ним действия, но он должен также „отражать“ в себе эти операции при отсутствии предметов, когда последние заменяются на словесные формулировки. Это „отражение“ есть мысль, достигшая второй стадии (стадии формальных операций). Конкретное мышление является представлением о возможном действии, а формальное мышление – представлением представления о нем. Поэтому нет ничего удивительного в том, что система конкретных 0перацнй должна полностью сформироваться в течение последних лет детства (к 11-12 годам) еще до того, как она получит свое представление с помощью формальных операций. По своим функциям формальные операции не отличаются от конкретных за исключением того, что они применяются к гипотезам или утверждениям абстрактной системы „вывода“, которая управляет конкретными операциями».
Ж. Пиаже (1971)
Я считаю, что имеется сходство между мыслями Пиаже о конкретных операциях и идеей использования трансформаций между фреймами системы. Некоторые виды логических операций могут быть легко реализованы на базе фреймов путём замены в них одних заданий отсутствия другими. Например, не вызовет затруднений попытка аппроксимации логических транзитивностей; так, силлогизмы вида: «Все, что принадлежит А, принадлежит В, и все, что принадлежит В, принадлежит С, =>, все, что принадлежит А, принадлежит С», должны естественным образом встречаться при подстановках субфреймов в терминалы фрейма. Я не думаю, что это общее правило универсально, но считаю, что вследствие транзитивности сменяющих друг друга субфреймов в некоторых случаях воспользоваться им будет полезно.
В дополнение к этому можно предполагать, что к справедливости высказываний вида: Большинство, относящееся к А, относится к В, и большинство, относящееся к В, относится к С, => большинство, относящееся к А, относится к С", следует относиться с той же степенью доверия, даже если иногда это не соответствует действительности.
Ясное понимание вопроса о том, что же может быть достигнуто на базе простейших операций с фреймами, было бы весьма ценным и актуальным. Значительным шагом в этом направлении, мне думается, явилась разработанная Дж.Муром и А.Ньюэллом(1973) процедура "выравнивания и покрытия" для их программы MERLIN. Эта процедура связана с известным в математической логике алгоритмом унификации (см.Н.Нельсон "Искусственный интеллект",1973), если известны фреймы А и В, то результаты ее работы могут быть проинтерпретированы (если не слишком вдаваться в детали) следующим образом:
Можно рассматривать А как вид В, если имеется "отображение" или фрейм-трансформация С, указывающая, каким образом (может быть даже с помощью каких иных отображений") терминалы, относящиеся к А, могут рассматриваться в понятиях В-терминалов.
В упомянутой выше работе метод изменения точек зрения используется, чтобы предложить ряд новых интерпретаций таким основным стратегиям, как целенаправленность, индукция и использование новых знаний.
Кроме того, авторы высказывают ценные предложения, каким образом можно в машинных программах реализовать основную идею теории фреймов.
По теории Ж.Пиаже способности детей к проведению рассуждений, как с помощью трансформаций, так и о них самих проявляются с переходом мышления ребенка на стадию формальных операций. Для различных видов умственной деятельности эти способности могут проявляться не одновременно и не синхронно по отношению друг к другу. Чтобы проводить более сложные рассуждения и освободиться от полезной, но малонадежной логики манипулирования с заранее заготовленными значениями, человек должен научиться оперировать с самими трансформациями, поскольку подобные преобразования содержат в себе сведения, необходимые, для более сложных форм умственной деятельности. В создаваемых для систем ИИ моделях можно было бы попытаться заставить ее (систему) читать свои собственные программы. Возможная альтернатива заключается в том, чтобы представить (с избыточностью) информацию о процессах иным способом. Сотрудники нашей лаборатории (Лаборатория искусственного интеллекта Массачусетского технологического института ), разрабатывающие программу, "понимающую программы", обычно приходили к мнению, что в них должны содержаться "комментарии" для более четкого выражения намерений, предпосылок и целей эти комментарии (в настоящее время) обычно записываются на специализированных языках.
В этой связи возникает важный вопрос о цели разработки нашей теории. Мышление на базе "схем", в основе которого лежит согласование сложных ситуаций со стереотипными структурами фреймов, явно недостаточно для некоторых видов умственной деятельности. Очевидно, что взрослые люди, думая о чем-либо, используют для своих целей ранее сформировавшиеся собственные представления. Если представить себе "формальные" операции в виде процессов, которые могут изучать и критиковать наши ранее сформировавшиеся представления (в виде фреймов или любом другом), то с их помощью можно создавать новые структуры, которые будут соответствовать "представлениям о представлениях". У меня, однако, не сложилось еще определенного мнения о той роли, которую могли бы играть системы фреймов в этих более сложных видах умственной деятельности.
Та же стратегия предполагает, что непосредственное использование фреймов мы связываем (схематично, по крайней мере) с "конкретными" операциями Ж.Пиаже. Если это так, то я поддерживаю тезис Ж.Пиаже о том, что позднее появление "формального" мышления у детей связано с парадоксальным повторным убеждением. При рассмотрении примеров применения системы фреймов к различным проблемам могут возникнуть сомнения по поводу того, что данная теория хорошо объясняет одно и плохо другое. Однако было бы наивно ожидать, что в рамках любой отдельно взятой системы можно решить все проблемы человеческого мышления, тем более что эта система ограничена конкретными операциями, сводящимися к манипуляциям со стереотипными структурами данных.
Глава вторая.
Язык, понимание и сценарии
2.1. Слова. предложения и смысл
«Механизм восприятия образов обладает некоторыми недостатками, которые являются платой за его исключительно ценные качества. Два из них, видимо, наиболее важны: образ, в особенности зрительный, склонен к обособлению ситуаций, более чем это биологически целесообразно; а принципы, лежащие в основе композиционного объединения образов, приводят к таким построениям, которые являются относительно беспорядочными, случайными и нерегулярными по сравнению с развертыванием привычных действий или довольно упорядоченным развитием мысли».
Ф. Бартлетт (1932)
Концепция фрейма и использование заданий отсутствия, по-видимому, полезны при рассмотрении проблемы понимания смысла. Н.Хомский(1957) указывал, что такое предложение, как:
(A) Бесцветные зеленые идеи спят неистово трактуется совсем иначе, чем высказывание:
(B) Неистово спят идеи, зеленые, бесцветные.
Это происходит, во-первых, потому, что оба высказывания "одинаково бессмысленны", и, во-вторых, потому что процессы, связанные с анализом предложений, должны во многом отличаться от процессов, связанных с пониманием смысла.
Нет сомнения в существовании особых механизмов связанных с грамматическим разбором предложений. Поскольку смысл высказывания в равной мере "закодирован" как в позиционных и структурных отношениях между словами, так и в выборе самих слов, то должны существовать и механизмы, связанные с анализом этих отношений и участвующие в формировании структур, которые призваны более четко представлять смысл этого высказывания. Почему при выработке такой структуры слова в высказывании (А) производят большее впечатление и смысл их более понятен, чем в высказывании (В), если не касаться вопроса о том, следует ли называть эту структуру семантической или синтаксической? Потому что порядок слов в (А) и отношения между ними заданы с учетом (грамматических) условностей и правил, которыми люди обычно пользуются, чтобы побудить других конкретизировать определенными значениями задания терминалов своих понятийных структур. Это полностью согласуется с грамматическими теориями. Порождающая грамматика могла бы служить в качестве совокупного описания внешнего проявления этих правил (или связанных с ними процессов), а операции в трансформационных грамматиках достаточно близки к нашим трансформациям фреймов.
Следует, однако, уточнить, насколько самостоятельно используется грамматика при работе человеческой мысли. Вероятно, неприятие высказываний (вследствие конструкций, не соответствующих правилам грамматики, или просто непонятных) указывает на более сложный характер причин, обусловливающих семантический отказ выработать какое-либо представление. Ниже приводятся доводы в пользу того, что противопоставление грамматики и смысла может осветить две крайности из этого круга вопросов, но в то же время завуалировать все остальные его важные проблемы.
Мы, конечно же, не можем считать, что любой "логической" бессмысленности неизбежно сопутствует и бессмысленность психологическая. В самом деле, высказывание (А) можт породить определенный психический образ! Центральным в этом образе, как я понимаю, является фрейм сна, для которого система задает определенную кровать с "лежащим" на ней фреймом, представляющим мягкую, бесформенную полупрозрачную массу зеленого цвета. Во фрейме сна имеется терминал для задания характера сна (сейчас, видимо, беспокойного), а слово "неистово" кажется здесь несколько неподходящим, так как этот фрейм предпочитает не признавать в своем действии чего-либо намеренно спланированного или заранее предусмотренного. Еще больше смущает слово "идеи", поскольку в качестве субъекта мыслится какое-нибудь лицо или, по крайней мере, что-то живое. В рамках рассматриваемой структуры фрейма разрешить эти противоречия не удается.
Сказать что-либо подобное о высказывании (В) попросту нельзя, поскольку в нем нет ни одного существенного фрагмента, который можно было бы сопоставить с одним из возможных субфреймов.
Поэтому ни один более высокий по иерархии фрейм не получит каких-либо данных для согласования своих терминалов и, следовательно, ни один из фреймов верхнего уровня типа "смысл" или типа "предложение" не в состоянии сообщить о том, имеет ли высказывание (В) правильную грамматическую форму к (или) заложен ли в нем какой-нибудь смысл. Я полагаю, что сочетание этой "гибкой" теории с градацией отбора данных для заполнения заданий отсутствия может быть положено в основу разработки такой системы, которая скорее будет несостоятельной для предложений с "плохой" грамматикой, нежели для предложений, где ее попросту нет. Если более мелкие фрагменты, т.е. фразы и части предложений достаточно хорошо удовлетворяют субфреймам, то даже, несмотря на неполную согласованность данных на верхних уровнях могут быть построены образы, приемлемые для определенных видов понимания. Таким образом, мы получили качественную теорию грамматического разбора:
если данные удовлетворяют верхним уровням и не удовлетворяют некоторым терминалам более низких уровней, то на входе – бессмысленное предложение; если же картина обратная, то высказывание может иметь смысл, но оно облечено в грамматически неправильную форму.
Я не собираюсь утверждать, что восприятие предложений обязательно должно сопровождаться зрительными образами. Некоторые люди не пытаются представить себе цвет мяча в предложении «он ударил по мячу». Но, в конечном итоге, все согласятся, что в рамках вызванного из памяти сценария используются, если не такие характеристики, как цвет или размер, то цели, отношения и другие существенные элементы. Вне рамок зрительного восприятия терминалы и их задания отсутствия могут представлять цели и функции, а не только цвета, размеры и формы.