Фреймы для представления знаний

Текст добавлен: 12 октября 2016, 04:42

Текст книги "Фреймы для представления знаний"

Автор книги: Марвин Минский

Жанры:

Прочая компьютерная литература

сообщить о нарушении

Текущая страница: 11 (всего у книги 12 страниц)

Назад к карточке книги

Глава 1.
Суть проблемы представления знаний

Проблема представления знаний является тем ключевым пунктом, через который проходят пути к достижению успеха, пожалуй, во всех направлениях исследований по искусственному интеллекту, начиная от проблем понимания естественного языка и кончая проблемами машинного восприятия зрительных образов и речи.

Очевидная первопричина сложности создания машинной модели реального мира кроется в бесконечном многообразии этого мира.

Действительно, представим себе, что такую модель необходимо создать для робота, предназначенного для выполнения неограниченного набора приказов человека и функционирующего в среде неограниченной вариативности. Если попытаться решить задачу "в лоб", путем представления модели мира в виде набора программ. каждая из которых соответствует последовательности возможных действий робота при выполнении одного из приказов, осуществляемых с учетом конкретных условий внешнего мира робота (состояния внешней среды), то возникают по крайней мере две непреодолимые трудности, обусловленные бесконечным многообразием реального мира. (Под условиями внешнего мира понимается не только мир, воссоздаваемый сенсорами робота, но и априорные знания о закономерностях реального мира).

Первая из них связана с необходимостью наличия в памяти ЭВМ неограниченного набора программ, каждая из которых рассчитана на выполнение приказа при определенном состоянии внешней среды.

Вторая трудность порождена необходимостью соотнести данный приказ оператора и состояние внешней среды робота с конкретной программой из этого неограниченного набора, ответственной за выполнение данного приказа в конкретной внешней ситуации, и выбрать эту программу из памяти за приемлемое весьма ограниченное время.

Иными словами, речь идет о машинном "понимании" за ограниченные отрезки времени языка приказов и "языка сенсоров", с помощью которых воспринимаются те особенности внешнего мира, которые важны для выполнения приказа. И если в отношении "понимания" языка приказов можно несколько уменьшить трудности за счет, например, использования приказов однозначного толкования, то в отношении понимания "языка" сенсоров это сделать невозможно.

Приведенные трудности объясняют нереальность создания модели реального мира таким путем. Несмотря на это, такой подход всё же несет одно ценное свойство. По крайней мере, на интуитивны уровне ясно, что каждую из программ, ответственную за выполнение данного приказа, можно построить так, чтобы учесть все необходимые для выполнения приказа особенности внешнего мира робота, причем реального внешнего мира со всем его многообразием и сложностью, что невозможно при использовании известных подходов из-за принципиальной ограниченности средств описания внешнего мира, характерных для этих подходов.

Конечно, ограниченность машинной памяти не позволит иметь большого количества таких программ, но в случае маловариативных сред и невысоких требований к диапазону функциональных возможностей робота реально получение приемлемых технических решений.

Очевидный путь, позволяющий, по-видимому, несколько уменьшить трудности создания машинной модели реального мира, лежит через кардинальное уменьшение числа входящих в модель программ при сохранении общего объема знаний о мире, содержащихся в этой модели.

Это можно было бы осуществить, если бы удалось определенным образом упорядочить, структурировать программы, образующие модель.

С этой целью, во-первых, полезно найти и выделить в разнообразных возможных действиях общие универсальные фрагменты, с помощью которых можно компоновать эти действия. Очевидно, из т таких универсальных фрагментов в пределе можно скомпоновать (1!+2!+3!+:+ m!) разнообразных действий. Если даже ограничить число используемых для описания действия фрагментов величиной m , т.е. имеет место колоссальный выигрыш в использовании памяти, тем больший, чем больше т.

Во-вторых, необходимо стремиться так построить программы, входящие в модель реального мира для робота, чтобы каждая из них была способна формировать широкий набор (в пределе бесконечный) разнообразных действий, варьируемых, например, в зависимости от характера информации, собираемой определенной группой сенсоров, или от модификации приказов.

Глава 2.
Характерные особенности фрейм-подхода к проблеме представления знаний

Одним из возможных новых путей организации машинной модели реального мира является подход, развиваемый М.Минским. В соответствии с этим подходом знания о мире – машинная модель реального мира – должны быть представлены в памяти ЭВМ в виде достаточно большой совокупности определенным образом структурированных данных, представляющих собой стереотипные ситуации. Эти структуры запомненных данных получили название «фреймы». В случае возникновения конкретной ситуации, например, необходимости совершить роботом, управляемым ЭВМ, определённое действие, воспринять с помощью сенсоров, связанных с ЭВМ, какой-то зрительный образ и т.д., из памяти ЭВМ должен быть выбран фрейм, соответствующий данному классу ситуаций и согласован с рассматриваемой конкретной ситуацией из этого класса путем изменения подробностей, т.е. путем конкретизации данных из набора, которые могут удовлетворить выбранный фрейм.

Так как фрейм можно представить себе в виде сети, состоящей из узлов и связей между ними, то каждый узел должен быть заполнен своим "заданием", представляющим собой те или иные характерные черты ситуации, которой он соответствует. В общем случае во фрейме можно выделить несколько уровней, иерархически связанных друг с другом. Узлы фрейма, принадлежащие к верхним уровням, представляют собой более общие вещи, которые всегда справедливы в отношении предполагаемой ситуации. Эти узлы уже заполнены своими заданиями. Например, узел самого верхнего уровня фрейма обычно заполнен названием ситуации, т. е. названием зрительного образа (это может быть, например, "куб"), названием действия (например, "уборка комнаты"). Узлы нижних уровней по большей части не заполнены своими заданиями. Такие незаполненные узлы называют терминалами. Они должны быть заполнены конкретными данными, представляющими собой их возможные задания в процессе приспособления фрейма к конкретной ситуации, из того класса ситуаций, который представляет данный фрейм. Каждый терминал может устанавливать условия, которым должны отвечать его задания. Простые условия устанавливаются "маркерами", которые могут потребовать, например, чтобы заданием терминала было какое-то лицо, какой-то предмет достаточной величины, какое-то элементарное действие или "указатель" на какой-то другой фрейм, представляющий собой другую, обычно более частную ситуацию и называемый субфреймом. Более сложные условия могут устанавливать связи между заданиями для нескольких терминалов.

Группа фреймов может объединяться в систему фреймов. Результаты характерных действий отражаются с помощью трансформаций между фреймами системы. Они используются, чтобы ускорить вычисления определенных видов при представлении типичных изменений одной и той же ситуации.

В случае зрительного образа различные фреймы системы описывают картину с различных точек наблюдения, а трансформация одного фрейма в другой отражают результаты перемещения из одного места в другое. Для фреймов певизуальных видов различия между фреймами системы могут отражать действия, причинно-следственные связи и изменения понятийной точки зрения. Различные фреймы системы используют одни и те же терминалы. Это важное обстоятельство, благодаря которому, в частности, экономится объем памяти ЭВМ, используемой для построения модели реального мира. Характерной чертой описываемого подхода является возможность использования различных видов прогнозов, ожиданий, предположений. В соответствии с этим терминалы фрейма, выбираемого для представления ситуации, обычно уже заполнены заданиями, которые наиболее вероятны в данной ситуации. Эти задания называются "заданиями отсутствия".

Таким образом, фрейм может содержать большое число деталей, которые могут и не подтвердиться данной ситуацией. Задания отсутствия "непрочно" связаны со своими терминалами, поэтому они могут быть легко "вытеснены" другими заданиями, которые лучше подходят к текущей ситуации.

После того как выбран фрейм для представления ситуации, процесс согласования фрейма с данной конкретной ситуацией состоят в нахождении таких заданий для терминалов фрейма, которые совместимы с маркерами терминалов. Процесс согласования частично контролируется информацией, связанной с фреймом (в которую входит и информация относительно того, как действовать в случае появления необычных ситуаций, "сюрпризов"), а частично знанием текущих целей.

Если выбранный фрейм не удается согласовать с реальностью, т. е. если невозможно найти задания для терминалов, которые соответствующим образом согласуются с условиями маркера, то происходит обращение к так называемой сети поиска информации, с помощью которой соединяются между собой системы фреймов. Эта сеть позволяет найти другие способы представления знаний о фактах, аналогиях и другой информации, которую можно использовать для согласования с реальностью.

Теория представления знаний с помощью фреймов, развиваемая М.Минским, претендует на объяснение ряда характерных особенностей человеческого мышления. По мнению автора, она позволяет охватить единой концепцией такие, казалось бы, разные теории, как понимание естественного языка, машинного "восприятия" зрительных образов, поиска решений, планирования, в том числе применительно к задачам управления роботами. Она объединяет многие классические и современные идеи психологии, лингвистики, а также искусственного интеллекта. В частности, эта теория обобщает идеи, высказанные в ряде известных работ по искусственному интеллекту, например в работах А.Ньюэлла, Г.Саймона(1972), в которых знания о мире представляются с помощью пространств подзадач, в работах Р.Шенка(1973), Р.Абельсона(1973), где модель мира представляется пространством "сценариев", наконец, в работах С.Пейперта(1972) и самого М.Минского(1972), в которых предлагается подразделить знания на "микромиры".

В своей теории М.Минский не проводит границы между теорией человеческого мышления и теорией построения "думающей" машины (искусственного интеллекта). Он считает, что и процесс мышления человека основан на наличии в его памяти каким-то образом материализованного огромного набора разнообразных фреймов, с помощью которых человек осознает зрительные образы (фреймы визуальных образов), понимает слова (семантические фреймы), рассуждения, действия (фреймы-сценарии), повествования (фреймы-рассказы) и т.д. Процесс понимания при этом сопровождается выбором из памяти соответствующего фрейма, у которого терминалы уже заполнены заданиями отсутствия, и приспособлением его к текущей ситуации. Если это не удается, то из памяти выбирается новый более подходящий к ситуации фрейм. В случае, когда и этот фрейм не достаточно хорошо согласуется с ситуацией и поиски нового не приводят к удаче, происходит приспособление наиболее отвечающего ситуации фрейма, который был обнаружен в процессе поиска.

2.1. Фрейм – визуальный образ

В качестве простейшего примера, иллюстрирующего представление знаний с помощью фреймов, рассмотрим приведенную в работе М.Минского возможную систему фреймов для элементарного зрительного образа – куба. В соответствии с использованным в работе А.Гузмана(1967) символическим представлением тел правильной формы с помощью «областей» и «связей» между ними можно допустить, что результатом разглядывания куба является структура, подобная показанной на рис.П1а. Эту структуру можно идентифицировать с фреймом куба при разглядывании его с соответствующей позиции. Области A, E и B являются терминалами фрейма, задания для которых соответствуют возможным деталям или обозначениям на видимых с данной позиции гранях куба. Если позиция наблюдения куба перемещается вправо, то грань А исчезает из поля зрения и становится видимой грань С.

Если бы потребовалось провести полный анализ этого нового визуального образа, необходимо было бы:

1) утратить знания о грани А,

2) повторно воспринять (с помощью соответствующих "вычислений") образ грани В,

3) воспринять образ новой грани С.

Однако, поскольку известно, что произошло перемещение позиции наблюдения вправо, можно сохранить знания о грани В в виде задания терминалу левой грани нового фрейма куба, соответствующего новой позиции наблюдения. Кроме того, чтобы сохранить знания и о грани А, можно ввести дополнительный терминал невидимой грани, относящийся к этому новому фрейму, как это показано на рис.П1б.

При возвращении на начальную позицию наблюдения оказывается возможным восстановить визуальный образ куба без каких-либо новых "вычислений". Для этого достаточно "вызвать" из памяти первый фрейм. Очевидно, полезно сохранить знания и о грани С, для чего можно ввести дополнительный терминал этой невидимой грани в первом фрейме (рис.П1б).

Можно продолжить эту процедуру построения системы фреймов, соответствующую перемещению точки наблюдения вокруг куба. Это привело бы к получению более широкой системы фреймов, в которой каждый фрейм соответствует своей позиции наблюдения куба. На рис.П1в показана система фреймов, состоящая из трех фреймов, каждый из которых представляет визуальный образ, получающийся в одной из трех позиций наблюдения. Две из этих позиций соответствуют перемещению вправо и влево на 45° относительно третьей позиции; указатели между фреймами соответствуют перемещениям точки наблюдения. Важно обратить внимание на выявленное в этом примере важное свойство представления ситуации с помощью системы фреймов. Оно состоит в том, что различные фреймы, входящие в систему, используют один и тот же терминал, соответствующий одной и той же физической черте, которая видна из различных позиций наблюдения. Это позволяет заранее сосредоточить в одном месте информацию о свойствах известных объектов независимо от позиций наблюдения, которых, особенно для предметов сложной формы, может быть очень много. В результате экономится память и сокращается процесс восприятия при изменении позиций наблюдения, так как память уже располагает необходимой информацией и время затрачивается лишь на "извлечение" ее из памяти.

Сами же системы фреймов, по-видимому, сформированы в памяти не для визуальных образов каждого возможного предмета, а для обычно используемых «основных форм», которые, вступая в различные комбинации, образуют системы фреймов для новых случаев. Это создает дополнительные возможности экономии памяти. Так же, как и в случае отдельных заранее сформированных терминалов, принадлежащих фрейму, наличие в памяти заранее заготовленного набора систем фреймов ускоряет процесс восприятия, так как новый образ не приходится строить заново, а только извлекать его из памяти и «приспосабливать» к действительности.

2.2. Фрейм-сценарий

Отмеченные свойства, позволяющие экономить память и время восприятия, очевидно, могут проявляться и при представлении невизуальных знаний о мире. Действительно, системы невизуальных фреймов, например описываемых ниже фреймов-сценариев, можно представить как одно из возможных понимании предмета обсуждения; например, электрогенератор можно представить как механическую и как электрическую системы. Любые знания о мире можно представить себе в виде некоторых общих универсальных фрагментов, которым соответствуют свои системы фреймов и из которых можно формировать новые системы фреймов, соответствующие некоторым новым представлениям.

Представление знаний о мире с помощью фреймов оказывается весьма плодотворным при объяснении механизмов понимания человеком естественного языка, рассуждении, повествований, наблюдаемых действий другого лица и т. д. По-видимому, оно будет полезным и при разработке искусственных механизмов реализации вышеперечисленных функций с помощью ЭВМ.

В работе М.Минского в этом случае предлагается строить знания о мире в виде фреймов-сценариев. Фрейм-сценарий по М.Минскому представляет собой типовую структуру для некоторого действия, понятия события и т. п., включающую характерные элементы этого действия понятия, события. Например, фрейм-сценарий для события, состоящего в праздновании дня рождения ребенка, включает следующие элементы, которые можно трактовать как узлы фрейма, заполненные заданиями отсутствия:

Одежда: воскресная, самая лучшая;

Подарок: должен понравиться.

Для объяснения быстрого понимания человеком ситуации, представляемой сценарием, в работе Р.Шенка, Р.Абельсона(l975) предлагается отождествлять терминалы фрейма-сценария с наиболее характерными вопросами, обычно связанными с этой ситуаций. Ответы на эти вопросы полезно получить для понимания данной ситуации. По существу фрейм-сценарий в этом случае является собранием вопросов, которые необходимо задать относительно некоторой гипотетической ситуации, и способов ответа на них.

Для фрейма-сценария – дня рождения ребенка в число таких вопросов войдут следующие:

Что должны надеть гости?

Выбран ли подарок для ребенка?

Понравится ли ему подарок?

Где купить подарок?

Где достать денег? и т. д.

Для того чтобы попять действие, о котором рассказывается или которое наблюдается, человек часто вынужден задать такие вопросы:

"Кто осуществляет действие (агент)?",

"Какова цель действия (намерение)?",

"Каковы последствия (эффект)?",

"На кого это действие влияет (получатель)?",

"Каким образом оно произведено (инструмент)?".

Относительно понимания вещей, отличающихся от действий, задают несколько иные вопросы, и эти вопросы могут быть значительно меньше локализованы, чем в случае понимания действий, например: "Почему они говорят это мне?", "Каким образом я могу выяснить больше об X?", "Каким образом это поможет в решении проблемы?" и т.д. По рассказу спрашивают, какова тема, каково отношение автора, какое главное событие, кто является главным героем и т. д. По мере того, как на каждый вопрос дается предварительный ответ, из памяти могут вызываться новые фреймы, соответствующие ситуациям, которые возникают в результате ответов на вопросы. Вопросы – терминалы этих новых фреймов становятся в свою очередь активными.

Следует отметить, что число вопросов, связанных с фреймом неопределено, и на первый взгляд кажется, что для понимания ситуации их может быть очень много. Однако на практике оказывается достаточным задать весьма мало вопросов, чтобы разобраться в ситуации.

Разные люди могут задавать разное число вопросов относительно одной и той же ситуации. Число и характер этих вопросов в большой степени зависят от базы знаний относительно обсуждаемого объекта у того или иного индивидуума. Может оказаться, что полное понимание не будет достигнуто из-за отсутствия у человека необходимой системы фреймов, объединяющих знания об обсуждаемом предмете.

Однако, когда необходимая база знаний существует, а относительно обыденных понятий, действий, рассуждений она есть у любого человека, то для понимания ситуации обычно достаточно не очень большое количество вопросов. Это весьма принципиальное обстоятельство, благодаря которому на интуитивном уровне мы приходим к весьма обнадеживающему для практики положению, состоящему в том, что большое количество реальных ситуаций, возникающих при понимании языка, рассуждении, действий можно понять, получив ответы на ограниченный круг вопросов. Это косвенно подтверждает возможность построения относительно простых моделей мира в данном случае с помощью фреймов, достаточных для принятия решений в этих ситуациях.

В случае фреймов-сценариев маркеры терминалов фрейма становятся более сложными, чем это было в случае фреймов визуальных образов, и определяют рекомендации относительно того, каким образом надо отвечать на вопросы, т.е., заполнять терминал заданием. Каждый терминал должен содержать рекомендации относительно того, каким образом найти его задание – ответ на вопрос. Задания отсутствия или перечень возможных ответов на вопросы являются самыми простыми особыми случаями таких рекомендаций. По-видимому, человек может иметь иерархический набор таких рекомендаций подобно схемам предпочтения, предложенным в работе Дж.Уилкса(1973).

В соответствии с подходом М. Минского полное и всестороннее представление каждой ситуации типа событие, действие, рассуждение и т.п. подобно представлению визуального образа и осуществляется с помощью не одного, а системы фреймов. Каждый фрейм, системы соответствует одной из возможных точек зрения на ситуацию, представляемую системой фреймов, подобно тому, как один из визуальных фреймов системы представляет визуальный образ из некоторой одной точки наблюдения. Различные фреймы системы представляют различные пути использования одной и той же информации, находящейся на общих терминалах. Как и в "визуальной ситуации", человек, понимая или передавая мысль, "выбирает" один из фреймов. Этот выбор "по существу" состоит в выборе вопросов, которые, нужно задать относительно рассматриваемой ситуации.

В интерпретации Р.Шенка, Р.Абельсона(1975) сценарий представляет собой последовательность действий, которые описывают часто встречающиеся ситуации. В этой последовательности действий используется принцип каузальной связи, т. е. результатом каждого действия являются условия, при которых может произойти следующее действие.

Каждый сценарий имеет исполнителей ролей. Он имеет различные интерпретации, отражающие точки зрения различных исполнителей. Таким образом, его можно рассматривать как систему фреймов.

Количество сценариев, отражающих возможные ситуации, встречающиеся в реальной жизни, огромно. Сюда относится и упомянутый выше день рождения ребенка и игра в футбол, занятия в школе и т. д. Ниже приводится сценарий посещения ресторана с точки зрения посетителя.

Сценарий: ресторан

Роли: посетитель, официантка, шеф, кассир

Цель: получить пищу, чтобы утолить голод

Сцена I. Вход

Войти в ресторан

Глаза направить туда, где есть пустые столы

Выбрать, где сесть

Направиться к столу

Сесть

Сцена II. Заказ

Получить меню

Прочитать меню

Решить, что хочешь заказать

Сделать заказ официантке

Сцена III. Еда

Получить пищу

Съесть пищу

Cцена IV. Уход.

Попросить счет

Получить чек

Направиться к кассиру

Заплатить деньги

Выйти из ресторана

В каждом сценарии средства выполнения действий могут варьи-юваться по обстоятельствам. Например, в сцене II заказ можно сделать письменно, устно и даже (в другой стране при незнании языка) жестами. В сцене IV выплата денег может быть осуществлена кассиру, официанту или словами "Включите в мой счет".

Возможно также, что обычная последовательность действий может нарушаться. Имеется по крайней мере три характерных случая такого нарушения. Первый – это отклонение, которое представляет собой прерывание последовятельности действий сценария другим сценарием. Другие два случая называются препятствием и ошибкой. Препятствие имеет место тогда, когда кто-то или что-то мешает обычному действию ила отсутствует какое-то условие, необходимое для выполнения действия. Ошибка появляется тогда, когда действие завершается не так, как требуется. В принципе после каждого элементарного действия сценария могут возникнуть препятствия и ошибки, поэтому в сценарий вводятся различные наборы вопросов типа "а что если...", ответ на которые необходимо получать после каждого элементарного действия. При положительном ответе на один из них в сценарии предусматриваются новые действия, устраняющие препятствия и ошибки. Например, в сцене II сценария "ресторан", если официантка не замечает посетителя, он попытается встретиться с ней взглядом или окликнуть её.

Таким образом, сценарий – не просто цепь событий, а скорее связанная каузальная цепочка действий. Он может разветвляться на множество возможных путей, которые сходятся в особо характерных для сценария точках – элементарных действиях. Для сценария в ресторане такими действиями являются "прием пищи" и "уплата денег".

Для того чтобы знать, когда пользоваться сценарием, нужны заголовки. Эти заголовки определяют обстоятельства, при которых обращаются к данному сценарию.

Из приведенного описания сценариев нетрудно установить аналогию между пониманием сценария по М. Минскому и по Р.Шенку. Действительно, как в том, так и в другом случае сценарии описывают стереотипные, обычно встречающиеся ситуации. Правда, в случае Р.Шенка сценариями охватывается несколько более узкий класс ситуаций, описываемый последовательностями действий. Как в том, так" и в другом случае со сценарием связан определенный круг вопросов. Однако в случае Р.Шенка имеет место более конкретный и узкий круг вопросов типа "а что если ...", а также вопросы, ответы на которые определяют выбор средств, определяющих действия сценария.

Поскольку в соответствии с высказанным ранее положением процесс понимания человеком реальной ситуации есть выбор из памяти и приспособление к этой ситуации соответствующего фрейма, возникает вопрос о возможном механизме этого акта.

Назад к карточке книги "Фреймы для представления знаний"