Текст книги "Фреймы для представления знаний"
Автор книги: Марвин Минский
сообщить о нарушении
Текущая страница: 7 (всего у книги 12 страниц)
3.6. Аналогии и альтернативные описания
Мы рассмотрели вопросы применения различных фреймов одной и той же системы для описания одной ситуации с помощью различных средств: для изменения положения при восприятии зрительных изображений и для смещения акцентов при использовании языка. Например, в эпизоде с волком и ягненком два фрейма используются в ситуационной паре типа «до – после». Иногда при поиске решений мы применяем два или большее число описаний, если ищем какие-то аналогии или используем разные виды анализа для оценки одной и той же ситуации. Для решения сложных задач использование одной проблемной области обычно оказывается недостаточным!
Предположим, что в вашем автомобиле стал разряжаться аккумулятор. Вы полагаете, что произошло короткое замыкание или неисправен генератор. Генератор можно представить себе как механическую систему: ротор снабжен ведомым колесом, приводимым в движение ремнем от двигателя. Тут же возникают вопросы: достаточно ли туго натянут ремень и имеется ли этот ремень вообще? С точки зрения механика выходным элементом является кабель, идущий от аккумулятора к каким-то другим устройствам: исправен ли он, хорошо ли затянуты болты, прижимаются ли щетки к коллектору? С точки зрения электрика генератор должен описываться иначе. Ротор рассматривается не как вращающееся устройство, а как катушка, индуцирующая магнитный поток. Щетки и коллектор выполняют роль электрических переключателей. Выходным параметром является электрический ток, протекающий по паре проводов, которые соединяют щетки, схему управления и аккумуляторные батареи.
Таким образом, ситуация описана нами в двух различных системах фреймов. В одной из них якорь является механическим ротором со шкивом, а другой – проводником в постоянно меняющемся магнитном поле. Одни и те же (или аналогичные) элементы совместно ИСПОЛЬЗУЮТСЯ терминалами разных систем фреймов, и эти системы могут трансформироваться одна в другую.
Различия между двумя этими системами фреймов существенны. В "электрической" системе фреймов шасси автомобиля всегда соединено с одной из клемм аккумулятора. Тот, кто ставит диагноз о неисправности, должен использовать в своих рассуждениях и действиях оба вида представления. Если ток не течет, то часто это является следствием того, что проводник его не проводит. Для этого случая трансформация приводит к фрейму, с помощью которого можно установить, что прочное механическое соединение исключает обрыв в электрической цепи. Поэтому любое нарушение проводимости, выявленное путем электрических измерений, заставит нас искать неисправность в "механической" системе фреймов. В нашем обычном понимании "исправность" чего-либо есть синоним понятия "механическая исправность" и поэтому проводимый диагноз должен заканчиваться именно в "механической" системе. В конечном итоге мы можем обнаружить неисправное механическое соединение, выявить разболтавшееся крепление проводника, коррозию, износ и т. д.
Но почему генератор должен быть представлен двумя отдельными системами фреймов, а не одной объединенной структурой? Я полагаю, что в рамках таких сложных задач человек не может сразу представлять себе очень большое число различных подробностей. В каждый момент времени человек должен мыслить в пределах разумно простой структуры. Я утверждаю, что любая проблема, которую вообще может решить человек, вырабатывается в каждый момент времени в рамках небольшого контекста и что ключевые операции, используемые при поиске решений, связаны с формированием соответствующей рабочей среды.
Действительно, поиск неисправности в предыдущем примере требует одновременной работы сразу с тремя фреймами: визуальным, электрическим и механическим. Если данные электрических измерений указывают на неисправность механического соединения, то визуальный фрейм используется человеком при ее отыскании.
Существуют ли общие методы построения компетентных систем фреймов? На этот вопрос можно ответить и положительно, и отрицательно! В самом деле, нам известны некоторые во многом очень ценные стратегии для приспособления уже существующих фреймов к новым целям; вместе с тем следует подчеркнуть, что люди не обладают каким-то единым и таинственным механизмом, позволяющим решать все сложные проблемы. Мы не должны впадать в крайность и требовать существования узких теорий человеческого поведения, которые объясняли бы невозможные вещи!
Не следует ожидать, что для любой ситуации можно будет отыскать или, в крайнем случае, построить в точности соответствующий ей фрейм. Нам, однако, предстоит много поработать над этим вопросом; важно напомнить здесь и о том вкладе общечеловеческой культуры, который был сделан ею в разработку вопросов оценивания сложности различных проблем. Опытному механику при выполнении своей обычной работы нет нужды что-либо изобретать; у него уже сформировано представление, например, о двигателе как совокупности систем зажигания, смазки, охлаждения, синхронизации, смешивания топлива, трансмиссии, сжатия и т.д. Система охлаждения подразделяется на схему циркуляции жидкости, воздушного потока и др. Большинство из таких "обычных" проблем решается систематическим применением аналогий, которое обеспечивается трансформациями между парами фреймов-структур. Элементы огромной сети знаний, приобретенных в школе, из книг, в процесс" профессионального обучения, а также из других источников, накрепко связаны друг с другом указателями различия и релевантности. Нет сомнения в том, что культура оказывает большое влияние на формирование такой сети благодаря обычному использованию одинаковых слов при объяснении различных мнений об одних и тех же предметах или явлениях.
Что можно сказать о взаимодействии между элементами фреймов-структур, которое тесно связано со всеми рассматриваемыми здесь вопросами? Гештальт-психолог потребовал бы выполнения такого синтеза (на базе имеющихся у человека сведений), при котором двигатель будет представляться как единое целое. Неплохо, однако, для начала вспомнить, что автомеханик сможет выявить неисправность (если вообще сможет ее отыскать), возникшую как результат взаимодействия трех или более элементов двигателя только после изнуряющей замены многих его исправных частей. Следует признать, что стремление к полным синтетическим представлениям нецелесообразно и не может выступать в качестве требования для теоретических построений. В действительности должна существовать некоторая структура, объединяющая различные концептуальные типы фрейма "двигатель". Но она тоже может быть относительно простой. К уже рассмотренным типам фрейма "двигатель" следует, видимо, добавить еще один – суперфрейм, терминалы которого будут указывать на первые три типа фрейма (электрический, механический и визуальный) и, будучи связанными друг с другом указателями, сообщать, как и когда именно следует использовать эти субфреймы. Каждая сложная "понимающая" система, по всей вероятности, содержит подобные структуры суперфреймов, которые управляют использованием субфреймов.
Заманчивой кажется идея о том, что более крупные понятия формируются на подсознательном уровне человеческого мышления. По наблюдениям X.Пуанкаре, после периода умственной активности, за которым следует более длительный период ее спада, на человека находит внезапное озарение. Подсознательную деятельность (если следовать взглядам X.Пуанкаре) следует рассматривать как комбинаторный эвристический поиск, в котором вероятность успеха зависит в первую очередь от качества ингредиентов, введенных во время активной умственной работы; эти элементы объединяются самыми разными способами до тех пор, пока не будет получена такая конфигурация, которая выдержит определенный вид проверки.
"Я говорил о чувстве абсолютной уверенности, сопровождающем наше вдохновение..., оно часто вводит нас в заблуждения, но мы обнаруживаем это только тогда, когда пытаемся привлечь на свою сторону доказательства", X. Пуанкаре (1946).
Итак, продуктом вдохновения является не полностью детализированное решение, а "точка отсчета" или план, доведенный до сознательного уровня мышления, потому что он прошел через порог "эстетической разумности".
Что же касается взглядов X.Пуанкаре, то он, видимо, придерживался (по крайней мере, в данном вопросе) концепции холизма, ибо в его понимании "элегантные" математические объекты есть не что иное, как объекты, "элементы которых расположены настолько гармонично, что ум в состоянии охватить их всех сразу, целиком и в то же время представлять себе все возможные подробности". Из нерассмотренных остался еще вопрос о том, требуется ли для работы фильтров, которые передают на сознательный уровень новые описательные комбинации. проведение активного их анализа или действия таких фильтров смогут получить объяснение на основе более простых операций согласования и поиска информации. К несчастью, математики, за исключением X.Пуанкаре, Д.Пойа и некоторых других, не сумели внести значительный вклад в понимание механизмов решения задач. Мне кажется, что это все же не было следствием их приверженности концепции "элегантности", которая передавалась от одного поколения другому как почитаемое, но не объяснимое и не проанализированное качество. В любом случае я не вижу оснований считать, что подсознательная деятельность отличается либо мощными параллельными вычислениями, либо необычным синтезом, предусматриваемым философией холизма. Более правдоподобно выглядит предположение о проводимых на этом уровне быстрых и неглубоких исследованиях с привлечением тех данных, которые были подготовлены в процессе активного анализа материала. Аспект подсознательного может только указать на отсутствие "аннотации" и какой-либо регистрации мыслительных операций: в противном случае мы получили бы возможность рассмотрения и анализа этих процессов. Вопрос относительно сложности фильтров остается, по-прежнему, открытым.
3.7. Резюме. Использование фреймов в эвристическом поиске
За последние десять лет широкое распространение получила идея о том, что важны все аспекты представления информации с помощью «пространства задачи»; однако мысль о том, что описания могут быть полезны и для самих программ, и для авторов этих программ, не стала столь же популярной. Прогресс в понимании этого ключевого момента был фактически задержан остроумными схемами, созданными для того, чтобы избежать явных манипуляций описаниями.
Основным устремлением, особенно при доказательстве теорем и моделировании игр, была разработка средств, ведущих к систематическому уменьшению протяженности поиска в пространстве задачи. Иногда простая задача может быть решена при помощи последовательного перебора допустимых методов решения: перебор производится до тех пор, пока один из методов не даст положительного результата. В более сложных ситуациях используются усовершенствованные локальные правила поведения, а также варианты "восхождения к вершине" в пределах пространства задачи. Однако если нам и удается таким способом решить определенную задачу, мы получаем мало сведений о пространстве задачи и, следовательно, не повышаем свою квалификацию, 470 весьма пригодилось бы нам в будущем. Наиболее разработанными в эвристических методах являются игровые методы поиска решений, в которых используются различные стратегии для уменьшения дерева перебора, оценки терминальных вершин и выработки разумного хода. Однако даже в тех системах, где применяются различные способы – организации иерархий символьных целей, отсутствует "осознанный" самой системой подход к процессу поиска решений и не совершенствуется качество представления информации. Я предлагаю следующее более совершенное и мощное правило.
Главной целью при решении задач должно быть стремление лучше понять пространство задачи и найти такие представления, в рамках которых данная задача решается довольно просто. Цель поиска состоит в том, чтобы получить информацию для формирования надлежащего представления, а не для нахождения решения, как это обычно предполагается; после того, как удастся соответствующим образом представить это пространство задачи, решение найти будет значительно легче.
В частности, я являюсь противником того, что значимость интеллектуального эксперимента должна оцениваться либо относительно категорий "неудача – частичный успех – успех", либо с помощью таких понятий, как "улучшение ситуации" и "уменьшение различия". Применение какого-то метода или изменение представления могут быть ценными лишь в том случае, когда они ведут к совершенствованию стратегии проведения последующих экспериментов. В более ранних формулировках роли стратегий в эвристическом поиске эти возможности не были выделены, хотя в неявной форме они содержались в рассуждениях о задачах планирования.
Каким образом можно объединить новое правило с классической стратегией минимакса? Пусть мы находимся в определенном узле А дерева решения (играя в какую-нибудь игру, например, шахматы) и исследуем два (или более) возможных хода, скажем В и С. Каждый из этих ходов получает значения оценок V(B) и V(C). Затем оба этих значения объединяются с помощью функции М для того, чтобы выработать одну общую оценку
S(A) = M( V(B), V(C) ) .
По существу, с помощью функции М должны подводиться итоги поиска на всем дереве ниже узла А и определяться оценка позиции А.
Посмотрим, в чем заключается цель подобных действий. Если можно было бы произвести поиск на всем дереве перебора, то мы смогли бы использовать найденную в каждом узле оценку S для принятия решения о том, какой следующий ход лучше всего сделать. Если, однако, оценка S дается просто в виде числа, то на это" основе невозможно будет провести значительные рассуждения, требуемые для анализа существующей ситуации.
Если значение S(B) невелико, то можно предположить, что В – неудачная позиция. Но если мы хотим, чтобы генератор ходов не повторял своих прежних ошибок, сообщение S должно включать некоторую дополнительную информацию относительно того, чем нас не удовлетворяет позиция В или как поступить в данном случае. Нам фактически требуется итоговое объяснение того, что обнаружено в процессе поиска; поскольку мы работаем с деревом перебора, нам требуется также рекурсивное суммирование подобных резюме.
Рассмотрим проблему, названную нами "расхождением резюме". Если резюме для ситуации А содержит (в общем случае) любое явное описание для В и С, то существует опасность того, что любая схема рекурсивного описания будет повторять дерево ходов; это приведет к столь же длительному поиску итогового сообщения, как и поиску самого решения. Чтобы этого не произошло, можно воспользоваться довольно простым способом – ограничить размеры самого резюме. В этом случае следует позаботиться о том, чтобы избежать сильного уменьшения информативности сообщений. Во фреймах-описаниях важные черты и отношения, находящиеся на верхних уровнях, могут служить в качестве резюме, а вспомогательные описания становятся доступными лишь по необходимости. Вопрос о том, какая часть проанализированного дерева должна оставаться в долговременной памяти, а какая отбрасываться после того, как сделан очередной ход, зависит от других аспектов использования участником игры всего накопленного им опыта.
Какие принципы должны лежать в основе образования резюме? И в этом вопросе концепция фреймов демонстрирует свою гибкость. Вместо того чтобы попытаться ограничить сообщения какими-то жесткими форматами, мы может построить набор "резюме"-фреймов для каждого данного случая; любой фрейм будет вызываться, когда его терминалы подходят к описаниям ситуаций более низких уровней, а маркеры согласуются с текущими целями. Таким образом, каждый из этих фреймов выполняет свою работу только тогда, когда он соответствует текущей ситуации. Например, у человека могут быть самые разные фреймы типа "шахматной вилки". Если конь занимает такую позицию, что угрожает одновременно и шахом, и взятием ладьи, то активируется фрейм вилки, соответствующий следующему условию: при любом из двух возможных ходов теряется та фигура, которая не изменит своей позиции. Как только будет активирован этот фрейм, он может дать конкретную рекомендацию, вероятно, следующего содержания: генератор ходов того игрока, который попадает под вилку, должен выяснить, не может ли какой-нибудь ранее сделанный ход обеспечить защиту того поля, откуда исходит угроза вилки.
3.8. Фреймы в качестве парадигм
«До тех пор, пока не была создана эта парадигма схоластов (средневековая теория „первого толчка“), маятники как таковые не были известны людям, а ученые видели в них только качающиеся камни. Существование маятников было открыто благодаря изменению парадигмы, очень напоминающему переключение гештальта. Следует ли нам описывать то, что отличает взгляды Галилея от воззрений Аристотеля или Лавуазье от Пристли с позиций трансформации зрительных образов? Действительно ли они видели разные вещи, когда смотрели на одни и те же предметы? Имеются ли у нас какие-то основания утверждать, что они проводили свои исследования, находясь в разных мирах? Я отчетливо предвижу трудности, которые могут возникнуть в том случае, если предположить, что когда Аристотель и Галилей смотрели на качающийся камень, первый видел в этом лишь несвободное падение тела, а второй – маятник. Тем не менее, я убежден, что нам следует научиться находить смысл в утверждениях, подобных данному утверждению».
Т.Кун (1975)
Согласно предложенной Т. Куном эволюционной модели наука развивается с помощью установленных описательных схем. Крупные открытия являются результатом новых парадигм, новых способов описания вещей, которые приводят к новым методам и методикам. В конце концов, изменяется содержание научного знания.
Т.Кун предпочитает применять свою весьма эффективную схему нового описания на уровне крупных научных революций; мне кажется, что эта идея применима и к проблемам повседневного мышления. Действительно, последнее процитированное предложение Т.Куна подтверждает ту его точку зрения, что в визуальном восприятии парадигмы должны играть не метафорическую, а, скорее, самостоятельную роль, а это именно то, что мы предлагаем в нашей концепции фреймов.
Когда обычно наши воззрения не пригодны, когда не удается отыскать в своей памяти эффективные системы фреймов, нам следует построить новые системы, которые позволят правильно отразить новые реалии. По всей видимости, обычным следует считать способ построения новой, системы из двух или более старых систем с последующим редактированием или "доводкой" ее до такого совершенства, когда она во всем будет соответствовать имеющимся обстоятельствам. Но каким образом можно это сделать? Заманчиво сформулировать эту задачу так: построить систему фреймов с наперед заданными свойствами. Подобная постановка задачи может упростить решение, поскольку позволяет разбить его на два этапа: вначале формулировка требований, затем само решение проблемы.
Этот путь, однако, несвойственен процессу человеческого мышления, ибо требования никогда не формулируются все сразу, а новая система не строится по заранее и полностью построенному сценарию. В действительности неудовлетворенные требования осознаются нами последовательно в процессе видоизменения непригодного для нас представления в виде тех или иных недостатков или "дефектов".
Мне кажется правильной мысль С.Пейперта (1972) о том, что способность к диагностике и модификации своих собственных процедур – это важный элемент человеческого интеллекта. (Об этом смотрите работу М.Минского и С.Пейперта (1972)).
"Доводка", фундаментально важный его компонент, обладает своими особыми методами и процедурами. Каждый нормальный человек имеет возможность пользоваться ими в полной мере; в противном случае он не научился бы ни видеть, ни говорить, Обратимся теперь к работам И. Голдштейн (1973) и .Дж.Суссмана (1973), в которых рассматриваются вопросы явного использования знаний о доводке при обучении символьным представлениям. В этих работах строятся новые процедуры, которые должны удовлетворять многочисленным требованиям с помощью простых и вместе с тем мощных методов. Перечислим некоторые из них:
1. Первую попытку сделайте с помощью простого объединения процедур, каждая из которых позволяем достигнуть одну определенную цель.
2. Если что-то получается не так как, нужно, попытайтесь представить один из дефектов как особый (и нежелательный) тип взаимодействия двух процедур.
3. Примените тот «метод доводки», который согласно информации, имеющейся в памяти, дает хорошие результаты при исправлении этого особого вида взаимодействия.
4. Составьте резюме по итогам выполненных операций и включите его в хранящуюся в памяти ^библиотеку методов доводки".
Эти методы могут показаться несколько наивными, однако в тех случаях, когда новая проблема не слишком отличается от старых, имеются значительные шансы на успех, особенно при правильном подборе процедур-кандидатов на совместную ра6оту. Коли же новая проблема резко отличается от всех предыдущих, то не следует ожидать, что вообще должна существовать такая теория обучения, которая будет хорошо работать в этих условиях. Без структурированного познавательного плана, без "почти промахов" П.Уинстона(1970) и без хорошей подготовки к решению проблем данного типа нельзя ожидать появления совершенно новых парадигм, как бы остро мы в них ни нуждались.
Что представляют собой "виды взаимодействий" и "методы доводки"? Самым простым для них, видимо, следует считать тот случай, когда результат достижения первой цели оказывает влияние на некоторые условия, необходимые для достижения второй цели. В этом случае можно предложить использовать эту предпосылку в качестве нового условия; известны, однако, такие ситуации, в которых применение только этой методики не приведет к успеху, ибо это новое условие несовместимо с первой целью.
Если задать вопрос о наиболее важных задачах в области искусственного или естественного интеллекта, то, на мой взгляд, среди них следует отметить, во-первых, проблему взаимодействия между рассмотренными выше идеями и, во-вторых, использование многочисленных вариантов представления для изучения одной и той же ситуации с нескольких точек зрения. Проведение исследований в этих направлениях потребует новых идей относительно взаимодействий между трансформируемыми элементами. Здесь проявляется определенная ограниченность представления о системе фреймов, взятой в изолированном виде. Образование новых представлений на базе старых является сложным процессом, в рамках нашей теории эта задача может быть решена лишь с помощью сложного предварительного ввода данных (конечно, если ее вообще можно решить). Более того, требуется особое искусство при разработке методов решения данной задачи, которую я считаю одной из основных в теории интеллекта.