355 500 произведений, 25 200 авторов.

Электронная библиотека книг » Николай Амосов » Алгоритмы разума » Текст книги (страница 1)
Алгоритмы разума
  • Текст добавлен: 12 октября 2016, 03:38

Текст книги "Алгоритмы разума"


Автор книги: Николай Амосов


Жанр:

   

Философия


сообщить о нарушении

Текущая страница: 1 (всего у книги 17 страниц)

Алгоритмы разума


Предисловие

Искусственный интеллект можно определить как свойство цифровой вычислительной машины или сети нейроноподобных элементов реагировать на информацию, поступающую на ее входные устройства, почти так же, как реагирует в тех же информационных условиях некоторый задуманный или конкретный человек. Машина и моделируемый человек одинаково по своим результатам распознают образы и ситуации, решают логические и другие задачи, принимают одни и те же решения в конфликтных ситуациях, то есть, кратко говоря, демонстрируют одинаковые результаты мышления. Если машина имеет достаточный набор гибких выходных органов, то машина и человек совершают одинаковые движения, что в целом приводит к одинаковым результатам в поведении. В идеальном случае эмоциональная окраска результатов мышления и поведения у машины-модели и человека – объекта моделирования – также должна быть одинаковой.

Подобным же модельным образом можно определить и интеллект коллектива либо целого общества людей. Устранение в результате обучения модели ошибочных реакций позволяет поставить задачу о построении искусственного интеллекта, более совершенного, чем интеллект человека. Вопросы создания «сверхинтеллекта» рассматриваются в данной книге.

Требование равных для машины и моделируемого человека результатов мышления и поведения является общепринятым среди ученых при определении искусственного интеллекта. Но относительно способов достижения этого равенства существуют разногласия. Некоторые ученые допускают, чтобы машина получала те же результаты только по своим, более свойственным ей алгоритмам. К таким машинным алгоритмам относятся программы, основанные на последовательном опробовании многих вариантов решения по целесообразно выбранным критериям – принцип самоорганизации модели. Другие же ученые (к ним принадлежит и автор этой книги академик АН УССР Н. М. Амосов) считают, что алгоритмы, по которым получаются одинаковые результаты мышления и поведения у машины и моделируемою объекта, должны совпадать. Способ открытия таких алгоритмов интеллекта – эвристический. Он основан на разновидности имитационных методов моделирования – эвристическом моделировании, разработанном Н. М. Амосовым для моделирования разнообразных сложных систем.

Характерной чертой имитационных методов моделирования является то, что они исходят из общих представлений автора модели об объекте. Экспериментальные данные или опытная проверка не требуются принципиально. Так, например, при построении модели трудовой активности личности достаточно указать общий характер нелинейных зависимостей типа «труд—плата», «плата—чувство», «чувство—труд» и др.

Подобно тому как это делается при имитационном динамическом моделировании Дж. Форрестера, характеристики элементов системы задаются автором модели машине, которая, решая полученную ею систему уравнений при различных начальных и граничных условиях, демонстрирует на дисплее возможные «сценарии» – варианты происходящих в системе процессов. При этом подтверждается, что система вовсе не является простой суммой ее элементов, так же как и решение системы уравнений не является суммой решений каждого из них.

Эвристическое моделирование Н. М. Амосова, в отличие от динамического моделирования Дж. Форрестера, оперирует в основном графическими нелинейными характеристиками элементов, а не их дифференциальными уравнениями, хотя использование последних не исключается. Это допустимо, так как изучаются только постоянно действующие установившиеся зависимости (об ограничениях области рассмотрения, принятой в книге, будет сказано ниже). Наблюдающийся сейчас несомненный успех применения и быстрое распространение имитационных методов моделирования объясняются удачным распределением «обязанностей» между человеком и машиной. Человек хорошо придумывает поэлементные характеристики, а машина хорошо обобщает их в единую систему уравнений, решая которую получает искомые результаты. Слабой стороной имитационных методов моделирования является их субъективный характер. Если изменятся представления автора модели о характеристиках элементов объекта, то изменятся и модели. К тому же практически сколько авторов – столько и моделей. Двух авторов с совершенно одинаковыми представлениями об объекте найти трудно. Здесь уместно напомнить читателю о существовании других, объективных методов моделирования, таких, как метод эвристической самоорганизации моделей, основанных на обработке небольшой таблицы опытных данных. Различие состоит в том, что имитационные методы моделирования, не требуя опытных данных, позволяют получить модели некоторых обобщенных объектов, тогда как экспериментальные методы дают модель конкретной личности, коллектива и общества.

В данной книге рассматривается имитационное моделирование указанных объектов в постановочном плане. На первых порах искусственный интеллект может не достигать полного совпадения модели и объекта. Моделирование вначале может решать только часть интересующих нас актуальных задач.

Основные ограничения следующие: динамика процессов выбора цели (целеполагания) и образования «установки» не рассматривается; цель объекта и система правил поведения считаются заданными или уже выработанными; эмоции не моделируются; рассматривается только неслучайная, регулярная составляющая психологических процессов; динамика не учитывается, поскольку уравнения элементов системы задаются как установившиеся характеристики.

В книге оговаривается, что эмоции человека в описываемых алгоритмах пока не моделируются. Кроме того, моделирование учитывает только так называемую регулярную составляющую результатов мышления и поведения, обусловленную воздействиями – «стимулами». При этом учитываются как точка зрения бихевиористических теорий (закон «стимул—реакция»), элементы гештальт-психологии (учет «врожденной», то есть заложенной при создании машины образной информации), так и предыстория одновременного взаимодействия многих элементов (обучение). Случайная составляющая результатов моделированию не подлежит. Поясним это. Мышление, как известно, связано с процедурой постановки задач и принятия решений. Каждое из решений происходит в условиях воздействия на личность многих признаков (термины «признак», «стимул» и даже «критерий» в данном контексте являются синонимами). В области задачи, где все признаки действуют согласованно, в одном направлении, решение является регулярным, однозначным, определенным. Например, если все рецепторы свидетельствуют о том, что распознаваемая буква есть буква А, то другая классификация буквы исключается. Отметим, что нас будет интересовать область случайных или нерегулярных решений задач, где действуют противоречивые признаки или стимулы. Грубо говоря, если сумма противоречивых стимулов с учетом их важности близка к нулю, например часть рецепторов утверждает: «буква А», а другая часть – «буква Б», то мозг принимает «чисто» случайные, равновероятные решения. Именно в этой области проявляется так называемая свобода выбора. В книге указывается, что в случае нерегулярности, согласно учению о доминанте, происходит всемерное усиление внимания и разрешающей способности, но если и оно не помогает, то в действие вступает случай.

Предсказать случайное решение принципиально невозможно, так же как нельзя регулярно угадывать результат тиража «спортлото» или предвидеть, на какую сторону упадет подброшенная вверх монета. Область случайных решений поддается моделированию только в том смысле, что и в модели можно предусмотреть генератор случайных движений. Однако направление случайного движения регулярно угадывать нельзя. Все сказанное хорошо согласуется с известной теорией многокритериального управления Парето (1909 г.), в соответствии с которой в области эффективных решений, где критерии противоречат друг другу, математика, а следовательно, и моделирование бессильны. Здесь для принятия решений обычно привлекаются эксперты, которые знают, что же нужно выбрать. Машина может только существенно помочь выбору, используя дополнительно процедуру прогнозирования будущего для каждого из входящих в область решений Парето (журн. «Автоматика», 1978, № 2). Добавление процедуры прогнозирования можно использовать и для сокращения области случайных решений человека. Область, где моделирование возможно, при этом расширяется. Вопрос о принципиальной возможности моделирования сводится к выяснению соотношения области регулярности и области случайного выбора в актуальных задачах. Профессор В. В. Налимов, например, утверждает, что в интересующих нас задачах биологии и социологии участвует такое множество противоречивых воздействий, что моделирование невозможно (журн. «Автоматика», 1977, №4). Конечно, это является преувеличением. Н. М. Амосов исходит из того, что область регулярных неслучайных решений при моделировании интеллекта достаточно содержательна, и ограничивает свое рассмотрение этой областью.

Привлечение идей Парето позволит в какой-то мере согласовать позиции сторон в научной дискуссии об экспериментально-вербальном, психологическом и математическом информационно-кибернетическом подходах в исследовании интеллекта. В частности, утверждение психологов о том, что в психике человека имеется принципиально не поддающаяся моделированию область решения задач (см., например, Тихомиров О. К. Развитие вычислительной техники и психологическая наука,– Вестник Московского ун-та. Психология, 1977, № 2, 3, 4), с учетом теории Парето получает ясное математическое объяснение. Экспериментальный характер моделирования обеспечивается рядом методов кибернетического подхода, что также соответствует требованиям психологов.

Простейшим применением излагаемой в данной книге теории моделирования интеллекта является создание роботов, управляемых по вычислительным программам, содержащим проявления интеллекта. Созданный под руководством автора книги в отделе биокибернетики Института кибернетики АН УССР робот – трехколесная тележка ТАИР – обходит препятствия и находит оптимальный путь к цели. Наблюдения за интеллектуальными роботами пока являются своеобразным и, пожалуй, единственным методом экспериментальной проверки всей теории в целом: поведение роботов должно быть «интересным» и «умным».

Излагаемая в книге теория интеллекта в целом далеко выходит за пределы задачи управления роботами и предназначена для моделирования поведения и интеллектуальной деятельности как отдельной личности, так и коллектива или даже общественной системы. Робот в виде нейроноподобной аналоговой М-сети с положительной обратной связью только иллюстрирует возможность реализации значительно более общей идеи.

Н. М. Амосов смело ставит вопросы об имитационном объяснении на основе его моделей самых сложных вопросов психологии человека – таких, какие возникают при решении задач, исследовании подсознания, сновидений, «озарений» и других сложных явлений.

В заключение автор высказывает сомнение в том, удалась ли ему книга. Я уверен в ее большой пользе, в том, что она очарует не только кибернетиков, но и психологов, воспринявших имитационный метод моделирования, а также всех тех, кого интересуют тайны регулярного поведения живого и искусственного интеллектов. Что касается упомянутых выше значительных ограничений области исследования, то они будут поняты как необходимые при первопроходческом характере работы.

Член-корреспондент АН УССР

А. Г. Ивахненко

Введение

Механизмы разума интересуют ученых разных специальностей. Для психологов и физиологов – это теория их науки, для кибернетиков – пути создания искусственного интеллекта (ИИ). В предлагаемой вниманию читателя книге я попытаюсь дать изложение представлений о этой проблеме – как результат развития работ, ведущихся в отделе биокибернетики Института кибернетики АН УССР начиная с 1962 г. Новые идеи значительно отличаются от ранее опубликованных [1, 3].

Слово «алгоритм» не случайно введено в название книги: мне представляется, что есть возможность «разложить по полочкам» самые сложные проявления интеллекта – и даже с перспективой на его развитие выше уровня человеческого разума. Видимо, я не смогу убедить скептиков – для этого нужно воспроизвести алгоритмы интеллекта в программах. К сожалению, на этом пути стоят большие трудности. Может быть, излагаемые идеи как-то помогут энтузиастам проблемы. Предупреждаю, что предмет исключительно сложен для понимания, поскольку лежит на стыке физиологии, психологии, техники и даже философии. Для упрощения я буду широко пользоваться схемами.

Интеллект определяется как совокупность средств и способов управления сложными системами путем оперирования с их моделями, направляемого критериями оптимальности управления. Современная наука и техника дают возможность воспроизводить модели и действия с ними техническими средствами и таким образом отделить разум от мозга, с которым его обычно связывают. Отличие приведенного определения от множества других состоит в том, что оно подчеркивает это последнее обстоятельство.


Рис. 1. Схема сетевого интеллекта (СИ): Об – объект управления; Рц – рецепторы; Э – эффекторы; ВП – кратковременная память; ПМ – первичная модель; ПП – постоянная память; РМ – распознанная модель; Кр – критерии; МД – модель действия.

Таким образом, говоря об интеллекте, мы будем иметь в виду эту совокупность средств и способов управления, независимо от того, реализована ли она в биологических системах или при помощи искусственно созданных, технических средств. Такое употребление термина «интеллект» не является общепринятым. Оно, однако, тесно связано с основной идеей этой книги. В тех отдельных случаях, когда речь пойдет только о естественном интеллекте человека, это будет специально оговариваться. Что же касается термина «искусственный интеллект» (ИИ), то он, как это и принято, будет использоваться для обозначения различного рода технических реализаций, моделей интеллекта.

Остановимся на основных понятиях, с тем чтобы постепенно войти в круг обсуждаемых вопросов. Прежде всего нужно выделить два противоположных подхода к моделированию интеллекта. Условно их можно назвать сетевым и алгоритмическим. Соответственно будем различать и два типа моделей – сетевой (СИ) и алгоритмический (АИ) интеллекты.

Самая простая схема сетевого интеллекта показана на рис. 1. Объект управления (Об) представляет собой некую сложную трехмерную структуру. Она воспринимается датчиком – рецепторами Рц (например, глазами) и передается сигналами в «мозг», где превращается в первичную модель ПМ. В первом приближении ПМ представлена плоской двухмерной структурой, составленной из возбужденных, активированных элементов некоторой сети – условного «рецепторного поля». Объект распознается путем наложения ПМ на множество фигур из неактивных элементов, объединенных «проторенными» связями. Эти неактивные модели-фигуры представляют собой модели уже известных объектов и составляют постоянную память ПП. В соответствии с принципом действия СИ элементы, составляющие постоянную и временную (или активную) память ВП,– одни и те же; они отличаются только уровнем активности. Наложением первичной модели на сеть выбирается и активируется одна распознанная модель – фигуры РМ, и от нее включается управляющее воздействие на объект. Это воздействие представлено моделью действия МД, управляющей эффекторами Э. Распознанная модель объекта связана с несколькими моделями действий; выбор одной, нужной, определяется критерием Кр. Активированная от РМ и Кр модель действий передает активность на эффекторы, в которых управляющие сигналы превращаются в механическую энергию управляющего воздействия. Таким образом, в сетевом интеллекте «действия с моделями» представлены изменением активности элементов сетей, в которых заложены модели.

Рис. 2. Схема алгоритмического интеллекта (АИ): Об – объект управления; Рц – рецепторы; ПМ1 – первичная структурная модель; П1 – преобразователь; ПМ2 – первичная цифровая модель; РМ – распознанная модель; Кр – критерии; ДП – длительная память; МД – цифровая модель действия; П2 – преобразователь; Э – эффекторы.

На рис. 2 показана схема алгоритмического интеллекта. Начало его функционирования такое же, как в СИ,– в результате работы рецепторов Рц формируется первичная структурная модель ПМ1 в виде такой же плоской двумерной структуры. Однако она тут же считывается преобразователем П1 превращаясь в линейную, одномерную модель из набора цифр – ПM2. Все последующие действия осуществляются с этой моделью. Распознавание ПМ2 состоит в последовательном сравнении ее с записанными тем же кодом моделями-эталонами из длительной памяти ДП, где находится распознанная модель РМ. По этой модели выбирается модель действия МД. Процесс этот осуществляется путем перебора моделей в длительной памяти под управлением критерия Кр. Модель действия передается на преобразователь П2, где цифровой код превращается в управляющие сигналы эффекторов Э и через управляющие действия – на объект Об.

Основное различие между СИ и АИ состоит в структуре памяти и вытекающих отсюда разных действиях с моделями. Однако в обоих типах интеллекта сохраняется принцип управления моделями со стороны критериев управления через их активацию.

Создание СИ и АИ предполагает использование разных методологических подходов к моделированию одного и того же объекта – разума человека. Каждый из подходов имеет свои сильные и слабые стороны. Поэтому при построении реальных систем ИИ может оказаться целесообразным представление некоторых функций разума в виде сетевых моделей, а некоторых – в виде алгоритмических. Общий принцип здесь таков: чем ниже уровень моделируемой функции в общей иерархии функций разума, тем вероятнее, что при ее воспроизведении в ИИ наиболее эффективным окажется сетевой метод.

Дело в том, что реализация многих функций нижнего уровня (как, например, нахождение распознанной модели по первичной модели – см. рис. 2) связана с осуществлением больших переборов в длительной памяти. Такие переборы особенно эффективно осуществляются в сетевых моделях, реализующих параллельные процессы переработки информации. В то же время сетевые модели имеют другие недостатки, ограничивающие область их применения. На сравнительном анализе достоинств и недостатков сетевых и алгоритмических моделей я еще буду неоднократно останавливаться.

Вопросам создания и исследования свойств СИ посвящен ряд работ, выполненных под руководством автора. Получены конкретные результаты, краткий обзор которых содержится в первом разделе книги. Все дальнейшее изложение я посвящу описанию принципов построения АИ, не делая больше специальных оговорок, что при практической его реализации ряд функций может быть представлен при помощи сетевых структур.

Искусственный интеллект сегодня

Основные этапы и направления исследований

Не буду даже пытаться охватить всю проблему искусственного интеллекта. Книга задумана как изложение собственной гипотезы об общих механизмах или алгоритмах интеллекта, которым равно подчиняются разум животных, человека, коллективный разум общества и которые, как мне кажется, обязательны для любой его модели.

Искусственный интеллект стал особой областью знания. Существуют специальные комитеты, координирующие исследования по этой проблематике, издается несколько журналов, созываются международные конференции. С одной стороны, предмет этих исследований примыкает к теоретической кибернетике, с другой – к технике автоматов и роботов, есть и психофизиологический аспект проблемы. Одно скажу сразу: искусственный интеллект не создан. Векселя, которые выдала кибернетика в начале своего развития, претендуя на решение почти всех интеллектуальных задач, остались неоплаченными. Более того – наметился явный пессимизм во взглядах на саму возможность воспроизвести разум человека. Сошлюсь на книги Дрейфуса. Тем не менее большинство ученых-кибернетиков смотрит в будущее с надеждой, хотя теории интеллекта пока нет и все предлагаемые модели представляют собой воспроизведение частных механизмов мышления. Для того чтобы дать представление о состоянии дела, приведу очень краткую сводку работ последнего времени.

С самого начала основные надежды кибернетики были связаны с моделированием работы мозга. Было ясно, что здесь можно идти двумя путями – моделировать нейронные сети и воспроизводить алгоритмы мышления.

Лучшие результаты по моделированию нейронных сетей были получены в работах школы У. Мак-Каллоха [7]. Выяснилось, однако, что сети из формальных нейронов не способны воспроизводить сложные функции мозга. Неэффективными оказались также попытки использовать такие сети для управления роботами [9]. Большой интерес вызвали работы Ф. Розенблата, который сформулировал ряд принципов нейродинамики мозга и использовал их для построения персептронов – устройств для распознавания образов. Однако строгий анализ, осуществленный М. Минским и С. Пейпертом [8], показал ограниченность существующих здесь возможностей. Таким образом, к началу 70-х гг. общий кризис нейронного подхода стал очевидным.

Одновременно проводились исследования по алгоритмическому моделированию мышления. Оcновные достижения в этой области связаны с именами А. Ньюэла и Г. Саймона [12]. Их работы по созданию GPS (общего решателя проблем) привели к формированию отдельного направления – эвристического программирования, влияние которого на исследования по ИИ прослеживается до сих пор. Однако в целом это направление исчерпало свои возможности уже к началу текущего десятилетия. При этом выяснилось, что оно не позволяет приблизиться к сколько-нибудь общей теории мышления, хотя и может обеспечить решение отдельных прикладных задач.

Кризис обоих направлений привлек внимание к работам, начатым еще в 50-е гг. и связанным с использованием формальных методов для решения сложных, «интеллектуальных» задач (доказательство теорем, игры и т.п.). К этому времени здесь был получен ряд интересных результатов. Среди них следует отметить разработку А. Сэмюэлем [11] программы для игры в шашки, которая до сих пор является одной из лучших игровых программ. Работы этого направления и составили основу нового раздела кибернетики, который занимается проблемой искусственного интеллекта.

В начале 70-х гг. на исследования по ИИ оказывали большое влияние результаты, полученные в области математической логики Дж. Робинсоном. Развитый им метод резольвенций позволил строить мощные процедуры доказательства теорем. Это было использовано для построения нового класса программ, решающих сложные задачи. Наибольшую известность среди них получила разработанная в Стенфордском исследовательском институте программа STRIPS [14], решающая задачи планирования действий робота. Методы математической логики составили также основу теории поиска решений, главные положения которой обобщены в работах Н. Нильсона. Однако использование этих методов для широкого круга задач показало их низкую эффективность, обусловленную в основном большим объемом и громоздкостью соответствующих программ для ЦВМ. Так что к 1975 г. наметилось разочарование и в этом подходе.

Попытки преодолеть трудности, сопутствующие разработке больших программ, привели к появлению новых методов автоматизации программирования и созданию специальных проблемно-ориентированных языков. Большие достижения здесь связаны с работами К. Хьюитта по построению языка PLANNER [15, 16], который послужил основой для целого ряда дальнейших разработок в этом направлении.

Использование новых языков программирования обеспечило прогресс в сравнительно новой для ИИ области – имитации речевого поведения человека. Первые значительные успехи здесь были получены Т. Виноградом [5], разработавшим систему диалогового управления роботом с помощью естественного языка. Начиная с 1973—1975 гг. проблемы естественной речи привлекают все большее число исследователей. Разрабатываются проблемы понимания [13], представления знаний, грамматического анализа и др. Проблема понимания активно исследуется также и в другой области ИИ – распознавания зрительных образов. Широко известны работы М. Минского, развивающего теперь новую теоретическую концепцию восприятия, связанную с представлениями о «системах фреймов».

В целом в последние годы опять намечается тенденция к использованию в программах ИИ знаний о поведении и мышлении человека, хотя сама задача моделирования человека прямо не ставится.

Меня больше всего интересует как раз эта задача – моделирование человека. Естественно было бы обратиться к нейрофизиологии и психологии. Именно эти науки должны описать физиологические механизмы психических явлений и дать рекомендации по их моделированию. Возможно, работающим здесь ученым кажется, что они знают, как мыслят животные и человек, но я не мог уяснить этого из их книг. Не нашел я и возможности переложить их словесные формулировки на цифровые модели. Впрочем, и другие кибернетики тоже не смогли перевести физиологию мозга в модели.

Разумеется, никто не будет отрицать, что именно нейрофизиологам принадлежат основополагающие открытия, благодаря которым стали возможными попытки строить модели. Перечислю несколько основных.

Первое – учение И. М. Сеченова о возбуждении и торможении. Разный уровень активности нейрона – от полного «молчания» до максимального возбуждения – это важнейший механизм взаимодействия моделей. Открытие И. П. Павловым условных рефлексов и условных связей дало объяснение обучаемости и самоорганизации. Учение А. А. Ухтомского о доминанте позволяет предположить механизм превалирования главной модели над всеми остальными. Если к этому добавить работы о ретикулярной формации, то, вместе взятые, они подсказали идею центрального регулирования активности коры – систему усиления-торможения (СУТ) и механизм сознания и подсознания. 3. Фрейд достаточно обосновал большое значение подсознания в психической жизни человека. Опыты X. Дельгадо и Н. П. Бехтеревой со вживленными электродами показали, как центры чувств управляют поведением, являясь источниками активности для моделей коры. Наконец, исследования Н. П. Бехтеревой и др. обнаружили так называемый «код слов», то есть наличие самих моделей слов речи, которые, видимо, запечатлены в нескольких или даже многих ансамблях нейронов. Следует также упомянуть П. К. Анохина, предложившего общие принципы управления физиологическими процессами.

Простое перечисление основных идей нейрофизиологии показывает, что наша гипотеза об алгоритме интеллекта является лишь одним из возможных вариантов их компоновки в единое целое. Это сделано для того, чтобы попытаться применить метод эвристического моделирования для изучения мышления и поведения. Если нейрофизиология идет к психике «снизу» путем анализа, от механизмов нейронов и их ансамблей, то кибернетическое моделирование идет «сверху», путем синтеза. Мне представляется, что второй подход имеет право на научность. Не уверен, что модели уже сейчас предложат физиологии новые идеи для экспериментов, но для создания искусственного интеллекта они дадут достаточно материала. К сожалению, попытки заинтересовать моделями физиологов и психологов пока терпят неудачу. Они кажутся им слишком примитивными в сравнении с огромной сложностью мозга. Что ж, против этого пока нечего возразить. Нужны более доказательные модели, способные продемонстрировать как можно больше феноменов поведения человека. Именно к этой цели и направлены работы отдела биокибернетики Института кибернетики АН УССР. Приведу их краткую историю.


    Ваша оценка произведения:

Популярные книги за неделю