Текст книги "Алгоритмы разума"
Автор книги: Николай Амосов
Жанр:
Философия
сообщить о нарушении
Текущая страница: 6 (всего у книги 17 страниц)
Критерии, потребности, чувства, стимулы
Основу деятельности интеллекта как действий с моделями составляют изменения активности его элементов. Активность – это энергия. В живых системах каждый нейрон генерирует специфическую энергию нервных импульсов, источником которой является химическая энергия, получаемая в каждой клетке в ее митохондриях. Они преобразуют энергию глюкозы и жиров в фосфорные соединения, которые и используются клеткой для своих нужд: в нейроне – на нервные импульсы, в мышце – на механическое сокращение, в железе – на синтез новых молекул. Мощности этой «электростанции» изменяются за счет тренированности или детренированности – процессов, которые в свою очередь определяются «запросами на специфическую функцию», предъявляемыми к клетке организмом как целым через его регулирующие воздействия.
В искусственном интеллекте также необходимо сохранить параметры активности элементарной модели, ее тренированности и детренированности как важнейшие средства его деятельности. Без этих параметров я не мыслю возможности создания ИИ. Другое дело, что энергетические затраты на активацию элементов ИИ могут быть ничтожно малы и не иметь значения (впрочем, они невелики и в организме), но выражение активности числом необходимо для осуществления программ взаимодействия моделей.
В живом мозге каждая нервная клетка – тренируемый «генератор импульсов», но для того чтобы она функционировала, выдавала эти импульсы, ей нужна стимуляция, то есть раздражение извне. Источником раздражения является прежде всего тело и во вторую очередь – внешняя среда. Тело действует не только через рецепторы, но и при помощи активных химических веществ, целенаправленно раздражающих центры в подкорке, являющиеся носителями тех самых критериев, о которых говорилось выше. Рецепторы, воспринимающие воздействия внешней среды, не только активируют нейроны «рецепторных полей», но действуют и более сложным образом. Путем обработки моделей среды выделяются сигналы, воздействующие на специфические нейронные ансамбли, которые соответствуют критериям – определенным качествам внешней среды, влияющим на поведение животного наряду с «требованиями тела», такими очевидными, как голод. Примером «внешних» критериев является любознательность. Этот критерий – стимул поведения животных, хотя для него нет «представительства» в теле, а качество новизны, возбуждающее центры любознательности, принадлежит среде.
Рис. 22. Зависимость чувства от «платы».
Чувство изменяется от «неприятно» НПр до «приятно» Пр в зависимости от удовлетворения потребности измеряемой величины «платы», которую нужно добавить к ее исходному уровню а, с тем чтобы получить полное удовлетворение.
Реальный стимул к некоторому действию для удовлетворения потребности измеряется приращением чувства Ч от исходного уровня а до уровня б ожидаемой «платы». Притязание – это «плата», необходимая для получения максимума чувства. Пунктирными линиями показаны новые характеристики потребностей, получаемые после адаптации: если потребность систематически не удовлетворяется, характеристика смещается влево, то есть притязание уменьшается, если же потребность удовлетворяется, характеристика смещается вправо, то есть притязание возрастает.
Понятие об информационных критериях как некоторых моделях-центрах, которые возбуждаются путем выделения информации из воздействий среды, но в то же время сами являются источником активности для других отделов мозга, исключительно важное. Его значение еще недостаточно осознано физиологами. У животных есть врожденные модели – программы переработки внешней информации и выделения из нее значимых, ценных качеств – критериев. Их субстрат – «центры» критериев – представляется особенно активным «генератором» нервной энергии, стимулирующим деятельность мозга. Значимые качества внешней среды могут быть самыми различными: новизна, превосходство собратьев по стае и пр.
Структурно критерии можно представлять при помощи моделей, имеющих «входы», «выходы» и характеристики примерно такого типа, как показано на рис. 22. Поскольку критерий является источником энергии для деятельности интеллекта, его можно связать с понятием стимула. Возможен случай, когда в результате деятельности совершаются процессы, дающие отрицательный стимул, то есть тормозящие исходную деятельность.
С понятием критерия тесно связано еще одно психологическое понятие – потребность, неудовлетворение которой побуждает к действию. Потребность является источником энергии для активации моделей. Ее можно выразить через критерий, как это сделано на рис. 22. Логично предположить, что когда потребность полностью удовлетворена, стимул для деятельности, направленной на ее удовлетворение, должен приблизиться к нулю. И наоборот, когда потребность совсем не удовлетворяется, иными словами, когда субъект – интеллект – не получает никакой «платы» от среды, стимул должен быть максимальным. Словом «плата» я буду широко пользоваться, понимая под ним все материальные, информационные и любые другие воздействия среды, получаемые интеллектом в ответ на его деятельность.
Явление адаптации тоже известно в психологии: если животное голодает, оно готово есть любую пищу, если же оно все время сыто, его пищевой центр адаптируется и требования к пище возрастают – подавай только вкусную. Однако если его снова заставить поголодать, все станет на свое место. Особенно распространена адаптация к приятному, к избытку «платы». К сильному голоду адаптироваться нельзя. При чисто психических функциях возможна значительная адаптация и к недостатку «платы» (пример – бедность информации). Уровнем притязаний можно назвать величину «платы», которая необходима для полного удовлетворения потребности, когда стимул приближается к нулю. Выражение конкретной потребности – это приращение «платы» от ее данного среднего уровня до уровня притязаний, до насыщения.
Понятия потребности и стимула тесно связаны с другим термином из психологии: «чувство». Его можно трактовать как субъективную меру удовлетворения потребности. Известно, что разная степень удовлетворения одной и той же потребности дает противоположные чувства – приятные или неприятные. Полный голод, когда потребность не удовлетворена,– неприятен. По мере насыщения наступает момент «нулевого чувства», если продолжать есть, появляется отчетливо приятное чувство. Оно достигает максимума при полной сытости, и стимул к еде в этот момент равен нулю. Стимул как источник деятельности начинается от полного голода, уменьшается по мере насыщения и исчезает при полной сытости. Таким образом, он изменяется от нуля до максимума. Величина чувства изменяется от отрицательного значения (неприятное чувство) до положительного (приятное). Стимул – это приращение алгебраической суммы чувств ..Ч от исходного до ожидаемого конечного их состояния.
Психологические компоненты приятного и неприятного наличествуют в каждой потребности. Суммарный уровень душевного комфорта (УДК) или усредненный уровень счастья – это тот показатель, к максимуму которого стремится каждый интеллект в живой природе, соответствующим образом выбирая свою деятельность. Этот показатель, как будто не имеющий отношения к искусственному интеллекту, тем не менее и для него является важнейшим рабочим параметром, так же как понятия чувств. Как ни странно, но мне кажется невозможным создание высокоразвитого искусственного интеллекта без этих параметров. Конечно, их можно было бы обозначить какими-то абстрактными символами, но это не упростило бы понимания сути дела. Я глубоко убежден, что без моделирования многих, казалось бы, чисто человеческих или даже животных чувств, создание ИИ вообще невозможно.
Рис. 23. Формирование оптимального напряжения действия (труда) при взаимодействии системы и среды. А – характеристики среды: а – изменение величины «платы» в ответ на напряжение; б – изменение величины сопротивления среды в ответ на напряжение. В – характеристики рабочего элемента: изменения положительного чувства Чпл в ответ на «плату» и чувства утомления Ут от преодоления сопротивления среды. В – суммарная характеристика: сумма чувств Ч имеет максимум, определяющий интенсивность труда. Уровню напряжения в соответствует «плата» г, сопротивление среды д и «тормоз» деятельности е.
На рис. 23 показано формирование оптимального напряжения действия (труда) как результат суммирования критерия-стимула и критерия-«тормоза» функциональной системы, взаимодействующей со средой. «Плата» а подается на рабочий элемент, формирующий соответствующее чувство Чпл. Одновременно деятельность встречает сопротивление б, вызывающее утомление Ут. Это «тормоз», ослабляющий стимул ЧПЛ. За счет нелинейности обеих характеристик устанавливается некоторое равновесие между насыщением критерия-чувства, «тормозом» и уровнем напряжения деятельности. Практически же происходит колебательный процесс за счет тренированности и детренированности рабочего элемента. С другой стороны, управляющий элемент – критерий-стимул – действует по другим законам: он способен к адаптации.
Принцип адаптации состоит в том, что характеристика управляющего элемента, в частности генератора критерия-стимула, своеобразно изменяется. Если потребность постоянно удовлетворяется, то крутизна его характеристики уменьшается (притязания возрастают); если она недостаточно удовлетворяется, то она увеличивается (притязания уменьшаются). Статическая характеристика рабочего элемента зависит от тренированности (см. рис. 9). Динамика адаптации и тренированности, то есть скорости изменения характеристики управляющего и рабочего элементов, неодинакова, поэтому саморегулирующийся комплекс, составленный из них, функционирует даже в неизменяющейся среде с некоторыми колебаниями около среднего уровня, на который был «спроектирован» комплекс – природой или конструктором. На рис. 9 показаны характеристики тренированности и детренированности рабочего элемента, а на рис. 22 – адаптация управляющего элемента при разной степени удовлетворения потребности. Такая система рассчитана на работу в среде, сопротивление которой не изменяется.
В действительности же среда не стабильна. «Сопротивление» ее улавливается «тормозом». В первом приближении – это «утомление» рабочего элемента в зависимости от сопротивления его деятельности со стороны «выхода» в среде, на которую направлена его работа. На рис. 23 показаны характеристики «тормоза» в зависимости от напряжения деятельности рабочего элемента и сопротивления среды.
«Плата» – это совсем не обязательно внешние воздействия среды. Источником активности могут быть внутренние структуры интеллекта (мозга), например модели некоторых качеств внешней среды, выделенные в процессе анализа ее моделей. Важно другое: модель, обозначающая критерий-стимул, становится усилителем, генерирующим избыточные мощности, которые этот усилитель передает другим моделям, стимулируя их активность. Проще всего предположить, что подобные модели-усилители запроектированы в генах живых существ. В действительности так и есть для некоторых врожденных чувств, выражающих потребности как функции инстинктов. Однако у человека, кроме биологических потребностей, появились социальные, часть которых в генах не предусмотрена и которые выражаются в так называемых «убеждениях». По мощности стимулов они иногда конкурируют с биологическими; Социальные потребности выражаются привитыми обществом моделями словесных формул, например долга («как надо»). Видимо, усилителем может стать любая модель, если ее активно тренировать. Биологический субстрат разума – нервные клетки – это позволяют. Соответственно тренируются и связи с этими «приобретенными чувствами», так что в результате по значимости они действительно становятся в ряд с биологическими чувствами, которые уже изначально заложены как усилители. Между прочим, воспитанием можно детренировать либо натренировать и биологические центры потребностей, и их «коэффициент усиления» изменится.
Рис. 24. Характеристики потребностей и соответствующих чувств а, б, в. Разная значимость чувств выражается в различиях абсцисс на универсальной шкале «неприятно» – «приятно» (Нпр—Пр).
Можно предположить, что как у моделей биологических, так и у натренированных приобретенных потребностей высок уровень собственной, спонтанной активности, обеспечивающий им постоянное воздействие на другие модели.
Значимость потребностей (или, иначе, их активность, «коэффициент усиления») различна. Модельно это выражается в выборе масштаба шкалы на оси абсцисс на рис. 22, где представлена характеристика «плата» – чувство. Разница в значимости чувств постоянно наблюдается у животных и человека: одни – жадные, другие – агрессивные, третьи – любопытные и т.д. В их различиях выражается направленность интеллекта – система приоритетов его деятельности. Разная значимость потребностей-чувств показана на рис. 24.
Модели потребностей – чувств-стимулов – это главные модели, они всегда находятся в оперативной памяти, поскольку имеют относительно высокую активность, которая периодически еще более возрастает, если потребность долго не удовлетворяется. Активность уменьшается после получения «платы». В этом смысле важны динамические характеристики моделей чувств. Пример статической характеристики показан на рис. 22.
На что расходуется энергия чувств в интеллекте. Можно предположить, что на возбуждение по связям других моделей, например для вызова их из длительной памяти в АИ. (Впрочем, положение о расходовании энергии активной моделью, воздействующей на другую, еще требует проверки расчетами. Возможно, энергия модели просто затухает согласно динамической характеристике, если на «вход» не поступают новые сигналы). Энергия чувств не уменьшается до тех пор, пока соответствующая потребность не удовлетворится получением «платы». Как говорилось выше, все модели в СИ обладают самостоятельной «спонтанной» активностью, величина которой определяется уровнем тренированности модели. Это положение особенно относится к моделям потребностей-чувств. Их постоянная активность должна найти отражение не только в СИ, но и в АИ, поскольку модели потребностей все время находятся в оперативной памяти.
Классификация потребностей-чувств
Первую группу составляют «специальные» потребности-чувства, которые определяются назначением интеллекта. Они отражают критерий оптимальности деятельности управляемого объекта. Я не буду на них останавливаться, поскольку возможно бесконечное множество назначений интеллекта. Вторую группу составляют потребности-чувства, необходимые для любого более или менее развитого интеллекта и являющиеся непременным условием его деятельности. Условно назову их «рабочими». И. П. Павлов называл их «сложными рефлексами» и выделял исследовательский рефлекс, рефлексы «цели» и «свободы». Я бы добавил к ним потребность деятельности и противоположную ей – потребность отдыха. Третью группу я обозначу как «интегральные чувства». Это «Приятно» и «Неприятно»; они присутствуют в каждом частном чувстве, только по ним чувства сравниваются и суммируются, так как в принципе каждое чувство совершенно своеобразно. В рассмотренных характеристиках чувств уже выделены компоненты Пр и НПр (см. рис. 22, 23, 24). Общее качество «рабочих чувств в том, что они «работают» при любой деятельности интеллекта, направленной на удовлетворение любой специальной потребности и достижение специальной цели. Без них его деятельность была бы невозможна или во всяком случае весьма затруднительна. В то же время при целенаправленной тренировке эти потребностичувства могут стать самодовлеющими и служить источником удовольствия (пример – любознательность ученого).
Рис. 25. Характеристика чувства утомления: А – накопление утомления в зависимости от длительности и интенсивности деятельности; Б – динамика чувства во время отдыха.
Несомненно, есть один общий процесс для всех видов деятельности. Это нарастание своеобразного неприятного чувства, которое выступает в роли тормоза для продолжения действий. Его можно трактовать как утомление, когда оно касается мышц, можно применить определения «скука», «надоело», когда речь идет о мышлении, но так или иначе оно присутствует. Его «входом» является сигнал от специальной следящей системы, которая учитывает длительность и напряжение деятельности, направленной к одной цели. Характеристика такого чувства показана на рис. 25. Его интенсивность является функцией продолжительности и напряжения деятельности. При прекращении действий чувство уменьшается, проходит фазы от неприятного к приятному, затем отдых надоедает, и чувство возвращается к нулю. Любое однообразное действие накапливает потребность в отдыхе или переключении на другое действие. Это касается не только всей обобщенной программы, например распознавания и исследования, но и ее частных проявлений – опознания названия, качеств, действия, прогнозов. По каждой из этих подпрограмм ведется учет количества и напряженности одинаковых операций и соответственно нарастает потребность остановиться, переключиться или отдохнуть. Уточнение соотношения двух процессов – расходования энергии действия и накопления тормозной энергии, ведущих к одному результату – остановке действия, еще требует исследования на конкретных примерах. Торможение от утомления или однообразия – универсальный процесс, касающийся любого действия, от любых стимулов. Он необходим для всякого интеллекта.
Любознательность – вторая универсальная рабочая потребность интеллекта. Многочисленные вопросы, которые у нас возникают при виде чего-либо, являются ее проявлением. Кто-что. куда-откуда. зачем-почему. и еще масса других вопросов охватывает отношения, причинность, прошлое, будущее. Качество модели, которое возбуждает любознательность,– это ее «неизвестность», отсутствие связей с другими моделями. Когда при восприятии внешнего мира в нашей кратковременной памяти отпечатываются первичные модели объектов, рецептор отключается и включается программа распознавания. Она представляет собой поиск в памяти и сравнение одинаковых или похожих, но уже известных моделей. Извлечение моделей из памяти, их активация и сравнение – это «действие», требующее энергии, которая поступает от «центра» любознательности. Вначале нужно ответить на вопрос «Кто-что.» Затем следует установление качеств, то есть ответы на вопросы «Какой.». Качеств очень много, они выражаются «частными» моделями, заключенными в одном из кадров. Существует целый ряд структурных качеств, касающихся сравнительных размеров или формы. Есть качества, воспринимаемые отдельными рецепторами, например тепло. Динамика объекта и его отношения к другим объектам тоже могут выступать как качества.
Еще одним видом распознавания является прогнозирование. Это очень важное действие, широко используемое интеллектом. Оно сводится к действию дописывания «фразы» по известным «словам», что становится возможным лишь после опознания этих исходных слов.
Программа любознательности не ограничивается только распознаванием уже воспринятой модели, но предусматривает и новое исследование среды через настройку рецепторов и нацеливание фокусированного восприятия на определенные места внешней среды или ее объект, чтобы проверить, есть ли тут важная «деталь». Исследование и распознавание продолжаются до тех пор, пока иссякнет энергия чувства любопытства и стимул нейтрализуется «тормозом» со стороны утомления.
Следующая потребность как функция «рефлекса цели» – доводить дело до конечного результата даже ценой преодоления непредвиденного сопротивления объекта деятельности. Она представляется как программа слежения, воздействующая на некоторый специальный усилитель, способный дать дополнительную энергию для избранного действия тогда, когда для его окончания не хватает главного – специального стимула.
Можно это чувство трактовать иначе: как удовольствие от самого процесса деятельности, как чувство, выражающее потребность, прямо противоположную расслаблению и отдыху. Снова получается пара программ (что бывает довольно часто): потребность действовать стимулирует напряжение, расходуется какая-то энергия, возникает утомление, которое вызывает потребность в отдыхе, после чего энергия действия восстанавливается. Отдых в свою очередь надоедает, и включается потребность деятельности. Количественное соотношение обоих процессов пока не ясно. Психологический смысл «рефлекса цели» или удовольствия, получаемого от деятельности, довольно ясен. Конечно, нет уверенности, что действия ради их самих так уж необходимы для ИИ, но, может быть, этот дополнительный стимул полезен для того, чтобы доводить дело до конца.
Еще больше сомнений вызывает «рефлекс свободы» И. П. Павлова. Суть его состоит в том, что при появлении видимой помехи, препятствующей деятельности, животное (да и человек) оставляет основную деятельность и включает специальную программу уничтожения самой помехи (тогда как в соответствии с «рефлексом цели» следовало бы включить программу преодоления мешающего воздействия помехи дополнительным стимулированием главного дела). Уничтожение препятствия сопровождается «форсировкой», называемой эмоциями. «Рефлекс свободы» часто реализуется через агрессию. Ее же можно представить как эмоцию гнева. Понимание эмоций и «экстремальных» режимов имеет значение для ИИ.
Сильно чувствуют все люди, следовательно, в принципе у всех достаточно стимулов, чтобы напряженно действовать, преодолевать сопротивление и достигать больших целей. Но в действительности это не так. Одни могут добиться желаемого, другие – нет, все зависит от характера. В модельном выражении мы определяем силу характера как способность к напряженным действиям, которая обусловливается не столько силой стимулов, сколько значимостью главного «тормоза» – утомления, скуки, «надоело». Сильные люди способны пересилить утомление, оно для них не имеет того значения, как для слабых, у которых много желаний, планов, но они не в состоянии их реализовать, поскольку быстро устают и не могут преодолеть сопротивление. Цели не достигаются, уверенность в себе исчезает, соответственно облегчаются планы и наступает детренированность механизмов системы напряжения, в частности того же «рефлекса цели». Максимум возможного напряжения – еще не все в характере, нужна, кроме того, его продолжительность: одни способны на сильное, но кратковременное напряжение, другие – на меньшее по силе, но более длительное. И уж совсем редко сочетаются оба качества силы характера: высокий уровень и большая длительность напряжения. Таким образом, характер закладывается в значимости главного «тормоза» – потребности в расслаблении, или, попросту говоря,– «чувства лени». Важную положительную роль играет ее антипод – «рефлекс цели».
Эмоции. О них следует сказать несколько слов, заканчивая раздел о чувствах. Почему-то именно они кажутся камнем преткновения на пути воссоздания разума человека. Действительно, как может «железка» переживать горе или ужас. Понятие эмоций в психологии не очень определенное. Нет четкого отграничения эмоций от чувств, даже их номенклатура расплывчата. Все согласны, что горе, ужас, радость и гнев – эмоции, а вот любовь. Однако эмоции все-таки имеют характерные черты, хотя и не столь четкие, чтобы полностью отделить их от сильных чувств. Прежде всего они дают такую высокую активность связанным с ними моделям, что все другие модели оказываются подавленными и не могут привлечь внимание. Следствием этого является крайняя субъективность оценок: все рассматривается через призму эмоции, человек не способен замечать другие раздражители и рассуждать здраво. Эмоции включают свою специфическую двигательную программу: гнев – потребность драться; ужас – бежать; радость – петь, танцевать; горе,– наоборот,– полную неподвижность. При этом происходит активация деятельности эндокринных органов, в частности возрастает выделение адреналина, который дополнительно возбуждает кору и играет роль положительной обратной связи. В целом эмоции производят впечатление первобытных примитивных чувств, которые включаются в условиях угрозы для жизни или по исчезновении такой угрозы. Можно думать, что на заре эволюции были простые рефлексы, потом на них наслоились эмоции, и уж потом дифференцировались чувства как более тонкие критерии поведения.
Воспроизвести эмоции в модели интеллекта не представляет труда. Нужно задать соответствующие «центры» как очень сильные усилители, «входами» на них будут чувства, «выходами» – модели раздражителя и ответного действия. Например, любая угроза вызывает потребность бежать или нападать, эмоция только многократно усиливает эту потребность вместе со значимостью раздражителя, вызвавшего угрозу. Центр эмоций включается от чувства через «реле силы» и дает дополнительное усиление соответствующим двигательным программам, тормозя при этом все остальные модели, пока действие не совершится.
Не думаю, что для искусственного интеллекта стоит задавать эмоции в таком виде. Они не улучшают, а нарушают разумную деятельность и оправданы . лишь у животных, поскольку включение эндокринных регуляторов позволяет на короткое время мобилизовать дополнительную мышечную силу. Возможно, что лишь для некоторых роботов понадобится такая форсировка в условиях чрезвычайной угрозы.