355 500 произведений, 25 200 авторов.

Электронная библиотека книг » Джарон Ланир » Вы не гаджет. Манифест » Текст книги (страница 11)
Вы не гаджет. Манифест
  • Текст добавлен: 5 октября 2016, 04:50

Текст книги "Вы не гаджет. Манифест"


Автор книги: Джарон Ланир



сообщить о нарушении

Текущая страница: 11 (всего у книги 14 страниц)

И хотя действительно в кино и сегодня есть всего несколько гениев, оказалось, что основные навыки получить так же просто, как научиться говорить или водить машину. То же самое должно когда-нибудь случиться с математикой. Соответствующий инструмент мог бы содействовать тому, чтобы математика стала еще одним способом творчески объединять множество людей в нашей культуре.

В конце 1990-х годов я был очень озабочен, так как казалось, что это начинает происходить. По всему миру математики всех мастей стали создавать веб-сайты, пытаясь выяснить возможности объяснить простым людям, чем они занимаются. В Сети стало легко познакомиться с замечательными геометрическими фигурами, странными поворотами логики и магическими последовательностями чисел. Ни один из материалов не был совершенен, большинство, по правде говоря, были странными и неуклюжими. Но такого рода материалы никогда раньше не появлялись в значительном количестве и в этом процессе никогда не принимали участия настолько разные люди, поэтому все до мельчайшей детали было экспериментом. Процесс оказался медленным, но была тенденция, которая могла куда-то нас привести.

Забытая альтернатива «Вики»

Одной из организаций этого, почти забытого, раннего периода Всемирной паутины был ThinkQuest – проводимый пионерами сети, в частности Элом Вайсом, конкурс, в котором команды студентов соревновались за стипендии, разрабатывая веб-сайты, объяснявшие идеи различных академических дисциплин, в том числе математики.

Поначалу ThinkQuest занимал успешную нишу, похожую на ту, которую сейчас занимает «Википедия». Будучи некоммерческим сайтом, он привлекал такую же огромную аудиторию, что и большие коммерческие сайты того времени, куда входили некоторые организации с названиями вроде AOL. Запись в ThinkQuest часто оказывалась первой в результатах поиска по сети.

Но составители ThinkQuest были гораздо более оригинальны и ценны, чем составители «Википедии». Участники конкурса были вынуждены учиться представлять идеи как целое, помимо того что им приходилось учиться использовать новый инструмент. Их работа включала симуляции, интерактивные игры и другие элементы, бывшие в новинку для всего мира. Они не просто переделывали уже существующий материал в более регулярную, анонимную форму.

ThinkQuest, вероятно, обходился немного дороже, чем «Википедия», поскольку механизм оценки предусматривал использование экспертов – конкурс не задумывался как война или состязание в популярности, – но он все равно был дешев.

Поиск новых способов делиться математикой в сети был и остается невообразимо трудным. [19]19
  Например, придумать, как показать эндекахорон (hendecachoron), представляющий собой четырехмерную форму, которая мне очень нравится, в доступной, интерактивной веб-анимации, – чрезвычайно трудная задача, которая до конца до сих пор не решена. Напротив, дополнить минимальную, сухую, сырую, но правильную статью об эндекахороне в «Википедии» намного проще, но это ничем не поможет тому, кто столкнулся с такой формой впервые.
  Это удивительная форма, потому что она симметрична, как куб, у которого шесть граней, но его симметрия – это симметрия простого числа 11, а не числа 6, которое можно делить. Но простые числа не делятся поровну, поэтому довольно странно звучит, что могут существовать их геометрические симметрии. Это возможно только потому, что эндекахорон нельзя вписать в сферу, как куб. Вместо этого он вписывается в близкого родственника сферы, которого называют реальной плоскостью проекции. Эта форма похожа на знаменитую бутылку Клейна в двойном пределе. Не кто иной, как Фримен Дайсон, познакомил меня с эндекахороном, а Карло Секуин и я работали над созданием его первого изображения. (Прим. автора)


[Закрыть]
Большая часть записей в ThinkQuest была слаба, а те, что оказались сильными, потребовали невообразимых усилий.

Всемирная паутина должна была развиваться в русле модели ThinkQuest, а не модели «Вики» – так и было бы, если бы не идеология коллективного разума.

Когда поиск был «кривым»

Довольно часто в течение нескольких лет первые страницы результатов поиска по очень многим запросам в поисковиках вроде Google не содержали ничего, кроме выдержек из «Википедии». Казалось, в Сети не существует больше никаких доступных поиску страниц по обширному срезу знаний и опыта человечества. В последнее время ситуация, кажется, выправляется – я думаю, потому что поисковые машины отреагировали на жалобы.

Люди, вносящие свой вклад в «Википедию», естественно, эмоционально привязываются к тому, что они сделали. Их тщеславные ссылки, вероятно, помогли направить поисковые машины к единственной книге коллективного разума. Но период, когда поиск был искривлен, сделал по-настоящему творческие, борющиеся, экспериментальные веб-разработки менее видимыми и менее оцениваемыми, что часто приводило к смертельной спирали.

Много из старых, более персонифицированных и более амбициозных материалов из первой волны вебпроизведений до сих пор никуда не делись. Если вы проведете поиск на тему математики и проигнорируете первые результаты, которые часто указывают на статьи из «Википедии» и их эхо, вы начнете получать ссылки на странные персональные попытки и даже на старые страницы ThinkQuest. Часто оказывается, что последний раз они обновлялись примерно тогда, когда возникла «Википедия». «Вики» лишила тенденцию силы. [20]20
  Я должен подчеркнуть еще раз: там, где «Википедия» полезна, она может быть не единственнымполезным источником. Например, существует альтернатива сырым, сухим математическим определениям – сайт, существующий как бесплатный сервис компании, производящей программное обеспечение для математиков. См. http://mathworld.wolfram.com/. (Прим. автора)


[Закрыть]

Борьба за включение математики в культуру продолжается, но уже по большей части не в Сети. Огромным шагом в этом направлении стала недавняя публикация книги Джона Конвея, Хайди Бурджил и Хаима Гудмана-Штрауса «Симметрия вещей». Это демонстрация силы, которая объединяет вводный материал с последними идеями с помощью совершенно нового визуального стиля. Меня разочаровывает то, что передовая работа продолжается преимущественно на бумаге и практически заглохла в Сети.

То же самое можно сказать о многих других темах помимо математики. Если вы, например, интересуетесь историей музыкальных инструментов, вы можете покопаться в архивах Сети и найти персональные сайты, посвященные этому предмету, хотя последний раз они обновлялись, вероятно, примерно в то время, когда появилась «Википедия». Выберите тему, в которой вы что-то понимаете, и посмотрите сами.

«Википедия» поднялась до того уровня, который может стать ее постоянной нишей. Она способна застыть, как MIDI или сервис обмена рекламой Google. Чтобы вы знали, это делает важным то, что вы можете пропустить. Даже в том случае, когда существует уже известная объективная истина, такая как математическое доказательство, «Википедия» уводит в сторону от вопроса, как включить ее в общение новым способом. Индивидуальный голос – в противоположность «Вики», – может, ничего и не значит для математической истины, но он является основой математической коммуникации.

Часть четвертая
Возьмем от битов лучшее

В этом разделе я переключусь на более позитивную перспективу, опишу отличия кибернетического тотализма от гуманизма, рассмотрев эволюцию культуры человека.

Я надеюсь показать, что каждый способ мышления имеет свое законное место и конкретные прагматические рамки, если в нем есть смысл.

Кибернетический тотализм не подходит как основа для принятия большинства решений, но некоторые его идеи могут быть полезными методами познания.

Различие между пониманием и убеждением, между наукой и этикой размыто. Я вряд ли могу утверждать, что безошибочно различаю эти два понятия, но, надеюсь, изложенные ниже отчеты о моих попытках могут оказаться полезны.

Глава 12
Я противоречу сам себе

Разбираются разновидности вычислительного способа мышления, определяется реалистичный вычислительный подход к нему.


Культура вычислительного подхода к природе

В Кремниевой долине можно встретить буддистов, анархистов, поклонников культа Богини, фанатиков Айн Рэнд, самозваных служителей Иисуса, нигилистов и множество либертарианцев, а также удивительные комбинации всего вышеперечисленного и еще многих других, кто на первый взгляд не придерживается никакой идеологии. Тем не менее есть система веры, которая, не соответствуя ни одной из упомянутых идентификаций, и может служить «общим знаменателем».

За неимением лучшего слова я назвал ее вычислительным способом мышления. Этот термин обычно используется в более узком смысле, означая склад ума, но я использую его более широко и включаю в это понятие что-то вроде культуры. Лежащую в его основе философию в первом приближении стоит вкратце описать так: мир можно понять как вычислительный процесс, представляя людей как подпроцессы.

В этой главе я изучу применение вычислительного подхода в научных рассуждениях. Я утверждаю, что, даже если вычислительный способ мышления полезен для понимания науки, его нельзя использовать при оценке инженерных решений определенного типа.

Три недостаточно хороших вида вычислительного подхода

Я, критик вычислительного подхода, редкий гость в кругах ученых-информатиков, так что приходится отметить, что эта философия в ряде случаев полезна.

Вычислительный способ мышления – это не всегда сумасшествие. Иногда к нему прибегают только потому, что не применить его означает столкнуться с другими проблемами. Если вы собираетесь рассматривать людей как нечто особенное, как я и советовал, то вы должны быть в состоянии определить, где их особость начинается и где заканчивается. Это очень похоже на проблему определения круга сочувствия, которую я описал в гл.2. Если вы хотите, чтобы разрабатываемые технологии служили людям, вы должны иметь хотя бы приблизительное представление о том, что является личностью, а что нет.

Но есть случаи, когда любое возможное определение круга порождает проблемы. Особенно трудно ученым разделить мир на две части, одна из которых обычная – детерминистская или, возможно, механистическая, а другая – загадочная, более абстрактная. Пугающий путь дуализма.

Если вы предполагаете, что в духовной плоскости мозг связан с другой сущностью – душой, становится неудобно изучать, к примеру, неврологию. Вам приходится подходить к мозгу просто как к механизму, который вы не понимаете, чтобы улучшить это понимание путем экспериментов. Вы не можете заранее заявить, что у вас получится объяснить, а что нет.

Здесь я противоречу сам себе, но причина – в понимании того, что в разное время я играю разные роли. Иногда я придумываю инструменты для использования их людьми, а потом работаю с учеными, пытаясь понять, как функционирует мозг.

Наверное, было бы лучше, если бы я мог найти одну философию, которой бы в равной мере пользовался в любых ситуациях, но, мне кажется, лучшее решение – верить в разные проявления различных аспектов реальности, когда я выступаю в разных ролях или выполняю работу того или другого вида.

До сих пор я излагал то, во что верю, когда играю роль технолога. В таких случаях я рассматриваю человека как нечто мистическое. Моим главным приоритетом становится не допустить умаления людей до простых устройств. Самый надежный способ – верить, что гаджеты, которые я разрабатываю, есть просто инертные инструменты, которые полезны исключительно потому, что люди обладают магической способностью передавать с их помощью смысл.

Когда я выступаю в другой своей роли, роли соавтора ученых, я верю в несколько иное. В таких случаях я предпочитаю идеи, не предусматривающие магических объектов, потому что ученые могут изучать людей, если в них нет совсем ничего волшебного. В идеале ученый должен уметь хоть немного изучить нечто, не разрушая его. Весь смысл технологии, однако, заключается в изменении ситуации, в которой находятся люди, так что для людей абсурдно стремиться быть непоследовательными.

В роли ученого я не пугаюсь идеи, что мозг – это что-то вроде компьютера, но есть множество способов использования вычислений в качестве источника моделей человеческих существ. Я опишу три распространенные формы вычислительного способа мышления, а затем и четвертую – ту, которая мне по душе. Каждая из разновидностей обладает своей идеей о том, что потребуется для изменения знакомых нам программ, чтобы они стали больше похожи на личности.

Основание одной из разновидностей таково: достаточно большой объем вычислений приведет к тому, что программы приобретут качества, которые мы ассоциируем с людьми, – такие как сознание. Можно заявлять, что закон Мура неумолимо приведет к возникновению супермозга, суперсуществ и, возможно, какого-нибудь глобального или даже космического сознания. Если эти высказывания кажутся вам чересчур смелыми, имейте в виду, что именно такого сорта риторику вы услышите в мире энтузиастов сингулярности и адептов экстропии.

Если не рассматривать романтическую сторону идеи, в основе ее останется предпосылка того, что смысл порождается битами в результате накопления их количества. Набор из тысячи записей в базе данных, которые ссылаются одна на другую в определенном порядке, не имел бы смысла без человека, который интерпретирует их. Но, наверное, квадриллион или гугол записей может означать что-то сам по себе, даже если рядом нет существа, которое бы все это объяснило.

Другими словами это можно выразить так: если вы располагаете достаточным количеством данных и достаточно большим и быстрым компьютером, вы предположительно можете преодолеть проблемы, связанные с логическим позитивизмом. Логический позитивизм – это идея о том, что предложение или другой фрагмент – нечто, что можно записать в файл, – означает что-то само по себе, не требуя привлечения субъективности читающего его человека. Или, говоря сленгом компьютерных фанатов, «значение предложения есть инструкция его верификации».

Логический позитивизм вышел из моды, и немногие сегодня встанут под его знамена, но с помощью компьютеров он неофициально возрождается. Новая версия идеи гласит, что, располагая достаточным количеством данных, вы сможете заставить логический позитивизм работать на основе статистики больших чисел. Рассуждения примерно таковы: в рамках облака не будет надобности в непостижимых половинах традиционных противопоставлений (дихотомий), таких как синтаксис/семантика, количество/качество, содержание/контекст и знание/мудрость.

Вторая разновидность вычислительного подхода утверждает, что программа с определенными свойствами, обычно связанными с самопредставлением и кольцевыми ссылками, похожа на личность. К числу некоторых приверженцев этого подхода относятся Даниэль Денетт и Дуглас Хофштадтер, хотя оба имеют собственные представления о том, какими должны быть эти специальные свойства программы.

Хофштадтер говорит, что программы, имеющие «странный цикл», несут в себе черты сознания. В «странном цикле» вещи включены в другие таким образом, что внутренняя является тем же, что и внешняя.

Если вы спускаетесь на парашюте на город, приземляетесь на крыше, попадаете в здание через дверь на этой крыше, входите в комнату, открываете дверь в кладовку, входите в нее и обнаруживаете, что в ней нет пола, а вы снова падаете в бескрайнем небе на город, – вы в странном цикле. Это же понятие, наверное, применимо к умственному феномену, когда мысли в мыслях ведут к первоначальным мыслям. Наверное, такой процесс имеет какое-то отношение к самосознанию и тому, что значит быть личностью.

Третья разновидность вычислительного способа мышления распространена в кругах веб 2.0: любая информационная структура, которая можетрассматриваться каким-либо реальным человеком как личность, являетсяличностью. Это, по существу, возрождение теста Тюринга. Если вы можете представить коллективный разум, к примеру, рекомендующий вам музыку, то коллективный разум фактически является личностью.

Должен признать, что, когда я выступаю в роли ученого, ни одна из трех описанных разновидностей вычислительного подхода мне не помогает.

Первая идея, что в программном обеспечении количество есть качество, раздражает особенно, поскольку ученый-информатик много времени проводит в борьбе с отвратительностью того, что происходит с современным программным обеспечением, по крайней мере когда оно становится большим.

Вторая идея тоже не помогает. Создать программу с самопредставлением и странными циклическими структурами – восхитительно и умно. Я на самом деле реализовал сценарий прыжка с парашютом в виртуальном мире. Я никогда не встречал никаких выраженных изменений в возможностях программных систем, основанных на усложненных вариантах такого рода трюков, несмотря на то что все еще существует значительное сообщество исследователей искусственного интеллекта, которое ожидает появления таких изменений.

Что касается третьей идеи, современной версии теста Тюринга, к настоящему моменту мои аргументы должны быть уже ясны. Люди могут заставить себя поверить в любых выдуманных существ, но если эти существа представляются населяющими программные продукты, с помощью которых мы проживаем наши жизни, нам приходится изменять себя в худшую сторону, чтобы поддерживать свою веру. Мы делаем себя скучными.

Но и помимо этих трех есть способ рассматривать людей с вычислительной точки зрения как особенные объекты.

Реалистичный способ вычислительного мышления

Я называю реализмом вычислительный способ мышления о людях, который я предпочитаю, когда считаю, что такой способ мне подходит. Идея состоит в том, что люди, если их рассматривать в качестве информационных систем, были созданы не вчера и не являются абстрактными игрушками в руках некоего высшего существа вроде программиста веб 2.0 в небесах или космического игрока в Spore. Вместо этого я полагаю, что люди есть результат миллиардов лет неявного эволюционного обучения в школе жестких ударов. Кибернетическая структура личности оттачивалась очень большой, очень долгой и очень глубокой встречей с реальностью.

С этой точки зрения единственное, что может придать битам смысл, – это то, что их структуры претерпели так много столкновений с реальностью, что их нельзя больше по-настоящему абстрагировать, они стали неабстрактным продолжением реальности.

Реализм основан на частностях, но мы пока не знаем и можем никогда не узнать частностей индивидуальности с вычислительной точки зрения. Максимум, что мы сегодня можем, – это начать рассказывать истории типа тех, которые иногда нам рассказывают эволюционные биологи.

Со временем данные и проницательность могут сделать историю более конкретной, но на текущий момент мы по меньшей мере способны рассказать правдоподобную историю самих себя в терминах широкомасштабной вычислительной истории природы. Миф, сказка сотворения, может, чтобы дать нам способ думать вычислительно, пока оставаться не настолько подверженным искажениям, привносимым нашими идеями об идеальных компьютерах (т. е. тех компьютерах, которые могут обрабатывать лишь небольшие программы).

Такое изложение сказок есть спекуляция, но спекуляция с определенной целью. Приятным бонусом этого подхода является то, что конкретика имеет тенденцию быть более красочной, чем обобщения, поэтому вместо алгоритмов и гипотетических абстрактных компьютеров мы рассматриваем певчих птиц, изменяющих форму головоногих и метафоры Шекспира.

Глава 13
Рассказ о возможном ходе развития семантики

В этой главе представлено прагматичное чередование философских взглядов (в противоположность требованию, чтобы единая философия применялась всегда без исключения). В натуралистических рассуждениях об истоках семантики используется вычислительный подход.


Наконец-то компьютеры начинают распознавать образы

В январе 2002 года меня пригласили выступить с вступительной речью и лекцией перед Национальной ассоциацией производителей музыкальных инструментов [21]21
  Учитывая мое трепетное отношение к музыкальным инструментам, участие в НАПМИ для меня является наиболее опасным (и дорогим) шагом. Я научился избегать его, как бывший заядлый игрок старается избегать посещения казино. (Прим. автора)


[Закрыть]
на их ежегодной выставке. Я продемонстрировал ударный ритм с помощью быстрой смены самых забавных гримас, которые только мог придумать.

Компьютер фиксировал выражение моего лица через видеокамеру и генерировал обидные ударные звуки в соответствии с той гримасой, которую он распознавал в каждый момент. [22]22
  Я использовал для этого компьютерную программу, разработанную маленькой компанией Eyematic, где я одно время работал главным научным специалистом. С тех пор компания прекратила свою деятельность, однако Хартмут Невен и многие прежние ее сотрудники создали компанию-последователь, чтобы спасти разработанную программу. Новая компания была поглощена Google, но пока неясно, как поступят с программой. Надеюсь, они придумают для нее какие-нибудь достойные сферы приложения, помимо поиска образов в Сети. (Прим. автора)


[Закрыть]
(Отбивать ритм с помощью смены выражений лица ново и забавно – думаю, вскоре молодежь возьмет на вооружение этот трюк.)

Этот вроде бы легкомысленный эпизод нужно воспринимать всерьез как индикатор технологических перемен. В ближайшие годы распознавание образов, например выражений лица, войдет в повседневную практику. С одной стороны, это означает, что нам придется изменить политику общества в отношении неприкосновенности частной жизни, поскольку гипотетически сеть камер видеонаблюдения получит возможность автоматически определять, где находится любой человек и какое у него выражение лица, однако существует и множество других невероятных возможностей. Представьте себе, что ваш аватар в Second Life (или, что еще лучше, в полностью реализованной, погружающей виртуальной реальности) передает всю вашу мимику.

Однако до недавнего времени компьютеры даже не могли распознать улыбку. Мимика была глубоко упрятана в неточном понятии качества и весьма далеко от другого полюса – абсолютно определенного понятия количества. Ни одна улыбка не похожа на другую, и невозможно сказать, что общего во всех них. Подобие – это субъективное ощущение, интересующее поэтов, но безразличное для разработчиков программного обеспечения.

Хотя и существует множество качеств, которые нельзя передать с помощью программного обеспечения, используя имеющиеся на настоящий момент средства, инженеры наконец-то смогли создать программу, способную распознать улыбку, и написать код, который улавливает хотя бы часть того, что объединяет все улыбки. Данная незапланированная трансформация наших возможностей произошла на рубеже столетий. Я не был уверен, что доживу до этого события, хотя меня не перестает удивлять, что инженеры и ученые, с которыми я периодически сталкиваюсь, не осознают, что именно произошло.

РАСПОЗНАВАНИЕ МИМИКИ ИМЕЕТ И БОЛЕЕ ГЛУБОКИЙ СМЫСЛ. МНОГИЕ ГОДЫ СУЩЕСТВОВАЛА ЧЕТКАЯ И НЕИЗМЕННАЯ ГРАНЬ МЕЖДУ ТЕМ, ЧТО МОЖНО И ЧЕГО НЕЛЬЗЯ ПРЕДСТАВИТЬ ИЛИ РАСПОЗНАТЬ С ПОМОЩЬЮ КОМПЬЮТЕРА. МОЖНО ПРЕДСТАВИТЬ ОПРЕДЕЛЕННОЕ КОЛИЧЕСТВЕННОЕ ПОНЯТИЕ, НАПРИМЕР ЧИСЛО, НО НЕВОЗМОЖНО ПРЕДСТАВИТЬ ПРИБЛИЗИТЕЛЬНОЕ ЦЕЛОСТНОЕ КАЧЕСТВО, ТАКОЕ КАК ВЫРАЖЕНИЕ ЛИЦА.

Технология распознавания образов и неврология развиваются вместе. Программа, которую я использовал для НАПМИ, служит прекрасным подтверждением этого. Неврология может достаточно быстро подтолкнуть развитие технологии. Изначально данный проект стартовал в 1990-е годы под эгидой ученого-невролога из Университета Южной Калифорнии Кристофа фон дер Мальсбурга, работавшего с группой своих студентов, в частности, с Хартмутом Невеном. (Фон дер Мальсбург более всего известен своим замечательным наблюдением, сделанным в начале 1980-х: синхронное возбуждение нейронов, когда многочисленные нейроны проводят электрические импульсы одновременно, важно для способа функционирования нейронных сетей.)

В данном случае он работал над ответом на вопрос, какие функции выполняются отдельными участками ткани в зрительной коре – той части мозга, которая первой получает изображение с оптических нервов. В настоящее время не существует инструмента, способного детально определить, что происходит в большой сложной нейронной сети, в особенности если последняя является частью живого мозга. Поэтому ученым приходится изыскивать иные пути для проверки своих гипотез о том, что же в ней происходит.

Одним из таких путей является построение компьютерной модели для проверки работы гипотезы. Если гипотеза о том, как функционирует часть мозга, инспирирует создание работающей технологии, эта гипотеза определенно имеет право на существование. Однако неясно, насколько она верна. Вычислительная неврология находится на нечеткой грани научного метода. Казалось бы, программа распознавания мимики сокращает степень неопределенности, присутствующую в человеческой натуре, но фактически она может не сократить, а усилить эту неопределенность. Дело в том, что программа приближает ученых и инженеров к тому состоянию, когда наука постепенно начинает использовать методы, близкие к поэзии и прозе. Правила, используемые программой, несколько неопределенны и останутся таковыми до тех пор, пока мы не получим более точные данные о функциях нейронов в живом мозге.

Впервые мы можем рассказать хотя бы в общих чертах, как мозг распознает образы, встречающиеся в мире, например улыбку, хотя мы и не знаем, как доказать, что наше понимание верно. Вот этот рассказ.

Каким кажется мир статистическому алгоритму

Начну со своего детского воспоминания. Когда я рос в пустыне южного Нью-Мехико, я обратил внимание на полосы, оставляемые на грунтовой дороге проезжающими автомобилями. На дороге появлялись волнистые выпуклые поперечные полосы, как вельветовые рубчики, которые представляли собой естественным образом образующуюся бесконечную последовательность «лежачих полицейских». Расстояние между полосами определялось средней скоростью движения автомобилей по этой дороге.

Когда вы ехали с этой средней скоростью, меньше трясло. Полосы были видны лишь на закате, когда горизонтальные красные солнечные лучи высвечивают все неровности на земле. Днем нужно было ехать осторожно, чтобы не пропустить эту информацию, спрятанную на дороге.

Цифровые алгоритмы должны подходить к проблеме распознавания образов подобным косвенным путем, и им часто приходится применять общую процедуру, немного похожую на проезд виртуальных колес по виртуальным неровностям. Она носит название «преобразование Фурье». Преобразование Фурье определяет объем деятельности, проходящий на конкретной «скорости» (частоте) в блоке цифровой информации.

Представьте себе графический дисплей эквалайзера, имеющийся на аудиопроигрывателях и показывающий интенсивность воспроизведения музыки на разных частотных полосах. Именно преобразование Фурье производит разделение частотных полос.

К сожалению, преобразование Фурье не в состоянии распознать мимику, однако существует связанный с ним, но более сложный алгоритм – фильтр Габора для небольших волн, который нам и поможет. Этот математический процесс идентифицирует отдельные маркеры деятельности на конкретных частотах в конкретных местах, в то время как преобразование Фурье лишь сообщает, какие вообще частоты присутствуют.

Существуют поразительные параллели между теми процессами, что происходят в инжиниринге, и теми, что наблюдаются в человеческом мозгу, включая двойственность Платона/Дарвина: новорожденный младенец способен отследить простое схематическое лицо, но ребенку постарше нужно наблюдать людей, чтобы научиться отличать их друг от друга.

Я рад сообщить, что группа ученых из Хартмута заработала высшие баллы в соревновании по распознаванию лиц, спонсированном правительством. Национальный Институт стандартов и технологии проводит тестирование систем распознавания лиц с той же целью, что лекарств и машин: люди должны знать, кому и чему можно доверять.

От образов к запахам

И теперь у нас появляются теории – или по крайней мере мы можем кое-что подробно рассказать о том, как мозг распознает объекты этого мира, такие как улыбка, например. Но рот производит гораздо больше движений, чем просто улыбается. Есть ли возможность расширить наш рассказ, чтобы объяснить, что такое слово и как мозг узнает его?

Оказывается, лучше всего подойти к этому вопросу через рассмотрение совершенно иного чувства. Вместо зрения и слуха, возможно, нам полезнее начать с изучения запахов, ощущаемых человеческим носом.

Около двадцати лет я выступал с лекциями об основах виртуальной реальности. Я рассказывал про главные характеристики зрения и слуха, а также осязания и обоняния. В конце лекции начинались вопросы, и одним из первых обычно был вопрос об обонянии: скоро ли у машин виртуальной реальности появится способность чувствовать запахи?

Возможно, но, скорее всего, лишь несколько. Запахи фундаментально отличаются от образов или звуков. Последние могут быть разделены на исходные составляющие, которые относительно просто обработать компьютеру – и мозгу. Видимые цвета – всего лишь слова, состоящие из различной длины световых волн. Любая звуковая волна состоит из множества синусоид, каждая из которых легко может быть описана математически. Каждая похожа на «лежачего полицейского» определенной высоты с грунтовых дорог моего детства.

Иначе говоря, цвета и звуки могут быть описаны с помощью нескольких чисел, широкий спектр цветов и тонов описывается с помощью интерполяции этих чисел. Человеческой сетчатке необходимо воспринимать лишь небольшое количество длин волн или цветов, чтобы наш мозг сумел воспринять все промежуточные. Компьютерная графика работает подобным образом: экран пикселей, каждый из которых способен передать красный, зеленый или синий, может воспроизвести приблизительно все цвета, которые определяет мозг. [23]23
  Современные коммерческие экраны не совсем соответствуют человеческому восприятию, поэтому они не могут передать все цвета, которые способны видеть мы, но, возможно, в будущем эти экраны начнут передавать гамму цветов, воспринимаемых человеческим глазом, во всей ее полноте. (Прим. автора)


[Закрыть]
Музыкальный синтезатор можно представить себе как устройство, генерирующее множество синусовых волн, затем налагающее их друг на друга, чтобы произвести набор звуков.

Запахи очень различаются, как и метод, которым мозг их воспринимает. Глубоко в носу, в глубине слизистой оболочки, находится кусочек ткани – обонятельный эпителий, – пронизанный нейронами, определяющими химические вещества. Каждый из этих нейронов содержит молекулы белка в форме чашечки, называемые обонятельными рецепторами. Когда определенная молекула попадает в подходящий рецептор, возбуждается нейронный сигнал, передающийся в мозг как запах. Молекула вещества, которая слишком велика, чтобы войти в какой-то рецептор, не имеет запаха. Число различимых запахов ограничено только числом обонятельных рецепторов, способных взаимодействовать с ними. Нобелевские лауреаты 2004 года в области психологии и медицины Линда Бак из Центра исследования рака Фреда Хатчинсона и Ричард Эксель из Колумбийского университета обнаружили, что человеческий нос имеет около тысячи различных типов обонятельных нейронов, причем каждый способен распознавать определенный набор химический веществ.

Все вышесказанное указывает на глубокое различие в базовой структуре чувств – различие, порождающее важные вопросы о том, как же мы мыслим, и, вероятно, даже о происхождении языка. Невозможно интерполировать две молекулы запаха. Запахи могут смешивать и создавать миллионы различных сочетаний, это верно. Однако существующие запахи невозможно разбить на несколько базовых единиц, «пикселей запаха» не существует. Можно выразить это так: цвета и звуки можно измерить с помощью линейки, но запахи нужно искать в словаре.

Для техника виртуальной реальности это досадно. Существуют тысячи основных запахов – гораздо больше, чем группка основных цветов. Возможно, однажды мы сумеем подсоединить провода к мозгу человека, чтобы создать иллюзию запаха. Но потребуется множество проводов, чтобы подсоединиться ко всем статьям в мозговом словаре запахов. С другой стороны, мозг должен иметь возможность организовать все эти запахи сам. Вероятно, на каком-то уровне из запахов вырисовывается некая картина. Возможно, «пиксель запаха» все же существует.

Запахи были первыми словами?

Я долгое время обсуждал эту проблему с Джимом Боуэром, компьютерщиком-неврологом из Техасского университета (Сан-Антонио), известным своими биологически точными компьютерными моделями мозга. Вот уже несколько лет Джим и сотрудники его лаборатории ищут подходы к пониманию «словаря запахов».

НЕ ЗАБЫВАЙТЕ, ЧТО ЗАПАХИ НЕ ЯВЛЯЮТСЯ ЭНЕРГЕТИЧЕСКИМИ СТРУКТУРАМИ, КАК ЗРИТЕЛЬНЫЕ ОБРАЗЫ ИЛИ ЗВУКИ. ЧТОБЫ ОЩУТИТЬ АРОМАТ ЯБЛОКА, ВЫ ФИЗИЧЕСКИ ПРИНОСИТЕ СОТНИ ТЫСЯЧ МОЛЕКУЛ ЯБЛОКА В ВАШЕ ТЕЛО. ВЫ НЕ ОБОНЯЕТЕ ВЕСЬ ПРЕДМЕТ, ВЫ ЗАБИРАЕТЕ ЧАСТЬ ЕГО И СВЕРЯЕТЕСЬ СО СВОИМ СЛОВАРЕМ ЗАПАХОВ, ЧТОБЫ НАЙТИ СООТВЕТСТВУЮЩУЮ ССЫЛКУ.

Они предполагают, что обонятельная система организована далеко не так, как специалист по органической химии организует молекулы (например, по числу атомов углерода в каждой). Напротив, она скорее напоминает сложную систему взаимосвязи химических веществ в реальном мире. Так, многие химические вещества, обладающие сильным запахом, – вещества, которые раздражают обонятельные нейроны, – взаимосвязаны со многими стадиями разложения или созревания органических веществ. Оказывается, существуют три основных индивидуальных химических способа разложения, каждый из которых, похоже, вносит свой набор статей в мозговой словарь запахов.


    Ваша оценка произведения:

Популярные книги за неделю