Текст книги "Репортаж с ничейной земли. Рассказы об информации"
Автор книги: Е. Седов
Жанр:
Научпоп
сообщить о нарушении
Текущая страница: 3 (всего у книги 15 страниц) [доступный отрывок для чтения: 6 страниц]
I =
n
∑
i=1
Pi log Pi
Когда вероятность движения электронов от минуса к плюсу была наибольшей, неопределенность была мала. Но вот электрическая энергия превратилась в тепловую, возникло иное движение, в котором одинаково вероятны все направления: ведь тепловое движение – это хаотическое движение мельчайших частиц. Значит, увеличилась неопределенность, и энтропия возросла, так же как в случае одинаковой вероятности появления черных и белых шаров. Где-то здесь и скрывается истина. Но, к сожалению... Я не могу ответить более четко на этот вопрос.
Учений умолк. Казалось, он забыл о нашем присутствии. Его задумчивый взгляд устремлен куда-то в пространство. Быть может, там, далеко за пределами Нового Города, ему чудятся еще неизведанные просторы загадочной Ничейной земли.
Психология и вероятность
Мы горячо поблагодарили ученого за помощь.
– Куда бы вы порекомендовали нам последовать дальше? – спросил я его на прощанье.
– Вы, очевидно, сами сможете наметить дальнейший маршрут, если воспользуетесь путеводителем по Новому Городу. Такой путеводитель можно приобрести в любом книжном киоске. А если понадобится моя помощь, вы всегда найдете меня в этом здании, в лаборатории математических методов психологии. Желаю успехов!
Ученый пересек площадь и скрылся в одном из подъездов, а мы, воспользовавшись его советом, отправились искать ближайший киоск.
Пять минут спустя я уже держал в руках справочник-путеводитель, очень похожий на те, что издаются во всех больших городах. Естественно, что в путеводителе по Новому Городу самое почетное место занимает Шеннон – на первой странице дан крупным планом его портрет. Я увидел скромного, можно сказать, неприметного человека со спокойным задумчивым взглядом и худощавым лицом. Встретив его на улице, я никогда не подумал бы, что это крупный ученый, имя которого известно теперь всему миру.
Рядом с портретом Шеннона помещен второй такой же портрет. Под ним короткая справка: «Хартли, инженер связи. В 1928 году предложил формулу для измерения информации».
Тут же приведена эта формула:
I = log N.
Больше никаких сведений нет.
Как же так? Значит, вовсе не Шеннон впервые подумал о том, что информацию можно измерить? Тогда почему жители Нового Города считают основоположником Шеннона, а не Хартли?
Просмотрев весь справочник, я не нашел в нем никаких разъяснений. А вопрос этот не давал мне покоя.
Я вспомнил о любезном приглашении ученого. Удобно ли обратиться к нему с этим новым вопросом?
А что, если кто-нибудь из участников экспедиции задаст мне тот же вопрос? После некоторых колебаний я решил отложить посещение лаборатории до следующего дня.
Наутро я разыскал лабораторию математических методов психологии, где застал моего знакомого в окружении приборов и схем. Он встретил меня приветливо и поинтересовался, что меня к нему привело.
Я задал вопрос о Хартли и Шенноне. Несколько мгновений он сосредоточенно смотрел на меня, очевидно собираясь с мыслями. Затем тепло улыбнулся и произнес:
– Я боюсь, что мое мнение покажется вам предвзятым. Но я твердо убежден в том, что все дело в психологии. Хартли пренебрег психологией, когда предлагал свою формулу, а Шеннон ее учел.
– Я не понимаю, чью психологию вы имеете в виду?
– Мою, вашу, вон того прохожего – чью угодно. В том-то и сила формулы Шеннона, что она позволяет учесть воздействие информации на всякого человека, независимо от его индивидуальных свойств. Она позволяет установить объективные закономерности психологических реакций. Я, очевидно, выражаю свою мысль слишком туманно? Я сам работаю сейчас именно в этой области, и потому мне все это кажется настолько очевидным, что даже не знаю, как вам объяснить. Во всяком случае, информация связана с психологией настолько тесно, что волей-неволей инженерам пришлось учитывать психологию.
Давайте рассмотрим формулу Хартли:
I = log N.
N – это число возможных событий. Если в алфавите есть 32 буквы, значит согласно формуле Хартли каждая буква даст информацию I = log 32. Но тут есть одна тонкость. Ведь буквы в алфавите разные, и одни попадаются чаще, другие реже. Чем реже попадается буква, тем неожиданней будет она для того, кто ее прочел. Хартли понял, что дело должно обстоять именно так. Но он решил, что математик или конструктор не должны учитывать неожиданность. И поэтому, излагая свой метод оценки количества информации, он прямо сказал, что вопрос неожиданности получаемых сообщений относится к области психологии и не должен интересовать инженера. Зато формула Шеннона позволяет учесть любую неожиданность. В ней учтены вероятности всех сообщений:
I = ∑Pilog Pi.
Чтобы найти среднее количество информации, приходящейся на каждую букву, надо подставить в формулу вероятность появления всех букв:
I = PАlog PА + PБlog PБ + PВlog PВ + ... + PЯlog PЯ.
Если бы все 32 буквы имели равную вероятность, мы получили бы:
I =
(
1
32
·log
1
32
)
·32 = – log 32.
Как видите, в этом случае формула Шеннона совпадает с формулой Хартли. Значит, формула Хартли справедлива лишь в тех исключительных случаях, когда все сообщения имеют равную вероятность. А в общем случае надо пользоваться формулой Шеннона. И она позволит учесть тот самый психологический фактор, который отбросил Хартли.
Ведь по ней как раз и получается: чем больше неожиданность, тем больше бит. Например, когда мы извлекаем черный шар из ящика, в котором 99 черных й 1 белый, неожиданность невелика, и бит мы получаем немного.
Ну, кажется, я окончательно сбил вас с толку, – улыбнулся ученый и взглянул на часы. – Впрочем, если у вас будет желание разобраться в этом как следует, вам придется задержаться здесь еще на часок. Сейчас я вас должен покинуть, а через 20 минут буду демонстрировать здесь опыты группе экскурсантов. Если хотите, можете принять в них участие.
– С удовольствием! – с готовностью отозвался я.
Двадцать минут я провел в размышлениях, вспоминая о том, что услышал. Шуточное ли дело – математика в психологии! Я попробовал представить себе, как должна выглядеть психология, занявшая прочное место в ряду точных наук. Вы решаете уравнение и узнаете, как в заданных обстоятельствах будет вести себя живой человек... Какая-то мистика! Разве человек не волен поступать, как ему нравится? Кто заставит его подчиняться каким-то формулам?
Нет, тут, очевидно, не следует все принимать на веру. Между математикой и психологией все же должна существовать какая-то грань. Я вдруг представил себе школьный учебник, в котором рядом с обычными задачами по алгебре есть, например, и такие:
«Из А в В идет пешеход со скоростью 4 километра в час. Навстречу ему идет другой со скоростью 6 километров в час. Сколько времени пройдет до момента встречи, если расстояние 25 километров, второй вышел на два часа позже первого, а еще через час неожиданно пошел сильный дождь?»
Интересно, как стал бы решать такую задачку мой новый знакомый? Каким образом он учел бы в своих уравнениях неожиданный дождь?
Разве можно предвидеть, как будут вести себя пешеходы: спрячутся под ближайшее дерево или предпочтут поскорей добежать до намеченного пункта? Сплошная неопределенность. Однако формула Шеннона и в самом деле позволяет учесть неожиданность и оценить неопределенность событий. Правда, она даст ответ в среднем. Может быть, условие этой задачи надо сформулировать так: 100 пешеходов идут из Л в В, и по дороге начался дождь. По всей видимости, некоторые пешеходы спрячутся под укрытия, а часть из них побежит что есть силы. Если учесть вероятность обоих случаев, можно подсчитать среднюю скорость.
Между прочим, при расчете потоков людей и транспорта по улицам крупного города и в самом деле приходится учитывать всякие неожиданности, вплоть до стихийных бедствий. Может быть, имеет смысл ввести в такие расчеты «среднюю психологию» горожан?
Любопытно узнать, какие опыты собирается демонстрировать мой новый знакомый? Вскоре он вновь появился в лаборатории в окружении многочисленной группы людей.
– Прошу вас, – обратился он ко мне и указал на кресло, стоявшее рядом с прибором. – Сейчас мы попробуем оценить вашу психологию в битах. Познакомьтесь с принципом действия этой машины.
Машина показалась мне очень простой. Десять клавиш, расположенных у меня под рукой. Десять лампочек перед глазами, окрашенных в десять разных цветов. На каждой клавише указано, какому цвету она соответствует. Ученый предложил мне потренироваться на клавишах, чтобы освоиться с этой установкой. Затем он предупредил присутствующих, что начинается опыт.
Вспыхнула на панели голубая лампочка. Я нажал на нужную клавишу. Голубой огонек сменился зеленым. Я опять нажал на соответствующую клавишу.
Затем появился синий, потом красный, опять голубой... Я нажимал на клавиши, и перед моими глазами беспрестанно вспыхивали разноцветные огоньки. Устройство это, с виду совсем простое, на самом деле оказалось довольно хитрым: огоньки зажигались так беспорядочно, что нельзя было угадать заранее, какой вспыхнет следом. Моя роль оказалась гораздо сложнее, чем я думал вначале. Машина меня измотала: пришлось нажимать на каждую клавишу, наверно, по сотне раз. Случалось, конечно, и ошибаться, но машина «замечала» любую оплошность: пока я не найду нужную клавишу, она не зажжет другой огонек.
И тут родилась у меня озорная мысль. А что, если я все-таки ее обману? Насколько я понял, ее задача состоит в том, чтобы оценивать время моей реакции. Значит, если я буду нарочно затягивать время...
В это мгновение раздался какой-то щелчок, погасли лампочки на панели, и вспыхнул матовый циферблат. Часы показали 9 минут 58 секунд.
Мой знакомый подходит к своим экскурсантам и показывает им лист с вычислениями.
– Это расчет длительности реакции испытуемого, – объясняет он им. – Как видите, время почти совпадает с расчетным: по расчету реакция на 1000 включений должна длиться 9 минут 55 секунд.
И тут меня вдруг охватила досада. Как же так получается? Значит, раньше, чем я вошел в эту лабораторию, экспериментатор уже знал, сколько времени я буду искать нужную кнопку и сколько раз ошибусь? Ну, а если я захочу нажимать быстрее? Нет, быстрее, пожалуй, не выйдет – я старался изо всех сил. А если медленнее? Я ведь могу нарочно искать кнопку подольше. Как же тогда ваши формулы?
А ученый объясняет присутствующим (меня он даже не замечает – я ведь теперь «испытуемый», то есть попросту подопытный кролик).
– Расчет здесь довольно прост. Скорость реакции зависит от количества информации, получаемой во время опыта. В нашем опыте лампочки Зажигались в совершенно случайном порядке: в любой момент времени вероятность того, что вспыхнет красная лам-! почка, равна вероятности синей или зеленой. Среди тысячи вспышек каждая лампочка зажглась около сотни раз. Чем больше на панели разноцветных лампочек, тем больше неопределенность опыта. Потому и выходит, что в случае N лампочек длительность реакции зависит от величины log N.
Между прочим, психологи еще в прошлом веке открыли эту закономерность. Но они тогда, конечно, не знали, что дело тут связано с информацией. А формула Шеннона убедила нас, что все обстоит именно так. Сейчас мы несколько усложним наш опыт.
Экспериментатор нажимает кнопку, и снова у меня перед глазами мелькает разноцветная карусель. Сначала мне показалось, что все идет, как и прежде. Оказывается, нет: теперь у каждой лампочки своя «повадка». Красная зажигается чаще всех, и к ней я приспособился быстро. А голубая оказалась капризной: зажигается редко и всегда в неподходящий момент. Рука по привычке тянется к клавише, предназначенной для красного цвета, а тут вдруг перед глазами вспыхнула голубая – пока найдешь нужную клавишу, время уходит зря.
– Условия опыта стали другими, – говорит мой знакомый. – Теперь каждой из лампочек задана различная вероятность. Неопределенность опыта стала меньше. Сейчас вы убедитесь, что уменьшилось и время реакции. Потом я покажу вам, что, подставив вероятность каждого цвета в формулу Шеннона, мы можем рассчитать это время.
Все слушают объяснения, а я сижу и нажимаю на кнопки. И снова проснулась во мне досада. Ведь я же не кролик в конце-то концов! Почему он так уверен, что я буду делать по формуле? Как хочу, так и делаю – пусть попробует что-нибудь доказать. И я стал «тянуть время». Как в футболе. Имеет команда один гол в запасе, до конца матча остались считанные минуты, вот они и «тянут»: давно бы можно было передать мяч центральному нападающему, а его вместо этого выкидывают за боковую черту, да так, чтобы улетел подальше, куда-нибудь на четвертый ярус трибун. А если доведется игроку этой команды вводить мяч в игру, он превращается в истинного артиста: уж как он «торопится», как старается сделать все «поскорее»! Но болельщик-то всегда видит, кто торопится по-настоящему, а кто делает вид.
И вот я решил поступить точно так же. Давно уж я отыскал глазами нужную клавишу, а делаю вид, что никак не могу найти. «Попробуйте, – думаю, – определите теперь время по своим формулам, узнаете, какой я вам кролик!» Легкий щелчок, погасла красная лампочка, часы зафиксировали время реакции: 7 минут 55 секунд. Ученый посмотрел на часы, еще раз взглянул на свои записи, подошел ко мне и громко сказал:
– Одно из двух: или вас очень утомил этот опыт, или вы намеренно удлиняли время реакции.
В эту минуту я почувствовал себя довольно-таки глупо. Может быть, потому я и задал довольно нелепый вопрос:
– А разве было заметно?
Кое-кто из присутствовавших чуть не подавился, потому что громко смеяться было неловко. Не смеялись только ученый и я.
– Я не следил за вашим поведением, – строго сказал ученый. – Но я верю расчетам. Реакция должна была длиться около 7 минут.
– Так ведь и на часах почти столько же! – попытался кто-то выступить в мою защиту.
– Нет, – твердо ответил он. – 50 секунд разницы – это слишком большое время. Наш расчет позволяет определять время гораздо точнее. Если хотите в этом убедиться, я могу повторить опыт. Только на этот раз прошу без обмана!
Нет уж, теперь мне не до обмана! На этот раз я стараюсь изо всех сил. Кончился опыт, и часы показали 7 минут 3 секунды. Расчет предусмотрел мою расторопность с точностью нескольких секунд! Очевидно, формула учла все: и «характер» красной лампочки и «капризы» лампочки голубой.
– Как видите, – обращается к нам ученый, – время реакции во втором опыте оказалось меньше, чем в первом, хотя в обоих случаях лампочки переключались ровно 1000 раз. Почему это произошло? Потому что в этом случае испытуемый получил меньшее количество информации: ведь неопределенность опыта уменьшилась, потому что вероятность зажигания красной лампочки составляла в данном опыте 60 процентов, а голубой – только 3.
(Следует заметить, что при расчете по формуле Шеннона в теории информации всегда имеется в виду дополнительное
n
∑
i=1
Pi = 1.
В рассматриваемом примере это условие следует понимать так: и в первом и втором опыте вероятность того, что зажжется любая из десяти лампочек, равна 100 процентам: P1 + P2 + ... + Pn = 1.)
А в первом опыте вероятность всех цветов была одинакова, неопределенность была наибольшей, так же как в ящике, содержащем равное количество черных и белых шаров.
– Непонятно! – раздались голоса у меня за спиной. – Лампочки могут зажигаться, как им угодно. Но ведь на них реагирует живой человек. Он не знает ни вероятности, ни информации – он только нажимает на клавиши. Откуда же такая точность?
– Да, он не знает никаких вероятностей, – согласился ученый. – А ему и не надо их знать. В томто и сила новой теории, что она помогает установить объективную связь информации и психологических реакций.
Когда красная лампочка зажигается чаще, чем все остальные, человек привыкает к красному цвету, и реакция на него становится почти мгновенной. Реакция на голубой цвет отнимала в нашем опыте значительно больше времени. Но он появляется редко, и общее время, потраченное на эту реакцию, было невелико. А в целом время, затраченное на 1000 включений, уменьшилось так же, как уменьшилось количество информации, подсчитанное по замечательной формуле Шеннона.
Итак, все кончилось благополучно: ученый простил мою невинную шалость, а я горячо, поблагодарил его за те сведения, которые он мне предоставил.
На этом, собственно, можно бы и закончить рассказ, если бы все было так, как я изложил. Но ведь читатель прекрасно знает, что нет на свете Нового Города, и потому ничего этого в действительности произойти не могло. И у него может возникнуть вполне законный вопрос: как расценивать то, о чем рассказывал автор? Не чистая ли это фантазия? Достоверно ли то, что рассказано здесь о новых методах психологии?
Эти опыты описаны в литературе, и если бы комунибудь из читателей довелось побывать в подобной лаборатории, он мог увидеть своими глазами опыт, который я описал.
Кстати, еще одно уточнение. Я рассказал о Хартли и Шенноне так, словно они жители Нового Города, руками которых заложен первый его кирпич. Имел ли я право допускать подобную вольность? Ведь имена этих ученых известны сейчас во всех странах мира, а о Новом Городе в мире не знает никто. И, конечно, не знают о нем ни Хартли, ни Шеннон – ведь такого города и на карте-то нет. Шеннон и Хартли живут и работают в Америке. А в нашей стране в эти годы плодотворно трудились над проблемами новой теории известные всему миру специалисты в области радио Берг, Котельников и Харкевич, математики Хинчин и Колмогоров, физиолог Анохин, языковеды Кнорозов и Иванов. От Шеннона и Хартли их отделяет широкий простор океана. С Хартли и Шенноном их связывает общность идей.
Информация внутри нас
Чем больше путешествует человек по далеким странам, тем чаще вспоминает он родные края. Чем рождены эти воспоминания? Тоской по дому, по родным и близким? Да, это чувство день ото дня становится острее. Но вместе с ним в душе путешественника зреет и другое чувство: ему очень хочется еще раз взглянуть на далекий привычный мир. Все новое, что довелось ему видеть во время странствий, заставляет его по-иному оценивать с детства запавшие в памяти факты, многие жизненные явления и поступки людей. Недаром выдающийся мастер слова Николай Васильевич Гоголь так любил взглянуть на Россию из «чудного далека».
Вот и мы с вами, побывав на улицах Нового Города, уже в ином свете представляем себе нашу прошлую жизнь. Разве могли мы раньше подозревать, что все наше прошлое неразрывно связано с информацией, что каждое его мгновение несло с собой миллионы незамеченных бит?
Где бы ни находились мы и чем бы ни были заняты в течение дня, хотели мы этого или нет, в любом месте и в любое мгновение мы принимали и «обрабатывали» огромное количество информации. Когда мы читали книгу или смотрели кинофильм, когда слушали лекцию, прогуливались по улице или обменивались новостями с друзьями – в любом случае зрение, слух, все наши органы чувств несли нам огромное количество разнообразных сведений и сообщений. Больше того, помимо той информации, которая воспринималась нами сознательно, каждую секунду наши органы чувств несли нам дополнительную, часто вовсе «не желательную» информацию. Читая книгу, мы испытывали неприятные ощущения жары или холода; беседуя с приятелем, чувствовали запах его папиросы, а самые интересные сведения, услышанные на лекции, воспринимались нами одновременно с назойливым шепотом соседа и звонкими гудками автомашин.
Непрерывным потоком бегут по нашим нервным волокнам неуловимые биты, неся с собой сообщения обо всем, что происходит во внешнем мире. Стало чутьчуть прохладней – и срочные сообщения уже следуют к центральной нервной системе, которая, посылая ответные команды, вызывает к деятельности процессы, которые поддерживают постоянной температуру нашего тела независимо от температуры внешней ереды. Ровная дорога сменилась небольшим подъемом – мышцы ноги уже чувствуют перемену и немедленно посылают срочные сообщения, чтобы пешеход, изменив положение тела, сохранил устойчивость во время ходьбы. Биты помогают нашему организму сохранять неизменным давление крови и снабжать все ткани тем' количеством кислорода, которое необходимо в данных условиях и в данный момент.
Побывав в лабораториях Нового Города, мы узнали, что самые совершенные «устройства» приема информации – это наши органы чувств. Но их пропускная способность небезгранична. Глаз человека способен воспринять миллионы бит в секунду, ухо – десятки тысяч. Для передачи большего количества информации требуется большее число каналов, поэтому число нервных волокон, идущих от 1лаз к головному мозгу, достигает 900 тысяч, в то время как число слуховых волокон составляет лишь около 30 тысяч. В то же время установлено, что наибольшее количество информации, которое сознательно усваивает человек в процессе чтения, разговора или быстрого (стенографического) письма, не превышает 50 бит в секунду. Такая огромная разница между количеством информации, воспринимаемой органами чувств, и количеством усвоенной и осознанной информации объясняется необходимостью той сложной обработки, которая осуществляется головным мозгом.
Наши органы чувств – это своеобразные датчики, превращающие сообщения, приходящие из внешнего мира, в импульсы биологических токов, возбуждающих нервную ткань. Бесчисленные «каналы связи» сложной сетью нервных волокон «опутывают» каждую клеточку нашего организма. Каждое мгновение внутри нас осуществляются передача и обработка огромного количества сообщений о том, что вокруг нас творится и как влияет происходящее на наш организм.
Вы погружаетесь в горячую ванну, и каждая клеточка вашей кожи посылает спешные сообщения, что вода чересчур горяча. Мгновенный процесс обработки информации – и новая информация, информация о принятом решении, уже мчится по бесчисленным каналам связи к тканям различных мышц: надо подняться из ванны и открыть кран с холодной водой. Когда органы осязания передадут сообщение, что вода в ванне стала умеренно теплой, новые команды помогут вам завернуть кран и вновь погрузиться в воду.
Казалось бы, совсем обычная, простая операция, а количество информации, необходимое для ее осуществления, поистине огромно: чтобы выполнить эти действия, каждая мышца вашего тела должна получить целую серию специальных команд. И не только каждая мышца, но и каждая клетка мышечной ткани принимает и обрабатывает такое количество информации, что ее хватило бы для управления целым заводом. И это понятно: ведь в микроскопическом объеме клетки и в самом деле разместился гигантский «химический комбинат». В этом мельчайшем «атоме жизни» протекают тысячи разных процессов с участием сотен и сотен веществ. «Комбинат» полностью автоматизирован.
Непрерывный поток информации течет из внешней среды ко всем «диспетчерским пунктам», где вырабатываются, команды, регулирующие скорость течения этих процессов в зависимости от условий внешней среды.
Когда попытались получить те же команды с помощью электронной машины, результат оказался весьма любопытным. Для того чтобы учесть все данные только одного из возможных состояний среды и произвести по ним расчет скоростей реакций, машине, производящей тысячи операций в секунду, потребовалось целых 30 часов. А клетка способна в одно мгновение перестроить работу всех «цехов» своего «комбината», причем режим и скорость ее процессов всегда наилучшим образом соответствуют условиям внешней среды. Значит, в микроскопическом «атоме жизни» процесс обработки информации доведен до полного совершенства.
Чтобы обработать огромное количество данных за такое короткое время, необходимо очень экономно использовать пропускную способность каналов, посылать в них только те сведения, которые крайне необходимы, а всю избыточную информацию отметать как лишний, ненужный груз.
Инженеры связи тоже пытаются производить подобную сортировку, но до того совершенства, которого достигла природа, им, конечно, еще далеко.
Однако главное уже сделано: люди поняли, что в любых сообщениях есть избыточная информация, и научились отличать ее от информации необходимой.
ГЛАВА 3. ИНФОРМАЦИЯ БЕЗ ИЗЛИШЕСТВ
Законы случайностей
Вопрос об избыточной информации оказался труднее всех предыдущих. Уже несколько дней ходим мы по улицам Нового Города, расспрашиваем местных жителей, заглядываем на страницы различных книг. Но ясности пока нет.
Нам сказали, что определить избыточность текста можно в том случае, если известны законы чередования букв. Но как уяснить себе эти законы? Мы привыкли считать, что текст подчиняется грамматическим правилам. А здесь на язык смотрят как-то иначе... Вместо склонений или спряжений какие-то графики, формулы и значки. Говорят, что по ним изучают «структуру языка». Эта структура подчиняется законам теории вероятностей. И понятие «избыточности» тоже вытекает из этих законов. Чтобы определить избыточность текста, надо научиться с помощью теории вероятностей анализировать законы чередования букв.
– Скажите, у вас найдется курс теории вероятностей? – спросил я в одной из библиотек.
– Разумеется, – ответил библиотекарь и через мгновение извлек с полки солидный, увесистый том. – Это самый фундаментальный курс. Надеюсь, что здесь вы сможете найти все, что вас интересует.
– Да, пожалуй, даже с избытком, – пошутил я, беря в руки толстую книгу. – А кстати, как вы думаете, в этой книге тоже есть избыточная информация?
– Разумеется. Любая книга содержит в себе добрую половину лишних страниц.
– Даже учебник по математике? Странно... До сих пор я был уверен, что в нем нет ни одного лишнего слова. А в поэме Пушкина или в романе Толстого? Неужели даже в их бессмертных творениях есть «лишние» мысли или слова? Или, может быть, в Новом Городе поступают так же, как в США: вместо романа «Анна Каренииа» выпускают очередной «комикс», где на 3-й странице Анна встретилась с Вронским, а на 15-й уже слышится роковой стук колес?
– Нет, нет, – улыбается библиотекарь. – Уверяю вас, что жители нашего города не посягают на шедевры мировой культуры. Напротив, они любят и ценят искусство, и все их заботы направлены лишь на то, чтобы все созданное художником, писателем и композитором могло «транспортироваться» по специальным каналам связи без всяких потерь. Но при этом они пользуются особыми кодами, позволяющими передать полный текст «Анны Карениной» самым малым количеством условных значков. Наш алфавит тоже является кодом. Но этот код не слишком удобен, потому что избыточность его велика.
– Может быть, вы порекомендуете мне литературу. по которой я смогу изучить, как избавляются от этих «излишеств»?
– С удовольствием. Правда, в последние годы появилось так много различных способов, что их еще никто не сумел обобщить. Они описаны в различных журналах и книгах. Впрочем, вот что: пройдите в соседнюю комнату и обратитесь за помощью к электронной машине. Стоит лишь вложить в нее карточку с надписью «Избыточность сообщений», и она даст вам исчерпывающую информацию по вашему вопросу и предоставит в ваше распоряжение выписки из всевозможных статей и книг.
Я воспользовался этим любезным советом. Материала оказалось так много, что пришлось потратить на его изучение несколько дней. Зато в вопросе о том, как определяют избыточность текста, я приобрел полную ясность.
Вся суть заключается в законах случайностей. Дело в том, что жители Нового Города считают случайными все значения букв. Приняв по телеграфу начало нового слова, например ст..., нельзя сказать какие буквы последуют дальше: может быть, передаваемое слово окажется столом или стулом, может быть, стеной, статьей, стоном, стройкой, стоимостью, старостью, степенью или стрелой. Поэтому и считают жители Нового Города, что вслед за буквами с и т может случайно появиться буква о, е или у.
Но, оказывается, и случайность имеет свои законы. Непосвященным это покажется странным: случайность – и вдруг закон! Казалось бы, одно из двух: или есть какая-то закономерность, или все подчиняется воле случая. Однако случай случаю рознь. У каждого случая есть своя вероятность. Какова, например, вероятность того, что вслед за ст появится буква а? Как ее подсчитать? Для этого необходимо рассмотреть огромное количество самых разнообразных текстов и произвести строгий учет всех случаев появления сочетания ст. Если в результате такого учета, произведенного на многих тысячах слов, окажется, что из каждой сотни букв, появляющихся вслед за буквами ст, буква аповторяется в среднем пять раз, значит вероятность появления буквы а после букв с и т составляет 5 процентов. И самым любопытным является то, что, определив однажды вероятность появления буквы а, равную 5 процентам, мы обнаружим то же количество букв а в любом тексте, состоящем из достаточно большого числа букв. Не правда ли, странно: можно взять разные тексты – стихи, прозу, газетные сообщения и научный отчет; в любом из них среди каждой тысячи букв будет одно и то же количество а. Чем больше будет рассматриваться букв, тем точнее повторятся те же проценты. Да что далеко ходить за примерами! Подсчитайте число букв а на этой странице, а потом откройте наугад несколько других страниц. Если на них нет рисунков, то вы на всех страницах насчитаете почти равное количество а. Отчего это происходит? Оттого, что все случайности подчиняются одному закону: среди большого числа различных случайностей каждая из них (например, появление а) повторяется определенное количество раз. Это главный закон случайностей – закон больших чисел.
Если подсчитать, сколько раз встретится каждая буква алфавита после букв с и т, мы узнаем вероятность появления различных букв. И тогда окажется, что появление некоторых букв вслед за буквами с и т имеет большую вероятность (например, буквы е, о, а, р и т. п.), других букв – меньшую (например, ы – слово стычка или стык или в – ствол, створка), а для многих букв вероятность будет вовсе равна нулю: ведь нельзя вспомнить ни одного слова, в котором за буквами ст следовали бы буквыб, г или щ. Значит, в передаваемом тексте появление тех или иных букв не является «чисто случайным»; между последующим и предыдущим значениями передаваемых букв существует определенная взаимосвязь.
Взаимосвязь между случайными влениями называется «корреляцией». Этим свойством обладают самые разнообразные случайные процессы.
Случайным является значение букв, переданных по телеграфу. Случайной является частота и громкость звука в то или иное мгновение радиопередачи, случайной является мгновенная яркость бегущего по экрану телевизора электронного луча.
Но все эти случайные процессы в той или иной степени обладают чудесным свойством корреляции: и яркость луча, и звучание той или иной ноты связаны с той яркостью и тем звучанием, которые имели место несколько мгновений назад. Эта связь – основа гармонии музыкальных мелодий, плавных переходов от света к тени, тонов и полутонов.