![](/files/books/160/oblozhka-knigi-vzlomschiki-kodov-15983.jpg)
Текст книги "Взломщики кодов"
Автор книги: Дэвид Кан
Жанры:
Прочая компьютерная литература
,сообщить о нарушении
Текущая страница: 25 (всего у книги 27 страниц)
Оказалось, что печатники того времени часто изменяли написание фамилий авторов для того, чтобы облегчить себе набор текста. Из-за плохого качества краски буквы, отпечатанные одной и той же формой шрифта, оказывались разными. Перед печатанием бумага смачивалась и, поскольку высыхала неровно, давала усадку. В результате идентичные буквы получались разных размеров. Нередко «закрытые» буквы «а», «е», «о» заполнялись изнутри краской, что смазывало различия между ними. Поэтому отдельные экземпляры издания в целом сильно разнились между собой. А следовательно, ни одно сообщение, зашифрованное двухбуквенным шифром, не могло быть передано в них с абсолютной точностью.
Окончательные доказательства отсутствия двухбуквенного шифра в произведениях Шекспира были получены от двух экспертов. Прежде всего, они поступили от Фредерика Гауди, одного из самых известных и авторитетных типографов Америки. В 1920 г. Фабиан поручил ему выяснить присутствие двухбуквенного шифра в первом издании пьес Шекспира, а потом скрыл полученный доклад, ибо Гауди подверг тщательным измерениям, анализу и сопоставлениям буквы этого издания, нарисовал их эскизы и в конечном итоге пришел к выводу, что в нем использовалось множество шрифтовых рисунков, а не два рисунка, которые требовались для двухбуквенного шифра. Такой же вывод сделал и Фред Миллер, занимавшийся в ФБР экспертизой документов. В своем заключении после исследования текста первого издания пьес Шекспира он написал:
«Не было обнаружено никаких характеристик, которые подтвердили бы разделение исследованного текста ни два комплекта шрифтов».
Казалось бы, сказано ясно и недвусмысленно. Однако защитники версий об авторстве Бэкона, хотя и именуют себя учеными, не удосуживаются заново пересмотреть свои выводы, произвести новые испытания, подвергнуть собственные суждения проверке в свете новых данных. Вместо этого они поносят своих критиков, прибегают к различным уверткам и изыскивают всяческие оправдания. Не было случая, чтобы они когда-нибудь признались, что, возможно, ошибаются. Когда Элизабет Гэллап, чтобы добиться желаемого результата, была вынуждена выдать белое за черное, она призвала на помощь такое «липовое» объяснение: ошибка была-де умышленно включена автором для введения в заблуждение, потому что «шифры делаются для того, чтобы скрывать смысл послания, а не раскрывать его».
Когда Фридманы полностью и окончательно развенчали энигмапланы, бэконианцы неожиданно выдвинули новые доводы, которые они никогда ранее не приводили:
«Хотя этот шифр может считаться недействительным по современным стандартам строгой криптографии, он предоставляет своим создателям вполне надежный метод записи исторических фактов или личных мнений, которые они были не в состоянии выразить открыто без серьезного риска».
Ни йоты доказательства этому не существует, если, конечно, не считать самих голословных утверждений бэконианцев. Более того, на каждое «предположение» в пользу Бэкона можно при желании вывести эквивалентное предположение в пользу Шекспира. Но этим заниматься столь же бесполезно, как бесполезно возражать телевизору, ибо бэконианцы не стремятся к познанию. Они не ученые, а проповедники.
Перед лицом каких свидетельств бэконианцы могли бы отказаться от своих утверждений? Перед лицом найденной авторской рукописи «Гамлета»? Если судить по опыту, они непременно заявят, что Шекспир переписал ее по распоряжению Бэкона. Или перед лицом обнаруженной записки Бэкона о том, что он ненавидел пьесы Шекспира и не имел ничего общего с этой дешевой стряпней? Бэконианцы и здесь найдутся: это-де, несомненно, умный прием, специально придуманный Бэконом для того, чтобы сбить с толку своих современников.
А так ли важно, кто написал шекспировские пьесы? В конце концов, имеет значение содержание самих пьес, а не их авторство.
Да, важно, так как в любом вопросе важна правда. По своему характеру ошибка бэконианцев выходит далеко за рамки вопроса об авторстве Бэкона и Шекспира. Если можно доказать, что свидетельства в пользу Шекспира не означают того, о чем они говорят, что они были фальсифицированы, чтобы подкрепить гигантскую мистификацию, которая остается нераскрытой в течение многих столетий, тогда с таким же успехом можно доказать, что другим историческим свидетельствам тоже нельзя доверять и что история – это пустая болтовня.
Справедливости ради надо сказать, что бэконианцы не являются единственными энигматологами. Габриэль Россетти, итальянский националист XIX века, «нашел» в «Божественной комедии» Данте секретный язык, которым некое тайное общество, выступавшее против политической и церковной тирании, формулировало свои цели и уведомляло о своей деятельности. Другие энигмадукции были извлечены из Библии, трактатов Аристотеля, а также из прочих, менее великих литературных творений человечества.
Энигматологов так же бессмысленно пытаться разубедить в их взглядах на разумной основе, как и демонстрировать пациенту психиатрической больницы фотоснимки похорон Эйнштейна, чтобы доказать этому пациенту, что он не Эйнштейн. Дело в том, что ни психически больные, ни энигматологи не выражают своих взглядов разумно. Они делают это эмоционально. Проблема энигматологии является по своей природе не логической, а психологической: энигматологи живут в мире иллюзий. Энигмадукции являются классическими результатами игры воображения. Они также подобны раковым опухолям на теле криптоанализа. Они представляют собой патологический криптоанализ.
Голоса предков
В конце каждого года редакция американского научного журнала «Очерки из истории греческой литературы» выпускает итоговый номер. В его статьях подробно рассматриваются узкие исторические вопросы греческой филологии, представляющие интерес для специалистов. Стиль этих статей ровный, повествование бесстрастное, заголовки сдержанные.
В одном из таких номеров можно найти статью, мало чем отличающуюся от других. В ней разбираются дебри глагольных окончаний и других грамматических форм греческого языка. Сугубо академичный заголовок этой статьи также ничем не примечателен: «Свидетельства о греческом диалекте в микенских архивах». Тем не менее после ее прочтения в воображении читателей возникают наполненные криками равнины вокруг обдуваемой ветрами Трои и развевающиеся султаны из конских хвостов на блестящих шлемах воспетых Гомером героев, толпящихся под стенами и башнями этого древнего города.
Дело в том, что в статье сообщается о дешифровании древнегреческого письма, оставленного на глиняных табличках в те времена, когда по земле ходили Ахиллес и Агамемнон, Елена и Менелай. В ней описывается одна из многих дешифровок, благодаря которым приглушенные голоса наших предков, молчавших несколько тысячелетий, через бездны времени и пространства дошли до ныне живущих людей. Некоторые из этих дешифровок следует причислить к величайшим достижениям человеческого ума, ибо они отвечают на вопросы о том, как прочитать неизвестную письменность давно умерших и как звучат слова тех, чьи голоса сегодня могут почудиться только в завываниях ветра.
При решении задачи дешифрования древней письменности используются некоторые методы криптоанализа. С одной стороны, для криптоаналитика такая задача легче, чем классическая проблема вскрытия шифра, так как здесь не надо иметь дело с сознательным стремлением скрыть информацию. С другой стороны, она является более трудной, поскольку иногда для ее решения бывает необходимо восстановить весь язык. Возможны четыре варианта.
В нулевом варианте известны и письменность, и язык. Поэтому никаких трудностей не возникает: англичанин может читать на английском, пользуясь знакомым ему алфавитом.
В варианте I язык известен, а письменность неизвестна. Эта задача равнозначна вскрытию шифра замены. Если письменность основана на алфавите, то ее дешифрование проводится методами, применяемыми при вскрытии однозначной буквенной замены. Если это слоговое письмо, например «катакана», то оно дешифруется способами, используемыми при криптоанализе номенклаторов. Если письмо идеограммное, как в китайском языке, то решение задачи напоминает вскрытие кода.
В варианте II письменность известна, а язык неизвестен. Американец, не знающий итальянского языка, может прочитать вслух статью из итальянской газеты на языке, близком к итальянскому, но он ничего не поймет в том, что произнесет. Задача, с которой сталкивается дешифровальщик в варианте II, подобна той, которую пришлось бы решать американцу, пожелавшему выучить итальянский язык без грамматических справочников и словарей, имея лишь некоторые картинки к текстам и их английский перевод, а также зная родственные языки, например испанский и латинский.
В варианте III ни письменность, ни язык не известны. В условиях культурной изоляции задача дешифрования никогда не будет решена. Но часто случается так, что, хотя в начале изучения и письменность, и язык неизвестны, позднее с помощью дополнительной информации, доступной благодаря другим источникам, удается установить значение звуков письма. Их перевод и привлечение родственных языков дают возможность восстановить и сам язык. Таким образом, в варианте III задача дешифрования сводится к последовательному решению задач в вариантах I и II.
Дешифрование для варианта I зачастую выглядит как пример из учебника по элементарному криптоанализу. Осенью 1946 г. известный французский востоковед Эдуард Дорм взялся за изучение надписей, найденных во время раскопок в сирийском городе Библе. Письмо имело сходство с иероглифическим, но не обретало смысла при попытках его прочитать. Учитывая место, где были обнаружены надписи, а также их возраст, Дорм уверенно предположил, что имевшиеся у него примерно 100 письменных знаков относятся к финикийскому языку. Их количество наводило на мысль о слоговом характере письменности, при котором каждый знак соответствует слогу. Но обычное финикийское письмо в соответствии с нормами, присущими семитским языкам, передает все слова лишь костяком входящих в них согласных букв. Поэтому у финикийцев слова «мистер» и «мастер» выглядели бы как «мстр».
Поскольку звучание слов найденного в Библе письма было никому не известно, Дорм не мог восстановить гласные звуки древнего слогового языка, на котором оно было написано. Но это не обескуражило 65-летнего ученого, награжденного орденом за успешные криптоаналитические разработки во время Первой мировой войны, и он энергично принялся за дешифрование найденных в Библе псевдоиероглифов, предположив с самого начала, что семь знаков в нижнем левом углу глиняной таблички означают дату вступления очередного финикийского царя на престол.
«Без колебаний я придал знакам, предшествующим дате, значение „в годы“ или „в год“. Это предположение позволило мне пренебречь внешним видом знака при определении его звукового значения. Вся моя работа теперь состояла в том, чтобы разносить эти четыре буквы по соответствующим позициям, и в том, чтобы заполнять пустые места результатами перекрестной проверки, пользуясь моим знанием финикийского языка.
В первой строке таблички я нашел группу «n?s», а поскольку табличка была медной, я восстановил слово «nhs» («медь» или «бронза»). Звук «h», отождествленный со знаком, изображающим птицу, дал мне окончание «??bh», по которому я узнал слово «mzbh» («алтарь»). Получив таким образом «m» и поставив его на место предпоследнего знака в 14-й строке, я обнаружил сочетание «btm?», которое могло обозначать лишь «в месяц Таммуз». Теперь я уже располагал вторым «z», которое я обозначил как «zl».
Но названию месяца должно предшествовать упоминание о дне. Так как в 14-й строке чисел не было, в группе «s?s» я узнал название числа и сначала принял эту группу за «sls», что означает «три». После некоторых безуспешных попыток пристроить куда-нибудь согласный звук «l» я понял, что в действительности это было не «sls» («три»), a «sds» («шесть»). К отождествленным знакам добавилось «d»…
Всякий занимавшийся такого рода дешифрованием, в котором беспрестанно приходится пускать в ход то карандаш, то резинку, когда разносишь сначала одни предполагаемые значения, потом вместо них другие, уступающие место окончательным решениям, – поймет, ценою каких усилий мне удалось составить слоговый алфавит и прочесть финикийские слова, скрывавшиеся в этом непрочитанном письме, которое, по мнению специалистов, не поддавалось дешифрованию…»
Дорм считал, что поскольку латинский алфавит произошел от греческого, греческий – от финикийского, а финикийский – от египетских иероглифов, то проведенная им дешифровка является новым связующим звеном «между иероглифами и латинским алфавитом». Некоторые ученые оспаривают это толкование, но мало кто сомневается в том, что благодаря работе Дорма в распоряжении историков появились доселе неизвестные документы.
Что же касается задач для варианта II, то их решение к дешифрованию никакого отношения не имеет. В действительности это восстановление языка. Таких задач было решено много, особенно в пору бурного развития лингвистических наук в XIX веке.
Одной из самых известных задач, относящихся к варианту III, является загадка иероглифов майя. Ее удалось разгадать при помощи современного всепобеждающего оружия криптоаналитиков – компьютера. Три советских математика Е.В. Евреинов, Ю.Г. Косарев и В.А. Устинов первыми применили компьютерную технику для дешифрования древней письменности. Они предположили, что наиболее часто высеченные на камнях знаки представляют запись самых частых звуков языка майя. А этот язык и его звуки были известны, во-первых, из двух майя-испанских словарей, составленных в период завоевания земель майя европейцами, во-вторых, из переродившегося языка майя, на котором все еще говорят на Юкатане, и в-третьих, из текстов, записанных жрецами племени майя с помощью алфавита конкистадоров.
Советские математики записали 60 тысяч слов, взятых из этих текстов, в память компьютера. В результате произведенных вычислений они установили, что в исследованных словах имеются 70 пар букв, которые приходятся на половину начал этих слов. Они также нашли 73 иероглифа, которые присутствуют в половине начал слов, высеченных на камнях, и отождествили обе группы. После этого в ходе 40-часовой электронной «блицдешифровки» ученые из СССР установили аналогичные соотношения для средних и конечных групп в словах. На основании найденных соотношений они пришли к окончательному выводу о том, что им удалось успешно дешифровать письменность майя. Вот образцы прочитанных ими прекрасных древних афоризмов на языке племени майя: «Молодой бог маиса обжигает сосуды из белой глины» и «Бремя, возложенное на женщину, – это бог войны».
Анатомия криптоанализа
Криптографию и криптоанализ иногда называют науками-двойниками. И действительно, на практике они взаимно дополняют друг друга: то, что одна наука создает, другая разрушает, и наоборот. Однако но своей природе криптография и криптоанализ различаются весьма существенно. Шифровальное дело абстрактно и до предела теоретизировано. Взлом же шифров эмпиричен и конкретен.
Голландский криптограф Моуриц Фрис так написал о теории шифрования: «Вообще криптографические преобразования имеют чисто математический характер. Например, перестановки набора первичных элементов (букв алфавита), преобразования координат узлов решеток, сложение и вычитание в конечных кольцах, линейные алгебраические преобразования. Простым примером таких математических преобразований, используемых для засекречивания, служит равенство: у = ах+b,где x –буква сообщения, убуква шифртекста, полученная в результате операции шифрования, аи bявляются постоянными величинами, определяющими данное преобразование. Таким образом, вычисления над буквами легко выполняются после определения для них соответствующего алгебраического закона».
Операции шифрования и их результаты настолько же универсальны и справедливы, насколько это свойственно законам математики. Отрицать, что при применении классического шифра Виженера 113113
Для засекречивания сообщений в этом шифре используется математическое преобразование вида у = х + 2, в котором, как и у Фриса, х– это буква открытого текста сообщения, a y– соответствующий ей знак шифртекста.
[Закрыть]буква «d» открытого текста дает знак «F» шифрованного, невозможно точно так же, как и заявлять, что 4 + 2D 6. Эта истина была справедлива в XIV веке во Франции, когда Виженер изобретал свой шифр. Будет она верна и десять веков спустя на Марсе. Различные шифры, как и разные геометрии, дают отличные друг от друга, но одинаково действительные результаты.
В криптоанализе положение несколько иное. Эта наука пользуется методологией других наук, изучающих материальный мир. Ее методы основаны не на неизменных законах математической логики, а на подмеченных фактах реального мира. Криптоаналитик получает эти факты с помощью экспериментов и измерений. В противоположность криптографу, который может вывести уравнение шифрования для классического шифра Виженера, не прибегая к дополнительным опытам, криптоаналитик, имея любое число высказываний об английском языке, априори не может сказать, какая буква встречается в нем наиболее часто. Он должен сперва подсчитать частоту встречаемости всех букв. В криптоанализе факты могут быть постоянными в каждом конкретном случае, но они логически не обусловлены и зависят от обстоятельств, от реальной действительности.
Эмпирический характер криптоанализа наиболее отчетливо проявляется в его операциях. Последние проделываются в четыре этапа, которые можно найти в других науках, занимающихся материальным миром. Эти этапы включают:
1) анализ (подсчет букв);
2) выдвижение гипотезы (знак хв шифртексте, возможно, заменяет букву «е» открытого текста);
3) предсказание (если хозначает «е», то появляются некоторые возможности для нахождения открытого текста);
4) проверку (такие возможности существуют) или опровержение (таких возможностей нет, так что хвовсе не означает «е»).
Данный научный метод, общий для криптоанализа и для других естественных наук, оправдывает употребление метафор вроде: «Он пытался дешифровать историю Земли, изучая отложения пород».
В криптоанализе применяются два метода – дедуктивный и индуктивный. Дедуктивные решения основываются на анализе частот встречаемости и используются при вскрытии любого шифра. Индуктивные решения основываются на вероятных словах или на благоприятном стечении обстоятельств, например наличии двух шифртелеграмм с одним и тем же открытым текстом.
Типичный силлогизм при анализе частот встречаемости букв в телеграмме на английском языке, засекреченной шифром простой однобуквенной замены, имеет в качестве универсальной посылки утверждение о том, что самым частым знаком в шифртелеграмме, вероятно, является замена для буквы «е», а в качестве частной – заявление о том, что знак хвстречается в шифртелеграмме наиболее часто. Вывод: знак хшифртекста, вероятно, заменяет букву «е» открытого текста. Поскольку всем языкам присущи строго определенные характеристики частот встречаемости букв, этот дедуктивный метод, как известно, применим к любой шифрованной телеграмме еще до ее изучения.
По своему характеру такой подход к дешифрованию является априорным. При наличии достаточного объема шифртекста он всегда дает правильный ответ и поэтому представляет собой общее решение.
С другой стороны, вскрытие шифра индуктивными методами может быть успешным лишь при выполнении определенных условий. Поскольку криптоаналитик не может сказать, действительно ли выполнены определенные условия, пока он не получит шифртелеграмму и не познакомится с ее особенностями, индуктивные методы вскрытия шифров по своему характеру являются апостериорными.
Если противник посылает шифрованное сообщение сразу же после того, как он был подвергнут массированному артиллерийскому обстрелу, за которым последовала танковая атака, криптоаналитик вполне может предположить, что в открытом тексте посланной шифровки содержатся слова: «артиллерийский обстрел» или «атака». Он может использовать эти вероятные слова для того, чтобы прочесть шифровку 114114
Распространенные слова «что», «и» и определенный артикль, которые очень часто можно найти во всех текстах на английском языке, в этом смысле но являются вероятными.
[Закрыть]. Рассуждения криптоаналитика основываются на множестве конкретных фактов, связанных с перехваченным шифрованным сообщением, и кристаллизуются всего в один вывод относительно открытого текста этого шифрсообщения. Такие рассуждения чисто индуктивны.
То же можно сказать и о криптоаналитических рассуждениях, используемых при вскрытии шифров в других особых случаях.
Так как наличие вероятных слов и особые случаи позволяют криптоаналитику добыть дополнительную информацию, такое вскрытие шифров является весьма эффективным и плодотворным. Поэтому криптоанализ новых шифрсистем чаще всего начинают именно с них. К сожалению, этот подход ограничен конкретными ситуациями, и от него криптоаналитики, как правило, затем переходят к поиску общего дедуктивного решения, основанного на частоте встречаемости букв.
Представление о криптографии как о математической науке, которое впервые сформулировали в своих работах Бэббидж 115115
Бэббидж Ч. – английский математик, в XIX в. разработавший идею вычислительной машины, осуществленную лишь в середине XX в.
[Закрыть]и Фрис, позволило глубоко изучить ее. Осознание этого факта породило также новые способы аналитического вскрытия шифров.
Применение принципа частот встречаемости букв в криптоанализе постепенно ширилось. В результате были вскрыты шифры, которые вначале казались ему неподвластными. Затем этот принцип столкнулся с явлением, на котором основывается современный криптоанализ, – с постоянством частотных характеристик текстов. Только после Первой мировой войны в криптоанализе возникла новая замечательная теория, которая дала объяснение этому явлению и всему процессу самого криптоанализа. Она позволила, наконец, ясно и четко понять, почему вообще возможно аналитическое вскрытие шифров.
Часто не учитывают поразительной стабильности и универсальности частот букв. Кроме криптоанализа есть и другие виды человеческой деятельности, в которых постоянство частот букв всегда принимается во внимание, поскольку пренебрежение этим явлением может причинить большие материальные убытки. Для иллюстрации этого положения обратимся к некоторым забавным фактам, прямо не связанным с криптоанализом.
В 1939 г. в США был напечатан 267-страничныи роман со скромными литературными достоинствами, но настолько оригинальный, что в своем роде у него нет равных во всей многовековой истории английского языка.
Само название романа указывает на его уникальность: «Гэдсби – роман, содержащий более 50 тысяч слов без буквы „е“. Это – поразительное творение. Пусть скептически настроенный читатель убедится сам, как долго приходится подбирать хотя бы одно предложение на английском языке без использования буквы „е“. Автор „Гэдсби“, Эрнст Райт, перечислил некоторые трудности, с которыми он столкнулся при написании „Гэдсби“. Ему приходилось избегать употребления большинства правильных глаголов в прошедшем времени, так как они оканчиваются на „ed“. Он не мог использовать определенный артикль „the“ или местоимения „he“, „she“, „they“, „we“, „me“ и „them“ 116116
«Он», «она», «они», «мы», «мне» и «им».
[Закрыть]. В «Гэдсби» надо было отказаться от просто незаменимых глаголов «are», «have», «were» и «be» 117117
«Являются», «иметь», «являлись» и «быть».
[Закрыть]и крайне необходимых слов, как «there», «these», «those», «when», «then», «more», «after» и «very» 118118
«Там», «эти», «те», «когда», «затем», «больше», «после» и «очень».
[Закрыть].
Строго придерживаясь избранного им принципа, Райт отказался от использования числительных между 6 и 30 даже в цифровом написании, так как буква «е» используется при их написании прописью. Райт жаловался: «Почти непреодолимая трудность возникла при введении в повествование молодых женщин: ведь про них не напишешь, что им за тридцать». Были изъяты также сокращения «Mr.» 119119
«Г-н».
[Закрыть]и «Mrs.» 120120
«Г-жа».
[Закрыть]из-за присутствия «е» в полном написании этих слов. Сложную задачу приходилось решать в конце почти каждого длинного абзаца: будучи не в состоянии найти слово, не содержащее «е», которым можно было бы закончить мысль, автор возвращался назад и переписывал весь абзац.
Райт так часто испытывал искушение использовать запрещенное слово, что ему пришлось заклинить рычаг буквы «е» на пишущей машинке, чтобы исключить ее попадание в текст. В предисловии к своей книге автор сообщает:
«Часто буква „е“ пыталась-таки проскользнуть незамеченной. Когда я писал, первоначально от руки, вокруг моего стола столпилась целая армия крохотных „е“, нетерпеливо ожидавших, когда их позовут. Но постепенно, наблюдая, как я пишу, не замечая их, они забеспокоились и, возбужденно перешептываясь, стали вскакивать верхом на мое перо, постоянно посматривая вниз в надежде улучить момент и прыгнуть в какое-нибудь слово. Они вели себя, как морские птицы, удобно рассевшиеся для охоты за проплывающей рыбой. Но когда они увидели, что я уже отмахал 138 страниц на бумаге машинописного формата, они соскользнули на пол и, взявшись за руки, удалились с поникшими головами, а потом, обернувшись, прокричали: „Представляем, какую тарабарщину ты там нацарапал без нас. Вот уж, право, человек! В любом рассказе нас всегда пишут сотни тысяч раз! А сейчас нас гонят прочь! Впервые за всю нашу жизнь!“
Райт говорил, что для написания романа ему потребовалось «пять с половиной месяцев упорного труда, причем в тексте пришлось сделать столько подчисток и поправок, что при воспоминании о них меня до сих пор бросает в дрожь». Эти эмоции Райта наглядно свидетельствуют о всепроникающей распространенности одной только буквы английского языка. Остальные буквы тоже держатся цепко.
Не только Райт, но и другие авторы написали, в качестве литературных курьезов, липограммы, то есть сочинения, из которых намеренно исключается одна или несколько букв. Древнегреческий писатель Трифиодор сочинил «Одиссею», в первой книге которой не встречалась буква «?», во второй «?» и т. д.
Несмотря на постоянство частот встречаемости букв и на большое различие частот отдельных букв во всех языках, они не настолько заметны, чтобы об их существовании знали все. Одним из людей, которые, очевидно, и не подозревали об этом, был Латам Шоулс, изобретатель пишущей машинки, увековечивший ее ужасную клавиатуру.
Такая клавиатура с неудобным размещением букв впервые появилась в опытном образце, изготовленном в 1872 г. Остатки алфавитного порядка сохранились в расположении букв «d», «f», «g», «h», «j», «k», «l» во втором ряду, а в верхний ряд были включены буквы слова «typewriter» 121121
«Пишмашинка».
[Закрыть], чтобы торговцы могли их легко найти при демонстрации работы.
Клавиатура с неудачным подбором букв первого ряда «q», «w», «е», «г», «t», «у», «u», «i», «о», «р» оборачивается для предпринимателей потерями времени и денег. Несмотря на то, что основная рабочая нагрузка у большинства людей приходится на правую руку, при такой клавиатуре левая рука делает более половины всех ударов. Получается, что для печатания слов вроде «federated» 122122
«Объединенный в федерацию».
[Закрыть]и «addressed» 123123
«Адресованный».
[Закрыть]левая рука лихорадочно мечется по клавишам, а правая тем временем пребывает в абсолютном покое. Кроме того, получается, что два самых «работящих» пальца правой руки приходятся на клавиши с наиболее редкими буквами английского алфавита – «j» и «k».
Ввиду этих вопиющих недостатков было разработано множество других, более удачных клавиатур. Однако все нововведения были отвергнуты машинистками, не захотевшими переучиваться для работы на новой клавиатуре, и фирмами, не желающими платить за переделку печатающих машинок, имеющих стандартную клавиатуру Шоулса.
В тех случаях, когда изобретатели и предприниматели учитывают явления, связанные с частотами встречаемости букв, они могут получить значительную дополнительную прибыль. Наиболее ярким примером является Ф. Морзе. В 1838 г. он решил использовать алфавитную систему сигналов для своего только что изобретенного электромагнитного телеграфа. Морзе сосчитал буквы в наборной кассе типографии одной филадельфийской газеты и присвоил наиболее короткие сочетания из точек и тире самым частым буквам.
За небольшими исключениями Морзе придерживался этого правила и при создании своего знаменитого кода, поставив в соответствие самый короткий знак (точку) самой распространенной букве («е»), другой короткий знак (тире) – следующей часто встречающейся букве («t») и т. д. При использовании современного кода Морзе, слегка отличающегося от его первоначального варианта, на передачу телеграммы из 100 букв на английском языке требуется около 940 знаков. Если бы код Морзе был составлен произвольным образом, то на такую же телеграмму потребовалось бы около 1160 знаков, или примерно на 23% больше. Благодаря проницательности изобретателя, принесшей, кстати, значительные денежные выгоды его потомкам, стало возможно передавать за один сеанс почти на 25% больше телеграмм, чем в случае, если бы Морзе составлял свой код наугад.
Из этих примеров видно, что частоты букв действительно довольно постоянны. Неоднократно проведенные опыты по их подсчету подтверждают этот факт. Например, восемь немецких криптоаналитиков независимо друг от друга подсчитали частоту буквы «е» в различных текстах на родном языке объемом примерно в тысячу букв. Полученные ими результаты колеблются от 16 до 19,2%. Эти цифры можно сравнить с подсчетом частот встречаемости букв, проведенным в лингвистических целях немецким филологом Ф. Кёдингом в 1898 г. Его подсчет можно принять за эталон: Кёдинг обработал 59298274 буквы, извлеченные из 20 миллионов слогов немецкого языка. Среди них он насчитал 10598015 букв «е», или 17,9%. Интересно, что средняя цифра от восьми результатов аналогичных подсчетов на текстах меньшего объема составляет 18%, то есть отклонение от нормы, полученной Кёдингом, составляет лишь одно «е» на тысячу букв. Получается, что любой человеческий язык укладывается в строгие статистические нормы!
В чем причина этого поразительного явления? Ответ можно найти с помощью разработанной после Второй мировой войны теории, которая называется «теория информации». Предметом ее изучения являются математические законы, которым подчиняются системы передачи данных. Созданная для решения проблем телефонии и телеграфии, она оказалась применима практически ко всем устройствам, передающим информацию, включая компьютеры и нервную систему животных. Ее идеи оказались настолько плодотворными, что были взяты на вооружение другими науками – психологией, лингвистикой, молекулярной генетикой, историей, статистикой и нейрофизиологией. Создатель этой теории стал также родоначальником ее применения в криптографии.
Клод Шеннон родился в городе Петоски в штате Мичиган 30 апреля 1916 г. Поступив в Мичиганский университет, Шеннон занялся серьезным изучением электротехники и математики. Именно там у него впервые проявился интерес к теории связи и криптографии.
В Массачусетском технологическом институте Шеннон написал диссертацию, в которой содержалось множество новаторских идей, связанных с разработкой телефонных систем. Получив степень доктора математических наук, Шеннон поступил на службу в лабораторию компании «Белл», которая была заинтересована в реализаций этих идей на практике.