Текст книги "Алло, робот"
Автор книги: Александр Кондратов
сообщить о нарушении
Текущая страница: 6 (всего у книги 8 страниц)
Для решения всех этих задач необходимо было широко использовать статистику – науку, изучающую приемы численного наблюдения над массовыми явлениями и занимающуюся обработкой этих наблюдений в научных и практических целях. Но статистические подсчеты – дело очень громоздкое. Только подсчет частоты отдельных знаков в рукописях майя занял не один год, хотя этим занимались несколько ученых (Гейтс – в Соединенных Штатах, Цимерман – в Германии, Кнорозов – в СССР). Ведь сначала требовалось установить все варианты написания, чтобы не спутать один знак с другим, восстановить неясно написанные места, указать все места в рукописях, в которых встречается данный знак. Нужно было подсчитывать отдельно случаи, когда знак стоит в начале, середине или в конце слова, учитывать место слова в предложении, знака – в группе знаков.
В 1963 году в издательстве Академии наук СССР вышла объемистая монография «Письменность индейцев майя». В ней доктор исторических наук Юрий Валентинович Кнорозов подвел итоги своей многолетней работы над дешифровкой загадочных письмен. Многие страницы истории доколумбовой Америки становятся ясными благодаря разгаданным письменам.
.При дешифровке письма майя были применены статистические методы. Одновременно с Кнорозовым успешно использовал статистику для дешифровки критского письма английский ученый Вентрис.
Возник вопрос, нельзя ли при дешифровке древних систем письма производить подсчеты с помощью вычислительных машин? Конечно, машина, даже самая «умная», не может по-настоящему читать древние рукописи. Да и знаки письменности она не различит. Ведь и сейчас ученые все еще пытаются «научить» машины различать русские буквы «а» и «б». Куда тут до иероглифов!
Кто-то из кибернетиков метко назвал электронные вычислительные машины «идиотами, наделенными феноменальной способностью к счету». Вот эту-то способность и можно использовать для дешифровки древних письмен.
Первый вопрос – определение системы письма. Мысли, сообщения можно записывать с помощью рисунков, «рисуночным письмом», или пиктограммами. Многие народности Сибири до Великой Октябрьской социалистической революции, коренные жители Австралии, индейцы Северной Америки пользовались «рисуночным письмом». Читать подобное письмо, как мы уже говорили в первой главе, нельзя. Можно лишь «толковать» рисунки. Чтобы передать новые понятия, нужны новые «говорящие картинки». И чем длиннее текст, тем больше этих рисунков понадобится. В среднем на каждые 100 рисунков-знаков появляется 70—80 новых!
В письменности, где знак передает корень слова или аффикс (лингвисты называют эти значимые элементы языка морфемами), конечно, новых знаков появится меньше. Еще экономнее «слоговое письмо», в котором каждый слог передается особым знаком. И, наконец, самое экономное письмо – алфавитное, в котором знак передает не слог, а лишь звук языка (например, наша русская азбука).
Каждая система письма имеет, таким образом, характерные особенности, которые могут быть выражены числами. А ведь язык машин – это язык чисел. И кибернетические машины могут вести подсчеты, чтобы определить систему письма.
Но это лишь начало дешифровки. Древние системы письма – обычно смешанные системы. В иероглифике часть знаков передает морфемы, а часть – слоги. Таким иероглифическим, смешанным письмом написаны древнеегипетские тексты, «глиняные книги» Ассирии, Вавилонии, Шумера, памятники письменности хеттов. Иероглифическим же письмом пользовались и древние майя.
Как же найти, какой знак – алфавитный, какой – слоговой, какой передает корень слова или аффикс?
При расшифровке египетских, хет-тских, вавилонских письмен помогало то, что имелся «дублирующий текст».
На знаменитом Россетском камне, кроме египетских иероглифов, была надпись и на древнегреческом языке, известном ученым. Вавилонские надписи также имели перевод на известный персидский язык. В письменах майя такого «дубля» не было. Здесь на помощь вновь приходит статистика. И проделать утомительные, громоздкие подсчеты могут чудо-счетчики – вычислительные машины.
С помощью машины можно исследовать все возможные варианты. И не придется тратить на это годы – машина проделает это за несколько часов. Но, прежде чем привлекать машину для помощи в дешифровке, нужно проверить правильность составления программы. В теории все выглядит стройно и гладко. А как окажется на практике?
Нужен был контрольный опыт.
В принципе для проверки можно взять любую письменность. Например, древнеегипетскую или хеттскую.
По предложению Кнорозова, этой «проверочной» письменностью была выбрана письменность майя. Машина должна была «прочитать» знаки майя, вернее, не сами знаки, а последовательность чисел, которыми были обозначены различные иероглифические знаки. Например:
Результаты машинной дешифровки должны были затем сравниваться с результатами «ручной». Совпадает ли «машинное» и «человеческое» чтение? Если машинная программа и методы верны, то, безусловно, они должны совпадать.
Подготовкой программы для машин занялись сотрудники Новосибирского института математики Сибирского отделения АН СССР Ю. Евреинов, Э. Косарев, В. Устинов.
Машинная дешифровка показала: да, знаки майя, прочитанные электронной вычислительной машиной, совпадают со знаками, прочитанными «вручную»!
Однако наряду с правильными чтениями в машинной дешифровке оказалось и очень много неправильных. При этом любопытно, что неправильные чтения повторяют те же ошибки, которые делались в начале «ручной» дешифровки. Это говорит о том, что многие ошибки дешифровщиков типичны и что программирование имеет серьезные недостатки.
Кроме того, составители программы допустили ряд принципиальных упрощений задачи. Например, они считали, что древние тексты майя написаны на современном испанскому завоеванию языке, то есть на языке XVI века. А сохранившиеся рукописи датируются примерно XII—XIV веками. Да и в те времена жрецы писали тексты на архаичном, древнем языке.
Впереди предстоит большая работа по усовершенствованию методов составления программ. Но при всех ее недостатках, машинная дешифровка, проведенная новосибирцами, доказала, что современные машины могут быть использованы для чтения древних письмен. При правильной методике и человеческий мозг, и «электронный мозг» вычислительной машины приходят к одним и тем же результатам.
НЕРАЗГАДАННЫЕ ТАЙНЫ
Какие же древние письменности не дешифрованы до сих пор? Какие загадки предстоит раскрыть с помощью кибернетических машин? Прежде всего, это тайна этруссков. Об этом загадочном народе часто упоминают древние римские писатели. Народ этруссков исчез, оставив памятники самобытной культуры и непрочитанные письмена.
Ученым известна система письма этруссков. Они пользовались греческим алфавитом. Известно, какой звук изображает тот или иной знак. Ученые легко могут читать письмена этруссков... не понимая почти ничего.
Каким языком пользовались этрусски? Эта тайна не решена наукой до сих пор. Представьте себе, что вам дают прочесть текст на неизвестном языке, но написанный русскими буквами. Читать вы его можете. Но не поймете ни слова из прочитанного.
Самый разумный способ – перебирать языки мира до тех пор, пока не наткнешься на нужный... Но ведь языков на земном шаре несколько тысяч! Да к тому же, вероятно, среди «живых» языков нужный язык не найти: он мог исчезнуть вместе с народом. Как это было, например, с шумерским или эламским языками на древнем Востоке.
Быть может, с помощью электронных машин такой перебор языков и удастся сделать. Американские ученые, во всяком случае, объявили о программе машинной дешифровки
письменности этруссков. Завершить ее они обещали в 1965 году. Что даст эта машинная дешифровка, неизвестно. А пока что язык этруссков остается неразгаданной загадкой, споры о которой не утихают и по сей день. Причем, о характере этих споров вы можете судить сами. Археологи нашли игральную кость этруссков. На каждой стороне кости написаны названия чисел. Но какую из цифр обозначает то или иное слово, до сих пор неизвестно, несмотря на множество написанных по этому поводу статей и книг.
Не менее интересную загадку загадал ученым так называемый «фестский диск». Найден он на острове Крит, хотя сделан не из критской глины. Это – круглая пластинка; на ней по обеим сторонам оттиснут 241 знак. Археологи нигде более не находили подобных надписей.
Среди знаков – изображения лодки, топора, орла, шкуры, лопатки каменщика, розетки, вазы, дома. Чаше всех повторяется знак, изображающий мужскую голову в головном уборе из перьев. Быть может, он является ключом к загадке диска?
Одни ученые считают, что этот головной убор говорит о Малой Азии. Другие – о Греции. Третьи – о Северной Африке. Четвертые находят в нем сходство с головными уборами индейцев Америки. А безудержные фантазеры считают диск из Феста последним памятником письменности Атлантиды!
Сумеют ли ученые прочесть загадочную надпись? Кто знает. Ясно одно – «вручную», без помощи машин, это сделать нельзя. И вот почему.
Казалось бы, чем больше памятников древней письменности сохранилось, тем больше работы, тем труднее дешифровка, тем нужнее помощь машин. Однако это не так. Наоборот, чем больше материала, тем легче дешифровать.
Руководитель лаборатории машинного перевода в Ленинградском университете Н. Д. Андреев считает даже, что можно дешифровать не только древние, но и марсианские письмена, если иметь достаточно большой текст – примерно 100 тысяч знаков.
Возможно ли это? Трудно ответить: контакт с «братьями по разуму» до сих пор не налажен. А во всех не расшифрованных еще памятниках древних письменностей содержится гораздо меньшее число знаков. На фестском диске их, как мы уже говорили, 241. Еще меньше знаков содержит древнейшая славянская надпись из могильника в селе Алиханово, сделанная на глиняном сосуде. Не так давно весь мир отмечал 1100-летие славянской азбуки. Надпись на этом сосуде восходит к еще более древним временам. Чтобы понять ее смысл, необходимы еще большие усилия, чем при изучении фестского диска: уж слишком кратка надпись и-к тому же ни один знак в ней не повторяется. А памятник древней письменности Андов, высеченный на камне близ индейского селения Тигуанако, содержит и того меньше – всего 5 знаков.
Имея длинный текст, мы легко можем проверить свои
предположения, найти систему письма, разыскать служебные и ключевые слова. А при дешифровке маленьких текстов, вроде текста на диске из Феста, на сосуде из Алиханова или на камне из Тигуанако, этого сделать нельзя.
Поэтому, чтобы попытаться найти правильное чтение, нужно перепробовать астрономическое число возможных ва-риантов. Человеческой жизни не хватит, чтобы перепробовать хотя бы небольшую часть этих комбинаций. Машина же, работающая в миллионы раз быстрее человека, может справиться даже с астрономически большими числами.
«ТАЙНА ЗА СОТНЯМИ ПЕЧАТЕЙ»
Еще одна загадка, ждущая решения с помощью «умных машин», – загадка древнейшей цивилизации Индии. Это поистине «тайна за сотнями печатей» – и не только в переносном смысле слова.
В 20-х годах нашего столетия археологи произвели раскопки в долине реки Инда, в местности, имевшей название «Мохенджо-Даро», то есть «Холм смерти»... Обычно считалось, что древнейшая история Индии начинается со вторжения в долину реки Инда племен арьев.
Это было около полутора тысяч лет до нашей эры.
Но раскопки показали, что две тысячи лет до вторжения арьев в Индии существовала развитая культура. Культура, современная древнеегипетской и шумерской – самым древним цивилизациям на нашей планете! Кто был ее создателем?
Казалось, свет на эту загадку истории могут пролить найденные при раскопках печати с иероглифическими надписями.
Вот как выглядят некоторые из них:
Все попытки прочесть эти знаки пока что безуспешны; больше того, ученые до сих пор не пришли к выводу, где, в каком месте земного шара следует искать создателей древнейшей культуры Индии.
Проще всего предположить, что ее создали дравиды, коренные жители Индии. Но ряд исследователей категорически возражает против этого предположения. «Цивилизация Мохенджо-Даро, – говорят они, – создана первой волной пришельцев-арьев, родственных тем племенам, которые через много веков, уже в «исторический» период пришли в долину Инда».
Одни ученые считают, что культура Мохенджо-Даро была создана народом, родственным с хеттами. Другие утверждают, что потомками древнейшего населения Индии могут оказаться жители хребта Гиндукуш – вершикцы или буриши. Третьи предполагают, что их надо искать в Центральной Азии, близ Памира. Четвертые в долине реки Тигра и Евфрата, поблизости от современной культуре Мохенджо-Даро шумерской цивилизации.
Наконец, совсем недавно в американском журнале «Америкен антиквити» появилась статья, в которой говорится о сходстве индийской цивилизации с культурой сапотеков, живущих в Мексике!
Но, пожалуй, самым сенсационным и неожиданным было предположение венгерского ученого Хевеши о сходстве древнеиндийской письменности с письменностью на «говорящих дощечках» («кохау ронго-ронго») острова Пасхи, затерянного в просторах Тихого океана.
ГОВОРЯЩИЕ ДОЩЕЧКИ КОХАУ РОНГО-РОНГО
В самом деле, сходство многих знаков этих письменностей поразительно. Судите сами, вверху изображены знаки кохау ронго-ронго, а под ними – знаки иероглифических надписей Мохенджо-Даро.
И все-таки слишком невероятным кажется большинству ученых родство этих письмен. Ведь не только двадцать тысяч километров, но и пять тысяч лет разделяют письменность острова Пасхи и письмена Мохенджо-Даро!
Письменность острова Пасхи также не дешифрована. Таинственные знаки на дощечках – это, пожалуй, самая трудная загадка изо всех многочисленных загадок, которые загадал ученым всего мира этот маленький остров в Тихом океане. Вот уже шестое поколение ученых тщетно пытается расшифровать кохау ронго-ронго.
Жители острова Пасхи до прихода европейцев имели специальные школы письма, в которых ученые, знатоки «маори ронго-ронго», обучали многочисленных учеников секретам древнего письма. Знаки вырезались на дереве. Пером служил зуб акулы. И с какой каллиграфической точностью и четкостью выводились строки этого письма!
Раз в год на острове Пасхи даже устраивались своеобразные «конгрессы» знатоков кохау ронго-ронго. Со всех сторон к месту «конгресса» стекались островитяне, чтобы участвовать или просто посмотреть на столь знаменательное событие. Ученые мужи, «маори ронго-ронго», располагались рядами. В центре стоял главный «профессор», главный знаток письмен. Церемония начиналась с
экзамена, который устраивали в первую очередь самим учителям. Если ошибку в чтении дощечек делал юноша, его поправляли. Если же в неправильном чтении письмен был уличен старик, то к нему подходил мальчик, брал за ухо и выводил из строя «людей ронго-ронго», причем главный «профессор ронго-ронго» приговаривал: «Как тебе не стыдно, тебя выводит ребенок!»
До сумерек продолжалось чтение дощечек, продолжался «конгресс» знатоков письма кохау ронго-ронго. По дошедшим сведениям, почти в каждом доме на острове Пасхи хранились деревянные дощечки, покрытые иероглифическими знаками.
Но во второй половине XIX века остров Пасхи подвергся пиратскому нападению перуанских работорговцев. Почти все мужское население острова было захвачено и вывезено на острова Чинча для добычи птичьего помета – гуано, используемого как удобрение полей. Среди островитян вспыхнула эпидемия оспы – и в результате погибло множество людей, в том числе и почти все «люди ронго-ронго».
Затем на острове Пасхи поселились миссионеры – и в огонь полетели бесценные памятники письменности, ибо миссионеры приказали сжечь «дьявольские письмена» с непонятными для них значками. В результате этого варварского поступка до наших дней дошло всего лишь несколько дощечек кохау ронго-ронго. Две из них хранятся в нашей стране, в Ленинградском музее
этнографии и антропологии. Их привез в прошлом веке знаменитый русский путешественник и ученый Миклухо-Маклай.
Скоро минет век, как начались первые попытки заставить заговорить дощечки кохау ронго-ронго. Итог этим попыткам подвел известный немецкий дешифровщик Фридрих: «Надежда когда-либо проникнуть в смысл дощечек с острова Пасхи весьма невелика».
Благодаря помощи электронных вычислительных машин шансы ученых прочесть таинственные знаки значительно возросли. Недаром директор Новосибирского института математики академик С. Л. Соболев писал в статье «Поэзия математики»: «Работники отдела прикладной кибернетики нашего вычислительного центра уже думают о новых исследованиях» – и назвал на первом месте среди письмен, ждущих разгадки с помощью машин, дощечки острова Пасхи.
НОВЫЕ УСПЕХИ ДЕШИФРОВКИ
Более трех лет прошло с тех пор, как новосибирские кибернетики опубликовали отчет о первом в мире опыте изучения древних письмен с помощью вычислительной техники. Их работа показала, что кибернетика с успехом может применяться для анализа древних письмен. Путь
машинной дешифровке был открыт, дело оставалось за новыми программами, с помощью которых машины-вычислители могли бы помочь ученым дешифровать неразгаданные письмена.
Общая программа дешифровки исторических систем письма была предложена известным советским ученым Ю. В. Кнорозовым. По этой программе научные сотрудники Института этнографии и Всесоюзного института информации занялись дешифровкой киданьского письма.
Кидани – так назывался народ, обитавший на территории Монголии и Северного Китая. Расцвет киданьской культуры относится к X—XII векам, когда их государство было самой могущественной силой в Восточной Азии. Кидани создали самобытную письменность и искусство, создали интересные литературные произведения. («Чувства его печальны и тревожны; его краткий, но насыщенный мыслями язык соответствует стремлениям изысканного человека», – так писали об одном кидань-ском поэте его современники).
В XIII веке начался упадок киданьского государства. Феодалы не подчиняются власти императора, учащаются восстания подвластных киданям племен. Тунгусское племя чжурчженей, бывших вассалов киданей, восстает и наносит своим прежним владыкам смертельный удар. Войска чжурчженей захватывают все пять столиц киданей и берут в плен киданьского императора. Часть киданей во главе с полководцем Елюй Даши уходит на запад, где основывает новое государство Кара-кидань («черные кидани»), или Кара-китай. (Отсюда и пошло название «Китай», первоначально относящееся к киданям, а затем по традиции перенесенное на современный Китай и китайцев, самоназвание которых – «хань» или «ханьцы».)
Но государство «черных киданей» было недолговечным: в начале XIII века его присоединяет к своей огромной империи Чингис-хан. История киданей как самостоятельного народа кончается. От киданей остаются лишь памятники литературы, храмы и надгробия, упоминания в средневековых летописях.
К сожалению, до наших дней дошло очень мало письменных памятников с надписями, сделанными своеобразным письмом киданей. Да и само это письмо было забыто, хотя оно и пережило на какой-то срок государство киданей. И до последнего времени эти письмена оставались непрочтенными. Ведь ученым было неизвестно даже, к какой языковой группе отнести язык киданей, на котором написаны эти письмена. Одни исследователи считали киданьский язык близким тунгусскому; другие зачисляли его в группу тюркских языков (к этой группе относятся татарский, узбекский, турецкий и многие другие языки народов СССР и зарубежной Азии). Многие ученые считали киданьский язык близким к старомонгольскому.
Совместная группа ученых Института этнографии и Всесоюзного института информации с помощью вычислительной техники менее чем за полгода проделала большую работу по дешифровке киданьского письма. В результате была воссоздана грамматика киданьского языка, и исследователи смогли вплотную подойти к полной дешифровке – прочтению киданьских текстов.
«Самую сложную работу – выявление статистических закономерностей, которые бы потребовали несколько десятков лет работы, если бы это пришлось делать вручную, – говорит директор Всесоюзного института информации профессор Александр Иванович Михайлов, – вычислительная машина сделала по специально составленным программам менее чем за 30 часов».
Грамматика киданьского языка, воссозданная благодаря работе машины, показывает, что язык киданей, создателей самобытной культуры, принадлежит к монгольской группе языков... Так благодаря помощи «электронного дешифровщика» историки получили окончательное решение «загадки Чингис-хана», создавшего в течение короткого времени могучее и прекрасно организованное государство. Теперь становится понятным, почему он смог сделать это: в XIII веке монголы были не дикими кочевниками, а народом, чья история в лице киданей начиналась не с Чингис-хана, а с киданьского государства. История монгольского народа, его культуры удлинилась почти на три века – время существования киданьского государства. Знаменательно, что это открытие было сделано в 1964 году – в году, когда Монгольская Народная Республика праздновала свой сорокалетний юбилей!
Письмена этруссков и долины Инда, значки кохау ронго-ронго и надпись на фестском диске по-прежнему не разгаданы. Однако новые успехи дешифровки, содружество филологов, программистов, палеографов – специалистов по древним письменам – вселяют уверенность, что не столь уж далеко то время, когда «умные машины», а вернее, люди, руководящие и повелевающие машинами, смогут проникнуть в тайну этих загадочных письмен. Задачи, которые не под силу одному человеческому мозгу, могут быть решены с помощью «мозга электронного».
ЧТО ТРУДНЕЕ!
Ч ТО ТРУДНЕЕ – дешифровать древние письмена или переводить с иностранного языка? Вопрос по меньшей мере странный. Ведь при дешифровке письмен нужно, помимо всего прочего, давать и перевод с чужого языка.
И тем не менее переводить с иностранного языка трудней.
Но только не человеку, а машине.
Во время второй мировой войны секретные донесения противника расшифровывались с помощью электронных вычислительных машин и методов статистики. Эти методы и заставили ученых задуматься: а нельзя ли применить их для перевода текстов с языка на язык?
«Нельзя ли рассматривать проблему перевода как проблему расшифровки тайнописи? – писал один из первых инициаторов машинного перевода американский ученый Уоррен Уивер. – Когда я смотрю на статью, написанную по-русски, я говорю: «Это написано по-английски, но закодировано неизвестными символами. Сейчас начну расшифровывать».
Задача, таким образом, сводится к расшифровке. Только не сообщений, написанных неизвестным секретным кодом, а текстов, написанных на чужом языке. А такая расшифровка секретных сообщений – дело нетрудное для вычислительных машин.
Но первые же попытки применить ее к задачам перевода сразу показали, что этот орешек будет покрепче. Да и к расшифровке древних письменностей эта методика не применима. Когда мы расшифровываем секретное донесение, мы твердо знаем, что оно написано на .каком-то из известных нам языков. Форма, структура языка не затрагивается шифром, он является подобием «морзянки». Поэтому возможно раскодировать самый запутанный секретный шифр.
При дешифровке древних письмен язык неизвестен, и нет никакой уверенности, что можно подыскать среди «живых» языков мира подходящий. Напротив, почти с полной уверенностью можно утверждать, что такой язык не найти.
Вы, наверное, читали рассказ Эдгара По «Золотой жук». Его герой Уильям Легран нашел пожелтевший пергамент с загадочной надписью:
Пользуясь статистикой, Легран сумел прочесть эту шифрованную надпись. Зная, кал часто встречаются буквы английского языка, он приравнял самый частый знак надписи к самой частой букве алфавита; второй по частоте знак шифровки – ко второй букве, и т. д. Но если бы Легран попробовал применить свой метод к расшифровке древних письмен, он не получил бы желаемого результата.
Например, стремясь расшифровать рукописи майя, он быстро бы зашел в тупик. Как отождествлять знаки рукописи? Древний язык майя неизвестен, и неоткуда взять «самую частую букву языка» и сопоставить ее с «самым частым знаком». К тому же знаки майя могут передавать не только одну букву, но и целые слоги и даже слова. И сколько бы ни бился дешифровщик над письменами, при такой методике он ни за что не смог бы прочесть древние знаки. Не помогли бы и электронные вычислительные машины, будь они во времена Эдгара По.
Задача машинного перевода еще бодее сложна, чем дешифровка древних письмен. Ведь при переводе с языка на язык, как замечает один из пионеров машинного перевода в нашей стране Дмитрий Юрьевич Панов, мы «меняем всю ту сложнейшую и тончайшую систему выражения мыслей, которая веками вырабатывалась тем или иным народом и теснейшим образом связана с его мышлением, историей, обычаями, образом жизни».
А это значит, что для машинного перевода нужно искать новые методы, новые программы, а не слепо идти проторенной, но ведущей в тупик «шифровальной» дорожкой.
ВПЕРВЫЕ В МИРЕ
Идея перевода с помощью машины долгое время считалась утопией. Уж слишком невероятным казалось, чтобы робот мог выполнить такую тонкую работу. Даже Норберт Винер, создатель кибернетики, не верил в возможность машинного перевода. «Механизация языка представляется весьма преждевременной», – заявил он в 1947 году. А между тем задолго до этого в нашей стране было запатентовано устройство «для подбора и печатания слов при переводе с одного языка на другой или несколько других одновременно». Придумал его талантливый советский инженер П. П. Троянский. В 1933 году ему было выдано авторское свидетельство на это изобретение.
Переводческая машина Троянского представляла собой автоматический словарь. Ведь именно поиск нужного слова занимает большую часть времени при переводе с языка на язык. Человек, по мысли Троянского, сначала подготавливает иностранный текст: все изменяемые слова записываются в основных формах. Существительное – в именительном падеже и единственном числе, глагол – в инфинитиве, и т. д. Например, слова «приказывающий машинам» были бы записаны как «приказывать машина». Правила грамматики, или, как называл их Троянский, «знаки логического разбора», также ставятся человеком, «препарирующим» текст.
Затем машина заменяет слова препарированного текста на слова чужого языка. Разумеется, они также даются в препарированном виде: без грамматики и в основных формах. Человеку остается произвести «обратное препарирование» – придать словам чужого языка грамматические формы, согласно «знакам логического разбора», и перевод с языка на язык– готов.
В этом проекте автоматического перевода машина выполняет самый трудоемкий, но промежуточный этап работы. Изобретатель, однако, указывал, что в принципе можно поручить машине весь процесс перевода. Она сама будет препарировать текст на одном языке и делать «обратное препарирование» на другом. Ибо грамматика, записанная в виде четких логических правил, также может быть доступна механическому переводчику.
Для того чтобы воплотить свой проект в жизнь, Троянский предложил в 1933 году модель переводческой машины. Она состояла из передвигающейся по столу ленты с нанесенными на ней словами на различных языках. Принцип работы был чисто механический. Это и понятно – ведь в то время не было не только кибернетики, но и электронных вычислительных машин.
В 1941 году изобретатель построил электромеханический вариант своей машины. А в 1948 году предложил сделать ее на электромагнитной аппаратуре связи. Но все эти модели так и не получили путевки в жизнь. Не было необходимой технической базы – электронных вычислителей-гигантов. Именно им был поручен машинный перевод.
«МЫ МОГЕМ СДЕЛАТЬ»
В конце 40-х годов вопрос о возможности машинного перевода только обсуждался американскими и английскими учеными; в 50-х началась совместная работа математиков и лингвистов. В январе 1954 года в конторе фирмы «Интернейшнл бизнес мэшинз» была проведена первая публичная демонстрация перевода с русского языка на английский. В конце следующего года был проведен первый опыт машинного перевода в нашей стране.
Идея Троянского о том, что перевод с помощью машины надо членить на части, «препарировать» текст, получила практическое подтверждение. Только «препарирование» это производит сама машина. Вот как выглядит схема автоматического перевода с русского на английский:
Программа, вложенная в «память» машины, должна учитывать грамматику языка, с которого переводится текст. Точно так же нужно учесть и грамматику языка, на который переводится текст; конечно же, нужен англо-русский словарь, если переводят с английского на русский язык, и т. п.
Все это – и правила грамматики, и словарь – записывается в виде чисел. В последовательность чисел преобразуется и текст, который нужно переводить. Сделать это нетрудно. Каждую букву надо обозначить числом, например: а = 00, б = 01, в = 02, и т. д. Любой текст таким образом можно перевести на машинный язык чисел. Точно так же в виде чисел записывают и словарь.
Первый опыт машинного перевода в нашей стране был проделан под руководством Д. Ю. Панова. Машина БЭСМ переводила с английского языка на русский. Вот как выглядели некоторые английские слова в числовой записи:
the = 212608 (21 – t, 26 —h, 08—е);
method = 110821262830 (11 —m, 08 —e, 21—t, 26 —h, 28 —o, 30 —d).
Встретив в тексте, который нужно переводить, последовательность чисел 212608 110821262830, машина легко может сопоставить их с записанными в «памяти» такими же последовательностями чисел и дать русский перевод – «метод».
А как быть с записью грамматики? Например, в английском языке есть артикли, а в русском их нет. Зато в русском языке есть показатель рода, отсутствующий в английском. В других языках, например полинезийских, вообще отсутствуют грамматические формы склонения,
спряжения, рода – их передают служебные слова, а не грамматические окончания.
Поэтому в словарь для машинного перевода рядом со словами ставят целый ряд их дополнительных признаков. Например, указывают род, склонение, обозначает ли данное слово одушевленный предмет. Вот часть из такого англо-русского машинного словаря:
31. Alternate – чередоваться (глагол I спряжения).
32. Altogether – вообще (наречие).
33. Among – среди (предлог-+-родительный падеж).
Конечно, в «памяти» машины эти грамматические категории также обозначаются числами: существительному соответствует число 1, глаголу – 2, и так далее.
Поиск слов в словаре машина делает с огромной скоростью. И точность ее действия весьма велика. С грамматикой дело сложней. Например, при переводе с английского машина «выдала» такую русскую фразу: «Так что хочем ли знать будущий путь Юпитера в небесах или путь электрона в электронном микроскопе». А при переводе с французского на русский: «Мы могем сделать».