Текст книги "Журнал «Компьютерра» №33 от 13 сентября 2005 года"
Автор книги: Компьютерра Журнал
сообщить о нарушении
Текущая страница: 5 (всего у книги 9 страниц)
ОГОРОД КОЗЛОВСКОГО
Клёвый чтец №8, или Новый сказ о Левше
«Клёвым чтецом» я перевел-обозвал FineReader в какой-то давней своей компьютерной брошюрке, еще до начала сотрудничества с «Компьютеррой», году, кажется, аж в 96-м, то есть, по скорости того компьютерного времени, – в далеком-далеком, практически незапамятном прошлом. Это как раз была третья версия, которая, после не вполне удовлетворительных мучений со второй, показалась мне верхом совершенства и одной из Сияющих Вершин брезжущего на близком – рукой подать – горизонте Искусственного Интеллекта, взятой Высокой Наукой вкупе с не менее Высокими Технологиями. Я увлеченно тестировал «тройку», сравнивая ее с конкурентами, как отечественными, так и зарубежными, – и она, подлинная «птица», легко обходила их всех на любых поворотах.
Сейчас уж не припомню, писал ли я отдельно о версиях следующих: с четвертой по седьмую, – очень может быть, что и нет: каждая очередная, конечно, была лучше предыдущей: качество распознавания – как божились PR-менеджеры, возрастало то на пять процентов, то на одиннадцать; рос и список распознаваемых языков, – включая даже такие вполне искусственные, как языки программирования (чтобы оцифровать покрытые пылью рулоны старых листингов) или чуть ли не эсперанто; появлялись всё новые возможности в смысле сохранения верстки документа и форматов; хорошели кнопочки тулбара; – и прочее, и прочее, и прочее. Конечно, это не могло не радовать, но при удовлетворении моих реальных потребностей: распознавание обложек компакт-дисков, книжных текстов и журнальных статей, – улучшения сказывались не особенно. Впрочем, ситуация естественная: при достижении любым продуктом некоего (довольно высокого) уровня дальнейшие усовершенствования идут больше по мелочам: возьмите хоть автомобили. То есть сказывались, конечно, однако недостаточно, чтобы дать повод для отдельного «Огорода».
Но вот вышла «восьмерка» – и повод такой, похоже, дала.
Список ее отличий от «семерки», выданный на презентации, занимает десять (!) страниц, включая в себя не только чисто эстетические удовольствия вроде появившихся словарных баз для словенского и башкирского языков и добавившегося в двух ипостасях – кириллической и латинской – уйгурского[Впрочем, относительно уйгурского и башкирского – это только для меня удовольствие чисто эстетическое, а для уйгуров и башкир – практическое. А они ведь – покупатели], но и практическое: например, понимание картинок в формате компрессированного (методом LZW) tiff’а, о кочку которого я в прежние времена частенько спотыкался. Повысившаяся скорость распознавания оставила меня практически равнодушным, поскольку и раньше она не казалась недостаточной: мне ведь, слава богу, не приходится просиживать за этим занятием дни напролет, – а вот понимание гиперссылок, их проверка в процессе распознавания и перенос в текст – это представилось блестящим, едва ли не цирковым трюком, и я стал всерьез подумывать о переводе в цифровую форму всего моего многокилограммового «Огородного» архива – с целью освобождения «тещиной комнатки». Появились радости и для бюрократов, для каторжной офисной работы, – но к интересам бюрократов я всю жизнь относился с неким брезгливым равнодушием… Впрочем, всё это вполне уложилось бы в стандартные улучшения от версии к версии, если б не…
Если б не объявленная (и, как выяснилось, неплохо реализованная) поддержка распознавания документов, снятых цифровыми аппаратами! Не могу сказать, что это революция, сравнимая с прорывом цифры в фотодело, но – безусловно заметный шажок, возможно, эту революцию завершающий. И впрямь: цифровой фотоаппарат сегодня есть если не у каждого, то у каждого, скажем, третьего, и, понятно, что переснять им пару нужных страниц учебника или справочника куда удобнее, чем предполагающим специальную стационарную обстановку сканером.
Косвенно эту материю я уже задевал в прошлом «Огороде» («Восточный DocExpress»)[Поскольку вегетационный период у овощей разный, редакция решила пропустить FineReader вперед. А DocExpress как раз через недельку и поспеет. – Прим. ред], когда писал, что цифровой фотоаппарат в ряде случаев удобнее любого, даже карманного (не говоря уж о настоящем) сканера, – но не мог и не признать, что результаты распознавания после фотосъемки выходят очевидно худшими. Дело понятное: оптика универсальных аппаратов недостаточно жестка, получаемое разрешение заметно ниже, чем у сканерных картинок, освещение, как правило, недостаточное и неравномерное, и вообще… И вот, программисты из ABBYY решили попробовать приспособить программу к этим «плохим» картинкам (предупредив, что лучше снимать камерами не менее чем с четырехмегапиксельными матрицами). И приспособили.
Я провел следующий тест: взял полосу «Компьютерры» с собственным «Огородом» («Компьютерру» потому, что она напечатана на полуглянцевой, бликующей бумаге и довольно мелким шрифтом; если бумага надежно матовая, можно у фотоаппаратов включать вспышку, что сразу резко повышает качество снимка), отсканировал ее сперва недорогим планшетником (Astra 4700 от Umax), потом – безо всякого специального света, но со штатива – снял ее же Olympus’ом Е-20 (5 мегапикселов) и шестимегапиксельным Exilim’ом Pro 600 от Casio (у него есть специальный режим для съемки документов, – распознавальщики и производители цифровых фотоаппаратов идут навстречу друг другу!). Все картинки скинул на винчестер и вызвал их для распознания сначала седьмым, а потом – восьмым «Клёвым чтецом».
Сканерная картинка в обоих случаях распозналась одинаково: практически стопроцентно, только после «восьмерки» гиперссылки, при сохранении в PDF, работали! Картинку с Olympus’а «семерка» распознала процентов эдак на шестьдесят, а «восьмерка» – ну… на семьдесят. Другое дело – картинка с Casio, у которого был включен «документ-режим». Там процент «семерки» повысился до восьмидесяти, а «восьмерки» – только, может, процента на три не дотянул до сотни! То есть разница налицо, причем видно, что аппаратная составляющая тоже играет свою, и немалую, роль. Короче: чудес, разумеется, не бывает, но если подходить к проблеме с умом и пониманием – можно добиться результатов, которые «третья» версия лет восемь назад давала при картинке со сканера.
В общем, браво, ABBYY! Верной дорогой идете, товарищи! Есть шанс дожить до времени, когда цифровики будут комплектоваться FineReader’ом Lite, как сегодня комплектуются сканеры.
Покончив с изюминкой «восьмерки», перейдем к неприятному, обозначенному в заголовке как «Новый сказ о Левше». Помните, в чем там, у Лескова, была главная грустная заковыка? Левша сумел подковать микроскопическую блоху и даже на гвоздиках автограф накарябал, – а сообразить, что после подковки она перестанет скакать – на это ума не хватило. Вот и FineReader, еще с самых первых своих версий, ковать учится все изощреннее, а думать, увы, нет.
Поясню в чем дело. Сканируется, положим, задняя обложка компакт-диска со списком треков, номера которых частенько набираются каким-нибудь высокохудожественным шрифтом или заключаются в квадратики или обводы другой формы. «Клёвому чтецу», несмотря на шрифт и квадратики, удается-таки разобрать два-три (а иной раз – и пять-шесть) номеров правильно. Но догадаться, что это – нумерованный список и, следовательно, нераспознанный между «тройкой» и «пятеркой» значок вероятнее всего есть «четверка» – это уж, извините, кишка тонка. Или еще пример, с той же обложки: фамилии авторов песни, заключенные в круглую скобку, распознаются не всегда точно: «(Josea – Taub» в четырех случаях распознаны как «Qosea – Taub», а в трех оставшихся – правильно. Честное слово, семи пядей во лбу не надо иметь, чтобы – по шрифту ли, по расположению – догадаться, что эта часть двадцатидвухпозиционного списка вся заключена в скобки, а нераспознанный Qosea есть не что иное, как распознанный рядышком Josea, – а вот поди ж ты!
Не то чтобы мне было так уж трудно поправить эти несколько «замученных очепяток», – но я в толк не мог никогда взять, почему такая умная программа, разбирающая знаковую составляющую порой очень трудно идентифицируемых закорючек, пасует перед столь элементарными задачами – и на каждой презентации тупо продолжал задавать один и тот же вопрос: когда же «Клёвый чтец» хоть чуть-чуть поумнеет? Задал и на этой, и мне, наконец, было отвечено, что в «восьмерку» «интеллектуальный» модуль уже встроен, хотя как следует еще на заточен, и, вероятно, точить его будут вплоть до выхода очередной версии. Но зачатки уже есть, так что я могу попробовать проверить.
Проверил первым делом – даже еще до фотографирования. Увы, «умнеющая» (по заявлениям разработчиков) «восьмерка» повела себя – в интеллектуальном отношении – ровно так же, как глупые «семерка», «шестерка», «пятерка» – и далее вверх до начала списка. Ну, как говорится: хорошо не жили, начинать нечего…
И все же закончить «Огород» хочется на ноте оптимистической: к «восьмерке», отдельно, прилагается замечательная утилитка под названием ABBYY Screenshot Reader, которая, правда, начинает работать только после того, как FineReader зарегистрируешь (эдакий легкий шантаж). Она запускается в виде маленького продолговатого окошка, в коем качестве и может висеть на экране, не особенно мешая работать. При необходимости можно выбрать, в каком из доброго десятка распространенных форматов сохранить содранное с экрана и тут же распознанное, потом – нажать на кнопочку с изображением фотоаппарата, потом – выделить нужную область экрана и… все.
Нельзя сказать, что раньше я не пользовался FineReader’ом для распознания текстов, скажем, системных табличек или субтитров фильма, – но тогда приходилось делать это в три с половиной этапа: сохранять в буфер обмена, записывать в графический файл и уж только потом вызывать FineReader, а в него – этот графический файл. Теперь процесс стал заметно проще и много приятнее.
Особенно впечатляет дерево каталогов с раскрытым справа списком файлов, экспортированное непосредственно в Excel. Правда, и тут ум прихрамывает: в тринадцати случаях правильно распознав и спозиционировав в таблице время создания файлов, в следующих пятнадцати Screenshot Reader (а вернее, думаю, сам FineReader) зачем-то отвел под минуты отдельную колонку.
В общем, как призвал в свое время Великий Вождь: учиться, учиться и еще раз учиться! Толк, рано или поздно, надеюсь выйдет.
Автор: Козловский Евгений.
ГОЛУБЯТНЯ
Кукла из тряпочки и выигрышная комбинация
Эдакие игры взрослых: в модном местном супермаркете «Таврия В» вовсю идет розыгрыш лотереи компании BIC. Покупаете какую-нибудь ихнюю фигню (фломастер, ластик, карандаш, шариковую ручку и пр.) на сумму 15 гривен (80 рублей) и допускаетесь к лотерее: после оплаты на выходе вам вручают скрэтч-карту – стираете, а там подарок! Разве я мог не доставить удовольствие Сереге-младшему?
Покупаю набор фломастеров, подкатываю за кассами к журнальному столику с девушкой и… недоверчиво упираюсь взглядом в россыпь подарков от мирового концерна BIC, участвующих в лотерее: пластиковые пенальчики, те же самые ластики, карандашики, какие-то то ли платочки с крылышками, то ли салфеточки … Не хватает тряпочной куколки и машинки из деревянной катушечки да спичечного коробка – и прямиком в декорации фильма «Дети подземелья», снятого по одноименному рассказу великого русского сострадальца Владимира Галактионовича Короленко.
Сережка-младший застенчиво улыбается, тянет ручонку за скрэтч-картой… стираем… какая фантастическая удача! Вот уж повезло так повезло: выиграли ЧУПА-ЧУПС! Ребенок, конечно, не плачет, но около того, а я думаю: "Какая гомерическая дешевка – этот BIC! Служил бы в ней менеджером (не приведи Господи!), удавился бы от стыда – от сопричастности к такой лотерее!
Антонелло тут недалече жаловался, что какая-то подвальная компьютерная лавка затребовала в обмен на тестирование дешевого причиндала чуть ли не выписку из роддома с выправленным пятым пунктом. Чудак-человек: чего ж ожидать от безымянной торговой мацыпурки?! Совсем другой коленкор – BIC! Не поленился, проверил: годовой оборот – один миллиард восемьсот девяносто один миллион долларов! И рядом – рекламные акции с чупа-чупсами! Можно, конечно, все списать на местных клиноголовых репрезентантов компании, но я бы не стал: в слоноподобных концернах типа BIC личная инициатива душится в эмбрионе, а менеджерийное мышление целиком формируется корпоративной хартией, в которой навеки закреплен дух ее учредителя!
И здесь, друзья, мы попадаем на высокий уровень метафизики, никак не связанный с капиталистическим мелководьем (все эти «выгодно-невыгодно»). Что же мы видим на этом метафизическом уровне? Мы видим человека, Марселя Бика, который взял шариковую ручку (чужое изобретение) и дополнил ее концепцией мусорной дешевизны. Да-да, единственное «открытие» учредителя BIC Марселя Бика – одноразовость товара! На этом и сколотились миллиарды: 1953 год – одноразовые ручки, 1973-й – одноразовые зажигалки, 1975-й – одноразовые станки для бритья. На склоне лет дядюшка Бик попытался протолкнуть идею «одноразовых духов» – утешает, что не обломилось: французы долго плевались, а BIC подзалетел на 250 миллионов франков.
Так что утрите слезы недоразумения и неоправданных ожиданий, участники биковских лотерей: ничего кроме чупа-чупсов и кукол из тряпочек эта компания разыгрывать не может по определению – таковы ее дух и метафизическая парадигма!
Ну да прочь печаль-тоска: пора вгрызаться в заплесневелый софтверный сухарь (шутка: не любил бы, давно убил). Сегодня у нас кэ-пэ-кашная тематика: хочу поделиться новинками софтостроения, но сначала – отчет о почти годовом функционале iPAQ 4700.
Декорацией для рассказа выбрал миниатюрную театральную зарисовку. Итак: в правом углу сцены стоит упитанный и уверенный в себе главный редактор «Домашнего компьютера» Роман Косячков, в левом – стройная и неуверенная в себе моя жена с подаренным ей год назад Palm Tungsten T3. В зарисовке всего две реплики:
Роман: Всю жизнь был «пальмоводом». Потом бес попутал, продал к $#@ amp; (в жизни Рома никогда не ругается. – С.Г.) Tungsten Т3 и купил самый лучший по тем временам iPAQ. По инерции написал испуганную хвалебную статью, но через полгода горько раскаялся, очистил душу разгромной статьей, продал iPAQ и купил Tungsten T5. Какое счастье, снова быть дома!
Светлана (пишет электронное письмо сестре): Дорогая Аля, теперь у меня есть свой КПК! Это такая чудесная маленькая машинка, которая может делать все. Ну, или почти все. Во всяком случае, так говорит Сергей, потому что я за год работы так и не поняла, как он устроен, поэтому использую свой «палмик» только для чтения. Одно плохо – аккумулятор живет не больше четверти часа. Это в идеале, при выключенной подсветке экрана. А так, в среднем, минут одиннадцать, после чего приходится перезаряжать.
(Занавес.)
Итак, что мы имеем? В одном углу – феноменальную логику, которую я не пойму до конца жизни, в другом – жуткую правду жизни. В самом деле: как можно вернуться к Palm после хотя бы недели работы с хорошим Pocket PC?! Это же полнейший абсурд! Временна,я зависимость геометрическая: через неделю Palm вспоминается как страшный сон, через месяц – раздражает одна мысль о том, что когда-то мог совершить в жизни столь роковую ошибку, через год (как в моем случае) – на губах не остается ничего, кроме спокойной и снисходительной улыбки в сторону «пальмоводов»: «Прости их, Господи, ибо не ведают, что творят!»
Эмоции удесятеряются, когда перед глазами продолжает телепаться пальмовый цахес, выделывающий совсем уж чудовищные антраша: дигитайзер смещается почти на сантиметр – да так, что невозможно попасть стилусом не то что в нужную букву виртуальной клавиатуры, но и вообще в экран. Аккумулятор Т3, который с самого начала был образцом того, что американские люди называют pathetic [Вызывающее жалость ничтожество (англ.)], в конце первого года пользования работает от зарядки до зарядки около тридцати минут, в конце второго года – описанные женой (и поддержанные Паоло Коэльо!) одиннадцать минут. Для сравнения: год спустя заряда моего 4700 хватает на пять часов интенсивной работы.
Понимаю, что читателю не терпится услышать про iPAQ 4700 и какую-нибудь гадость. Что ж – запросто! Во-первых, сошла эмаль на всех четырех углах магниевого корпуса. Во-вторых, непотребный уровень программной поддержки со стороны производителя. Поддержка эта убога сама по себе, а уж на фоне заботы Dell об Axim’e смотрится совсем непристойно. Дело вот в чем. Самым слабым местом iPAQ 4700 является Windows Mobile 2003 SE. Вернее, не столько сама операционная система, сколько ее несовместимость с конкретным железом. Здесь 4700-й демонстрирует три неприятных бяки: происходит постоянная утечка памяти – это раз; Wi-Fi-соединение совершенно не умеет работать с методом шифрования WPA PreShared Key (невозможно отменить запрос сертификата с RADIUS-сервера) – это два; запредельно дебильный интерфейс управления Bluetooth – это три.
Обо всех трех гадостях iPAQ 4700 Hewlett-Packard знал чуть ли не с первого дня выпуска дивайса, однако в ус до сих пор не продул (думаю, что и не продует). Пока Dell чуть ли не ежемесячно выстреливал кумулятивными прошивками, вылизывающими и без того совершенное взаимодействие софта и железа своих флагманских моделей КПК, HP полоскал носки в тазике молчания и лишь этим летом разродился патчем ROM, который ни один из багов не устранил, зато ускорил утечку памяти чуть ли не в три раза.
Прошу правильного понимания: даже если взять баги iPAQ 4700 и помножить их на десять, мы все равно получим абсолютно лучший КПК из всех, что представлены сегодня на рынке, – и по быстродействию, и по функциональности, и по экрану, и по всему остальному. Тем не менее перечисленные недостатки, усиленные 64 мегабайтами ROM, смехотворных для ненасытного птенца гнезда Биллгатуса, однозначно определяют дальнейшую судьбу моего дорогого наладонника: как только появится модель следующего поколения, я тут же избавлю жену от страданий с Т3, подарю ей 4700-й, а сам сделаю апгрейд. Благо точно знаю, чего не хватает до окончательного самадхи.
Теперь поговорим об одном жарком сражении, которое разворачивается на софтверном покет-писишном горизонте. Речь о плагинах, выводящих на экран Today информацию из органайзера. Если вопрос самого органайзера давно решен в пользу Pocket Informant, де-факто признанного лучшим ПИМ’ом для КПК, то с плагинами не все так однозначно. Разработку ведет десяток-другой конкурентов по мелочи со средненького качества продуктами и два титана: израильский SBSH Software и питерский SPB Software. Программы SBSH:
– PocketBreeze – плагин для выведения на экран Today Календаря и Задач ПИМ’а.
– ContactBreeze – плагин, дополняющий PocketBreeze закладкой с Контактами (телефонной книжкой) ПИМ’а.
– iLauncher – плагин, позволяющий размещать на экране Today иконки любых программ вашего КПК.
Программы SPB:
– Pocket Plus – более навороченный аналог iLauncher;
– SPB Diary – менее навороченный аналог PocketBreeze и ContactBreeze одновременно, однако обладающий дополнительной функциональностью: закладкой с Заметками (Notes) – последним недостающим компонентом ПИМ’а.
Если б я устанавливал и тестировал эти программы в правильной последовательности, то никакой интриги не вышло и я бы давно сидел на идеальной софтверной конфигурации. Увы, правильно не получилось, так что пришлось почти полгода добиваться совершенства на ощупь. Дело в том, что SPB Pocket Plus является культовым продуктом, чей статус подтверждается не только могучими продажами на Handango и PocketGear, но и сильным эмоциональным давлением патриотической тусовки («Как, чувак, у тебя не стоит Покет Плюс?! Ну ты лоханулся!»).
По этой причине SBSH и SPB мерялись силой на моем iPAQ 4700 стенка на стенку, как в далеком детстве кузьминская шпана против люблинской: устанавливал Pocket Plus + SPB Diary и сравнивал с комбинацией PocketBreeze + ContactBreeze + iLauncher. При таком раскладе неизменно побеждала израильская шпана, поэтому я удалял питерских до следующего релиза и… мучился с SBSH, поскольку оба «Бриза» хоть и выигрывали у SPB в быстродействии, периодически отказывались обновляться на экране Today и подвешивали наладонник. Выходили новые версии программ SPB, я их тестировал… увы и ах: с прежним результатом возвращался к хоть и неудовлетворительному, но status quo.
Хэппи-энд возник случайно: как-то раз удалил оба «Бриза» и заменил их на SPB Diary, а вот Pocket Plus ставить не стал, сохранив iLauncher. И все залетало! Идеальная комбинация возникла после избавления от неподъемных компонентов обоих разработчиков, поскольку компоненты эти изначально вышли из порочной концепции: и «Бризы» SBSH, и Pocket Plus SPB стремятся подменить собой ПИМ! Идея дурацкая не потому, что Pocket Informant подменить сложно, а потому, что нельзя вывешивать ПИМ на экран Today: убогая Windows Mobile такой нагрузки не выдерживает и либо ползает недодавленным тараканом, либо виснет. Именно тяжеловесный Pocket Plus обрекал комбинацию SPB на поражение, а беременные лишними настройками «Бризы» SBSH препятствовали обновлению экрана.
Теперь все расставлено на правильные места: SPB Diary, обладающий за счет закладки с Заметками большей функциональностью, чем оба «Бриза», к тому же еще и занимает в три раза меньше места в памяти. Также и iLauncher – несоизмеримо легче Pocket Plus. Истинно говорю вам: SPB Diary + iLauncher = рулез форева!
Линки, помянутые в «Голубятне», вы найдете на домашней странице www.internettrading.net/guru
[Закрыть].
Автор: Сергей Голубицкий.