Текст книги "Создание электронных книг в формате FictionBook 2.1: практическое руководство"
Автор книги: Михаил Кондратович
сообщить о нарушении
Текущая страница: 1 (всего у книги 15 страниц)
М.И. Кондратович
(Юзич)
СОЗДАНИЕ ЭЛЕКТРОННЫХ КНИГ В ФОРМАТЕ
FictionBook 2.1:
ПРАКТИЧЕСКОЕ РУКОВОДСТВО
Все категоричные высказывания и утверждения в книге являются личным мнением автора, и, ни в коем случае, не претендуют на истину в последней инстанции.
Предуведомление
Данное произведение свободно распространяется в электронной форме с ведома и согласия автора на некоммерческой основе при условии сохранения целостности и неизменности текста, включая сохранение настоящего уведомления. Любое коммерческое использование настоящего текста без ведома и прямого согласия автора НЕ ДОПУСКАЕТСЯ.
Цитирование возможно только со ссылкой на первоисточник. При цитировании более одного абзаца, для текста, в который будут помещены цитаты, должна быть предусмотрена возможность свободного распространения.
Предисловие
От автора
Электронные книги заинтересовали меня практически сразу после знакомства с ПК.
Сначала скабрезные тексты о Штирлице, перегнанные на антикварный компьютер БК-0011М c не менее допотопного ЕС-1840, затем книги с минских BBS. Сокровища на дисках «Библиотека в кармане» и «HarryFAN», пиршество онлайн-библиотек…
О формате FB2 автор этой книги узнал несколько лет назад, и, поначалу, не оценил его по достоинству. В то время мне казалось, что для хранения электронных книг нет ничего лучше, чем форматированный текст в кодировке DOS-866.
Однако более детальное знакомство быстро заставило меня пересмотреть свои взгляды. А когда я окончательно «распробовал» формат, у него стало на одного горячего приверженца больше.
Пытаясь внести свою лепту в популяризацию FB2, в 2006 г. я написал цикл публикаций для «Компьютерной Газеты», которые прошли почти незамеченными. Поэтому было решено найти этим материалам лучшее применение, замахнувшись на написание книги.
К великому сожалению, в ходе творческого процесса очень быстро выяснилось, что я не обладаю производительностью Александра Дюма, который мог принимать гостей, не прекращая строчить очередное произведение. Книга писалась урывками, в свободное от основной работы и хобби время.
Однако, пусть ни шатко, ни валко, но процесс был доведен до логического конца. Что получилось, судить вам.
Разумеется, сей опус не является ни всеобъемлющим, ни лишенным недостатков.
В первую очередь, справедливые нарекания, несомненно, вызовет то, что при описании редактирования книги автор ориентировался на морально устаревший FB Editor, а не на более современный и продвинутый FB Writer. Дело в том, что сам я до сих пор продолжаю работать в старом добром FB Editor 1.0, его возможности меня не то чтобы удовлетворяют, но, скажем так, пока их хватает. К тому же, проект FBW на момент выхода книги находится в состоянии «закрыт» и перспективы его более чем эфемерны.
Что же касается, «подпирающего» FB Writer продукта компании «ЛитРес», то я лишь недавно получил его последнюю (не финальную!) версию. Думается, детальное описание его войдет во второе «издание» книги.
Эта книга отличается от других тем, что написана и развивается по принципу софта. То есть, альфа, бета, пререлиз, релиз и так далее, пока автору не надоест. Конечно, это не самый лучший вариант для книги, но, в противном случае, она бы добралась к читателю гораздо позже. А то и совсем не добралась…
Зачем вообще нужна эта книга?
Такой вопрос может задать любой продвинутый пользователь. И где-то он будет прав.
Ни сам формат FictionBook, ни программные средства для работы с ним не представляют из себя ничего сложного.
Однако, судя по количеству вопросов «Как сделать книжку?», «Как мне сделать то-то и то-то», на форумах FictionBook.org и сетевых библиотек, необходимость в качественном руководстве назрела давно.
Разрозненной информации по FictionBook в Сети достаточно. Но ее еще надо суметь отыскать.
Книга была написана, в первую очередь, для тех, у кого не хватает времени перебирать страницы wiki или просеивать форум официального сайта, в поисках ответов на свои вопросы.
Искренне надеюсь, что она станет неплохим подспорьем для начинающих.
Оффтопик.
«А зачем мне все это нужно?»
Вы любите читать, вы быстро привыкли к электронным книгам, и ваш новый день чаще всего начинается с визита в онлайн-библиотеку: что новенького.
У нормального человека, если он не законченный эгоист, привыкший только потреблять, рано или поздно возникнет желание как-то поддержать все это дело.
Можно просто взять и послать денег. Автору полюбившейся книги или, что тоже хорошо, держателю электронной библиотеки.
А можно самому начать делать электронные книги. Больше хороших книг – популярнее формат – еще больше хороших книг. Замкнутый, но совсем не порочный круг!
Кроме того, у вас может оказаться редкая книга, которую можно и нужно сделать достоянием общества.
И, наконец, вопрос изготовления качественных книг обрел кардинально новую остроту, после того, как некоторые популярные сетевые библиотеки, поставили условием полного доступа к своим ресурсам, закачку новых книг.
Резюме и планы на будущее
Файл, который вы сейчас читаете, носит гордое наименование Release. После почти двух лет вялотекущих усовершенствований автор осознал, что этот процесс не имеет конца и края. Поэтому было принято волевое решение закончить работу над книгой.
Естественно, выпуск финальной версии не означает отказа от данной темы. За время, пока шла доработка книги, некоторые темы успели полностью или частично устареть. Тот же ExportToFB21 успел превратиться в OOoFBTools. Получила свободу последняя версия редактора от «ЛитРес».
Поэтому более чем вероятно второе издание этого опуса. Также, если в этой книге обнаружатся существенные ошибки, будет выпущена исправленная версия.
Введение
По мере распространения персональных компьютеров и совершенствования носителей, очень быстро обнаружилось, что текстовую информацию крайне удобно хранить в электронном виде.
Первоначально коллекции текстов были сравнительно небольшими, и размещались на компьютерных досках объявлений (BBS). [1]1
BBS – board bulletin system, компьютерная доска объявлений. Обычно представляла собой домашний ПК под управлением специального софта, подключаясь к которому напрямую по телефонной линии, пользователи могли обмениваться сообщениями и скачивать выложенные там файлы. Скачивание файлов обычно было лимитировано. Чтобы увеличить лимит, пользователю необходимо было повышать свой ранг, закачивая на BBS, полезные, с точки зрения хозяина BBS, файлы. Таким образом, BBS были предтечами не только сетевых файловых хранилищ, но и современных файлообменных сетей.
[Закрыть]
А с появлением быстрых сканеров и совершенствованием средств распознавания текста (OCR), дело было поставлено на поток.
Особенно буйно, в силу особого отношения к авторскому праву, это явление расцвело в русскоязычной части Интернета.
При поддержке энтузиастов феномен набрал невиданный размах. Любительские коллекции текстов стремительно трансформировались в огромные библиотеки, содержащие тысячи произведений. В одной только библиотеке Альдебарана до недавнего времени ежедневно появлялись десятки новых книг.
Нынешний читатель привередлив. Его уже не устроит подслеповатый 14'' монитор, на котором в свое время мы читали присланные из ФИДО тексты о том, как размножаются ежики. К его услугам высококачественные ЭЛТ– и ЖК-дисплеи, КПК, продвинутые мобильные телефоны (смартфоны), специализированные устройства для чтения. Современный софт для просмотра текстов предоставляет такие функции как сглаживание шрифтов, выделение заголовков, позволяет качественно сформатировать текст, вплоть до отображения на экране развернутой книги.
Конечно, переломить себя, и перейти с «бумаги» на e-book очень непросто. Испытано на себе. Но зато потом… Доходит до того, что когда читаешь бумажную книгу, непроизвольно пытаешься вызвать функцию поиска или кликнуть по гиперссылке…
Вначале для создания электронных книг использовались обычные текстовые файлы. Простая последовательность ASCII-кодов, каждый из которых соответствовал либо символу, либо управляющему коду. Главным достоинством текста была максимальная простота просмотра и обработки. Текст можно вывести на экран или на печать простой командой «copy»!
Но довольно скоро выяснилось, что возможностей текстовых файлов для подготовки качественных книг недостаточно. Нужно было как-то выделять размер и гарнитуру шрифта, форматирование абзацев и т.д.
Для этого в текст стали вставлять вначале управляющие esc-последовательности, [2]2
Esc-последовательности – последовательность кодов, в которой первый код, обычно десятичный 27 (ESCAPE), является признаком управляющей последовательности, а несколько следующих за ним – командой. Вначале ESC-последовательности использовались для управления печатью, позднее стали использоваться для оформления документов. Сейчас стремительно вытесняются XML.
[Закрыть] а затем и тэги. [3]3
Тэги (tags) – текстовые команды, используемые в гипертекстовой разметке. Заключены в угловые скобки. Бывают одинарные
[Закрыть]
Итогом попыток создать формат, максимально приближенный к бумажному изданию стал Portable Document Format (PDF), предложенный фирмой Adobe. Он позволяет создать файл, на 100% аутентичный бумажной версии.
Соответственно, для нормального просмотра PDF необходим большой экран. Что, собственно, и стало главным недостатком формата.
Параллельно форматам электронных книг совершенствовались и средства просмотра. Появилось много различных специализированных электронных устройств для чтения книг, которые, впрочем, так и не получили широкого распространения.
Последние несколько лет самым удобным устройством для чтения книг является КПК PocketPC.
Правда, по массовости распространения он давно проигрывает мобильным телефонам, которые сейчас плавно трансформируются в коммуникаторы, но по качеству отображения текста равных ему практически нет.
Что же касается специализированных устройств для чтения, то здесь все далеко не радужно.
Замечательные девайсы Rocket eBook опередили свое время и, не сумев завоевать сердца любителей чтения, почили в бозе.
А новейшие устройства на e-ink (Sony Jinke и iLiad), судя по всему, наступают на те же грабли. Высокая стоимость устройства, закрытые форматы с системой защиты «авторских прав», плюс букет неудобств в эксплуатации. Опять же, громоздкий формат книг… Все это вряд ли даст этим, без сомнения, интересным устройствам стать подлинно массовыми «читалками» и заметно потеснить бумажные книги.
И даже второе поколение этих читалок (iRex Reader и Pocketbook 301) с Linux–начинкой, и, как следствие, этого, повышенной «всеядностью», вызывает нарекания. Габариты, отсутствие подсветки, завышенная цена.
По всей видимости, в конце концов, эту нишу займут коммуникаторы. Именно они смогут стать тем устройством, совмещающим доступность, удобство чтения и массовость.
Часть I
Формат FictionBook и его место в мире электронной литературы
§ 1.1 Неизбежность перехода от книг бумажных к книгам электронным
Одно из величайших изобретений человечества – печатная бумажная книга – медленно, но верно уходит в историю. Эпоха, начатая Иоганном Гутенбергом, Франциском Скориной и Иваном Фёдоровым, близится к своему закату.
Электронные книги исключительно компактны и мобильны. На один компакт-диск можно поместить вполне приличную библиотеку. А если это DVD-диск, то библиотека будет более чем солидной. В мобильный телефон или коммуникатор можно закачать десятки, а то и сотни книг.
Возможность поиска по цитате или ключевому слову, также крайне ценное свойство. Отпадает необходимость часами рыться в бумажных фолиантах.
С распространением электронных книг исчезнет понятие «редкая книга». Читатель более не будет зависеть от каприза издателя, который может переиздать книгу, а может и отказаться. Видите ли, неформат-с… Пипл не хавает… Или же новоявленные тоталитаристыдерьмократы (нужное подчеркнуть) объявят книгу вредной для неокрепших умов…
Электронные книги очень демократичны. В услових тотальной компьютеризации, вы легко можете поделиться такой книжкой с другом, нисколько не опасаясь, что он испортит ее или потеряет.
Вообще, сами по себе электронные книги не подвержены износу и старению. А проблема поврежденных и устаревших носителей решается своевременным копированием.
И, конечно же, e-book экономически выгодны. Даже «официальные», лицензионные ЭК стоят гораздо дешевле своих бумажных товарок.
Параллельно текстовым электронным книгам, растет популярность так называемых аудиокниг. Актер читает текст под ненавязчивую музыку. Запись сжимается в формат MP3 или аналогичный и распространяется на компакт-дисках.
К аудиокнигам можно относиться по-разному. Но людям с ослабленным зрением, водителям, а также, тем, которым приходится долгое время проводить в пути, эти «книги», разумеется, придутся по душе.
У бумажной книги есть только два неоспоримых преимущества перед книгой электронной – чтение без каких-либо специальных средств и сравнительная долговечность.
Распространение портативной электроники, и появление емких, независимых от электросети (например, подзарядка через генератор, который можно вращать вручную), и, надеюсь, экологичных, источников питания, компенсирует первую выгоду. Что же касается долговечности, то здесь все гораздо сложнее. Речь идет не только о физическом старении носителей, но и о моральном устаревании форматов и стандартов хранения.
Известен случай, когда, еще на заре лазерных компакт-дисков, на один такой носитель были записаны сканы редких манускриптов. Вящей сохранности ради. Но не прошло и десяти лет, как изменились стандарты записи, и, для того, чтобы прочесть диск, понадобилась специальная аппаратура…
Еще одним недостатком электронных книг, считается распространенное пиратство. А в Рунете эти понятия вообще стали почти синонимами…
Да, тиражировать электронную книгу, на несколько порядков проще, чем бумажную. А все способы защиты от несанкционированного копирования, в первую очередь создают неудобства читателям.
===ВАЖНО=======================
Все защиты на медиа-контент ставятся от обычных пользователей. И только от них.
===============================
Но время не стоит на месте. Рано или поздно будет отработан механизм, позволяющий авторам получать свои гонорары. Собственно, попытки создать такие сервисы мы наблюдаем уже сейчас.
Свою лепту внесет и технический прогресс. Когда электронные платежи будут простыми как мигание, и, хотя бы приблизятся по безопасности к платежам обычным, любителям халявы придется в срочном порядке обзаводиться губозакаточными машинками.
Опасность грозит лишь так называемым правообладателям – издательствам и медиа-компаниям, которые паразитируют на авторах. Если автор сможет сам издавать свои произведения, выкладывая их в Сеть, получая за это достойные деньги, необходимость в издателях и тиражировщиках просто исчезнет…
Постоянный рост цен на бумагу и полиграфические услуги также ускоряет переход на цифровые книги.
Как итог – в не слишком отдаленном будущем бумажная книга станет некоей роскошью, уделом ценителей и эстетов. Подобно виниловым дискам, кинопленке и верховой езде.
И чем дороже будут книги, тем больше будет этих снобистских разговоров про шелест страниц, запах типографской краски и «радость настоящего чтения». Пусть. Мы тоже можем сказать, например, что любое устройство с активной матрицей ЖК-экрана, кроме прочих достоинств, нетребовательно к внешнему освещению. Владельцы КПК знают, как клёво с ним сумерничать, когда нет нужды отвлекаться, чтобы пересесть поближе к наливающемуся вечерней синевой окну или включить лампу.
§ 1.2 Многообразие форматов электронных книг
Для начала давайте вспомним, что такое книга.
Толковый словарь Ожегова трактует понятие «книга», как: «Произведение печати (в старину также рукописное) в виде переплетённых листов с каким-либо текстом». [1.1]1.1
Две других трактовки понятия «книга», как-то:
2. Сшитые в один переплёт чистые или разграфленные большие листы бумаги для записей.
и
3. Крупное подразделение литературного произведения, состоящее из многих глав.
представляют собой частные случаи и поэтому к предмету нашего обсуждения не относятся.
[Закрыть]
Соответствует ли большинство форматов e-book этому определению?
Скорее нет, чем да. Электронная книга – вещь нематериальная. Набор битов в памяти компьютера или гаджета, намагниченных частиц или микроскопических углублений на электронном носителе. Кроме того, надо как-то отделить книги от рабочих документов.
Поэтому определение «электронная книга», должно звучать так: «Текст (возможно иллюстрированный), в цифровом формате, специально подготовленный для чтения».
Чтобы оценить преимущества и недостатки того или иного формата, необходимо сформулировать свод требований к электронным книгам.
Читабельность. Легкость и удобство чтения текста. Поскольку это обеспечивают программные и аппаратные средства для чтения, от самого формата требуются несколько иные качества, а именно два нижеследующих:
Полиграфичность. Возможность отформатировать текст, выделить заголовки, вставить иллюстрации, содержание и. т.д. То есть, приблизиться к бумажным изданиям.
Масштабируемость. Возможность читать e-book при разных разрешениях экрана и размерах рабочего окна.
Кроссплатформенность. Электронная книга в идеале должна одинаково легко читаться на различных устройствах – от специализированной «читалки» до персонального компьютера.
Конвертируемость. Очень важный параметр, учитывая постоянно меняющиеся стандарты, операционные системы и «железо».
Гипертекст. Тоже весьма существенный для e-book параметр. Возможность мгновенно перейти в нужное место книги, щелкнув по ссылке.
Возможность редактирования. Не обязательно, но желательно. Учитывая «какчество» текстов в онлайн-библиотеках. Хотя, для «лицензионных» книг, эта фича, быть может, и не актуальна. Там достаточно возможностей делать закладки и пометки на полях, которые предоставляет софт для чтения.
Профессиональный издатель обязательно бы добавил в этот список возможность установки DRM, [1.2]1.2
Digital Rights Management, буквально, управление цифровыми правами, говоря проще – защита от несанкционированного копирования.
[Закрыть] но я лично считаю (и большинство читателей, без сомнения, согласятся со мной) что этот элемент совершенно излишний. Если дать волю издателям, они и на бумажные книги начнут ставить защиту, например, покрывать страницы гильоширной [1.3]1.3
Гильоширная сетка, гильоши – специальные трудновоспроизводимые узоры, наносимые на деньги, документы, ценные бумаги, для защиты их от подделки.
[Закрыть] сеткой, чтобы затруднить распознавание текста программой OCR…
С этими требованиями мы и пройдемся по существующим форматам.
Обычный текст (plaintext) (.TXT)
Текст – он и в Африке текст. Простая последовательность восьмибитных (как правило) значений, каждое из которых соответствует либо символу, либо управляющему коду. Отличается лишь кодировкой и способом перевода строки.
Полиграфичность. Низкая. Набор средств разметки у текста весьма невелик. Форматирование абзацев, отступы и выделение заглавными буквами – вот, пожалуй, и все.
Масштабируемость. Все зависит, от того, как сформатирован текст. Если он аккуратно отформатирован по абзацам с выравниванием, то очень низкая. Если же разбиения на строки нет – «один абзац – одна строка» – тогда масштабируемость высокая.
Кроссплатформенность. Практически абсолютная.
Конвертируемость. Практически абсолютная.
Гипертекст. Нет.
Возможность редактирования. Абсолютная.
Формат txt активно использовался на заре электроных библиотек, при создании всевозможных сборников книг («Библиотека в кармане», «HarryFan Text Collection», и прочие). Сейчас книги в формате txt можно найти, пожалуй, лишь в библиотеке Максима Мошкова, (да и то перед подачей их пользователю они преобразуются в HTML) и в некоторых небольших библиотеках.
Rich Text Format (.RTF)
Этот формат был специально разработан компанией Micro$oft в 1987 году для переноса текста с разметкой из одной программы в другую. В таком качестве он используется и по сей день. RTF понимают практически все современные текстовые редакторы и издательские системы.
Полиграфичность. Выше среднего.
Масштабируемость. Почти абсолютная.
Кроссплатформенность. Очень высокая.
Конвертируемость. Очень высокая.
Гипертекст. Нет.
Возможность редактирования. Абсолютная.
RTF до сих пор широко используется в русскоязычных онлайн-библиотеках. Главным образом, именно из-за его хорошей совместимости с различным программным обеспечением.
Документ Micro$oft Word (.DOC)
Формат DOC – это внутренний формат Micro$oft Word и предназначен для хранения текстовых документов, подготовленных в этой программе. Распространенность Micro$oft Office и Micro$oft Word как его части, обусловила широкое распространение формата DOC.
Полиграфичность. Высокая.
Масштабируемость. Высокая.
Кроссплатформенность. Ниже среднего.
Конвертируемость. Высокая.
Гипертекст. Присутствует.
Возможность редактирования. Абсолютная.
По скромному мнению автора, документы Word используют в качестве e-book только по одной причине – авторам книги (или сканнеристам ;)) ) просто-напросто лень конвертировать его в более удобочитаемый формат.
Документы HTML (.HTM; .MHT; .CHM)
Язык HTML (HyperText Markup Language) был создан для отображения информации в сети Интернет.
Полиграфичность. Высокая.
Масштабируемость. Очень высокая.
Кроссплатформенность. Практически абсолютная.
Конвертируемость. Практически абсолютная.
Гипертекст. Разумеется, есть.
Возможность редактирования. Абсолютная.
Хотя НTML позволяет неплохо оформить текстовый документ, он все же не слишком подходит для e-book. Далеко не всем нравится читать книги в браузере. При использовании же программы-ридера, HTML, как правило, конвертируется в обычный текст и теряет все свои преимущества.
А вот формат CHM, первоначально предназначавшийся для подготовки файлов справки к программному обеспечению, – дело иное. Компактность и высокая интерактивность делают его весьма удобным для различных электронных руководств и справочников.
В частности, очень эффектно смотрятся в CHM компьютерные руководства издательства O'Reilly. Наличие глоссария и контекстного поиска сильно облегчает работу.
Однако, все эти достоинства CHM перечеркивает большой недостаток. Это формат справки и он жестко ориентирован на Windows. Решит Micro$oft поменять формат справки в следующей версии «форточек» и с накопленным объемом книг придется попрощаться.
Конечно, как для любого мало-мальски популярного формата, для CHM существуют альтернативные средства просмотра. Та же кроссплатформенная читалка FBReader. И декомпилировать его, в случае надобности, задача тривиальная. Но это уже получаются шаманские пляски.
* * *
У всех вышеперечисленных форматов есть один существенный недостаток – они ИЗНАЧАЛЬНО НЕ ПРЕДНАЗНАЧАЛИСЬ для создания электронных книг. Созданные на их основе файлы даже не являются книгами – это просто текстовые документы.
Как ни странно, из этого же недостатка вытекает и достоинство – чтобы читать их не требуется специального программного обеспечения. Достаточно стандартных средств, встроенных в операционную систему.
Форматы, описанные далее, уже требуют установки специальных программных средств для их просмотра.
Adobe Acrobat (.PDF).
Первоначально PDF разрабатывался для нужд полиграфии. В основном для платформенно-независимого переноса макетов. В последние годы интенсивно продвигается как формат для создания e-book.
Полиграфичность. Абсолютная. Для того и был разработан. Как следствие, PDF-файлы могут быть весьма увесистыми.
Масштабируемость. Низкая! На портативных устройствах читать PDF проблематично.
Кроссплатформенность. Cредняя.
Гипертекст. Есть.
Возможность редактирования. Низкая. К тому же, для этого нужно устанавливать громоздкий Adobe Acrobat.
Основной аргумент против массового применения PDF для изготовления e-book – это большой объем файла и неудобство чтения на портативных устройствах.
Впрочем, качественные книги и журналы, сформатированные на страницы размером более A5, трудновато читать даже на 21'' мониторах.
===============================
Вообще, формат PDF предназначен, в первую очередь, ДЛЯ ВЫВОДА НА ПЕЧАТЬ.
===============================
Существуют и другие форматы, аналогичные PDF. Например, формат Zinio, предназначенный специально для выпуска в электронном виде периодических изданий, в частности глянцевых журналов.
DeJaVU (.DJVU)
Формат DJVU был создан компанией АТ&T специально для компактного представления информации в Internet. Подобно MP3 и Divx, он пришелся ко двору и произвел маленькую революцию в деле свободного распространения контента.
Полиграфичность. Высокая.
Масштабируемость. Весьма средняя. Зависит от того, насколько хорошо программа-просмотрщик поддерживает anti-aliasing. [1.4]1.4
Anti-aliasing – сглаживание картинки при масштабировании.
[Закрыть]
Кроссплатформенность. Средняя.
Конвертируемость. Ниже среднего.
Гипертекст. Есть подобие.
Возможность редактирования. Средняя.
Формально, файлы созданные с использованием DJVU трудно называть книгами. Это, по существу, растровый многостраничный графический файл. При его создании специальные алгоритмы отделяют текст от фона и иллюстраций, после чего они сжимаются с различным разрешением. Что и обеспечивает чрезвычайно высокое сжатие картинки (примерно 1:500) при более чем приемлемом качестве изображения. Эти свойства делают его идеальным для множества сканированных компьютерных (и не только) руководств и пособий, которыми сейчас завалены варезные сайты (такие книги еще называют «освобожденными» ;)) ). Ведь, если книга содержит примеры исходников программ, формулы, схемы или сложные таблицы, то даже незначительные ошибки при OCR могут непоправимо испортить ее. A DJVU позволяет представить книгу «как есть».
Причем интересы читателей, привыкших парой щелчков копировать нужный кусок текста в буфер, тоже учтены. Последние версии формата DJVU могут содержат чисто текстовый слой.
Справедливости ради, следует заметить, что DJVU, более чем хорошо справляющийся с текстами и штриховыми иллюстрациями, пасует перед изданиями, содержащими цветные фото и рисунки – иллюстрированными энциклопедиями и глянцевыми журналами. Выглядят такие издания в DJVU весьма непрезентабельно.
Закрытые специализированные форматы
Существует довольно много форматов электронных книг, которые были созданы для одного конкретного устройства или программы.
К ним можно отнести Rocket e-book (.rb), Micro$oft Reader (.lit), PalmDoc, MobiPocket (.prc), Jinke Book Wolf (.wol) и т.д. Плюс, некоторые программы для чтения норовят сконвертировать текст в свой собственный, ни с чем не совместимый формат (IceBook Professional на PC, iSilo и Weasel на Palm и прочие). Правда, при близком рассмотрении оказывается, что это все те же HTML, RTF или txt (некоторое исключение составляет формат ExeBook, который конвертирует текст книги в исполняемый файл, содержащий набор растровых картинок), как правило, упакованные для компактности, и снабженные служебной областью, где могут храниться, например, закладки. Также (и чаще, чем хотелось бы) может быть добавлена DRM.
Полиграфичность. Зависит от конкретного формата. Средняя или выше среднего.
Масштабируемость. Средняя или выше среднего.
Кроссплатформенность. Низкая. Обычно такие форматы создаются для одного конкретного устройства или программы. Просмотр на PC или, соответственно, КПК нередко возможен только с помощью программ, написанных энтузиастами.
Конвертируемость. Низкая. Обычно только через софт, опять же написанный энтузиастами.
Гипертекст. Чаще всего есть.
Возможность редактирования. Низкая или вообще никакая.
И, наконец…
Специализированные открытые форматы на основе XML
Что такое XML, подробно описано ниже. Сейчас нас интересуют лишь сравнительные характеристики формата.
Полиграфичность. Высокая. Правда, всецело зависит от программы-ридера.
Масштабируемость. Почти абсолютная.
Кроссплатформенность. Практически абсолютная.
Конвертируемость. Практически абсолютная.
Гипертекст. Есть.
Возможность редактирования. Как правило, абсолютная.
Как видим, язык XML имеет наилучшее сочетание качеств, необходимых для e-book. Поэтому попытки делать e-book на его основе уже предпринимались неоднократно и небезуспешно.
В отличие от txt, RTF, DOC, HTML, PDF, и т.д. которые однозначно ориентированы на отображение или хранение текстовых данных, форматы на основе XML позволяют структурировать книгу.
Известны форматы OEB (Open E-Book), DocBook, e-Pub и другие. Но наиболее популярным (по крайней мере, в Рунете) является FictionBook.