Текст книги "Создание электронных книг в формате FictionBook 2.1: практическое руководство (beta 4)"
Автор книги: Михаил Кондратович
сообщить о нарушении
Текущая страница: 10 (всего у книги 10 страниц)
Приложение В
Список жанров FictionBook
В FB 2.1 определен следующий список жанров:
Значение
* Science Fiction & Fantasy – (Научная фантастика и Фэнтези)
sf_history – Alternative history – Альтернативная история
sf_action – Action – Боевая фантастика
sf_epic – Epic – Эпическая фантастика
sf_heroic – Heroic – Героическая фантастика
sf_detective – Detective – Детективная фантастика
sf_cyberpunk – Cyberpunk – Киберпанк
sf_space – Space – Космическая фантастика
sf_social – Social-philosophical – Социально-философская фантастика
sf_horror – Horror & mystic – Ужасы и Мистика
sf_humor – Humor – Юмористическая фантастика
sf_fantasy – Fantasy – Фэнтези
sf – Science Fiction – Научная Фантастика
* Detectives & Thrillers (Детективы и Триллеры)
det_classic – Classical detectives – Классический детектив
det_police – Police Stories – Полицейский детектив
det_action – Action – Боевик
det_irony – Ironical detectives – Иронический детектив
det_history – Historical detectives – Исторический детектив
det_espionage – Espionage detectives – Шпионский детектив
det_crime – Crime detectives – Криминальный детектив
det_political – Political detectives – Политический детектив
det_maniac – Maniacs – Маньяки
det_hard – Hard-boiled – Крутой детектив
thriller – Thrillers – Триллер
detective – Detectives – Детектив, не относящийся в прочие категории.
* Prose (Проза)
prose_classic – Classics prose – Классическая проза
prose_history – Historical prose – Историческая проза
prose_contemporary – Contemporary prose – Современная проза
prose_counter – Counterculture – Контркультура
prose_rus_classic – Russian classics prose – Русская классическая проза
prose_su_classics – Soviet classics prose – Советская классическая проза
* Romance (Любовные романы)
love_contemporary – Contemporary Romance – Современные любовные романы
love_history – Historical Romance – Исторические любовные романы
love_detective – Detective Romance – Остросюжетные любовные романы
love_short – Short Romance – Короткие любовные романы
love_erotica – Erotica – Эротика
* Adventure (Приключения)
adv_western – Western – Вестерн
adv_history – History – Исторические приключения
adv_indian – Indians – Про индейцев
adv_maritime – Maritime Fiction – Морские истории
adv_geo – Travel & geography – Путешествия и география
adv_animal – Nature & animals – Природа и животные
adventure – Other – Прочие приключения (то, что не вошло в другие категории)
* Children's (Детское)
child_tale – Fairy Tales – Сказка
child_verse – Verses – Детские стихи
child_prose – Prose – Детская проза
child_sf – Science Fiction – Детская фантастика
child_det – Detectives & Thrillers – Детские остросюжетные
child_adv – Adventures – Детские приключения
child_education – Educational – Детская образовательная литература
children – Other – Прочая детская литература (то, что не вошло в другие категории)
* Poetry & Dramaturgy (Поэзия, Драматургия)
poetry – Poetry – Поэзия
dramaturgy – Dramaturgy – Драматургия
* Antique literature (Старинное)
antique_ant – Antique – Античная литература
antique_european – European – Европейская старинная литература
antique_russian – Old russian – Древнерусская литература
antique_east – Old east – Древневосточная литература
antique_myths – Myths. Legends. Epos – Мифы. Легенды. Эпос
antique – Other – Прочая старинная литература (то, что не вошло в другие категории)
* Scientific-educational (Наука, Образование)
sci_history – History – История
sci_psychology – Psychology – Психология
sci_culture – Cultural science – Культурология
sci_religion – Religious studies – Религиоведение
sci_philosophy – Philosophy – Философия
sci_politics – Politics – Политика
sci_business – Business literature – Деловая литература
sci_juris – Jurisprudence – Юриспруденция
sci_linguistic – Linguistics – Языкознание
sci_medicine – Medicine – Медицина
sci_phys – Physics – Физика
sci_math – Mathematics – Математика
sci_chem – Chemistry – Химия
sci_biology – Biology – Биология
sci_tech – Technical – Технические науки
science – Other – Прочая научная литература (то, что не вошло в другие категории)
* Computers & Internet (Компьютеры и Интернет)
comp_www – Internet – Интернет
comp_programming – Programming – Программирование
comp_hard – Hardware – Компьютерное «железо» (аппаратное обеспечение)
comp_soft – Software – Программы
comp_db – Databases – Базы данных
comp_osnet – OS & Networking – ОС и Сети
computers – Other – Прочая околокомпьтерная литература (то, что не вошло в другие категории)
* Reference (Справочная литература)
ref_encyc – Encyclopedias – Энциклопедии
ref_dict – Dictionaries – Словари
ref_ref – Reference – Справочники
ref_guide – Guidebooks – Руководства
reference – Other – Прочая справочная литература (то, что не вошло в другие категории)
* Nonfiction (Документальная литература)
nonf_biography – Biography & Memoirs – Биографии и Мемуары
nonf_publicism – Publicism – Публицистика
nonf_criticism – Criticism – Критика
design – Art & design – Искусство и Дизайн
nonfiction – Other – Прочая документальная литература (то, что не вошло в другие категории)
* Religion & Inspiration (Религия и духовность)
religion_rel – Religion – Религия
religion_esoterics – Esoterics – Эзотерика
religion_self – Self-improvement – Самосовершенствование
religion – Other – Прочая религионая литература (то, что не вошло в другие категории)
* Humor (Юмор)
humor_anecdote – Anecdote – Анекдоты
humor_prose – Prose – Юмористическая проза
humor_verse – Verses – Юмористические стихи
humor – Other – Прочий юмор (то, что не вошло в другие категории)
* Home & Family (Домоводство (Дом и семья))
home_cooking – Cooking – Кулинария
home_pets – Pets – Домашние животные
home_crafts – Hobbies & Crafts – Хобби и ремесла
home_entertain – Entertaining – Развлечения
home_health – Health – Здоровье
home_garden – Garden – Сад и огород
home_diy – Do it yourself – Сделай сам
home_sport – Sports – Спорт
home_sex – Erotica & sex – Эротика, Секс
home – Other – Прочее домоводство (то, что не вошло в другие категории)
Приложение Г
Список возможных языков
Ниже приведены коды языков, которые можно прописывать в тэгах
Здесь приведены только основные кодировки, полный список содержится в стандарте ISO 639:
abk – ab – Абхазский
aze az Азербайджанский
alb/sqi sq Албанский
eng en Английский
arm/hye hy Армянский
ba Башкирский
bel be Белорусский
bul bg Болгарский
hun hu Венгерский
vie vi Вьетнамский
dut/nla nl Голландский
ell/gre el Греческий современный (1453-)
dan da Данийский
grc Древнегреческий (до 1453)
heb he Иврит
esl/spa es Испанский
ita it Итальянский
kaz kk Казахский
kir ky Киргизский
chi/zho zh Китайский
kor ko Корейский
lat la Латинский
lav lv Латвийский
lit lt Литовский
mac/mak mk Македонский
mol mo Молдавский
mon mn Монгольский
deu/ger de Немецкий
mul Несколько языков
und Неопределенный
nor no Норвежский
fas/per fa Персидский
pol pl Польский
por pt Португальский
rus ru Русский
san sa Санскрит
slk/slo sk Словацкий
slv sl Словенский
tgk tg Таджикский
tat tt Татарский
tur tr Турецкий
uzb uz Узбекский
ukr uk Украинский
cym/wel cy Уэльский
fin fi Финский
fra/fre fr Французский
che Чеченский
ces/cze cs Чешский
hr Хорватский
sve/swe sv Шведский
epo eo Эсперанто
est et Эстонский
jpn ja Японский
Приложение Д
Регулярные выражения
==Важно!========================
Это описание было заимствовано из документации к программе Дмитрия Грибова СlearTXT. Реализация регулярных выражений в FB Editor несколько отличается от СlearTXT. Поэтому, эта документация справедлива для FBE лишь с некоторыми оговорками.
Хотя, в связи с тем, что регулярные выражения используются не только в FB Editor, но и в других программах, упомянутых в книге, было принято волевое решение привести это описание здесь полностью.
===============================
Регулярные выражения – широко используемый способ описания шаблонов для поиска текста и проверки соответствия шаблону. Специальные метасимволы позволяют определять, например, что Вы ищете подстроку в начале входной строки или определенное число повторений подстроки.
На первый взгляд регулярные выражения выглядят страшновато (ну хорошо, на второй – еще страшнее ;) ). Однако вы очень быстро оцените всю их мощь. Они избавят вас от длительного и нудного ручного поиска/замены/правки, а в некоторых случаях дадут вам возможности, реализация которых «ручками» даже не придет вам в голову.
СИМВОЛЫ
Это простейшие случаи подстановок.
xNN – символ с шестнадцатеричным кодом NN
t – табуляция (HT/TAB), можно также x09
n – новая строка (NL), можно также x0a
r – возврат каретки (CR), можно также x0d
Пример: rn – поиск разрыва строки (Windows, DOS).
Поиск «одного из» – перечни
Можно определить перечень, заключив символы в «[]». Перечень будет совпадать с любым одним символом, перечисленным в нем.
Если первый символ перечня (сразу после «[») – «^», то такой перечень совпадает с любым символом, не перечисленным в перечне.
Внутри перечня символ «-» может быть использован для определения диапазонов символов, например, a-z представляет все символы между «a» и «z», включительно.
Если необходимо включить в перечень сам символ «-», его нужно поместить в начало или конец перечня или предварить «». Если необходимо поместить в перечень сам символ «]», поместите его в самое начало или предварите «».
Примеры:
п[иа]р – будут найдены буквосочетания «пир» и «пар». Но, допустим, не «пор».
п[^иа]р – будут найдены буквосочетания «п…р» с любым символом между «п» и «р», кроме «и» и «а».
[-az] – «a», «z» и «-»
[az-] – «a», «z» и «-»
[a-z] – «a», «z» и «-»
[a-z] – все 26 малых латинских букв от «a» до «z»
[n-x0D] – #10, #11, #12, #13
[d-t] – цифра, «-» или «t»
[]-a] – символ из диапазона «]»..«a»
Оговорка. В FB Editor в режиме исходника перечни, содержщие кирииллицу ФУНКЦИОНИРУЮТ НЕПРАВИЛЬНО.
Метасимволы
Метасимволы – это специальные символы, являющиеся важнейшим понятием в регулярных выражениях. Существует несколько групп метасимволов.
• Разделители строк (начало строки, конец строки и т.п.)
• Стандартные перечни символов (цифры, буквы и цифры и т.п.)
• Границы слов (показывают, что вхождение должно быть на границе слова)
• Повторения (указывает, сколько раз должна присутствовать последовательность)
• Варианты (позволяет указать набор масок, с любой из которых должен совпадать текст)
• Подвыражения (используются при замене)
• Обратные ссылки (способ обратиться к подвыражениям при поиске)
Метасимволы – разделители строк и границы
Разделители и границы
^ – начало строки
$ – конец строки
A – начало текста
Z – конец текста
b – Совпадает на границе слова
B – Совпадает НЕ на границе слова
Примеры:
^Все – Находит все строки в тексте, начинающиеся словом «Все»
bмир – Находит все слова, начинающиеся буквосочетанием «мор». Слова будут найдены и в начале строк, и в середине.
^x20$ – Находит все строки в тексте, состоящие из единственного пробела.
Метасимволы – стандартные перечни символов
. (точка) – Любой символ
w – буквенно-цифровой символ или "_"
W – не w
d – цифровой символ
D – не d
s – любой «пробельный» символ: [x20tnrf]
S – не s
Метасимвол «.» по умолчанию совпадает с любым символом, однако, если выключить модификатор s ((?-s), синтаксис см. ниже), то «.» не будет совпадать с разделителями строк.
Стандартные перечни w, d и s можно использовать и внутри перечней символов.
Примеры:
–foob[ws]r – —находит «foobar», «foob r», «foobbr» но не «foob1r», «foob=r»
–+d (ddd) ddd-dd-dd – —Находит телефон в формате «+7 (095) 555-55-55»
Метасимволы – повторения
После любого элемента регулярного выражения может следовать очень важный тип метасимвола – повторитель. Используя их Вы можете определить число допустимых повторений предшествующего символа, метасимвола или подвыражения.
Указание числа вхождений
* – ноль или более раз (может быть «жадным»), то же что {0,}
+ – один или более раз (может быть «жадным»), то же что {1,}
? – ноль или один раз (может быть «жадным»), то же что {0,1}
{n} – точно n раз (может быть «жадным»)
{n,} – не менее n раз (может быть «жадным»)
{n,m} – не менее n но не более m раз (может быть «жадным»)
*? – ноль или более раз («не жадный»), то же что {0,}?
+? – один или более раз («не жадный»), то же что {1,}?
?? – ноль или один раз («не жадный»), то же что {0,1}?
{n}? – точно n раз («не жадный»)
{n,}? – не менее n раз («не жадный»)
{n,m}? – не менее n но не более m раз («не жадный»)
Т.о. {n,m} задает минимум n повторов и максимум – m. Повторитель {n} эквивалентен {n,n} и задает точно n повторов. Повторитель {n,} задает минимум n повторов. Теоретически величина параметров n и m не ограничена, но рекомендуется не задавать большие значения, поскольку в некоторых ситуациях это может потребовать существенных затрат времени и ОЗУ при обработке такого повторителя.
Небольшое пояснение по поводу «жадности». «Жадные» варианты повторителей пытаются захватить как можно большую часть входного текста, в то время как «не жадные» – как можно меньшую. Например, b+ как и b* примененные к входной строке «abbbbc» найдут «bbbb», в то время как b+? найдет только «b», а b*? – вообще – пустую строку; b{2,3}? найдет «bb», в то время как b{2,3} найдет «bbb».
По умолчанию, в FB Editor повторители могущие быть жадными, являются таковыми.
Примеры:
foob.*r – находит «foobar», «foobalkjdflkj9r» и «foobr»
foob.+r – находит «foobar», «foobalkjdflkj9r» но не «foobr»
foob.?r – находит «foobar», «foobbr» и «foobr» но не «foobalkj9r»
fooba{2}r – находит «foobaar»
fooba{2,}r – находит «foobaar», «foobaaar», «foobaaaar» и т.д.
fooba{2,3}r – находит «foobaar», или «foobaaar» но не «foobaaaar»
((+d )?(d{3}) )?(d{3}(-dd){2}) – Находит номера телефонов в форматах «+7 (095) 555-55-55», «(095) 555-55-55», «555-55-55». Это сложный пример, и в нем используется группировка скобками. Подробнее о применении скобок см. ниже.
(?g)(
[^-].{5,59}
(rn)){4,} – Этот пример найдет нам стихи – цепочки (из 4-х и более) следующих друг за другом коротких (от шести до шестидесяти символов) параграфов. Такой вид (много коротких параграфов) характерен, например, для стихов. Первый знак не должен быть длинным тире, так как серии коротких параграфов характерны и для диалогов, а нам диалоги не нужны. Обратите внимание, что пришлось использовать модификатор жадности, так как в «не жадном» режиме мы бы нашли только четыре первых строфы.
Метасимволы – варианты
Вы можете определить перечень вариантов, используя метасимвол «|» для их разделения, например, fee|fie|foe найдет «fee» или «fie» или «foe», (так же как f(e|i|o)e). В качестве первого варианта воспринимается все от предыдущего метасимвола ( или [ или от начала выражения до первого метасимвола «|», в качестве последнего – все от последнего «|» до конца выражения или до ближайшего метасимвола). Обычно, чтобы не запутаться, набор вариантов всегда заключают в скобки, даже если без этого можно было бы обойтись.
Варианты пробуются начиная с первого и попытки завершаются сразу же как удастся подобрать такой, при котором совпадет вся последующая часть выражения. Это означает, что варианты не обязательно обеспечат «жадное» поведение. Например, если применить выражение foo|foot ко входной строке «barefoot», то будет найдено «foo» так это первый вариант который позволил совпасть всему выражению.
Обратите внимание, что метасимвол | воспринимается как обычный символ внутри перечней символов, например, [fee|fie|foe] означает ровно то же самое что и [feio|].
<(p|div)>.*(p|div)> – найдет все корректно закрытые параграфы. Так же найдутся и включения вида
TEXT
.*
)Заметьте, что применив то же выражение в жадном режиме (?g)<(p|div)>.*(p|div)> мы не найдем ничего полезного.
Оговорка. Выражения с метасимволом «|» в FB Editor в режиме исходника НЕ ФУНКЦИОНИРУЮТ.
Метасимволы – подвыражения
У скобок в регулярных выражениях двоякая функция
1. Скобки позволяют группировать элементы (аналогично математическому использованию)
2. Скобки выделяют в исходном тексте подвыражения, на которые можно ссылаться при замене.
Вы можете обратиться к любому подвыражению в строке замены используя его номер. Подвыражения нумеруются слева направо, в порядке появления открывающих скобок. Ссылка осуществляется в виде $N, где N-номер.
Примеры группировки:
(проба){8,10} – находит строку содержащую 8, 9 или 10 копий «проба»
про([0-9]|б+)а – находит «про0а», «про1а» , «проба», «пробба», и т.д.
Примеры замены:
(.*)
—>>–$1– Заменит все параграфы на разделы((+d )?(d{3}) )?(d{3}(-dd){2}) —>>– $3 – Найдет в любом телефонном номере вида «+7 (095) 555-55-55» последнюю часть «555-55-55»
(?g)([s(]|A|
)(http://|ftp://|https://)([^s)"'<>]+) —>>– $1$2$3 – Такая замена преобразует все URL, встреченные в тексте, в гиперссылки.(?g)([s(]|A|
)(www.)([^s)"'<>]+)—>>—$1$2$3 – Преобразует все строки типа www.domain.root в гиперссылки
Метасимволы – обратные ссылки
Метасимволы от 1 до 9 воспринимаются как обратные ссылки. N совпадает с ранее найденным подвыражением #N. В отличие от случая с заменой, где используются переменные $N, обратные ссылки можно применять в выражении поиска.
Примеры группировки:
(.)1+ – находит «aaaa» и «cc»
(.+)1+ – также находит «abab» и «123123»
(['"]?)(d+)1 – находит «"13"» (в дв.кавычках), или «'4'» (в один.кавычках) или 77 (без кавычек)
Модификаторы
Модификаторы служат для изменения режимов работы регулярных выражений. Они вводятся в виде (?imsgr-imsgr). Если модификатор вписан после минуса – он отключается, если нет – включается. Модификаторы подвержены группировке (в Perl нет), можно применить модификатор для отдельного участка выражения (см. пример).
Модификаторы:
i – Регистро-независимый режим. Использует выбранный в ОС язык по умолчанию. По умолчанию выключено.
m – Воспринимать входной текст как многострочный, при этом метасимволы ^ и $ будут совпадать не только в начале и конце текста в целом, но и в начале и в конце всех имеющихся в тексте строк (см. также Разделители строк). По умолчанию включено.
s – Воспринимать входной текст как одну строку. При этом метасимвол «.» совпадает с любым символом, если же этот модификатор выключен, то он не совпадает с разделителями строк (см.также Стандартные перечни символов). По умолчанию включено.
g – Включая его Вы переключаете все повторители в «жадный» режим. По умолчанию включено.
r – Модификатор предназначенный для русского языка. Если включен, то диапазоны вида а-я включают также букву «ё», А-Я включают «Ё», а а-Я включает вообще все русские буквы. По умолчанию включено.
Примеры группировки:
(?i)Saint-Petersburg – находит «Saint-petersburg» и «Saint-Petersburg»
(?i) – Saint-(?-i)Petersburg – находит «Saint-Petersburg» но не «Saint-petersburg»
(?i)(Saint-)?Petersburg – находит «Saint-petersburg» и «saint-petersburg»
((?i)Saint-)?Petersburg – находит «saint-Petersburg», но не «saint-petersburg»
Оговорка. В FB Editor модификаторы НЕ ФУНКЦИОНИРУЮТ.
При подготовке приложения использовалась документация к ClearTXT (автор – Алексей Сорокин).