Иногда кажется, что определиться с форматом дело довольно сложное, их так много и у каждого свои преимущества. Многие авторы задаются вопросом: "Как выбрать формат для электронной книги?" Мы провели свой анализ форматов и выяснили, какой же именно является лучшим форматом для обычных книг. Мы внимательно изучили множество форматов, причем рассматривали их как с точки зрения удобства читателя, так и с точки зрения удобства автора. Давайте немного погрузимся в детали и посмотрим, что повлияло на наш выбор.

Почему ePub — лучший формат?

За время разработки наших сервисов, мы изучили некоторые технические ньюансы, которые влияют на внешний вид и работу с электронной книгой.

Начнем с самого простого — управление отображением книги. Т.е. возможностью читателем менять размер шрифта и ориентацию страницы. EPUB прекрасно адаптируется к изменению размера экрана устройства или размера шрифта. Хочется отметить, что в спецификации указано, что на самом деле формат поддерживает 2 режима верстки — первый (reflowable), когда можно менять эти параметры, и второй (fixed-layout), когда можно четко указать, что где находится.

Рассмотрим режимы верстки несколько подробнее.

Разметка Reflowable

На русский язык можно перевести как текучая, адаптивная или плавающая. Позволяет подогнать содержимое книги к экрану устройства, изменять цвет и размер шрифта. Идеально подходит для обычных книг с простым текстом — романов, стихотворений, технической литературы. Т.е. всего, где не требуется четкая привязка изображений или сложное визуальное представление.

Данная разметка не подойдет для визуальных интерактивных книг и детских книг со множеством иллюстраций, то есть тех, где требуется пространственная привязка графики, разного рода комбинация картинок и врезок. Сам по себе формат EPUB позволяет создавать интерактивные книги, но адаптивный дизайн таких книг - это настоящее искусство.

Так выглядит адаптивная разметка

C поворотом экрана
С увеличением масштаба

Screen Shot 2017-03-17 at 10.39.22 AM.png

IMG_1269.jpg

Использование этой разметки идеально в случае, когда вы точно не знаете, где и как будет вопроизведена ваша книга. Из-за гибкости разметки, книга будет корректно отображена практически на любом устройстве, начиная от компьютера и заканчивая какими-нибудь умными часами. Плюс данная разметка отлично подойдет для людей с ограниченными возможностями.

Фиксированная разметка — fixed-layout

Данный вид разметки подразумевает, что все элементы имеют четко закрепленное положение на странице с четко указанным размером. Эта разметка имеет формат, который более всего близок к физическому носителю, например странице обычной бумажной книги. Все на своих местах и никакой адаптации. На устройствах адаптация чаще всего выглядит ввиде масштабирования со всеми из этого вытекающими последствиями. То, что выглядит приемлемо на экране компьютера уже мелковато на планшете, а на экране смартфона вообще не разглядеть. Ну а игра с увеличением и уменьшением масштаба превращается в пытку читателя.

Пример отображения фиксированной разметки

С поворотом экрана С увеличением масштаба

Screen Shot 2017-03-17 at 10.38.08 AM.png

IMG_1268.jpg

 Этот формат подходит в том случае, когда вы точно знаете, что ваше произведение будут читать на носителе с конкретным размером, под который и будет сверстано ваше произведение. Изначально предполагается, что данная разметка разработана для дальнейшей печати произведения, поэтому в ней указываются размеры и формат будущего носителя. Мы не рекомендуем использовать данную разметку для электронных книг, так она ограничивает область чтения книг устройствами с определенным размером экрана.

Самый распространный цифровой представитель этой разметки — формат PDF, но и EPUB тоже ее поддерживает.

Мы решили свести популярные форматы в таблицу и показать поддержку различной разметки внутри них

Формат Reflowable
Fixed-layout
ePub идеальная поддержка
хорошая поддержка начиная с версии 3.0
PDF
нет
идеален для жесткой разметки
FB2
полная
нет
TXT
полная
нет
MOBI
полная хорошая

С версткой разобрались. Теперь один рассмотрим самый волнующий авторов момент — авторское право.

Поддержка защиты авторских прав на уровне форматов электронных книг

Как правило авторы настаивают на поддержке DRM (Digital Rights Management) или технических средств защиты авторских прав в электронных книгах. Это одна из самых неприятных тем, как для авторов, так и для читателей, но затрагивает и интересы издателей тоже. И основная проблема заключается в том, что нет надежного способа защиты от копирования, т.к. книга представляет собой источник преимущественно текстовой информации представленной в графической форме. Можно создать исключительно надежный способ доставки контента путем зашифрованной передачи файла в специальное отдельное приложение или даже специальное отдельное устройство для чтения книг, но это все будет обойдено простым фотоаппаратом с последующим распознаванием текста. Так что все самые сложные и неприятные для всех процедуры будет нивелированы самым примитивным способом копирования, которому уже больше двух веков. Все то, что видит глаз человека, это все увидит и камера. А дальше дело техники.

Итак, как обстоит дело с поддержкой DRM в различных форматах. Мы собрали информацию и поместили в таблицу

Формат Уровень поддержки
ePub идеальная поддержка от компаний Adobe (Adept) и Apple (FairPlay)
PDF
идеальная поддержка от компании Adobe
FB2
поддержка отстутствует
TXT
поддержка отстутствует
MOBI
идеальная поддержка от компании Amazon на устройствах Kindle

Из таблицы видно, что ePub, PDF и Mobipocket являются форматами, отлично поддерживающими защиту авторских прав.

Однако, как мы отметили выше, ничего, кроме неудобств для пользователя DRM больше не создает. Многие были в ситуации, когда срочно нужна книга, но ее нет в формате доступном для твоего устройства. Как правило, такая ситуация частенько застает человека врасплох или в самый неподходящий момент. Обычно люди решают это разными путями, в большинстве случаев просто ищут другую книгу на эту же тему, но уже в доступном формате. Как результат, автор теряет читателей и, разумеется, деньги.

Основная проблема защиты области прав лежит в области воспитания людей и их отношения к защите авторских прав. Например, ведь никому не приходит в голову красть напрямую из магазина, хотя все лежит, только протяни руку. Аналогично и с цифровым контентом. Просто происходит осознание того, что произведение принадлежит автору и это результат его труда, который должен быть оплачен. Чем больше людей осознает это, тем меньше книг будет украдено.

Предоставление легального доступа к книгам одна из миссий нашей библиотеки.

Резюмируя вышесказанное мы снова приходим к выводу, что ePub отличный выбор и с точки защиты авторских прав.

Что не так с форматом EXE?

Наверняка многие слышали про такой формат. Этот формат называется — приложение для операционной системы Windows. Все верно, это не формат электронных книг, это обычная программа для Windows, которую нужно устанавливать и которая работает только на очень ограниченном круге устройств — компьютерах и планшетах с Windows. Открыть такую "книгу" на iPad, Kindle, Nook и планшете с Android не получится не говоря уже о других системах таких как OS X или Linux. Более того, т.к. формат является исполняемым файлом, то к нему очень часто цепляются вирусы, что делает его исключительно небезопасным. Вот так просто, скачал книгу в exe, а получил вирус. Злоумышленники часто выкладывают вирусы в духе "Все книги Донцовой.exe", но вместо книг люди получают пачку вирусов.

Screen Shot 2016-05-23 at 12.27.05 AM.png


Существует аналогичный формат, называемый JAVA — какое-то время был популярен на старых смартфонах. Суть такая же — программа, но только для смартфона. Аналогичная маскировка вирусов для смартфонов.

Мы советуем авторам избегать издания книг в форматах EXE и JAVA, а читателям не скачивать подобные книги в целях безопасности.

О формате FictionBook

Популярен под названием FB2. Популярен преимущественно в России и на постсоветском пространстве, так что можно смело называть его национальным форматом.

 В целом формат достаточно простой, но есть и определенные неудобства связанные с тем, что он основан на формате XML. Например, чтобы отобразить название книги и автора, нужно разобрать файл целиком. Если в файле много иллюстраций, то у устройства может закончиться память и попытка чтения метаданных будет приводить к завершению работы приложения для чтения книг или просто к выдаче ошибок.

Fb2-shema.jpg


 Тем не менее данный формат содержит в себе логическую разметку, книга разбита на секции, которые могут быть стихотворениями или прозой. Однако сам по себе формат очень ограничен, т.к. не только нет поддержки сложной верстки и формул, но и банальных вещей вроде маркированных списков.

Существует идея формата FB3, усовершенствованного FB2, судя по описанию являющегося клоном формата ePub. В нем используется аналогичный zip-архив и разделение файлов на описание, текст и картинки. Дмитрий Грибов интенсивно работает над новым форматом и мы надеемся, что он порадует авторов новыми возможностями.

Данный формат хорошо подойдет для простой художественной литературы, написанной на русском языке.

О формате TXT

Представляет собой просто текст, словно вы его распечатали на обычной печатной машинке. Форматирование заключается в отступах, симуляции списков с помощью звездочек и т.п. Забудьте про картинки, цвета и формулы. Зато может быть открыт практически на любом устройстве.

Screen Shot 2016-05-23 at 12.29.07 AM.png

О формате MOBI

Полное название Mobipocket — основной формат книг на платформе Amazon Kindle.
Формат MOBI доступен с помощью программы Kindle на Mac OS X, iOS, Android, Windows и Windows Phone устройствах. Разумеется формат доступен в электронных книгах Amazon Kindle и Kindle Fire.
Этот формат появился в 2000 году благодаря формату PRC, который был рожден при разработке наладонников Palm — предков современных планшетов со стилусом.

Screen Shot 2016-05-23 at 12.29.53 AM.png

Формат MOBI имеет несколько разновидностей в виде семейства форматов AZW, отличающихся более высокой степенью сжатия данных.

  • AZW1 — другое имя для формата "топаз" (также называется .tpz). Эта разновидность предназначена для хранения отсканированных документов и похожа на DJVU. Формат TPZ — используется в сети WhisperNet. WhisperNet — это специальная сотовая 3G сеть, которая создана компанией Amazon для поддержки книг Kindle и синхронизации книг, закладок и т. д.
  • AZW3 — другое название для KF8. Этот формат впервые появился для Kindle Fire. Представляет собой скомбинированный формат ePub с базой данных Palm, DRM-защитой Amazon, практически копируя все возможности формата ePub и обеспечивая совместимость со старыми читалками Kindle.
  • AZW4 — специальный формат для учебников (аналогичен PDF).
  • AZK — это специальная версия формата MOBI под iOS для Kindle Reader и других продуктов Apple.
  • KFX — один из относительно новых форматов от Амазон, который появился одновременно с Kindle Paperwhite 3. Является наследником AZK. В него были добавлены такие возможности, как воспроизведение звуков и видео, отображение таблиц на отдельном экране, добавлен новый шрифт и формат изображений JXR.
  • AZW8 является расширением для KFX, который является еще одним специальным форматом в настоящее время на Kindle paperwhite 3, Kindle Oasis и Kindle Voyage. На текущий момент это самый продвинутый формат и используется в современных устройствах от Amazon.

О формате PDF

PDF — межплатформенный формат электронных документов, разработанный фирмой Adobe Systems.
Формат доступен с помощью программы Adobe Reader на Mac OS X, iOS, Android, Windows и Windows Phone устройствах.

Screen Shot 2016-05-23 at 12.30.22 AM.png

О формате DJVU

DJVU — формат Lizardtech, который все более широко используется для научных публикаций. Основное предназначение данного формата — хранение отсканированных изображений, содержащих текст и относительно простую графику. Его основные характеристики заключаются в том, что коэффициент сжатия примерно в 10 раз лучше, чем в формате .pdf при том же качестве. Ничто не сравнится с этим в настоящее время для черно-белого текста и изображений. Скорее всего в нем вы встретите такие журналы как Радио или Моделист-Конструктор, их старые версии практически недоступны в других форматах, потому что большинство старых журналов обычные отсканированные изображения. Для того, чтобы в нем работал поиск, добавляют специальный невидимый слой с текстом, полученный с помощью систем распознавания текста (OCR). Для электронных книг этот формат совершенно непригоден, поскольку его невозможно адаптировать для устройств с маленьким экраном, да и многие читалки его не поддерживают.

О формате DOC, DOCX

Это обычные текстовые документы, созданные в редакторе Word из Microsoft Office. Их можно редактировать, изменять шрифты и оформление. Данный формат поддерживается очень узким списком устройств и программ ввиду очень высокой сложности и закрытости формата, плюс очень часто не может быть корректно отображен. Формат подходит в качестве черновика для книги, но неприемлен для распространения.


О формате EPUB

Единственный официально признанный мировым сообществом (Международным форумом по цифровым публикациям) формат электронных книг. Поддерживает практически все, о чем только можно мечтать: сложное форматирование, списки, таблицы, формулы, сноски, растровые и векторные изображения, различные режимы верстки и DRM защиту авторских прав.

Формат поддерживают такие бесплатные программы для чтения электронных книг как iBooks, CoolReader, FBReader, Mobipocket, Okular.
Устройства для чтения электронных книг в формате ePub: iPad, iPhone, Mac, Amazon Kindle, Fire, Barnes&Noble Nook, планшеты на Android и многие другие, все не перечислить.

Существует довольно много программ для создания электронных книг в вышеприведенных форматах, мы же разработали специализированное решение именно для авторов.

Редкие и устаревшие форматы

Еще мы хотели бы о рассказать о некоторых редких форматах.

  • ABW — формат файла, используемый AbiWord. Если файл сжат, то это будет формат ZABW.
  • ACSM — формат файла, используемый для обеспечения DRM защиты в Adobe eBooks PDF и ePUB.
  • AEH — формат файла, используемый eBooksWriter.
  • BBeB — собственный формат Sony. Подставки для широкополосного EBook, также известного как LRF из-за расширения файла.
  • CBR / CBZ — Сжатый контейнер для изображений. R означает, что картинки сжаты архиватором RAR, а Z означает, что сжаты через ZIP. Внутренний формат может быть любым из нескольких форматов изображений, а считыватели CBR / CBZ отображают их как несколько страниц книги. Название означает читалка для комиксов, но используется для любых книг, где содержание содержит в основном фотографии.
  • CHM — сжатый HTML, часто используемый для файлов справки Windows. Он стал очень популярным для распространения текстов и других материалов поддержки через Интернет.
  • DNL — формат цифровой веб-книги, используемый автором Desktop.
  • DTB — Digital Talking Books — книги для слепых, слабовидящих, физически неполноценных людей, учащихся с ограниченными возможностями или других читателей с отключенной печатью. DTBook устанавливает спецификации для цифровых говорящих книг (DTB) как часть DAISY.
  • EBA — фирменный формат электронных книг. Специально поддерживается eBook Readers для китайского языка.
  • EBAML же, что и EBA 2.0 — Используется на Dr. Yi Reader и других продуктах Китая.
  • -ER.PDB — формат базы данных Palm для читалки eReader. ER используется для различения этого формата.
  • FUB — формат электронной книги Франклина.
  • GPF — Ganaxa Publishing Format, позволяющий «горячие точки» и встроенный мультимедийный контент.
  • GPX — защищенный документ Ganaxa.
  • IMP — формат электронной книги, используемый eBook Technologies ETI-1 (REB 1200 / Softbook Reader) или ETI-2 (EBookwise-1150 / Gemstar 1150). Некоторые программы конвертируются в него. Он считается форматом для терминалов.
  • -IS.PDB — формат базы данных Palm для читалки ISilo. IS используется, чтобы отличить этот формат.
  • KML — формат электронной книги HieBook.
  • LIT — собственный формат Microsoft для Microsoft Reader.
  • LRC — специальный сопроводительный формат, который должен быть компаньоном для аудиокниг.
  • LRF — также: BBeB book. Собственный формат Sony. Поддерживается Sony Librie и Sony Reader.
  • LRS — также: BBeB Xylog XML. Формат исходного кода для книг BBeB, который скомпилирован в LRF для чтения на устройстве.
  • LRX — защищенный документ BBeB. Sony Librie и Sony Reader используют несовместимые друг с другом форматы.
  • MART — это проприетарный формат, используемый только на веб-сайте Martview для распространения книг, состоящих из изображений.
  • Формат NP — формат загрузки газеты, используемый в NewspaperDirect для их продукта PressDisplay.
  • OEB — формат открытой книги. Формат электронной книги, используемый EBookwise-1150, MobiPocket и Microsoft Reader. Этот стандарт является старой версией ePUB.
  • ODT — это открытый стандарт, формат документа, используемый в OpenOffice.org, Star Office и многих других текстовых редакторах.
  • OSIS — это определение XML-схемы для Библии и других библейских текстов исследований.
  • PKG — формат, используемый в Apple Newton.
  • PNPd — Формат, используемый программой eReader. Это популярный формат (также известный как PML).
  • PS — Postscript поддерживается в нескольких программах для чтения, но предназначен для отправки информации на принтер.
  • RB — формат электронной книги для Rocket eBook и Gemstar RCA REB 1100.
  • RTF — Rich Text Format — это формат обмена документами, поддерживаемый некоторыми программами чтения электронных книг, а также многими приложениями обработки Word, включая MS Word и OpenOffice. Это предпочтительный формат для многих пользователей, которые создают свой собственный контент для Sony Reader.
  • SGF — собственный формат для Sigil, прямого редактора для ePUB. (Больше не используется)
  • STK — собственный формат STAReBOOK.
  • TCR — электронная книга для EPOC.
  • TeBR — специальный формат для крошечной электронной книги от Fictionwise.
  • TR — формат Tome Raider. Их последний формат называется TR3. Tome Raider — это формат электронных книг, который поддерживает очень большие книги, такие как справочники, энциклопедии и словари.
  • VBK — формат электронной книги от VitalSource, поддерживающий графическую поддержку. Этот формат обычно используется в учебниках.
  • XEB — формат, используемый электронными книгами Apbi в основном на китайском языке.
  • XDXF — формат обмена словарями на основе XML.
  • WOLF — Собственный формат, используемый HanLin eBook в своих электронных книгах V2B, V3 и V8. Обычно используется расширение .wol. Также используется JCNIP на их читаталке Dr.Yi.
  • ZTXT — формат, используемый WeaselReader на устройствах Palm. Имеет расширение .pdb.
  • ZNO — проприетарный формат электронных журналов подписки Zinio. Эти журналы включают мультимедийные материалы, такие как фотографии и видео. Ходят слухи, что формат основан на DJVU.

Пожалуй мы покончим с экзотикой на этом месте. Спасибо за внимание!

Присоединяйтесь к нам, чтобы получать новые статьи и узнавать о выходе в свет книг на нашей платформе.

Подписаться