Momotik.ru

Народный проект

Метки: Djvu где используется, djvu для мак ос, djvu reader скачать бесплатно, djvu на ipad, djvu распознать текст, скачать бесплатно программу djvu на русском языке для windows 8.

DjVu

Расширение

.djvu, .djv

MIME

image/vnd.djvu, image/x-djvu

Разработан

AT&T Research

Опубликован

1998

Последний выпуск

27[1] / июль 2006

Тип формата

графические форматы

Открытый формат?

да

Сайт

djvu.org

DjVu (от фр. déjà vu — «уже виденное») — технология сжатия изображений с потерями, разработанная специально для хранения сканированных документов — книг, журналов, рукописей и прочее, где обилие формул, схем, рисунков и рукописных символов делает чрезвычайно трудоёмким их полноценное распознавание. Также является эффективным решением, если необходимо передать все нюансы оформления, например, исторических документов, где важное значение имеет не только содержание, но и цвет и фактура бумаги; дефекты пергамента: трещинки, следы от складывания; исправления, кляксы, отпечатки пальцев; следы, оставленные другими предметами и т. д.

DjVu стал основой для нескольких библиотек научных книг. Он довольно популярен, и в нём делается большое количество разных документов.

Формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать ещё до завершения загрузки файла. DjVu-файл может содержать текстовый (OCR) слой, что позволяет осуществлять полнотекстовый поиск по файлу. Кроме того, DjVu-файл может содержать встроенное интерактивное оглавление и активные области — ссылки, что позволяет реализовать удобную навигацию в DjVu-книгах.

Содержание

Используемые технологии

Для сжатия цветных изображений в DjVu применяется специальная технология, разделяющая исходное изображение на три слоя: передний план, задний план и чёрно-белую (однобитовую) маску. Маска сохраняется с разрешением исходного файла; именно она содержит изображение текста и прочие чёткие детали. Разрешение заднего плана, в котором остаются иллюстрации и текстура страницы, по умолчанию понижается для экономии места. Передний план содержит цветовую информацию о маске; его разрешение обычно понижается ещё сильнее. Затем задний и передний планы сжимаются с помощью вейвлет-преобразования, а маска — алгоритмом JB2.

Особенностью алгоритма JB2 является то, что он ищет на странице повторяющиеся символы и сохраняет их изображение только один раз. В многостраничных документах каждые несколько подряд идущих страниц пользуются общим «словарём» изображений.

Для сжатия большинства книг можно обойтись только двумя цветами. В этом случае используется всего один слой, что позволяет достичь рекордной степени сжатия. В типичной книге с чёрно-белыми иллюстрациями, отсканированной с разрешением 600 dpi, средний размер страницы составляет около 15 Кб, то есть приблизительно в 100 раз меньше, чем исходный файл. В присутствии сложного заднего плана выигрыш объёма составляет обычно 4—10 раз. Однако при стандартных настройках в DjVu используется сжатие данных с потерями, поэтому для особо важных документов обычно используются форматы сжатия без потерь: PNG, JPEG 2000, TIFF и т. п. В DjVu также можно использовать и сжатие данных без потерь. Так например утилита CJB2 из пакета DjVuLibre предоставляет сжатие без потерь.

В основе формата DjVu лежат несколько технологий, разработанных в AT&T Labs:

  • алгоритм отделения текста от фона на отсканированном изображении;
  • вейвлетный алгоритм сжатия фона IW44;
  • алгоритм сжатия чёрно-белых изображений JB2;
  • универсальный алгоритм сжатия ZIP;
  • алгоритм распаковки «по запросу»;
  • алгоритм «маскировки» изображений.

Текстовое представление изображений DjVu

Формат DjVu предусматривает наличие текстового слоя, который содержит текст со страницы. (Используется для поиска и лёгкого копирования текста при работе с ним). В случае, если текстовый слой недоступен, единственный метод получения текста — выполнение оптического распознавания в сторонних программах.

Лицензионная информация

AT&T продали технологию компании LizardTech, которая пыталась использовать её в своих коммерческих интересах, но благодаря открытости формата[2] для создания и просмотра документов DjVu существует свободное программное обеспечение, доступное для различных платформ. 1 июля 2008 года LizardTech передал менеджмент DjVu родительской компании Celartem[3], а 10 июня 2009 года Celartem передал права на технологию DjVu компании Caminova[4].

Существует открытая публикуемая под лицензией GNU GPL библиотека DjVuLibre и программы-кодировщики и просмотрщики на ней.

Программы для работы с DjVu

Просмотр

Для Windows

Для Linux

Для Android

Редактирование

См. также

Примечания

  1. DjVu File Format Versions. Разработчики DjVu (июль 2006). Проверено 16 января 2010.
  2. Лицензия
  3. Пресс-релиз LizardTech
  4. Пресс-релиз LizardTech

Ссылки

  • DJVU — формат для электронных библиотек. Алгоритмы и достоинства, программы и использование, руководства пользователя.
  • Дежавю или DjVu: ликбез. Сборник статей о технологии DjVu.
  • DjVu.org Англоязычный портал DjVu-сообщества.

Tags: Djvu где используется, djvu для мак ос, djvu reader скачать бесплатно, djvu на ipad, djvu распознать текст, скачать бесплатно программу djvu на русском языке для windows 8.