
Сколько информации (в байтах) будет "весить" книга, содержащая 250 страниц с размером текста на
странице 100 символов?

Ответы на вопрос

Відповідь:
Adobe Photoshop (7.0 и выше) – графический редактор, Document Express Editor (6.0.1, DEE) – djvu-редактор, Abbyy FineReader (7.0 и выше) – программа распознавания изображений – коммерческие;
ScanKromsator (v. 5.92, СканКромсатор, СК) – программа обработки сканированных изображений (сканов), Djvu Small – djvu-кодер, DjvuOCR – редактор OCR-слоя в djvu-книгах, Djvu Bookmarker (1.0.15) – редактор оглавлений в djvu-книгах, IrfanView – графический просмотрщик с функциями редактирования изображений – бесплатные.
Материал: страницы с черно-белыми (ч/б), полутоновыми и/или цветными (далее – полутоновыми/цветными) иллюстрациями.
Описание. В данном руководстве сделана попытка проинструктировать весь процесс по созданию полноценной djvu-книги, начиная с обработки отсканированных изображений (сканов) страниц и заканчивая созданием электронного оглавления. Рассматриваются вопросы разделения текстовой и графической составляющих посредством программы ScanKromsator, обработки, djvu-кодирования и внедрения иллюстраций в готовый djvu-файл с текстами согласно разработанной методики вклейки иллюстраций (МВИ, метод разделенного кодирования). Данная методика позволяет добиться качественного сохранения иллюстративного материала и компактности djvu-книги за счет оптимального кодирования текстовой и графической составляющих обрабатываемых книг (журналов). Подробно ознакомиться с понятиями, методами djvu-кодирования, а также МВИ можно на сайте http://sourceforge.net [1].
В общих чертах суть создания качественного и компактного djvu-файла выражается в раздельном кодировании (сжатии) одноцветного текста, рисунков И растровых иллюстраций (полутоновых, цветных) соответствующими алгоритмами. При этом информация об одноцветном тексте и рисунках заносится в слои mask и foreground, а информация о растровых изображениях – в слой background. В каждом слое информация максимально сжата благодаря разработанным и усовершенствованным алгоритмам. На сегодняшний момент проблема корректного автоматизированного разделения текста и изображений и их кодирования в соответствующих слоях djvu-книги полностью не решена. Согласно МВИ предлагается использовать ручное разделение слоя текста и иллюстраций с последующей обработкой и вставкой иллюстраций в слой background. Одна из сопутствующих проблем – наличие растра в изображениях и выбор метода его удаления. Однозначного решения в выборе доступного и качественного метода удаления растра пока нет, существующие методы размытия растра требуют визуального контроля и смекалки в подборе оптимальных параметров и последовательности действий. Но об этом позже.
Приведу средние размеры получаемых по МВИ djvu-страниц в зависимости от типа содержания: текста, ч/б рисунков, полутоновых или цветных иллюстраций (см. табл.). В расчетах условно предполагается, что текст, рисунки и иллюстрации занимают равные части страницы, например 50% текста+50% ч/б рисунков=15-35 Кб. Отмечу, что размер кодированных иллюстраций во многом зависит как от характеристики цветовой палитры, так и параметров применяемого размывания.
Пояснення:



Для расчета веса книги нам нужно узнать сколько символов в ней содержится и сколько байт занимает один символ.
Количество символов в книге можно получить, умножив количество страниц на количество символов на странице:
250 страниц * 100 символов = 25 000 символов.
Следующим шагом нужно узнать, сколько байт занимает один символ. Это может зависеть от кодировки, используемой для хранения текста. Однако, для примера, давайте рассмотрим кодировку UTF-8, которая является одной из самых распространенных.
В кодировке UTF-8 символы могут занимать разное количество байт, в зависимости от их кодового значения. Однако, для большинства символов, используемых в тексте, каждый символ занимает 1 байт.
Таким образом, общий вес книги в байтах будет равен количеству символов:
25 000 символов * 1 байт = 25 000 байт.
Таким образом, книга, содержащая 250 страниц с размером текста на странице 100 символов, будет "весить" 25 000 байт.


Похожие вопросы
Топ вопросов за вчера в категории Информатика
Последние заданные вопросы в категории Информатика
-
Математика
-
Литература
-
Алгебра
-
Русский язык
-
Геометрия
-
Английский язык
-
Химия
-
Физика
-
Биология
-
Другие предметы
-
История
-
Обществознание
-
Окружающий мир
-
География
-
Українська мова
-
Информатика
-
Українська література
-
Қазақ тiлi
-
Экономика
-
Музыка
-
Право
-
Беларуская мова
-
Французский язык
-
Немецкий язык
-
МХК
-
ОБЖ
-
Психология
-
Физкультура и спорт
-
Астрономия
-
Кыргыз тили
-
Оʻzbek tili