Вернуться к разделу "Создание книг в электронном виде из бумажных книг".


Материалы по сканированию и оцифровке бумажных книг

(Раздел ещё будет дорабатываться)

В этом разделе будут постепенно собираться ссылки, имеющие отношение к первичному этапу создания электронных версий бумажных книг - получение и обработка сканов (или цифровых фотоснимков) бумажных книг.


I. Основные материалы

Разнообразные инструкциии по созданию сканированных книг:

Мои статьи:

Создание электронных книг в формате DjVu  (Простое и технологичное описание для чайников. Уже слегка устарела. Зато очень подробна и предельно недвусмысленна. Читать её нужно внимательно, не ленясь :) - и тогда всё будет понятно. Приведён полный список всех нужных программ с указанием, откуда их скачать).

Что такое DPI и ресемплинг  (Очень простое описание с примерами для чайников - прочитать всем обязательно!).

Устранение кривизны строк текста в Book Restorer 4.1  (Простое пошаговое описание для чайников).

Ужирнение трудночитаемого текста в СканКромсаторе  (Простое пошаговое описание для чайников с примерами).

Рекомендации по сканированию книг от botolph  (одна из самых ранних публикаций - есть устаревшие моменты).

Рекомендации по сканированию и дальнейшей обработке научных и прочих книг  (castleofmusic (старое) / pkfrance).

Как подготовить и упаковать книгу. Пособие для начинающих.  Александр Лушников. 17.05.2003)

Инструкция по преобразованию книг

Пособие для самостоятельного изготовления djvu книги

Рекомендации по переводу книг из бумаги в DjVu-документ  (© Роман Ефимов)

Как почистить сканы книг?  (© Иван Сторожев )

Часть 1     Часть 2     Часть 3     Все 3 части в CHM   (177 КБ)


Работа с цифровым фотоаппаратом:

Съемка текстов фотоаппаратом   (Сделанная мною выдержка из хелпа к ABBYY FineReader Professional v8.0).

Оцифровка книг с помощью цифрового фотоаппарата   PDF-вариант (183 КБ)   (© Кирилл Шубин)

Пример некачественного цифроснимка  (PDF 1,49 МБ)  (хорошо демонстрирует проблемы оцифровки).

Хакеры взломали одноразовый фотоаппарат  (довольно интересно)


Документация по СканКромсатору:

Три способа получить нужную тебе научно-техническую книгу в электронном виде с минимальными затратами. (Статья об использовании Кромсатора. Автор: vadimir).

Пособие по Кромсатору   (Составленное мною (со слов автора) описание работы с программой СканКромсатор).

Полезные советы от bolega по работе с Кромсатором. (Материалы из форумов, не вошедшие в Пособие. Моя разработка).

СканКромсатор v5.6A. Что нового (What's new). (Автор: bolega).

СканКромсатор v1.0b. Руководство пользователя.  (Вариант в формате PDF 368 КБ). (Автор: bolega).  (Сильно устаревший официальный хелп к первой версии программы).

Примечание: Эти материалы вместе с данным Пособием содержат 95-98% всей ранее известной информации по Кромсатору.


Выбор сканера:

Покупать следует только CCD-сканеры, а не CIS-сканеры (у последних недостаточно хорошая цветопередача и совсем «никакая» глубина резкости).

Как правильно выбрать сканер

Вокруг сканера

Сканер? Это не дорого!

Выбор и покупка «домашнего» сканера

Недорогие планшетные сканеры со слайд-модулем


Литература:

1. Айриг С., Айриг Э. «Сканирование: профессиональный подход».

Книга немного устаревшая (в плане описания сканеров) и написана не самым лучшим языком. Полезна тем, что раскрывает новичкам всякие общие моменты и понятия относительно процесса сканирования книг. Эта книга представляет интерес лишь для полных новичков в деле сканирования книг.

Вариант 1  (27 MB) Формат - PDF (RUS)

Вариант 2  (2,48 МБ) Формат - CHM (RUS)

Вариант 3   (HTM - выложена постранично онлайн)

Вариант 4   (3,92 МБ) Формат - HTM (RUS)

2. Айриг С., Айриг Э. «Подготовка цифровых изображений для печати».

В отличие от предыдущей книги, эта книга будет полезна не только новичкам, но также и тем, кто давно сканирует книги, но хотел бы знать больше о базовых понятиях из области обработки получаемых сканов - таких, как.коррекция изображения, улучшение чёткости, муар, треппинг, фильтры и т.д.

Вариант 1  (26 MB) Формат - PDF (RUS)

Вариант 2  (2,29 МБ) Формат - CHM (RUS)

Вариант 3 (HTM - выложена постранично онлайн)

3. Дэн Маргулис. Photoshop 6 для профессионалов. Руководство по цветокоррекции.

Это очень серьёзная книга, в чём-то напоминает предыдущую. Вряд ли есть смысл её читать всем подряд, скорее, лишь единичным суперпрофессионалам. Эта книга - более для цветных полиграфистов, чем для книгосканировщиков. Содержит множество цветных картинок, подробно иллюстрирующих разные сложные случаи обработки изображений.

Описание (Это ИМЕННО оно).

Вариант 1 (42,9 МБ) Формат - PDF-векторный (RUS)   Зеркало

Вариант 2 (10,3 МБ) Формат - DjVu 300 dpi OCR (RUS) (получен мною путём прямой конвертации Pdf -> DjVu варианта 1. Имеет оглавление с работающими гиперссылками).


Разное:

Закладки (Bookmarks, Outlines) в Pdf и DjVu файлах  (Rar 1,09 МБ)   (© ging) "Закладки" - это дерево-содержание. Данный пакет содержит небольшие программы. Работа с закладками в DjVu-файлах освещена лишь частично, зато в Pdf-файлах - очень подробно.

Lib.Ru: О копирайтах и др.

Домен – читальня

Похитители книг

Научная литература в России и за рубежом  (© А.Д. Полянин. 02.2001)

Пример сложной обработки изображения (снимки Венеры)


II. Дополнительные материалы

В этом разделе собрана самая общая информация, не имеющая непосредственного отношения к сканированию и оцифровке бумажных книг. Если у Вас модемный доступ в Интернет - читать все эти материалы не надо.

Учебники по Adobe PhotoShop:

Уроки Фотошоп

Photoshop 4-5. Учебный курс

Анатомия Adobe PhotoShop

Иллюстрированный самоучитель по Adobe Photoshop CS 8

Учебник по Adobe PhotoShop 7.0


Специальные сканеры:

Книжные сканеры   Ещё

Сканирующий робот

Автоматический книжный сканер   Подробнее

ATIZ BookDrive

ATIZ BookDrive поможет сканировать книги

Сканер Atiz BookDrive умеет переворачивать книжные страницы

Подробности

Крупная фотография ATIZ BookDrive

Сайт компании-производителя

4DigitalBooks - Automatic book scanning solution.


Материалы для разработчика:

The FreeImage Project - FreeImage is an Open Source library project for developers who would like to support popular graphics image formats like PNG, BMP, JPEG, TIFF and others as needed by today's multimedia applications. FreeImage is easy to use, fast, multithreading safe, compatible with all 32-bit versions of Windows, and cross-platform (works both with Linux and Mac OS X).

Leptonica - This site contains well-tested C code for some basic image processing operations, along with a description of the functions and some design methods. A full set of affine transformations (translation, shear, rotation, scaling) on images of all depths is included, with the exception that some of the scaling methods do not work at all depths. There are also implementations of binary morphology, grayscale morphology, convolution and rank order filters, and applications such as jbig2 image processing and color quantization.

SIP - Scilab Image Processing Homepage - SIP stands for Scilab Image Processing toolbox. SIP intends to do imaging tasks such as filtering, blurring, edge detection, thresholding, histogram manipulation, segmentation, mathematical morphology, color image processing, etc.
These operations are useful for problem solving in real-world applications ranging from car motion planning to automatic diagnosis of medical images.
SIP is meant to be a complete, useful, and FREE digital image processing toolbox for Scilab.

GOCR - GOCR is an OCR (Optical Character Recognition) program, developed under the GNU Public License. It converts scanned images of text back to text files. Joerg Schulenburg started the program, and now leads a team of developers.
GOCR can be used with different front-ends, which makes it very easy to port to different OSes and architectures. It can open many different image formats, and its quality have been improving in a daily basis.

Clara OCR - free OCR system.

restoreInpaint - restoreInpaint is a state of the art project about making 8 or 16bit depth images "better".

unpaper 0.2 - unpaper is a post-processing tool for scanned sheets of paper, especially for book pages that have been scanned from previously created photocopies. The main purpose is to make scanned book pages better readable on screen after conversion to PDF. Additionally, unpaper might be useful to enhance the quality of scanned pages before performing optical character recognition (OCR).


Цветное сканирование:

В этом разделе приведены ссылки на статьи полиграфистов. То есть эти материалы не имеют никакого отношения к созданию DjVu-книг и приведены тут просто на всякий случай. Полиграфисты - это те, кто сканирует цветные картинки и делает из них рекламные буклеты. Исторически полиграфисты появились гораздо раньше книгосканировщиков.

Если Вы сидите на модеме и у Вас малый трафик - читать все эти статьи не надо (!!!)

Scaners.Ru | Статьи и публикации о сканерах и сканировании

Цветокоррекция во время сканирования

Техника сканирования и основы коррекции изображений

Теория и практика сканирования

Сканирование — это так просто...

Техника сканирования изображений (при желаниии, отсканировать можно что угодно... :) )

Руководства по изготовлению сканов от Jenz

Скан-клуб

Автоматическая коррекция изображений мифы и реальность

Сканирование текста и фотографий

Если враг не сдаётся…

Основы сканирования изображений

Техника сканирования (советы опытных)

Робоскоп


Отдых:

Олимпиада Турин-2006 - Видеоклипы выступлений российских фигуристов - придают, на мой взгляд, заряд эмоционально-психической энергии. Посмотрите эти видеоклипы (полезно до и после сканирования - снимает усталость как рукой :)).


Автор: monday2000.

31 марта 2006 г.

E-Mail  (monday2000 [at] yandex.ru)

Сайт создан в системе uCoz