Устранение фона бумаги
Устранение фона бумаги в отсканированных изображениях — операция по приведению ярких цветов изображения (фактуры бумаги) к белому цвету.
Настройка уровней[править]
Операцию можно произвести путем обрезания гистограммы в графических редакторах, таких как GIMP или Adobe Photoshop.
Переход в режим градаций серого[править]
В бесплатном редакторе GIMP для этого требуется активировать пункты меню Изображение-Режим-Градации серого (или RGB, если изображение цветное). То же самое следует сделать и в Фотошопе. В англоязычном варианте интерфейса этот режим называется Grayscale.
Функция работы с уровнями[править]
После этого следует выбрать пункт главного меню Цвет-Уровни (аналогичное действие в Photoshop — нажать Ctrl-L или выбрать пункт меню «Levels»).
Если эта функция не вызывается, проверьте перешли ли вы в режим градаций серого (см. пункт выше).
В открывшемся окне настроек уровней нужно сдвигать белый и черный треугольники под шкалой «Уровни на входе», чтобы исчезли ненужные градации в белой области (фон бумаги), а чернила стали чёрными:
Бинаризация[править]
Помимо обрезания гистограммы, для устранения фона бумаги можно использовать бинаризацию (пункт меню Цвет — Порог в GIMP) или аналоги в других программах. Однако, этот режим дает более грубый двухцветный вариант страницы, где печатные символы и наклонные линии представлены без серых полутонов, «квадратными ступеньками».
Гамма-коррекция[править]
Другой способ «отбелить» бумагу на книжных сканах — отрегулировать гамма-коррекцию и контраст. Этот способ не обрезает яркие составляющие снимка, а лишь переводит их близко к белой области (какие-то следы от фактуры бумаги все равно остаются).
Понижение гамма-коррекции при соответствующей регулировке контраста позволяет, напротив, проявить на бумаге скрытые малозаметные надписи, просвечивающий текст и т. д.
Если есть возможность выполнить обрезание гистограммы (отредактировать уровни), то качество обработки получится лучшим (проблема состоит в том, что в той же Irfan View гистограмму можно только просмотреть, но нельзя отредактировать). Кстати, серый треугольный движок посередине в настройке гистограммы в GIMP и Photoshop — это гамма-коррекция и есть: иногда нужно подкрутить еще и её.
Scan Tailor[править]
Массовая обработка отсканированных изображений книжных страниц может также производиться программой Scan Tailor (бесплатная) или аналогами, где фон бумаги может быть обесцвечен в автоматическом режиме на заключительном этапе обработки страниц. При этом скан переводится в режим 600 DPI, где ступенчатость двуцветного текста малозаметна, а на специальной закладке можно выделить области, которые не подлежат бинаризации (например, фотографии в книге).
Устранение фона бумаги в пакетном режиме[править]
Автор этой статьи (X-romix) написал программу, которая работает из командной строки и переводит светлые пиксели в белый цвет, а темные пиксели — в черный цвет (уровни, что считать светлым и темным — настраиваются при помощи параметров командной строки). Таким образом, программа позволяет «отбелить» бумагу и сделать чёрными чернила в книжных сканах, причем в автоматическом режиме обработать сразу большое количество страниц (результат нужно просмотреть, чтобы плохо пропечатанные буквы не исчезли). Программа с исходным текстом на Delphi 7 приведена по ссылке.[1]