ВЛИЯНИЕ ПАРАЛЛАКСА НА РАСПОЗНАВАНИЕ ПЕЧАТНЫХ БУКВ ОПТИКОЭЛЕКТРОННОЙ КОГЕРЕНТНОЙ СИСТЕМЫ
М.Илиева, Р.Илиева, Г.Минчев, Х.Пехливанов, Т.Божков
НРБ
В работе исследовано влияние параллакса на распознавание печатных букв в оптикоэлектронной системе. Показано, что в интервале отклонений ±10° нет надобности изменений алгоритма распознавания в системе.
В процессе распознавания образов необходимым этапом является выделение и формирование признаков изображения, которые обрабатываются анализирующими системами /1,2/.
В предыдущей работе авторов под названием "Оптикоэлектронная когерентная система распознавания печатных букв" информативные признаки ищутся путем исследования спектров разных сегментов входных объектов - печатные буквы, которые выделяются через сканирование прямоугольной щели. Основным соображением для этого исследования является различие в дифракционных картинах (по энергии и пространственному распределению) для связи разных типов в контурах объектов.
При сканировании букв измеряется энергия пространственного спектра отдельных сегментов как функция шага сканирования. Из полученных экспериментально энергетических кривых для каждой буквы определяется набор информативных признаков, однозначно соответствующих характерным элементам в контурах объектов.
С целью повышения чувствительности измерения слабых изменений в контуре мы использовали оптическую маску для подавления нулевых и низких пространственных частот, которые являются высокоэнергетическими и малоинформативными.
В результате выделены следующие признаки.
1. Количество энергетических максимумов, которых бывает
1, 2 или 3.
2. Градиент максимума.
3. Полуширина максимума.
4. Отношение максимум/минимум.
По этим признакам буквы разделены на 4 группы.
Во время эксперимента отмечена зависимость отклика системы от вращения объектной плоскости относительно установленной входной плоскости. В некоторых случаях это привело бы к ошибке в распознававшей системе. Поэтому мы поставили себе задачу изучить эту "параллаксную" зависимость с целью оценить возможные ошибки и сделать систему инвариантной относительно таких вращении
объектной плоскости.
Результаты позволят нам оценить, насколько надежна наша система распознавания.
Исследования показывают, что случайные ротационные отклонения от заданной входной плоскости приводят к перемещению локальных экстремумов и изменению параметра 4.
Эксперименты проведены на опытной установке, показанной на рис.1. Объекты (негативные изображения печатных букв) освещались плоской когерентной волной, формированной гелий-неоновым лазером и коллимирующей системой Л
0. Линза Л1 осуществляет Фурье-преобразования сегментами входного объекта (ОБ), которые формируются путем сканирования прямоугольной щели П1. Этот оптический преобразователь связан с фотоэлектронным преобразователем, который состоит из оптической маски М для подавления низких частот и фотоприемника ФП для измерения энергии прошедших через маску высоких пространственных частот разложения.
Экспериментальные кривые, полученные для буквы "А", например, приведены на рис.2. Они показывают амплитуды сигнала как функции шагов сканирования. Они аналогичны вышеупомянутой работе. При этом параметром является угол α (0°, ±20°). Экспериментальным способом обнаружено, что оптимальный шаг(в данном масштабе)входных объектов равняется 200 микрометра. Ширина сканирующей щели тоже равняется 200 микрометра.
Из приложенных экспериментальных кривых следует,
Рис.2. Экспериментальные кривые для буквы "А".
1. Вращение плоскости входного объекта в интервале (0°, ±20°) приводит к перемещению локальных максимумов на ширине одного шага, при котором оба максимума приближаются относительно друг друга.
2. Отношение максимум/минимум для вращения в интервале (0°,
±10°) сохраняет допустимые для распознавания изменения.
3. Полуширина максимумов для ротации в интервале (0°, 10°) сохраняет допустимые для распознавания изменения.
4. В интервале (0°, 20°) отношение максимум/минимум принимает недопустимые для распознавания стоимости.
5. Полуширина максимумов в интервале (10°, 20°) сохраняет
заданные значения.
Практические исследования ротации объекта во входной плоскости вокруг оси параллельной сканирующей щели в интервале углов (±10°) показывают, что нет надобности перемены алгоритма распознавания.
Если понадобится распознавать объекты, ротация которых находится в интервале больше ±10°, надо ввести пятый параметр, отсчитывающий расстояние шагов между максимумами.
Это заключение относится ко всем буквам, у которых два и более максимумов. На практике буквы, имеющие один локальный максимум, не имеют отношение к ротации в интервале ±20°.
Сделанное исследование делает возможным аппаратное решение, при котором требования точности ротационного позиционирования входных объектов ослабляется до ±5°. Это вполне возможно для механических систем позиционирования входного объекта.
Л и т е р а т у р а
1. К.Престон. Когерентные оптические вычислительные машины, "Мир", М., 1974.
2. Г.И.Василенко. Голографическое опознавание образов, "Сов.радио", 1977.