Распознавание дискретных визуальных образов
Рассматривается подход к распознаванию геометрических фигур
(изображений), образованных конечными множествами точек на плоскости
или в пространстве.Подход существенным образом опирается на введение
внутренней кодировки фигур, инвариантной к аффинным их преобразованиям.
В плоском и объемном случаях внутренний код фигур вводится так.
Нумеруются точки фигуры; с учетом ее размерности рассматривается
множество всех симплексов, образованных точками фигуры; для каждого
симплекса вычисляется мера. Код фигуры образует множество всех троек,
состоящих из двух симплексов и числа, являющегося отношением их
ненулевых мер.
Для каждой из размерностей показано, что фигуры с точностью до
перенумерации их точек имеют один и тот же код тогда и только тогда,
когда они аффинно эквивалентны.
Сравнение (и распознавание) произвольных фигур А и В основывается
на следующем. Порождаются множества А* и В* всех фигур, получаемых
из А и В преобразованиями из некоторого класса (в общем случае
аффинными). Рассматривается множество величин r(A`,B`), где A`из А*,
B`из В*, являющихся расстоянием между множествами A`и B`(расстояние
Хаусдорфа). Показывается, что минимум на этом множестве достигается
на конечном его подмножестве, что и позволяет его вычислить. Этот
минимум и служит мерой сходства и различия фигур.
Рассмотрено восстановление объемных фигур по их плоским проекциям
(моделирование стереовосприятия).
К настоящему времени имеются две компьютерные реализации подхода:
по распознаванию и стереовосприятию дискретных образов.
Руководитель группы исследований по распознаванию визуальных образов –
д.ф.-м.н. Козлов Вадим Никитович
|