Пятница, 2024-03-29, 11:24 AM
Главная Регистрация Вход
Приветствую Вас неизвестный прохожий | RSS
Главная » Статьи » О кино, музыке, здоровье, технике, интересных фактах.

Распознавание лиц для интеллектуальных сред(часть2)
Алекс (Сэнди) Пентланд,Танзим Чаудхари

Среди первых реализаций распознавания лиц наиболее известна, по-видимому, система Теуво Коонена из Технологического университета Хельсинки [4]. Он продемонстрировал, что распознавание выровненных и нормализованных изображений можно выполнить с помощью простой нейронной сети. Сеть, которую использовал Коонен, вычисляла описание лица, аппроксимируя собственные вектора матрицы автокорреляции изображения. Эти собственные вектора (eigenvector) получили название «собственные лица» (eigenface).

Однако система Коонена не нашла практического применения, поскольку базировалась на точном выравнивании и нормализации. В последующие годы предпринимались многочисленные попытки реализации схем распознавания лиц с использованием различных методов нейронных сетей. Удалось сделать несколько удачных систем, работавших с небольшими базами данных выровненных изображений. Но не было ни одной успешной реализации для более жизненной ситуации – крупномасштабной базы данных, в которой расположение и размеры лиц неизвестны.

Затем Майкл Кирби и Лоуренс Сирович из Университита Брауна [5] ввели алгебраическую операцию, которая упростила прямое вычисление «собственных лиц». Кроме того, они показали, что для аккуратного кодирования тщательно выровненных и нормализованных изображений нужно не более 100 собственных лиц. Мэтью Турк и Алекс Пентланд из Массачусетского технологического института [6] продемонстрировали, что остаточную погрешность, которая возникает при кодировании с помощью собственных лиц, можно использовать для обнаружения лиц в неупорядоченном естественном изображении и определения точного расположения и размера лица. Затем они показали, что объединение этого метода обнаружения и локализации лиц с методом распознавания собственных лиц обеспечивает надежное распознавание лиц в реальном времени, при этом на среду распознавания накладываются минимальные ограничения. Когда стало очевидно, что комбинация простых методов распознавания в реальном времени позволяет создать весьма эффективную систему, интерес к распознаванию лиц стремительно вырос.
Современные разработки

К 1993 году было заявлено о существовании нескольких алгоритмов, правильно решающих задачу в среде с минимальным числом ограничений. Чтобы выявить их реальный потенциал, агентство DARPA и Исследовательская лаборатория армии США разработали програму Feret (face recognition technology). Цель этой программы – оценить эффективность предложенных алгоритмов и стимулировать развитие лучших из них.

В ходе реализации программы Feret три алгоритма продемонстрировали самый высокий уровень точности распознавания для больших баз данных (1200 человек) в наиболее сложных для распознавания условиях тестирования. Это алгоритм, разработанный в Университете Южной Калифорнии [8] (рис. 1); алгоритм Университета штата Мэриленд [9]; и алгоритм, созданный в Media Laboratory Массачусетского технологического института [10] (рис. 2).
Рис. 1. Система Университета Южной Калифорнии распознает лица путем гибкого сравнения с графом (elastic graph matching).

Чтобы получить общее представление лица, так называемую адаптированную к объекту решетку (object-adapted grid), система по 70 моделям лица создает обобщенный граф лица (face bunch graph) (a). Затем (b) сравнивает заданное изображение с обобщенным графом и ищет отправные точки. С помощью гибкого сравнения создается граф изображения, и затем для опознания лица полученное изображение сравнивается с лицами из базы данных.

1 – адаптированная к объекту решетка (лицо)


Рис. 2. В основе системы Массачусетского технологического института, которая использует для распознавания лиц метод собственных лиц, лежат моделирование наружности (a) и моделирование отличий (b).

(а)
Система формирует базу данных изображений лиц.
Анализ главных компонентов (principal component analysis — PCA) изображений лиц позволяет создать множество «собственных лиц». Для программирования большой базы лиц достаточно порядка 100 собственных векторов.
Затем система представляет каждое изображение лица как линейную комбинацию собственных лиц.
Поступающее изображение система аппроксимирует как комбинацию собственных лиц. Степень различия указывает на сходство двух изображений.
(b)
Система получает множества данных Q1 и Q2, вычисляя внутриличностные отличия (сопоставляя две наружности каждого человека в множестве) и вычисляя межличностные различия (сопоставляя разных людей в множестве).
Для каждого класса выполняется РСА и создаются два множеcтва собственных лиц.
Система выводит оценку сходства между двумя изображениями, вычисляя S = P(Q||d), где d – различие между парой изображений. Если S меньше 0,5, система считает, что она имеет дело с двумя изображениями одного и того же человека.

В алгоритмах МТИ, Университета Рокфеллера и Университета штата Мэриленд используются варианты метода преобразования собственных лиц, а затем моделирование отличий. Алгоритм Университета штата Мэриленд использует линейный дискриминант, а система МТИ – квадратичный. В системе Университета Рокфеллера используется разреженный вариант преобразования собственных лиц, после которого включается в работу нейронная сеть отличий. В основе системы Университета Южной Калифорнии лежит совершенно иной подход. Сначала из изображения вычисляются струи Габора (Gabor jet), затем при помощи алгоритма поиска соответствия по графу (graph-matching algorithm) проводится гибкое сравнение описателей изображения c образцами.
Рис. 3. Разработанная в Университете Рокфеллера система для распознавания лиц использует анализ локальных признаков.

Части лица, отмеченные на изображении слева, соответствуют областям (а) рта, (b) носа, © брови, (d) щеки и (e) скулы. (Печатается с разрешения NYT Pictures).

В тестовые базы данных Feret заносились лица в различных положениях, разного размера и по-разному освещенные, похожие на фотографии для водительских удостоверений или полицейского архива. Работа всех четырех алгоритмов была близка к идеалу в том случае, если база данных включала не более 200 лиц, а изображения получались при сходных условиях. Интересно, что даже простое сравнение корреляций иногда удавалось провести с той же точностью на базе данных ровно из 200 элементов [7]. Из этого со всей очевидностью следует, что признать новый алгоритм достойным рассмотрения можно только в том случае, если он протестирован на базе данных из по крайней мере 200 человек и продемонстрировал эффективность распознавания не ниже 95% для изображений типа фотографий для удостоверений.

В более масштабных тестах программы Feret (с числом изображений не менее 1196) эффективность всех четырех алгоритмов была примерно одинаковой. В этой связи трудно или даже невозможно провести четкие различия между ними (особенно если согласовать даты тестирования). Для фронтальных изображений, сделанных в один и тот же день, приемлемая точность распознавания, как правило, составляет 95%. Для изображений, сделанных разными аппаратами и при разном освещении, точность, как правило, падает до 80%. Для изображений, сделанных с разницей в год, точность распознавания составляет примерно 50%. При этом стоит заметить, что даже 50 процентов – это более чем приемлемая точность работы системы.
Коммерческие системы и приложения

Сейчас имеется несколько коммерческих продуктов для распознавания лиц. Ряд из них базируются на алгоритмах, признанных лучшими в программе Feret; другие никак с ней не связаны. Дать окончательную оценку очень сложно, однако, похоже, три системы выбиваются в лидеры – это разработки компаний Visionic, Viisage и Miros.
В основе приложения FaceIt компании Visionic лежит алгоритм анализа локальных признаков, разработанный в Университете Рокфеллера. Одна коммерческая компания в Великобритании интегрировала FaceIt в телевизионную антикриминальную систему под названием Mandrake. Эта система ищет преступников по видеоданным, которые поступают с 144 камер, объединенных в замкнутую сеть. Когда устанавливается идентичность, система сообщает об этом офицеру безопасности.
Еще один лидер рынка систем распознавания лиц, компания Viisage, использует алгоритм, разработанный в МТИ. Коммерческие компании и властные структуры во многих американских штатах и в ряде других стран используют систему компании Viisage вместе с идентификационными удостоверениями, например, водительскими правами.
В системе распознавания лиц TrueFace компании Miros используется технология нейронных сетей, а сама система применяется в комплексе выдачи наличных денег корпорации Mr.Payroll и установлена в казино и других увеселительных заведениях многих штатов.
Новые приложения

Спектр задач, решаемых системами распознавания лиц, уже не ограничивается верификацией личности и наблюдением. Все больше приложений используют распознавание лиц как первый шаг к интерпретации действий человека, его намерений и поведения. Иначе говоря, к реализации тех возможностей, которые будут играть центральную роль в интеллектуальной среде следующего поколения. Многие действия и особенности поведения человека поддаются интерпретации только в том случае, если идентифицируются его личность и окружающие его люди. Примеры – распознавание постоянного покупателя магазина, наблюдение за поведением пациентов, интерфейсы командного управления на военных и промышленных объектах. В каждом из этих приложений информация о личности человека дает машине те базовые знания, без которых невозможна правильная интерпретация количественных показателей или результатов научных наблюдений, связанных с теми или иными действиями человека.

Источник: http://www.osp.ru/os/2000/03/177939/

Категория: О кино, музыке, здоровье, технике, интересных фактах. | Добавил: fonogramshik (2009-02-15) W
Просмотров: 2095 | Рейтинг: 0.0/0
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
Категории раздела
Околорыночное. [1]
Статьи о городе [40]
О кино, музыке, здоровье, технике, интересных фактах. [45]
Треки для туризма. [4]
Расписание транспорта. [22]
Заметки путешественника. [4]
О природе. [15]
О Краснодарском крае. [29]

Мини-чат

Наш опрос
Что вам больше всего нравится на сайтах?
Всего ответов: 168

Статистика

На проводе всего: 1
Прохожих: 1
Пользователей: 0

Форма входа

Поиск

Друзья сайта
  • Официальный блог
  • Сообщество uCoz
  • FAQ по системе
  • Инструкции для uCoz

  •  
    Copyright MyCorp © 2024