Спросить
Войти

РАСПОЗНАВАНИЕ ЛИЦ ДЛЯ СИСТЕМЫ БЕЗОПАСНОСТИ

Автор: Муса Акбота Жанаткызы

ТЕХНИЧЕСКИЕ НАУКИ

РАСПОЗНАВАНИЕ ЛИЦ ДЛЯ СИСТЕМЫ БЕЗОПАСНОСТИ Муса А.Ж.1, Алдашев А.А.2

&Муса Акбота Жанаткызы - магистрант, Институт кибернетики и информационных технологий;

2Алдашев Алишер Алмазович - доктор экономических наук, профессор, директор, Институт управления проектами им. Е. Туркебаева, Казахский национальный исследовательский технический университет им. К.И. Сатпаева,

г. Алматы, Республика Казахстан

Аннотация: в статье анализируется представление лиц на основе глубокого обучения при нескольких различных условиях, таких как нижняя и верхняя окклюзии лица, рассогласование, различные углы позы головы, изменение освещенности, дефектная локализация черт лица с использованием подходов глубокого обучения. В данной работе были использованы модели глубокого обучения на основе CNN и библиотека алгоритмов компьютерного зрения OpenCv. Поскольку эти модели показывают, что модель глубокого обучения устойчива к различным типам рассогласования и может терпеть ошибку локализации межокулярного расстояния

Введение. Система распознавания лиц стала одним из перспективных методов биометрической и также бесконтактной идентификации человека по лицу. Поскольку мир становится все более взаимосвязанным, и все наши данные оцифровываются, заменяя традиционные способы, такие как пароль или карты доступа, в связи с чем данная система является уникальным способом авторизации. Такого рода прогресс в области инноваций и технологий приводит нас к решению одной из сложных проблем современного мира: "Безопасность". Предлагаемое решение - система безопасности распознавания лиц, может обнаруживать злоумышленников в ограниченных или особо охраняемых зонах и минимизировать человеческие ошибки. Система состоит из двух частей: аппаратной части и программной части. Аппаратная часть состоит из камеры, в то время как программная часть состоит из программного обеспечения для распознавания лиц и алгоритмов распознавания лиц.

Методы: В данной работе представлен общий процесс распознавания лиц изображен на рис. 1.1. Прежде чем система сможет распознать лицо, она должна определить, есть ли лицо в данном изображении или видео. Этот вид процесса называется распознаванием лиц. Когда система обнаруживает лицо, она должна обрезать его, чтобы изолировать форму лица и передать ее в процесс распознавания.

Рис. 1.1: Конфигурация универсального распознавания лиц

Цель статьи.

Разработать эффективную и защищенную методику персональной аутентификации с использованием распознавания лиц и создать демонстрационный симулятор для того, чтобы показать эффективность системы на примере реального мира. В этом проекте реализован алгоритм, называемый гистограммой ориентированных градиентов или сокращенно HOG. После того, как мы смогли изолировать лицо от изображения, нам нужно

6

решить еще одну проблему, где лица, повернутые в разные стороны. Для этой задачи мы будем использовать алгоритмы оценки ориентиров лица. Самый простой способ идентификации лица - сравнить неизвестное лицо, которое мы обнаружили на предыдущем шаге, с остальными другими лицами в нашей базе данных. Решение этой задачи заключается в создании сверточной нейронной сети. Во время обучения сеть будет анализировать три лица одновременно: обучающее изображение лица неизвестного профиля, другое изображение лица того же профиля, изображение лица другого профиля. Затем алгоритм рассмотрит размеры каждого из этих трех изображений.

Наша задача состоит в том, чтобы обучить классификацию, которая будет принимать наши размеры изображения в качестве входных данных и даст нам, какой известный профиль в основном соответствует и выглядит похожим. Для решения этой задачи будет использован алгоритм support vector machine или SVM. Правило простой логистической регрессии выглядит следующим образом:

if у = 1, then fe (х) « 1 and QTx » О if у = 0, then fe (х) = 0 and QTx « О

Таким образом, наша гипотетическая функция будет выглядеть :h0(х) = д( 0 тх) , где z = 0тх, д (z) = 1 _z, форма использует "Сигмоидную функцию", также называемую "логистической функцией". Функция g (z) или сигмовидная функция, дает любое число в диапазоне от 0 до единицы. Эти выходные значения очень удобны для преобразования произвольно-значной функции в функцию, более подходящую для классификации. h9 говорит только о проценте вероятности того, что наш выход равен 1. Например, hx=0.9 дает нам вероятность 90% , что наш выход равен 1, как показано ниже:

he(x) = Р(х; б) = 1 -Р(х;б) Р(х;0) +Р(х;0) = 1

Функция затрат - это функция, которая отображает событие или значения одной, или нескольких переменных на действительное число. Цель выполнения функции затрат состоит в том, чтобы выяснить, что лучше всего подходит для некоторых заданных входных данных

/(б) = cost^x^) + (1 - y^)cost0{eTx®) + 0/

¿=1 7=1 where cost0(eTx) = (0,к(1 + втх)) and cost^x) = max (0,/c(l - бгх))

На самом деле, то, что эта функция вычисляет гипотетическое значение минус фактическое значение, а затем все квадратное. Наконец, мы получим одно число. И какое бы наименьшее число мы ни получили, оно лучше всего нам подходит.

ИНТЕРФЕЙС ПРИКЛАДНОГО ПРОГРАММИРОВАНИЯ

Первым шагом проекта была разработка веб-сервиса RESTful API, который сделает эту систему доступной для любого устройства через HTTP-методологии, определенные протоколом RFC 2616. Он разбивает транзакцию, чтобы создать серию различных модулей. Каждый модуль обращается к определенной базовой части транзакции. Эта модульность обеспечивает разработчикам большую гибкость. Доступные запросы: вставка, удаление, изменение, распознавание.

1. Веб-приложение

Когда back-end API будет готов, мы сможем перейти к созданию лицевой стороны приложения. Будет полезно отслеживать журнал работы системы, и выполнять операции с использованием графического интерфейса вместо команд bash.

2. Имитатор ворот

Имитатор ворот будет создан микроконтроллером Arduino. Мы должны создать сценарий, который будет записывать видео перед воротами. После того, как он обнаружил лицо, кадр этой записи должен быть отправлен на веб-сервер для распознавания. Ответ будет возвращен в виде текста JSON. Если сервер вернул какое-то имя пользователя, то оно

должно быть выведено на экран ворот и открыть вход, отправив определенную команду на микроконтроллер, оснащенный сервоприводом.

Web Server

Рис. 1.2: Блок-схема веб-сервера

Результаты.

База данных была создана и доступна программным обеспечением во время обработки входного изображения. Эта система представляет собой систему распознавания лиц в реальном времени, которая считывает видео в реальном времени с камеры, подключенной к компьютеру, на котором работает программное обеспечение, берет изображение из этого видео, обрабатывает его для обнаружения любого человеческого лица, представленного перед камерой, а затем распознает лицо с помощью набора изображений лиц в базе данных. Эта система была протестирована на нескольких случаях, и она достигла точности распознавания лиц 98% и точности распознавания лиц 90%.

Выводы и предложения.

В статье были рассмотрены некоторые исследовательские работы, которые помогли нам разработать систему. Последовательность наших действий следующая:

1) закодировать изображение с помощью алгоритма HOG для создания упрощенного изображения, чтобы найти ту часть изображения, которая выглядит как сгенерированная HOG кодирующая картинка лица;
2) выяснить положение лица в кадре изображения, упомянув конкретные точки лица. Как только мы получим эти очки, нам нужно будет централизовать этот образ глазами и ртом;
3) генерировать это централизованное Изображение через нейронную сеть, которая может измерять символы лица и сохранит его вывод в виде 128-мерного массива;
8
4) сравнивать эти размеры с другими и находить наиболее похожие с помощью машинного обучения.

Следует также отметить, что модель распознавания лиц с использованием глубокого обучения написан на языке Python, и хотя его точность превышает 90%, эта система может быть улучшена за счет использования дополнительных функций.

Список литературы

1. Francis Galton Personal identification and description: In Nature. June 21, 1888. Pp. 173-177.
2. Zaho W. Robust image-based 3D face recognition: Thesis. Ph.D. Maryland University, 1999.
3. Chellappa R., Wilson C.L. and Sirohey С. Humain and machine recognition of faces: A survey // Proc. IEEE, 1995.no. 5.vol. 83. pp. 705- 740.
4. Fromherz Т., Stucki Р., Bichsel М. A survey of face recognition // MML Technical Report, 1997. №97.01. Dept. of Computer Science, University of Zurich.
5. Riklin-Raviv Т. and Shashua А. The Quotient image: Class based recognition and synthesis under varying illumination conditions // In CVPR,1999.P. II: Pp. 566-571.
6. Edwards G.J., Cootes T.F. and Taylor C.J. Face recognition using active appearance models // In ECCV,1998.
7. Lin S.H., Kung S.Y. and Lin L.J. Face recognition/detection by probabilistic decision-based neural network // IEEE Trans. Neural Networks, 1997. Vol. 8. Pp. 114-132.
РАСПОЗНАВАНИЕ ЛИЦ ИЗВЛЕЧЕНИЕ ПРИЗНАКОВ ВЕРИФИКАЦИЯ ЛИЦ ВЫРАВНИВАНИЕ ЛИЦА СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ БУСТИНГ ГЛУБОКИЕ НЕЙРОННЫЕ СЕТИ
Другие работы в данной теме:
Контакты
Обратная связь
support@uchimsya.com
Учимся
Общая информация
Разделы
Тесты