В ПНИПУ до 95% повысили точность опознавания действий человека с видеокамер
Математическую модель описания действий человека, представленных видеоинформацией с камер наблюдения, которая позволяет повысить точность их распознавания с помощью нейронных сетей до 95%, разработали ученые Пермского национального исследовательского политехнического университета (ПНИПУ), 20 декабря сообщает пресс-служба вуза.
В настоящее время камеры видеонаблюдения часто устанавливаются в местах большого скопления людей, торговых центрах, концертных залах и образовательных учреждениях, на стратегически важном промышленном производстве и в других местах.
Такие системы видеонаблюдения распознают, фиксируют и классифицируют движения человека, попавшего в ее видеообъектив. В зависимости от характера действий объекта и установленных ограничений они формируют ответную реакцию. Например, если эти действия представляют опасность, то могут быть инициированы меры предотвращения чрезвычайных происшествий.
При этом адекватность и своевременность реакции системы на такой сигнал в большой степени зависят от точности и скорости распознавания ситуаций.
Алгоритм распознавания действий человека, представленных камерой видеонаблюдения, включает в себя выделение его как отдельный объект, определение положений тела человека и последовательности совершаемых им движений для каждого фиксируемого момента.
Причем системе необходимо хранить все эти данные для последующей обработки и классификации действий. Выполнять такую работу помогают математические модели, которые бывают разных типов. Модели описания по набору кадров, в которых действие в каждом кадре определяется отдельно, часто некорректно анализируют информацию, когда в поле зрения камеры находятся другие люди и предметы.
Таким недостатком не обладают векторные модели, которые определяют движения по изменению последовательности координат ключевых точек скелета человека. Для повышения точности эти точки группируют, что позволяет алгоритму эффективно находить и обрабатывать информацию о положении различных частей тела.
Для точного распознавания объекта в пространстве данные подвергают процедуре нормализации, когда пиксельные ключевые точки получают реальные значения координат. Однако существующие способы не учитывают большую вариативность поворотов и положений человека в пространстве.
При этом одинаковые движения, но выполненные в ином положении относительно камеры, вероятнее всего, будут распознаны как разные. Это затрудняет работу системы, приводя к увеличению объема памяти устройства и усложнению алгоритмов расчета, что требует больше времени и финансовых ресурсов.
Для ускорения обработки поступающего с камер видеоматериала и повышения точности определения движений объекта ученые Пермского политеха, проанализировав существующие модели распознавания скелетов людей и используемые алгоритмы обработки, предложили внедрить в систему видеонаблюдения оригинальные модель и технологию нормализации видеоизображений.
Аспирант кафедры «Информационные технологии и автоматизированные системы» ПНИПУ Александр Князев рассказал о сути разработки:
«Мы создали упрощенную модель, в которой отсутствует лишняя для наших исследований информация, например, о положении пальцев рук. Зачастую их местонахождение зашумлено, но при этом на обработку также уходит время, усложняется процесс распознавания действий. Ключевыми точками в нашей модели стали глаза, плечи, бедра, локти, кисти, колени и ступни. Также мы предложили алгоритм преобразования информации о движении скелета человека, который распознает действия, сравнивая для большей точности данные с разных камер или под разными углами».
Рассказ Князева дополнил заведующий кафедрой «Информационные технологии и автоматизированные системы» ПНИПУ, доктор экономических наук Рустам Файзрахманов: «Эксперименты показали, что наша модель и технология нормализации видеоизображений позволили достичь точности распознавания в 95%. А применение первичных данных обеспечивало лишь 35% точности».
Результаты исследования предложенной модели были представлены в статье «Векторная модель и алгоритм нормализации для компьютерного анализа действий человека по кадрам с камер видеонаблюдения», опубликованной в журнале «Вестник ПНИПУ. Электротехника, информационные технологии, системы управления» № 3 за 2024 год.
Модель ученых Пермского политеха, улучшая точность распознавания действий человека, фиксируемых камерами видеонаблюдения, повысит эффективность мониторинга ситуации на контролируемых объектах и тем самым безопасность на производственных предприятиях, охраняемых территориях и в общественных местах, отмечается в сообщении. Интерес к внедрению новой технологии уже проявили несколько промышленных компаний.