В СФУ создали систему, быстро отыскивающую людей в большом видеопотоке
Новую модель хранения видеоданных, позволяющую быстро извлечь нужную информацию из большого массива данных, разработали ученые Института космических и информационных технологий Сибирского федерального университета (СФУ) в содружестве с коллегами из Университета Утара (Малайзия), 20 августа сообщает пресс-служба СФУ.
Инфраструктура новой системы определяет, как и где хранить данные, доступ к ним, а также позволяет оперативно найти нужный фрагмент видеозаписи с камер наблюдения общественных и жилых объектов. Причем модель определит, были ли попытки скрыть или изменить некоторые участки видеозаписи.
Существуют системы видеонаблюдения, где данные идут постоянным потоком. Ранее информацию с таких камер записывали на жестких дисках, однако в настоящее время используются облачные системы хранения. При этом возникает вопрос, как отыскать нужный фрагмент в огромном массиве данных. Например, выделить на потоковом видео кадры с определенным человеком.
Соавтор исследования, доцент кафедры информационных систем и базовой кафедры интеллектуальных систем управления СФУ Екатерина Чжан пояснила:
«Мы говорим в первую очередь об информации, которая записывается, например, с внешних камер видеонаблюдения: это банки, медицинские центры, школы и т. д. Везде, где есть видеофиксация, хранятся гигантские объемы видеоматериалов. Наша исследовательская задача состоит в том, чтобы помочь при поступившем запросе — например, найти определенного человека, — обнаружить фрагменты, где этот человек фигурирует».
Способ, который предложили ученые, заключается в детектировании посетителей в видеопотоке. При этом кадр, где запечатлен определенный человек, сохраняется вместе с метаданными в новой базе данных, а параллельно запускается процесс хэширования (hash function — функция свертки, преобразующая массив входных данных произвольного размера в выходную битовую строку определенного размера в соответствии с определенным алгоритмом).
«Хэш-функция, — продолжила пояснения Екатерина Чжан, — это такой инструмент, который позволяет создать „цифровой отпечаток“ данных. Каждому кадру из видеопотока соответствует индивидуальное значение хэш-функции. Поэтому, если в будущем будет внесено какое-то изменение в видео, значения хэш-функций не совпадет и укажет на вмешательство».
При этом, когда в видеопотоке определяется человек, то его изображение вычленяется и сохраняется в таблице с некоторыми данными. При этом каждому его появлению соответствует таблица с метаданными.
Поскольку современные нарушители закона могут вырезать или заменить определенные фрагменты видео с камер видеонаблюдения, то в случае использования модели возникает возможность определить, были ли какие-либо изменения в записи, — значения хэш-функций становятся как бы «цифровыми отпечатками» события.
Аналогично, когда кто-то перепишет в облаке данные, но при этом существуют исходные значения хэш-функций, то при сравнении значения хэш-функций для имеющегося видео и того, что было записано в базу данных, эти значения не совпадут.
«Если, например, вскрыли автомобиль и украли оттуда какое-то имущество, полиция будет изучать видео, и, чтобы определить, не было ли изменено это видео, правоохранители смогут обратиться к нашей базе данных, где хранится „отпечаток“ этого видео. Сравнив два „отпечатка“ — существующего и изначального видео, сотрудники органов правопорядка сделают выводы, имело ли место вмешательство — „убрали“ с него человека, например, или нет», — рассказала Екатерина Чжан.
Такую модель хранения видеоданных можно применить, например, в системе умного города, где находится большое количество камер видеонаблюдения, и возникают задачи быстрого поиска каких-либо объектов, считают разработчики.