Необходимо зарегистрироваться, чтобы получить доступ к полным текстам статей и выпусков журналов!
- Название статьи
- Аналитическое исследование проблемы биометрической идентификации и аутентификации субъектов по голосу
- Авторы
- Иниватов Даниил Павлович daniilini@mail.ru, ассистент, ФГАОУ ВО «Омский государственный технический университет», Россия, Омск
- В разделе
- ТЕХНИЧЕСКАЯ ЗАЩИТА ИНФОРМАЦИИ. Доверенная среда
- Ключевые слова
- автоматическое распознавание говорящего / глубокое обучение / спуфинг / противодействие шуму / параметры голоса диктора / биометрическая аутентификация / корпусы голосовых данных
- Год
- 2023 номер журнала 3 Страницы 28 - 38
- Индекс УДК
- 004.89
- Код EDN
- SEATMG
- Код DOI
- 10.52190/2073-2600_2023_3_28
- Финансирование
- Тип статьи
- Научная статья
- Аннотация
- Представлен обзор современных достижений и методов в области распознавания человека по голосу и биометрической идентификации. Рассматриваются ключевые задачи, с которыми сталкиваются исследователи в этой области, такие, как борьба с шумом, дрейфом голосовых характеристик, спуфингом и состязательными атаками, диаризация и др. Приводятся сравнительные таблицы результатов исследований, проведенных в этой области. Особое внимание уделяется прогрессу в разработке методов, способных улучшить точность распознавания голоса в условиях шума и переменных голосовых характеристик. В обзоре приводятся наиболее значимые результаты из достигнутых на сегодняшний день и очерчен круг актуальных (нерешенных) проблем. Отмечается, что перспективным направлением можно рассматривать реализацию различных архитектур, включающих в себя нейросетевой преобразователь биометрия-код с целью защиты биометрических шаблонов.
- Полный текст статьи
- Необходимо зарегистрироваться, чтобы получить доступ к полным текстам статей и выпусков журналов!
- Список цитируемой литературы
-
Just AI. Исследование. Рынок разговорного ИИ в России 2020-2025 [Электронный ресурс]. https://just-ai.com/blog/issledovanie-rynok-razgovornogo-ii-v-rossii-2020-2025 (дата обращения: 12.04.2023).
IBM Security. Cost of a Data Breach Report 2020 [Электронный ресурс]. Режим доступа: https://www.ibm.com/reports/data-breach-action-guide. Дата обращения: 24.07.2023.
Калашников А. О. и др. Влияние новых технологий на информационную безопасность критической информационной инфраструктуры //Информация и безопасность. - 2019. - Т. 22. №. 2. С. 156-169.
Наталья Касперская: никаких особых способов защиты биометрии нет // РИА Новости URL: https://ria.ru/20211006/kasperskaya-1753227872.html (дата обращения: 28.03.2023).
Сердюк В. Организация и технологии защиты информации: обнаружение и предотвращение информационных атак в автоматизированных систем предприятий. - Litres, 2022.
What is homomorphic encryption, and why isnt it mainstream? // keyfactor URL: https://www.keyfactor.com/blog/what-is-homomorphic-encryption/ (дата обращения: 28.03.2023).
What is homomorphic encryption? // OpenMined URL: https://blog.openmined.org/what-is-homomorphic-encryption/ (дата обращения: 28.03.2023).
Ложников П. С., Сулавко А. Е. Защищенное исполнение нейросетевых алгоритмов искусственного интеллекта: актуальность проблемы и перспективные решения //Региональная информатика и информационная безопасность. - 2021. - С. 104-108.
Сулавко А. Е. Биометрическая аутентификация на основе сети гиперболических нейронов байеса с трехуровневыми квантователями //Информационные технологии и автоматизация управления. 2020. С. 199-206.
Кузнецов А. А., Сергиенко Р. В., Уварова А. А. Нечеткий экстрактор на помехоустойчивых кодах для биометрической криптографии //Radiotekhnika. 2018. №. 195. С. 224-234.
Monrose F. et al. Cryptographic key generation from voice //Proceedings 2001 IEEE Symposium on Security and Privacy. S&P 2001. IEEE, 2000. С. 202-213.
Сулавко А. Е. и др. Преобразователь образов голосовых паролей дикторов в криптографический ключ на основе комитета предварительно обученных сверточных нейронных сетей // Вопросы защиты информации. 2021. № 4. С. 23-33.
Иванов А. И., Ложников П. С., Сулавко А. Е. Оценка надежности верификации автографа на основе искусственных нейронных сетей, сетей многомерных функционалов Байеса и сетей квадратичных форм //Компьютерная оптика. 2017. Т. 41. №. 5. С. 765-774.
Namiot D. Schemes of attacks on machine learning models //International Journal of Open Information Technologies. 2023. Т. 11. №. 5. С. 68-86.
Лапина Т. И., Лапин Д. В. Многофакторная аутентификация пользователей информационных ресурсов // Информационно-измерительные и управляющие системы. 2017. Т. 15. №. 5. С. 37-42.
Юнусов Н. Т., Смирнов С. В., Сакулин С. А. Состязательные примеры в задаче классификации изображений //Социально-экономическое управление: теория и практика. - 2019. №. 4. С. 74-77.
Gao Y. et al. Detection and evaluation of human and machine generated speech in spoofing attacks on automatic speaker verification systems //2021 IEEE Spoken Language Technology Workshop (SLT). IEEE, 2021. С. 544-551.
Wahab O. A. Intrusion detection in the iot under data and concept drifts: Online deep learning approach //IEEE Internet of Things Journal. 2022. Т. 9. №. 20. С. 19706-19716.
Namiot D., Ilyushin E. Data shift monitoring in machine learning models //International Journal of Open Information Technologies. - 2022. Т. 10. №. 12. С. 84-93.
Кормилицин А. А., Калинина С. А., Меркулова А. Г. Исследование спектральных характеристик голоса человека в процессе профессиональной деятельности //Биотехнические, медицинские и экологические системы, измерительные устройства и робототехнические комплексы-Биомедсистемы-2022. 2022. С. 325-328.
Jabari S. et al. Multispectral change detection using multivariate Kullback-Leibler distance //ISPRS Journal of Photogrammetry and Remote sensing. 2019. Т. 147. С. 163-177.
Narasimhappa M. et al. MEMS-based IMU drift minimization: Sage Husa adaptive robust Kalman filtering //IEEE Sensors Journal. 2019. Т. 20. №. 1. С. 250-260.
Sharma S., Tiwari G. SPEECH SENTIMENT ANALYSIS. // International Research Journal of Modernization in Engineering Technology and Science. 2023. №5. С. 9715-9722.
Abbasi A. et al. ElStream: An ensemble learning approach for concept drift detection in dynamic social big data stream learning //IEEE Access. 2021. Т. 9. С. 66408-66419.
Ghomeshi H., Gaber M. M., Kovalchuk Y. EACD: evolutionary adaptation to concept drifts in data streams //Data mining and knowledge discovery. 2019. Т. 33. С. 663-694.
Talbot M. Adapting to the speaker in automatic speech recognition //International journal of man-machine studies. - 1987. Т. 27. №. 4. С. 449-457.
Садыхов Р. Х., Ракуш В. В. Модели гауссовых смесей для верификации диктора по произвольной речи //Доклады Белорусского государственного университета информатики и радиоэлектроники. 2003. №. 4 (4). С. 95-103.
Song S. et al. An integrated multi-channel approach for joint noise reduction and dereverberation //Applied Acoustics. - 2021. - Т. 171. - С. 107526.
Chung J. S., Nagrani A., Zisserman A. Voxceleb2: Deep speaker recognition //arXiv preprint arXiv:1806.05622. 2018.
Garofolo J. S. et al. DARPA TIMIT acoustic-phonetic continous speech corpus CD-ROM. NIST speech disc 1-1.1 //NASA STI/Recon technical report n. 1993. Т. 93. С. 27403.
Lee K. A. et al. The RedDots data collection for speaker recognition //Interspeech 2015. - 2015.
Ardila R. et al. Common voice: A massively-multilingual speech corpus //arXiv preprint arXiv:1912.06670. - 2019.
Kersta L. G. Voiceprint identification //The Journal of the Acoustical Society of America. 1962. Т. 34. №. 5_Supplement. С. 725-725.
Wohlford R., Wrench E., Landell B. A comparison of four techniques for automatic speaker recognition //ICASSP'80. IEEE International Conference on Acoustics, Speech, and Signal Processing. - IEEE, 1980. Т. 5. С. 908-911.
Snyder D. et al. X-vectors: Robust dnn embeddings for speaker recognition //2018 IEEE international conference on acoustics, speech and signal processing (ICASSP). IEEE, 2018. С. 5329-5333.
Kanagasundaram A. et al. A study of x-vector based speaker recognition on short utterances //Proceedings of the 20th Annual Conference of the International Speech Communication Association, INTERSPEECH 2019. Vol. 2019-September. - ISCA (International Speech Communication Association), 2019. С. 2943-2947.
Heo H. S. et al. Clova baseline system for the voxceleb speaker recognition challenge 2020 //arXiv preprint arXiv:2009.14153. 2020.
Taherian H. et al. Robust speaker recognition based on single-channel and multi-channel speech enhancement //IEEE/ACM Transactions on Audio, Speech, and Language Processing. - 2020. Т. 28. С. 1293-1302.
Xiao X. et al. Microsoft speaker diarization system for the voxceleb speaker recognition challenge 2020 //ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2021. С. 5824-5828.
Zeinali H. et al. But system description to voxceleb speaker recognition challenge 2019 //arXiv preprint arXiv:1910.12592. 2019.
Pappagari R. et al. x-vectors meet emotions: A study on dependencies between emotion and speaker recognition //ICASSP 2020-2020 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). - IEEE, 2020. С. 7169-7173.
Xie W. et al. Utterance-level aggregation for speaker recognition in the wild //ICASSP 2019-2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). - IEEE, 2019. С. 5791-5795.
El-Moneim S. A. et al. Text-independent speaker recognition using LSTM-RNN and speech enhancement //Multimedia Tools and Applications. 2020. Т. 79. С. 24013-24028.
Vaessen N., Van Leeuwen D. A. Fine-tuning wav2vec2 for speaker recognition //ICASSP 2022-2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2022. С. 7967-7971.
Kanagasundaram A. et al. PLDA based speaker recognition on short utterances //Proceedings of The Speaker and Language Recognition Workshop: Odyssey 2012. International Speech Communication Association, 2012. С. 28-33.
Khan A., Malik K. M. SpoTNet: A spoofing-aware Transformer Network for Effective Synthetic Speech Detection //Proceedings of the 2nd ACM International Workshop on Multimedia AI against Disinformation. 2023. С. 10-18.
Lei Y. et al. Towards noise-robust speaker recognition using probabilistic linear discriminant analysis //2012 IEEE international conference on acoustics, speech and signal processing (ICASSP). IEEE, 2012. С. 4253-4256.
Ming J. et al. Robust speaker recognition in noisy conditions //IEEE Transactions on Audio, Speech, and Language Processing. 2007. Т. 15. №. 5. С. 1711-1723.
Wu Z., Chng E. S., Li H. Detecting converted speech and natural speech for anti-spoofing attack in speaker recognition //Thirteenth Annual Conference of the International Speech Communication Association. - 2012.
- Купить
