Блог Доктора Демкина

Статьи о психологии и психодиагностике

Биометрический зверинец Доддингтона

Биометрический зверинец Доддингтона

Эффективность биомтерического распознавания голоса обычно проводится с использованием отдельных показателей, ориентированных на сверку с базой данных, таких как равные частоты ошибок. Эти показатели не учитывают выступления отдельных типов ораторов или групп ораторов, что очень важно для криминалистического распознавания говорящих. Например, система распознавания голоса, которая хорошо работает для биоидентификации говорящих мужчин, может плохо работать для говорящих женщин или детей.

Такие типы людей, отличающиеся по возможности их биометрической иденитфикации вошли в классификацию биометрического зверинца Джорджа Доддингтона [Doddington G. et al., 1998]. Классификация группирует пользователей в соответствии с их поведенческими особенностями при работе с процессом аутентификации. Были определены четыре категории животных:

  • овцы: пользователи, которых легко узнать,
  • козлы: пользователи, которых особенно трудно распознать,
  • ягнята: пользователи, которым легко подражать,
  • волки: пользователей, которые могут легко подражать другим.

Согласно первоначальной классификации Доддингтона, тип «овцы» являются "нормальными" ораторами и, как правило, их голосовые параметры хорошо соответствуют сохраненным данным и значительно отличаются от других. Таких людей большинство в базах данных для распознавания. «Козлы» - это ораторы, которых трудно проверить, и они, как правило, имеют низкие результаты по совпадению с собственными образцами голоса. «Ягнята», как правило, набирают высокие баллы по сравнению с образцами голосов других ораторов и, таким образом, легко выдают себя за других, что приводит к ложным признаниям. Волки тоже легко выдают себя за других ораторов, что также приводит к ложным признаниям.

Биометрический зверинец Доддингтона

Рис. 1 Расширенная классификация биометрического зверинца Доддингтона-Даунстоуна. По оси Y – средняя вероятность стать самозванцем. По оси Х – вероятность быть правильно распознанным.

Существует и другой подход, основанный на оценке личной энтропии и относительной энтропии для биометрического зверинца [Houmani N., Garcia-Salicetti S., 2016]. Личная энтропия вычисляется с использованием только данных подлинности идентификации. Она служит для различения пользователей класса овец и коз. Действительно, класс овец представляет пользователей, характеризующихся низкой личной энтропией, а класс коз представляет пользователей, отмеченных высокой личной энтропией. Относительная энтропия рассчитывается как по подлинным, так и по поддельным данным. Это помогает различать класс ягнят, которые известны самой низкой относительной энтропией. Кроме того, овцы, как правило, доминируют в популяции зоопарка, козы, а также ягнята составляют лишь небольшую часть популяции. Однако категория "волки" составляет значительную долю случаев ложного отклонения и принятия.

Зверинец Доддингтона

Рис. 2 Сравнение подходов к типологии зверинца Додднгтона на основе частоты несоответствий (FNMR) системы распознавания и частоту ложных совпадений (FMR) (слева) и личной и относительной энтропии (справа).

Анализ зверинца, разработанный Нейлом Ягером и Ягерандом Данстоуном [N. Yager, T. Dunstone, 2007], расширяет оригинальную классификацию биометрического зверинца Доддингтона, вводя в классификацию новых «животных»:

1. «Голуби» - подгруппа «овец» - показывают высокие результаты по сравнению со своей сохраненной моделью голоса и низкие результаты по сравнению с моделями-самозванцами. Голуби являются лучшими по точности правильного распознавания, так как их легко распознать и трудно атаковать.

2. «Хамелеоны» - подгруппа «овец и «ягнят» - показывают высокие результаты по сравнению со своими собственными моделями голоса и высокие результаты по сравнению с моделями других людей. Ораторы хамелеоны кажутся похожими на всех. Хамелеоны соответствуют пользователям, которых легко распознать и легко атаковать.

3. «Фантомы» - подгруппа «коз» - имеют низкие баллы по сравнению со своими собственными моделями и моделями других людей. Фантомные ораторы ни на кого не похожи.

4. «Черви» - подгруппа «коз» - являются худшим вариантом для систем распознавания. Они показывают низкие результаты по сравнению со своей моделью голоса и высокие результаты по сравнению с образцами других. Оратора червя нелегко распознать, и его легко спутать с другими ораторами. При этом – его легко атаковать.

Что касается метода, основанного на энтропии, то он использует личную и относительную энтропии, чтобы различать эти классы. Хамелеоны являются подкатегорией овец и ягнят, поскольку они известны самой низкой личной энтропией и наименьшей относительная энтропия. Фантомы являются подкатегорией класса коз, в связи с тем, что у них есть особенность в виде низкого качества данных, сгенерированных на этапе регистрации. Они характеризуются высокой личной энтропией и высокой относительной энтропией. Голуби являются подкатегорией класса овец. Они являются характеризуется самой низкой личной энтропией и самой высокой относительной энтропией. Черви являются подкатегорией классов коз и ягнят. У них самая высокая личная энтропия и самая низкая относительная энтропия [Mhenni A., et al., 2019].

Как практически выявить людей – «животных» разных групп?

Анализ участников «зоопарка» выполняется следующим образом:

1.Выберите группу ораторов, которая представила записи голоса.

2.Из этого набора записей голосов выберите файлы для тестирования и обучения системы распознавания голоса. В идеале должно быть более одного файла для тестирования и обучения одного по одному и тому же оратору.

3.Для каждого оратора сопоставьте их обучающие выборки со всеми их тестовыми выборками и вычислите их средний балл подлинного соответствия (правильной идентификации оратора).

4.Аналогично, среднее значение всех баллов, полученных путем сравнения обучающих выборок с файлами от других докладчиков, дает средний балл «самозванца» (ошибок идентификации).

5. Средний балл подлинности сопоставляется со средним баллом «самозванца» для всех ораторов. Пользователи, которые попадают в четыре квартиля (верхние и нижние 25%), распределяются по группам животных (черви, хамелеоны, голуби и фантомы), причем каждый набор показывает разные характеристики.

В зависимости от вариативности подлинных и самозваных результатов классификация животных может быть расширена еще и как "высоких / низких" или "толстых / худых" [Alexander A. et al., 2014]. Например, если говорящий "голубь" обладает низкой изменчивостью подлинности и высокой изменчивостью самозванца, то он или она является "высоким худым голубем". Вообще говоря, изменчивость результатов совпадений образцов является основной проблемой идентификации, независимо от типа животного. Рост, худоба или полнота зависят от изменчивости подлинности и изменчивости самозванца, которая рассчитывается путем определения того, на сколько стандартных отклонений от среднего значения для всех говорящих отличается изменчивость для данного оратора. Таким образом, улучшенная визуализация добавляет новое измерение независимой и полезной диагностической информации.

ЛИТЕРАТУРА

A. Alexander, O. Forth, J. Nash, N. Yager Zooplots for speaker recognition with tall and fat animals // Proc. Int. Assoc. Forensic Phonetics Acoust. Conf., 1-2., 2014

G. Doddington, W. Liggett, A. Martin, M. Przybocki and D. Reynolds, “SHEEP, GOATS, LAMBS and WOLVES - A Statistical Analysis of Speaker Performance in the NIST 1998 Speaker Recognition Evaluation,” in Proceedings of ICSLP, Sydney, 1998.

N. Houmani, S. Garcia-Salicetti, On hunting animals of the biometric menagerie for online signature, PloS one 11 (4) (2016) 

Abir Mhenni, Estelle Cherrier, Christophe Rosenberger, Najoua Essoukri Ben Amara. Analysis of Doddington Zoo Classication for User Dependent Template Update: Application to Keystroke Dy-namics Recognition. Future Generation Computer Systems, Elsevier, 2019.

N. Yager, T. Dunstone Worms, chameleons, phantoms and doves: New additions to the biometric menagerie //  IEEE Workshop on Automatic Identification Advanced Technologies, 1-6, 2007

Андрей Демкин

Статьи по теме:

О сайте

Вы находитесь на сайте врача и психолога Андрея Демкина, посвященном вопросам психологической помощи, психодиагностики и профессионально-психологического отбора и аттестации (оценке) персонала. Для работы с онлайн психодиагностической плаформой перейдите по сслылке: https://dmnsys.ru/