Статья: Пути повышения эффективности криминалистической идентификации аппаратуры цифровой звукозаписи

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Пути повышения эффективности криминалистической идентификации аппаратуры цифровой звукозаписи

Рыбальский Олег Владимирович,

доктор технических наук, профессор, лауреат Государственной премии УССР в области науки и техники, профессор НАВД, г. Киев, Украина

Соловьев Виктор Иванович, кандидат технических наук, доцент, заместитель заведующего кафедрой компьютерных систем и сетей Восточноукраинского национального университета им. В. Даля, Северодонецк, Украина,

Журавель Вадим Васильевич,

кандидат технических наук, заведующий лабораторией исследований в сфере информационных технологий Киевского научно-исследовательского экспертно-криминалистического центра МВД Украины, Киев, Украина

Рассмотрены вопросы построения высокоэффективного инструментария для диагностики оригинальности цифровых фонограмм и идентификации аппаратуры цифровой звукозаписи, основанного на фрактальном подходе к сигналам ее собственных шумов. Предложены усовершенствованные методы выделения и обработки самоподобных структур из фонограмм, используемых в качестве идентификационных признаков при экспертизе. Предложено обязательное использование кривых ошибок первого и второго рода, построенных на основании большого объема данных, полученных из ограниченного количества фонограмм в автоматическом режиме. Установлено, что для фонограмм длительностью более 20 сек, записанных на разной аппаратуре, кривые ошибок носят устойчивый характер, т.е. практически не изменяются.

Ключевые слова: аппаратура цифровой звукозаписи, вероятность, идентификационные признаки, мера близости, самоподобные структуры, цифровая фонограмма, фрактальный подход, экспертиза

Rybalskyi Oleh,

Doctor of Technical Sciences, Full Professor,

Laureate of the state award in the field of science and technology,

Chief Researcher, Professor at the Department, National Academy of Internal Affairs, Kyiv, Ukraine,

ORCID ID 0000-0002-1440-8344

Soloviov Viktor,

Candidate of Technical Sciences, Docent, Deputy Head of the Department,

V. Dahl East Ukrainian National University, Severodonetsk, Ukraine,

ORCID ID 0000-0003-3541-4740

Zhuravel Vadym,

Candidate of Technical Sciences, Chief of the Laboratory,

Kyiv Research and Expert and Criminalistics Center of the Ministry of Internal Affairs of Ukraine, Kyiv, Ukraine

WAYS OF ENHANCING THE EFFECTIVENESS OF FORENSIC

IDENTIFICATION OF DIGITAL AUDIO RECORDING EQUIPMENT

The article deals with the issues of building a toolkit for diagnosing the originality of digital soundtracks and identification of digital audio recording equipment. One of the last variants of creation of the expert toolkit intended for identification of digital recording equipment is the “Fractal” toolkit, but its efficiency is reduced because identification signs are allocated from signals of pauses in the language information (pauses between words) recorded on a phonogram. The purpose of the article is to improve the expert toolkit for identification of sound recording equipment based on the fractal approach to the signals of its own noises. It is suggested to use the separation of hardware noises not only from pauses, but also from a mixture of signals with the entire duration of the phonogram. At the same time, the volume of information from which the identification features of the equipment are allocated increases significantly. Such separation of the own noise signals ensures the increased efficiency of the identification system. The proposed methods of separation and processing of self-similar structures from phonograms, used as identification features in the examination. One of the proposed methods is based on the separation of self-similar structures of the phonogram's own noises along its entire length from their mixture with language and sound environment signals. The second method provides for mandatory building of error curves of the first and second types when developing the system. When building them, it is necessary to use a large amount of data that can be obtained from a limited number of phonograms by dividing them into separate sections of different lengths in automatic mode. It has been established that for phonograms lasting more than 20 seconds, the error curves are stable, in other words, they practically do not change. The degree of closeness of parameters of self-similar structures, separated from the compared phonograms, is offered to define as the module of distance between the normalized fractal curves, received at measurements of fractal characteristics. The proposed methods allow increasing considerably the efficiency of establishing the originality of soundtracks and identification of digital recording equipment during the expertise.

Keywords: digital audio recording equipment, probability, identification features, degree of proximity, self-similar structures, digital phonogram, fractal approach, expertise

Розглянуто питання побудови високоефективного інструментарію для діагностики оригінальності цифрових фонограм та ідентифікації апаратури цифрового звукозапису, заснованого на фрактальному підході до сигналів її власних шумів. Запропоновані вдосконалені методи виділення і обробки самоподібних структур з фонограм, які використовуються як ідентифікаційні ознаки при експертизі. Запропоновано обов'язкове використання кривих помилок першого та другого роду, побудованих на підставі великого об'єму даних, отриманих з обмеженої кількості фонограм в автоматичному режимі. Встановлено, що для фонограм тривалістю більше 20 сек, записаних на різній апаратурі, криві помилок мають стійкий характер, тобто практично не змінюються.

Ключові слова: апаратура цифрового звукозапису, імовірність, ідентифікаційні ознаки, міра близькості, самоподібні структури, цифрова фонограма, фрак- тальний підхід, експертиза

Введение и постановка задачи

Известно, что в комплект инструментария, необходимого для проведения судебной экспертизы материалов и аппаратуры звукозаписи, входят программы и методики идентификации голоса диктора, идентификации аппаратуры звукозаписи и диагностики подлинности (аутентичности) фонограмм [1].

В статье рассматриваются вопросы построения инструментария для диагностики оригинальности цифровых фонограмм и идентификации аппаратуры цифровой звукозаписи. Они относятся к основным задачам экспертизы материалов и аппаратуры звукозаписи. Это поясняется тем, что диагностика оригинальности (первичности) фонограммы, входящей как составная часть в диагностику ее подлинности, проводится путем идентификации такой аппаратуры [1]. По мере развития аппаратуры звукозаписи развивался и инструментарий, используемый для экспертизы. Однако на всех этапах его развития для идентификации использовались идентификационные признаки, фиксируемые при записи в фонограмме и выделяемые из нее при экспертизе. Разные виды аппаратуры записи создают разные признаки, но всегда они образуются за счет конструктивных и технологических особенностей (паразитных параметров) аппаратуры звукозаписи [1--9]. Основными свойствами таких признаков являются:

1. Индивидуальность для каждого конкретного аппарата записи;

2. Физическая выделяемость из фонограммы (реализуемость);

3. Стабильность в течение идентификационного периода;

4. Повторяемость для разных фонограмм, записанных на одном аппарате;

5. Изменяемость при обработке [4].

Эти признаки, в силу их индивидуальности и изменяемости при обработке, используются и при диагностике отсутствия следов монтажа в фонограмме. Существуют различные системы идентификации аппаратуры цифровой звукозаписи и диагностики подлинности фонограмм [1--9], но основная сложность создания таких систем состоит в том, что уровень паразитных параметров данной аппаратуры крайне мал, что не позволяет извлечь идентификационные признаки из фонограммы классическими методами [9].

Одним из последних вариантов создания экспертного инструментария, предназначенного для идентификации цифровой аппаратуры звукозаписи, является инструментарий “Фрактал” [10-13]. Он обладает высокой эффективностью и обеспечивает идентификацию аналоговой и цифровой аппаратуры. Однако его применение требует значительных трудовых и временных затрат. Кроме того, его эффективность снижается из-за того, что идентификационные признаки выделяются из сигналов пауз в речевой информации (пауз между словами), записанной на фонограмме. Но выделение пауз из фонограммы всегда производится с некоторой погрешностью, а сигналы собственных шумов в паузе содержат, как правило, смесь шумов внешней звуковой среды с собственными шумами аппаратуры. Именно последнее обстоятельство приводит к необходимости записи и сравнения трех образцовых фонограмм для вычисления доверительного интервала критериальных точек фрактальных масштабов, используемых при сравнении образцовых и спорной (исследуемой) фонограмм [14]. Кроме того, при использовании для записи фонограмм современных средств коммуникации (например, смартфонов), сигналы шумов в паузах могут генерироваться в самом устройстве и не нести в себе собственных шумов аппаратуры.

При этом порог принятия решения об оригинальности исследуемой фонограммы принят на основании обобщенного практического опыта группы экспертов и определен на уровне 15 %, однако эта величина не имеет научного обоснования и носит субъективный характер.

Все это значительно ухудшает эффективность системы, усложняет экспертные исследования и увеличивает трудовые затраты на экспертизу.

Следовательно, имеются возможности и потребность усовершенствования инструментария, построенного на основе фрактального подхода. Оно должно привести к повышению эффективности инструментария для идентификации аппаратуры звукозаписи, упрощению использования и снижению трудоемкости его применения.

Цель статьи - усовершенствование экспертного инструментария идентификации аппаратуры звукозаписи, основанного на фрактальном подходе к сигналам ее собственных шумов.

Мы полагаем, что эта задача может быть решена путем дополнения фрактального подхода новыми технологиями обработки сигналов и автоматизации процесса проведения экспертизы. Кроме того, переход на программирование в программной среде “Piton” должно оказать положительное влияние на результаты автоматизации процесса экспертизы и, следовательно, упрощения использования и снижения ее трудоемкости.

Основная часть

Ранее нами было показано, что в аналоговой записи собственные шумы аппаратуры носят регулярный характер и поэтому в частотной области могут быть отделены от звуковых шумов, всегда носящих случайный характер, путем кратковременного (оконного) преобразования Фурье с последующим накоплением [1]. При этом уровень собственных шумов аналоговой аппаратуры достаточно высок (динамический диапазон не превышает 52 дБ), что и обеспечивает выделение регулярных частотных составляющих собственных шумов аппаратуры из всей фонограммы без разделения ее на сигналы речи и сигналы пауз [1]. Вместе с тем нами показано, что и собственные шумы аппаратуры цифровой звукозаписи содержат регулярные частотные составляющие, что обусловлено источниками их происхождения, но уровень таких сигналов и, соответственно, уровень порождаемых ими самоподобных структур не превышает величины двух младших разрядов аналогоцифрового преобразования [9; 13]. Следовательно, такие сигналы как во временной, так и в частотной области будут содержать регулярные самоподобные структуры, которые можно выделить из смеси речевых сигналов, сигналов звуковой среды и собственных шумов фонограммы [13]. При выделении аппаратурных шумов не только из пауз, а из смеси сигналов по всей длительности фонограммы, значительно возрастает объем информации, из которой выделяются идентификационные признаки аппаратуры. Такое выделение сигналов собственных шумов должно обеспечить повышение эффективности системы идентификации. Разумеется, для их выделения потребуется применить специальные способы обработки информации. Один из них - вейвлет - преобразование с последующей декомпозицией сигналов, примененный для извлечения собственных шумов из смеси сигналов, обеспечивающий извлечение сигналов собственных шумов по всей длительности фонограммы [15]. Его применение также обеспечивает устранение погрешностей, возникающих при сегментации сигналов на паузы и речевую информацию. Мы полагаем, что совмещение фрактального подхода к выделению идентификационных признаков со способом декомпозиции сигналов, зафиксированных на фонограмме, способно обеспечить высокую эффективность системы, несмотря на крайне малый уровень сигналов собственных шумов, присущих аппаратуре цифровой звукозаписи. На рис. 1 показаны собственные шумы аппаратуры цифровой звукозаписи, выделенные из смеси сигналов, записанных на фонограмме. фонограмма цифровой аппаратура звукозапись

Эти шумы были выделены следующим образом.

Рис. 1. Собственные шумы аппаратуры цифровой звукозаписи, выделенные из смеси сигналов, записанных на фонограмме

Следующим аспектом повышения эффективности системы является установление научно обоснованного порога принятия решения об оригинальности исследуемой фонограммы. Мы считаем, что такое значение порога может быть принято только на основе установления на экспериментальном материале большого объема кривых ошибок первого и второго рода, присущих разрабатываемой системе. Для этого, во-первых, требовалось создать массив “больших данных” (dataset), который содержал бы сотни тысяч реализаций собственных шумов различной аппаратуры цифровой звукозаписи. В распоряжении авторов было 15 смартфонов различного типа и марок, на которых было сделано по четыре экспериментальных записей. Из этих записей приведенным выше способом были выделены собственные шумы аппаратуры. Полученные реализации шумов сканировались окном длительностью 20 мсек с интервалом 1 мсек и из них вырезались фрагменты данной длительности. При этом использовалась технология каркасов [15]. Таким образом, были сформированы массивы фрагментов шумов различной аппаратуры размерностью около 300000. Из них в созданном для этого программном модуле формировались фонограммы длительностью < 3, < 5 и > 20 сек. Для построения кривой ошибок первого рода сравнивались фрагменты шумов из массива записей, сделанных на одной аппаратуре. Для формирования массива фрагментов шумов, выделенных из разной аппаратуры, они отбирались случайным образом. Массивы сравниваемых фонограмм из их фрагментов создавались в автоматизированном компьютерном режиме. Из фонограмм выделялись самоподобные структуры и попарно сравнивались друг с другом. По результатам сравнения строились кривые ошибок. Эти кривые строились для фонограмм разной длительности. Установлено, что для фонограмм, записанных на различной аппаратуре, длительностью более 20 сек, кривые ошибок носят устойчивый характер, т.е. практически не изменяются. Пример таких кривых приведен на рис. 2.

Рис. 2. График ошибок первого и второго рода для фонограмм длительностью больше 20 сек

Самоподобные структуры из фрагментов шумов аппаратуры выделялись методом максимума вейвлет преобразования [10; 15]. Они характеризуют индивидуальность аппаратуры цифровой звукозаписи и являются идентификационными признаками [10].

При этом точка пересечения кривых ошибок первого и второго рода определяют максимальное значение порога, при котором фонограммы принимаются как записанные на одной аппаратуре, т.е. определяет минимальную эффективность системы [16].