Статья: Актуальные вопросы использования больших данных в деятельности правоохранительных органов

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Актуальные вопросы использования «больших данных» в деятельности правоохранительных органов

Лемайкина Светлана Владимировна

Лемайкина Светлана Владимировна, начальник кафедры информационного обеспечения органов внутренних дел Ростовского юридического института МВД России.

В статье рассматриваются вопросы, касающиеся анализа использования «больших данных» в правоохранительных структурах различных государств. Отдельное внимание уделено актуальным подходам и совершенствованию этой технологии в деятельности органов внутренних дел России.

Ключевые слова: «большие данные», информация, преступление, социальные сети, структурированный массив, Интернет.

TOPICAL ISSUES OF USE OF «BIG DATA» IN THE ACTIVITIES OF LAW ENFORCEMENT. Lemaykina Svetlana Vladimirovna - Head of the Department of Informational Supply of the Law Enforcement Bodies, the Rostov Law Institute of the Ministry of Internal Affairs of Russia.

правоохранительный информация правительство общественность

The article discusses issues related to the analysis of the use of «big data» in law enforcement agencies of various states. Special attention is paid to current approaches and the improvement of this technology in the activities of the internal affairs bodies of Russia.

Keywords: «big data», information, crime, social networks, structured array, Internet.

Big Data (от англ. «большие данные») - термин, который появился более десяти лет назад. В настоящее время в информационных науках не существует точного определения «больших данных». Так могут называть массивы информации с различными структурами, которые можно определить как неоднородные, иногда ссылающиеся на сложный аналитический процесс.

Большая часть организаций хранит информацию как «большие данные», то есть информация находится в неструктурированном формате: тексты, изображения, видео. Существенным отличием «больших данных» от «простых данных» является их разноформатность. Информация содержит совершенно различные сведения, может поступать из разных источников. Не имеет смысла собирать, анализировать и хранить большое количество информации в организации, если нет программного продукта, который способен работать с данными.

В настоящее время государственные, в том числе правоохранительные структуры, в подавляющем большинстве стран работают с «большими данными». По принципу «чем больше, тем лучше». Данные структуры стремятся собрать информацию не только из своих хранилищ информации, но и из других источников - из интернета, от других организаций, видеонаблюдения и т. п. Эта информация - сложная, имеет большие объемы и поступает из различных источников, и ее определяют как неструктурированную, но на самом деле она имеет структуру. Привести все это в единый формат не представляется возможным.

«Большие данные» можно классифицировать по источникам и форматам происхождения:

- «большие данные» людей. Это разноформатная часть, сюда входят данные сети Internet, данные телекоммуникационных сетей, различная текстовая информация - в основном это сайты социальных сетей. Остальная часть - это информация, связанная с идентификацией личности, данные о здоровье людей и их передвижениях;

- «большие данные» корпораций. Эти данные похожи на большие данные людей, но есть существенное различие, в них текстовых и табличных файлов больше, чем видео-, фотофайлов;

- «большие данные» вещей. Это информация в виде сигналов, поступающих от датчиков, встроенных в различные вещи - автомобили, дома, бытовые приборы;

- «большие данные» денег. Это информация о транзакции банков, платежных карт и платежных сервисов. Данная информация интересна правоохранительным органам, поскольку иногда преступлению предшествует денежная транзакция [1].

Открытые, т. е. общедоступные данные - это часть «больших данных». Открытые данные - это информация, созданная в результате требования общественности к правительству сделать свою деятельность прозрачной и, естественно, публиковать не только правительственные решения, но и предшествующие им события. Сами по себе открытые данные полезны, в большинстве стран они публикуются в соответствии с законодательством. В России главный агрегатор структурированных государственных данных - «Портал открытых данных РФ» (Рис. 1). Ключевым назначением портала является обеспечение централизованного доступа к информации, представленной в форме открытых данных [2].

В государствах Европейского Союза информация правоохранительных структур и судебных органов закрыта. Другая ситуация в США и странах Британского Содружества наций - все судебные и большинство правоохранительных данных стали открытыми.

Во Франции существует и эффективно действует специальный портал, на котором размещается вся информация, содержащая не только законодательные и нормативные тексты, но и информацию о назначениях на должности, статистическая информация. Также европейским илидерами по открытым данным в судебной области является Франция и Нидерланды. В этих странах публикуются не только судебные решения, но и сопутствующие документы.

Рис. 1. Сайт портала открытых данных

Данный портал предоставляет следующую информацию:

- полный набор сведений, освещаемых органами государственной власти и органами местного самоуправления РФ;

- информационная поддержка, которая помогает осуществлять связь общественностью с целью образования, освещения и использования открытых государственных данных;

- формирование и реализация единой технологической политики в области открытых государственных данных.

Человечество использует технологию «больших данных», расширяет при этом список задач. Не вызывает удивления и то, что для расследования и раскрытия преступлений, задержания преступников стали использовать большие данные. Информация, собираемая в правоохранительных органах; информация о праве собственности на недвижимость, сведения о водительских правах и владении транспортным средством, криминальная информация, информация о розыске преступников, об административных правонарушениях. Обычным способом обработки найти нужную информацию и установить связь между соответствующими данными было трудно. По мере того, как количество публичной информации, хранимой в сети, увеличивается, увеличивается и потенциал для сбора и использования данных для поиска преступников [3].

В связи с развитием Интернета информация из чатов, форумов, социальных сетей, текстовые документы, лог-файлы, видеозаписи, данные о трафике и соединениях абонентов содержатся в различных источниках. В результате правоохранительные структуры могут иметь доступ к огромному объему данных из внутренних и внешних источников, но могут не обладать необходимыми инструментами, чтобы обработать различную информацию и найти общие связи. Технологии больших данных позволяют решить эту проблему, связав воедино разнородные данные.

Анализ подходов зарубежных государств в отношении «больших данных» в правоохранительных структурах свидетельствует о том, что требуется:

- объединение разрозненных источников информации в единое хранилище;

- применение специального программного обеспечения, позволяющего выявлять нужную информацию из документированных файлов;

- использование программно-аппаратных решений, которые ускоряют работу при обработке огромных массивов структурированной и неструктурированной информации.

Например, с этой целью в Нью-Йорке в 2007 г. было решено создать централизованный операционный центр общественной безопасности. В данном центре было интегрировано боле 100 разрозненных источников информации. Далее, используя аналитические инструменты, информацию помещают в контекст. С помощью аналитической системы распознается информация, включая связь между различными частями. Создание единого центра позволило снизить преступность в городе на 27 %.

Свою эффективность доказала система BlueCRUSH (от англ. Crime Reduction Utilizing Statistical History - «снижение преступности на основе статистических данных»), разработанная компанией IBM, которая позволила правоохранительным структурам на основе статистических данных о преступлениях иметь сведения о зонах потенциальной угрозы совершения преступления с указанием места (в пределах нескольких кварталов) и времени (в пределах нескольких часов конкретного дня недели). Данное прогнозирование позволило снизить уровень преступности в городе Мемфисе на 31 %, из которых 15 % приходится на тяжкие преступления.

Новые технологии и «большие данные» нашли свое отражение и в полиции Нью-Йорка, где Microsoft разработал систему Domain Awareness System (DAS), которая анализирует информацию об общественной безопасности из отчетов камер наблюдения, наблюдений очевидцев и т. д.

Для повышения осведомленности в эксплуатации новых технологий является использование социальных сетей. Так, во время беспорядков, устроенных спортивными болельщиками в Ванкувере, полиция использовала Twitter, а после того, как беспорядки были устранены, Twitter и Facebook стали каналами, через которые свидетели могли сообщить полиции имеющуюся у них информацию.

В России «большие данные» также используются, но их обработка и анализ ограничены, так как для этого требуются большие вычислительные мощности, много времени и финансовые затраты. Лидеры по объему государственного финансирования - это проекты для государственных структур, транспортной отрасли, обороны и безопасности, в том числе и для правоохранительной системы. Например, основной автоматизированной информационно-поисковой системой (АИПС) ОВД на транспорте является программно-технический комплекс (НТК) «Розыск-Магистраль». Этот комплекс начал внедряться еще с 1996 года, а окончательно - в 2000 году.

Контроль за перемещением людей железнодорожным и воздушным транспортом ведется круглосуточно, а с 2013 года еще и за автомобильным, морским и внутренним водным транспортом. Сейчас возможности НТК позволяют не только выявить любого человека в пассажиропотоке, но и проследить всю его «криминальную биографию». Номимо основной функции НТК «Розыск-Магистраль» предназначен для выполнения ряда других функций:

- пополнение баз данных информацией из различных источников правоохранительных структур, формирование и хранение архива информации о билетных операциях различных перевозчиков;

- предоставление автоматизация поиска, анализа информации о пассажиропотоке, хранящейся в архиве.

В ПТК «Розыск-Магистраль» кроме функций, описанных выше, еще используются автоматизированные рабочие места (АРМ), которые позволяют раскрывать и прогнозировать преступления, совершенные в сфере пассажирских перевозок. В основу работы АРМ заложен принцип объединения информации из различных источников. Для каждого АРМ существует свое направление (по линии уголовного розыска, борьбы с незаконным оборотом наркотиков, организованной преступностью и др.). Посредством специально разработанной программы выше описанные АРМ выявляют из большого массива различной информации данные, необходимые для выявления и раскрытия конкретных видов преступлений [4].

Кроме того, практика борьбы с преступностью свидетельствует о том, что для успешного расследования и раскрытия преступлений правоохранительным органам России необходима эффективная информационная поддержка. Данная поддержка осуществляется посредством различных банков данных МВД России, формируемые ФКУ «ГИАЦ МВД России» и ИЦ территориальных органов МВД России.

В ФКУ «ГИАЦ МВД России» эксплуатируются свыше 30ти централизованных информационно-поисковых систем и подсистем. Общий объем информации составляет свыше 490 млн. объектов учета, в том числе розыскных, криминалистических и специализированных - более 395 млн. [5].

Одновременно идет формирование Межгосударственного информационного банка (МИБ) на основе соглашений: о взаимоотношениях министерств внутренних дел в сфере обмена информацией (03.08.1992 г., г. Чолпон-Ата); соглашения об обмене информацией в сфере борьбы с преступностью (22.05.2009 г., г. Астана). В данном банке размещено свыше 115 млн. объектов учета оперативно-справочной, криминалистической, розыскной и дактилоскопической информации.

Центром информационного обеспечения органов внутренних дел РФ является статистический учет преступлений, являющийся единым для всех правоохранительных органов России. Статистическая информация ФКУ «ГИАЦ МВД России» содержит данные с 1970 года, ее объем превышает 60 млн. показателей. Объемы оперативно-справочной, криминалистической, розыскной, дактилоскопической, статистической, научно-технической информации постоянно растет.

В МВД России проводится комплекс мероприятий, направленных на интеграцию и анализ больших объемов данных, содержащихся в информационных массивах министерства и иных государственных органов. Так, МВД осуществляет разработки, позволяющие сопоставлять различные сведения, которые находятся на информационных ресурсах, и выявлять оперативно значимые сведения.