кривая в плане, горизонтальная, уклон, конец спуска, вершина подъема); сооружения и инженерные устройства (мост, эстакада, тоннель, пешеходный переход, перекресток, перегон, остановка общественного транспорта, регулируемый железнодорожный переезд с дежурным, регулируемый железнодорожный переезд без дежурного, нерегулируемый железнодорожный переезд); вид покрытия (асфальтобетон, цементобетон, щебеночный, грунтовое, иной вид покрытия); состояние проезжей части (сухое, мокрое, загрязненное, свежеуложенная поверхность, заснеженное, гололед, обработанное противогололедными материалами, иной вид покрытия); состояние погоды (ясно, пасмурно, туман, дождь, снегопад); дорожные условия, сопутствующие возникновению ДТП (неровное покрытие, дефекты покрытия, низкие сцепные качества покрытия и т.д.); командир СПДПС (фамилия); дата регистрации ДТП.
Для потока «Сведения о транспортных средствах, участвовавших в ДТП» необходимо сформировать следующие данные: № транспортного средства; транспортное средство скрылось (да, нет, задержано – 1 сутки, 1–3 суток, 3–10 суток, свыше 10 суток); тип транспортного средства; транспортное средство в розыске (да, нет); № двигателя; № кузова; № шасси; группа цвета (белый, желтый, коричневый, красный, оранжевый, фиолетовый, синий, зеленый, иной); технические неисправности; код завода-изготовителя; расположение руля и тип привода (левый, правый, передний привод, задний привод, полноприводный, иной); модель транспортного средства; код модели; год выпуска; пассажировместимость; места наибольшего повреждения; количество прицепов; регион регистрации; принадлежность (форма собственности, организационно-правовая форма); лицензия (есть, нет, неопределенно); государственный регистрационный знак; свидетельство о регистрации.
Для потока «Сведения об участниках ДТП» необходимо сформировать следующие данные: фамилия, имя, отчество; адрес места жительства; место работы; водительское удостоверение; категория участника ДТП (водитель, пассажир, пешеход, иной участник); № транспортного средства; скрылся с места ДТП (нет, да, впоследствии разыскан, не установлен); пол (мужской, женский); дата рождения (число, месяц, год); водительский стаж (количество лет); время за рулем (в часах); социальная характеристика (рабочий, служащий, военнослужащий, пенсионер, безработный, учащийся, предприниматель, сотрудники ОВД, иной); тяжесть (не пострадал, погиб, ранен); страна
121
гражданства; нарушения ПДД.
Рассмотрим выходные потоки информации, которые необходимо сформировать в данной системе. Они представлены в табл. 5.
Таблица 5
Выходные параметры ИА СППР
Наименование |
Описание |
Периодичность |
|
|
|
Хранилище данных |
Содержит всю информацию о |
Ежедневная, ежегод- |
|
данных, получаемых в резуль- |
ная, ежемесячная |
|
тате возникновения ДТП, ста- |
|
|
тистическую информацию |
|
|
и т.д. |
|
|
|
|
Отчетность за опре- |
Содержит информацию о числе |
Ежедневная, ежегод- |
деленный период |
сформированных отчетов о |
ная, ежемесячная |
|
ДТП |
|
|
|
|
Информация, необхо- |
Содержит информацию, полу- |
По запросу пользова- |
димая для принятия |
ченную после анализа ДТП |
теля |
управленческого ре- |
|
|
шения |
|
|
|
|
|
Для выходного потока «Отчетность за определенный период» будет характерно обобщение всей входной информации и на ее основе формирование карточки учета дорожно-транспортного происшествия. Для системы анализа и учета ДТП целесообразно использовать
Multidimensional OLAP (MOLAP), предназначенную для реализация механизма при помощи многомерной базы данных на стороне сервера.
Вследствие того, что некоторые измерения содержатся в нескольких связанных таблицах, такая схема хранилища данных носит название «снежинка». Дополнительные таблицы измерений в такой схеме, обычно соответствующие верхним уровням иерархии измерения и находящиеся в соотношении «один-ко-многим» в главной таблице измерений, соответствующей нижнему уровню иерархии, иногда называют консольными таблицами (outrigger table).
Одним из важных вопросов при разработке ИА КСППР является вопрос выбора структуры. Существует два вида структур КСППР:
122
КСППР на основе транзакционной системы обработки данных и |
||||
предметной экспертизы; КСППР с аналитической экспертизой и хра- |
||||
нилищем данных. |
|
|
|
|
В КСППР для |
анализа |
и учета |
ДТП как информационно- |
|
аналитической системы необходимо включить методы анализа данных |
||||
(Data Mining). Это |
говорит о необходимости использования процедур |
|||
аналитической экспертизы и создании базы оперативных данных, кото- |
||||
рые потребуются для принятия решений ЛПР. Детализированная схема |
||||
хранения информации в ИА КСППРпредставлена на рис.18. |
||||
Нормативные и |
|
Оперативные |
||
справочные дан- |
|
данные |
||
ные |
|
Пользователь |
|
|
|
|
|
||
Хранилище данных |
БД оперативных |
|||
Витрины данных |
|
данных |
||
|
|
|||
|
Репозиторий |
Формирование |
||
1 |
n |
|
||
Хранение |
метаданных |
|||
. . . |
|
|||
|
метаданных |
|
||
m |
n |
|
|
|
. . . |
|
|
|
|
БД аналитической информации |
|
|||
|
|
|
Система хранения |
|
|
|
|
информации |
|
Рис.18. Детализированная схема системы хранения информации в КСПП |
||||
На рис. 18 видно, что различные данные поступают в хранилище, из которого могут быть сформированы оперативные данные, исполь-
123
зуемые для дальнейшей обработки и анализа информации. Из храни- |
|||
лища данных можно выделить витрины данных, которые содержат |
|||
набор данных, не подвергающихся аналитической обработке, и БД |
|||
аналитической информации, где содержится анализ предыдущих ис- |
|||
следований, а также репозиторий – место хранения метаданных и |
|||
случайных ошибок работы программы. |
|
||
Данные |
Данные из БД |
Оперативные |
|
из ВД |
аналитической |
||
данные |
|||
|
информации |
||
|
|
||
Информационный |
Система обработки информации |
||
анализ данных |
|||
|
|
||
|
Разбор данных |
|
|
|
|
Анализируемые данные |
|
Аналитическая экспер- |
|
|
|
тиза |
Разобранные |
Подбор |
|
Data Mining |
данные |
||
вариантов |
|||
|
|||
Регрессия |
|
|
|
Ассоциация |
|
Правила |
|
Трансформация |
разбора |
||
|
|
||
Классификация |
и нормализация |
|
|
данных |
|
||
|
|
||
|
Предметная экспертиза |
||
Таблицы |
|
Деревья |
|
|
Диаграммы |
|
|
Результаты для |
|
|
|
принятия решения |
|
Решение |
|
|
|
||
Рис. 19. Детализированная схема системы анализа информации в КСППР |
|||
Система анализа информации (рис. 19) позволит формировать отчеты с использованием математических вычислений, сравнительного анализа и многих других возможностей, которые позволяют поль-
124
зователю привести данные к желаемому виду и принять необходимое решение. Технология использования хранилищ данных позволяет принимать высокоэффективные решения, повысить качество и скорость обработки информации, при этом КСППР будет хранить исторический анализ данных в БД аналитической информации, что позволит проводить более полное моделирование и прогнозирование.
Система анализа информации позволяет формировать отчеты с использованием математических вычислений, сравнительного анализа и многих других возможностей, которые позволяют пользователю привести данные к желаемому виду.
В общем виде система поддержки принятия решений (СППР) представляет собой совокупность инструментальных средств, которые используются для манипулирования данными, их анализа и представления результатов анализа конечному пользователю. В качестве универсальной технологии анализа данных можно указать на техно-
логию Knowledge Discovery in Databases (KDD), которая включает в себя следующие этапы: подготовку данных, выбор информативных признаков, очистку данных, методы анализа данных или технологию Data Mining (DM), постобработку данных и интерпретацию полученных результатов. Данная технология представляет собой своеобразный конструктор, который позволяет в зависимости от специфики решаемой задачи выбирать наиболее подходящий алгоритм решения, методы и модели обработки данных, обнаружения новых знаний из данных больших объемов. KDD – это современная технология поиска полезных знаний в «сырых» данных. Этими знаниями могут быть правила, описывающие связи между свойствами данных (деревья решений), часто встречающиеся шаблоны (ассоциативные правила), а также результаты классификации (нейронные сети) и кластеризации данных (карты Кохонена) и т.д.
Для поддержки принятия решений в задаче учета и анализа ДТП применяются различные методы. В СибАДИ в рамках дипломного проекта была разработана ИАСППР на основе технологии хранилища данных и технологии KDD. Были решены такие задачи поддержки принятия решений, как определение травмоопасных участков дорог, определение вероятности наступления дорожно-транспортного происшествия при заданном наборе параметров и другие задачи. Для
125