ЗМІСТ
ПЕРЕЛІК УМОВНИХ ПОЗНАЧЕНЬ
ВСТУП
. ТАКТИКО − ТЕХНІЧНЕ ОБГРУНТУВАННЯ НЕОБХІДНОСТІ РОЗРОБКИ АЛГОРИТМУ ІДЕНТИФІКАЦІЇ СКЛАДНИХ ОБ’ЄКТІВ МОНІТОРИНГУ НА ОСНОВІ НЕЧІТКИХ АЛГОРИТМІВ КЛАСТЕРНОГО АНАЛІЗУ
.1 Методи та алгоритми кластеризації
.2 Постановка задачі дослідження
. РОЗРОБКА АЛГОРИТМУ ІДЕНТИФІКАЦІЇ СКЛАДНИХ ОБ’ЄКТІВ МОНІТОРИНГУ НА ОСНОВІ НЕЧІТКИХ АЛГОРИТМІВ КЛАСТЕРНОГО АНАЛІЗУ
.1 Основні ознаки, що дозволяють здійснювати ідентифікацію складних об’єктів моніторингу на основі нечітких алгоритмів кластерного аналізу
.2 Вибір доцільного алгоритму кластеризації складних об’єктів моніторингу
.3 Синтез математичної моделі кластеризації об’єктів за результатами роботи засобів радіомоніторингу
.4 Алгоритм ідентифікації складних об’єктів моніторингу на основі нечітких алгоритмів кластерного аналізу
. АПРОБАЦІЯ АЛГОРИТМУ ІДЕНТИФІКАЦІЇ РІЗНИХ ТИПІВ СКЛАДНИХ ОБ’ЄКТІВ НА ОСНОВІ НЕЧІТКИХ АЛГОРИТМІВ КЛАСТЕРНОГО АНАЛІЗУ
. ОХОРОНА ПРАЦІ
.1 Аналіз умов праці на робочому місці
.2 Вимоги безпеки при роботі з ПЕОМ
ВИСНОВКИ
ПЕРЕЛІК ПОСИЛАНЬ
Додаток. Програма реалізації алгоритму ідентифікації складних ОМ на основі нечітких алгоритмів кластерного аналізу
ПЕРЕЛІК УМОВНИХ ПОЗНАЧЕНЬ
¾ ГІС геоінформаційна система
¾ ДРВп джерело радіовипромінювання
¾ ЗС збройні сили
¾ ІР інформаційна робота
¾ ОМ об’єкт моніторингу
¾ РЕО радіоелектронна обстановка
¾ РЛС радіолокаційна станція
¾ РМ радіомоніторинг
¾ РТМ радіотехнічний
моніторинг
ВСТУП
Об’єктом дослідження кваліфікаційної роботи є процес ведення інформаційної роботи підрозділами радіомоніторингу (РМ). Предметом дослідження є програмно - алгоритмічне забезпечення інформаційної роботи (ІР) ідентифікації об’єктів моніторингу (ОМ) за результатами роботи засобів РМ. Ведення ІР має на меті обробку даних від добуваючих підрозділів. Зокрема, підвищення інформаційного забезпечення застосування військ, у підрозділах і частинах збройних сил (ЗС) передбачається за рахунок підвищення точності визначення місцеположення джерела радіовипромінювання (ДРВп) засобами моніторингу з подальшою їх ідентифікацією та створенням відповідних моделей їх діяльності.
Метою роботи є розробка алгоритму ідентифікації різних видів складних ОМ при веденні ІР, внаслідок роботи якого збільшується швидкість обробки інформації, яка надходить від засобів РМ та збільшується час для прийняття рішення оператором.
Робота виконувалась методом кластерного аналізу, адже одним з найефективніших варіантів побудови моделі розміщення складних об’єктів моніторингу в умовах відсутності апріорної вибірки є застосування кластерного аналізу. Використання алгоритмів кластеризації дозволяє здійснювати побудову можливих варіантів розміщення об’єктів моніторингу з врахуванням особливостей рельєфу місцевості на основі геоінформаційних систем (ГІС) з меншими затратами часу.
Отримані результати відображають бойовий порядок, тип підрозділу та радіоелектронну обстановку (РЕО) в ньому. Для побудови моделі розміщення складних об’єктів моніторингу застосовується принцип статистичного детермінованого розміщення простих об’єктів. Застосування даного принципу зводиться до послідовного отримання засічок для побудови моделі відображення РЕО.
Результати роботи можуть бути використані для ведення ІР підрозділами РМ.
Розвиток даної роботи полягає у
збільшенні кількості ознак ідентифікації, що в свою чергу призведе до
збільшення ймовірності правильного розпізнавання складних ОМ.
1. ТАКТИКО - ТЕХНІЧНЕ ОБГРУНТУВАННЯ
НЕОБХІДНОСТІ РОЗРОБКИ АЛГОРИТМУ ІДЕНТИФІКАЦІЇ СКЛАДНИХ ОБ’ЄКТІВ МОНІТОРИНГУ НА
ОСНОВІ НЕЧІТКИХ АЛГОРИТМІВ КЛАСТЕРНОГО АНАЛІЗУ
Сьогодні, основою досягнення переваги над противником є технологічна перевага та збільшення інформаційної складової забезпечення бойових дій ЗС, а головною рисою сучасної збройної боротьби - інтеграція процесів ведення моніторингу, передачі даних, управління військами та зброї, вогневої поразки противника в масштабі часу близькому до реального.
Цим питанням присвячено чимало розробок закордонних і вітчизняних фахівців. Їх успішність радикально пов’язують з можливостями добувати й доставляти споживачеві необхідну інформацію для вирішення визначених збройним силам завдань.
Метою даного розділу є обґрунтування необхідності удосконалення процесу розпізнавання та вибір доцільного алгоритму ідентифікації складних ОМ.
Даний алгоритм повинен забезпечити вибір найкращого рішення з множини можливих рішень при проведенні ідентифікації складних ОМ. Процес прийняття рішення при веденні РМ характеризується частковою невизначеністю, неповнотою і недостовірністю інформації, малим резервом часу та динамічною зміною РЕО. Крім того, він повинен враховувати існуючі недоліки процесу ідентифікації складних ОМ.
Враховуючи особливості ведення РМ: умови невизначеності та відсутність апріорної інформації про груповий об’єкт, що робить не можливим використання класичної теорії ідентифікації (класифікації), в даній роботі мною запропоновано рішення даної задачі за допомогою кластерного аналізу [3].
Згідно [9] кластерний аналіз - це спосіб групування багатовимірних об’єктів, оснований на представленні результатів окремих спостережень точками геометричного простору з подальшим виділенням груп як «згустків» цих точок.
Таким чином, основна мета аналізу -
виділити у вхідних багатовимірних масивах даних такі однорідні підмножини, щоб
об’єкти всередині груп були схожі між собою, а об’єкти з різних груп - не
схожі. Під «схожістю» розуміється близькість об’єктів в багатовимірному
просторі ознак, і тоді задача зводиться до виділення в цьому просторі скупчень
об’єктів, які вважаються однорідними групами. В даному розділі розглянуто
існуючі алгоритми кластеризації та проведено їх аналіз [7], а також здійснено
постановку задачі дослідження. Задача ідентифікації вирішується в умовах
невизначеності, адже для кожного окремого завдання необхідно вибрати
відповідний алгоритм і міри відстаней. Вибір метрики повністю лежить на операторі,
оскільки результати кластеризації можуть істотно відрізнятися при використанні
різних способів визначення ступеня схожості. Візуалізація великої кількості
просторових даних займає тривалий час. Дана проблема вирішується за допомогою
вибору найбільш доцільного методу кластеризації, що дозволить багато в чому
покращити процес відображення просторових даних і полегшить роботу з ними.
1.1 Методи та алгоритми кластеризації
кластеризація моніторинг складний об'єкт
З аналізу літератури [2] визначено, що загальноприйнятої класифікації методів кластеризації не існує. Але якщо узагальнити різні методи кластеризації, то можна виділити ряд груп.
Об'єднання схожих об'єктів у групи може бути здійснене різними способами. Серед таких груп, згідно [18] виділяються наступні:
а) ієрархічні групи - будують не одне розбиття вибірки на кластери, що не перетинаються, а систему вкладеного розбиття. За допомогою таких груп можна виділити кластери, об’єднуючи менші кластери та розподіляючи більші. Тобто на виході створюється дерево кластерів, на різних рівнях якого можна отримати різне розподілення на кластери. Серед груп ієрархічної кластеризації виділяються два основні типи: висхідні і низхідні алгоритми.
низхідні типи груп кластеризації працюють за принципом «згори-вниз»: на початку усі об'єкти поміщаються в один кластер, який потім розбивається на дрібніші кластери.
висхідні типи, які на початку роботи поміщають кожен об'єкт в окремий кластер, а потім об'єднують кластери у більші, поки усі об'єкти вибірки не будуть міститись в одному кластері.
б) неієрархічні (плоскі) - будують одне розбиття об’єктів на кластери. Плоскі групи вважаються досить швидкими та простими в дії. До того ж одноразове розбиття дозволяє уникнути необхідності зберігати велику кількість проміжних даних. Серед таких груп кластеризації виділяються наступні типи:
типи, які ґрунтовані на теорії графів. Суть їх полягає в тому, що вибірка об'єктів представляється у вигляді графа G= (V, E), вершинам (V) якого відповідають об'єкти, а ребра (E) мають вагу, яка дорівнює «відстані» між об'єктами. Перевагою даних типів кластеризації є наочність, відносна простота реалізації і можливість внесення різних удосконалень, які ґрунтовані на геометричних міркуваннях.
EM - тип. Алгоритм EM - типу використовують в математичній статистиці для пошуку оцінок максимальної правдоподібності параметрів ймовірнісних моделей, коли модель залежить від деяких прихованих змінних. Кожна ітерація EM-типу алгоритму складається з двох кроків. На E-кроку (expectation) обчислюється очікуване значення функції правдоподібності, при цьому приховані змінні розглядаються як спостережувані. На M-кроку (maximization) обчислюється оцінка максимальної правдоподібності, таким чином збільшується очікувана правдоподібність, що обчислюється на E-кроці. Потім це значення використовується для E-кроку на наступній ітерації. Алгоритм виконується до збіжності.
K - середніх (k - means) - тип. Алгоритм цього типу будує задане число кластерів, розташованих якнайдалі один від одного. Робота алгоритму ділиться на декілька етапів: випадковий вибір k точок, що є початковими «центрами мас» кластерів; віднесення кожного об'єкта до кластера з найближчим «центром мас»; перерахування «центрів мас» кластерів згідно з їх поточним складом; якщо критерій зупинки алгоритму не задоволений, то повернутися до віднесення кожного об'єкта до кластера з найближчим «центром мас». В якості критерію зупинки роботи алгоритму зазвичай вибирають мінімальну зміну середньоквадратичної похибки. Так само можливо зупиняти роботу алгоритму, якщо при спробі віднести об'єкт до кластера з найближчим «центром мас», не було об'єктів, що перемістилися з кластера в кластер. До недоліків цього алгоритму можна віднести необхідність задавати кількість кластерів для розбиття.
C - середніх (c - means) - найбільш популярний тип нечіткої кластеризації. Він є модифікацією типу k- середніх. Кроки роботи алгоритму даного типу:
) вибір початкового нечіткого розбиття n об'єктів k кластерів шляхом вибору матриці приналежності U розміру n * k;
) використовуючи матрицю U, пошук значення критерію нечіткої помилки; кожне спостереження «приписується» до одного з n кластерів - того, відстань до якого найкоротша;
)розрахунок нового центра кожного кластера як елемент, ознаки якого розраховуються як середнє арифметичне ознак об’єктів, що входять у цей кластер.
Відбувається стільки ітерацій (повторюються кроки 3-4), поки кластерні центри не стануть стійкими.
Не дивлячись на значні відмінності
між перерахованими методами всі вони спираються на початкову « гіпотезу
компактності»: у просторі об’єктів всі близькі об’єкти повинні відноситись до
одного кластера, а всі різні (відмінні) об’єкти відповідно повинні знаходитись
у різних кластерах відповідно. Для вирішення основної задачі, тобто
ідентифікації ОМ за допомогою алгоритмів кластерного аналізу доцільним буде
застосування алгоритму C - середніх - типу. Адже даний тип алгоритму має ряд
особливостей та переваг, він дозволяє одному і тому ж об’єкту належати
одночасно кільком кластерам з різним ступенем приналежності, а також він
простий і швидкий та легко реалізується на практиці.
1.2
Постановка задачі дослідження
Процес прийняття рішення при веденні РМ характеризується частковою невизначеністю і недостовірністю інформації, малим резервом часу та динамічною зміною РЕО. Проаналізувавши теоретичний матеріал було встановлено, що на сучасному етапі існує велика кількість типів кластеризації, які використовують різні принципи та підходи. Але, незважаючи на це, проблема актуальна, розробляються нові алгоритми для вирішення тих чи інших завдань. Для роботи над кваліфікаційною роботою необхідно проаналізувати методи і алгоритми кластеризації, розібратися в області застосування кожного з них і вибрати найбільш доцільний для даного завдання алгоритм, який повинен забезпечувати: вибір найкращого рішення з множини можливих рішень ідентифікації складних ОМ, головним елементом якого є кластеризація.
Підвищення вимог до достовірності та оперативності прийнятих рішень в процесі ведення ІР потребують комплексування даних різних видів моніторингу. Тим часом, існуючі способи визначення місця положення ОМ та їх ідентифікації неоптимальні стосовно основних показників ефективності. Такими показниками є ймовірність правильного ухвалення рішення і час його прийняття. В ідеалі потрібно домогтися покращення даних параметрів, але через їхній взаємозв’язок це неможливо. Підвищення достовірності потребує обробки й аналізу додаткової інформації, що неминуче призводить до збільшення часу.
Задачу підвищення достовірності своєчасного і правильного рішення для визначення місцеположення ОМ та його ідентифікації можна вирішити шляхом автоматизації процесу обробки інформації і формування рекомендацій, що призведе до значного зменшення часу інформаційної підготовки прийняття рішення. Його зменшення дасть оператору більше часу на прийняття рішення, що дозволить більш детально аналізувати інформацію, яка надходить про ОМ, і дасть можливість використання додаткової інформації. Це, у свою чергу, призведе до підвищення ймовірності правильного прийняття рішення при тому ж часі виконання алгоритму прийняття рішення. Вироблення рекомендацій оператору дасть можливість істотно спростити наступний етап його роботи - етап безпосереднього прийняття рішення.
Отже, задачу дослідження по ідентифікації ОМ з використанням різних видів ДРВп в загальному вигляді можна сформулювати таким чином: необхідно за певними показниками РЕО провести ідентифікацію ОМ з максимальною достовірністю за заданий час.
Часові витрати на прийняття рішення
в автоматизованій системі управління (АСУ) з аналізу наявних матеріалів можливо
відобразити за допомогою діаграми (рис.1.1).
Рисунок 1.1 − Часова
діаграма прийняття рішень
На рис. 1.1 прийняті такі умовні позначення:
- час збору
інформації технічними засобами;
- час, що
витрачається на обробку інформації і формування первинних гіпотез;
- час, що
витрачається на вибір рішення;
- час,
необхідний для реалізації прийнятого рішення.
Як видно з діаграми (рис.1.1), значна частина часу йде на обробку інформації і формування гіпотез. На вибір рішення приділяється досить малий час, що може привести до низької його імовірності. Це може викликати прийняття неадекватних рішень.
Отже, задача комплексування даних
різних видів радіомоніторингу сформульована таким чином: необхідно за
показниками
оцінити
місцеположення ОМ та провести його ідентифікацію D за допустимий час з
максимальною достовірністю. У формалізованому вигляді її можна представити:
,
(1.1)
де
− показник з визначеної множини
;
−
варіанти оцінки місцеположення ОМ;
−
час і допустимий час аналізу відповідно.
Висновок до першого розділу
На основі визначених недоліків та
обґрунтованого методу ідентифікації ОМ у межах даної кваліфікаційної роботи
необхідно провести наступні дослідження: визначити ознаки, що характеризують
процес iдентифiкацiї складних об’єктів по різних видах РМ, розробити модель
iдентифiкацiї складних ОМ по різних видах РМ, розробити програмно-алгоритмічне
забезпечення.
2. РОЗРОБКА АЛГОРИТМУ ІДЕНТИФІКАЦІЇ
СКЛАДНИХ ОБ’ЄКТІВ МОНІТОРИНГУ НА ОСНОВІ НЕЧІТКИХ АЛГОРИТМІВ КЛАСТЕРНОГО АНАЛІЗУ
В даному розділі здійснюється
розробка алгоритму ідентифікації об’єктів моніторингу на основі нечітких
алгоритмів кластерного аналізу. Розробка охоплює чотири етапи. На першому етапі
проаналізовано методи розрахунку відстаней між об’єктами і центрами кластерів,
обґрунтовано який для вирішення задачі кваліфікаційної роботи буде
найдоцільнішим. На другому етапі вибрано сукупність алгоритмів кластеризації,
на основі яких буде будуватись математична модель. На третьому етапі
розраховано математичну модель кластеризації ОМ за результатами роботи засобів
РМ та РТМ. На завершальному четвертому етапі побудовано власне алгоритм
ідентифікації складних ОМ на основі нечітких алгоритмів кластерного аналізу.