Материал: Розгляд принципу максимуму Понтрягiна для систем диференціальних рiвнянь з запiзненням по аргументу та з нефiксованим часом i фiксованими крайовими умовами

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Розгляд принципу максимуму Понтрягiна для систем диференціальних рiвнянь з запiзненням по аргументу та з нефiксованим часом i фiксованими крайовими умовами

Зміст

оптимальний диференціальний понтрягiн продуктивність

Вступ

. Теоретична частина

.1 Постановка задачі оптимального керування

.2 Принцип максимуму Понтрягіна

.3 Моделювання оптимального економічного зростання

. Практична частина

Висновки

Список використаної літератури

Вступ

Принцип максимуму в задачі з запізненням ґрунтується на диференційних рівняннях з аргументом, який запізнюється або відхиляється, тобто на таких диференційних рівняннях, в яких невідома функція та її похідна входять при різних значеннях аргументу.

Вперше окремі рівняння такого типу з'явилися в літературі в другій половині XVIII століття (Кондорсе, 1771 р.), але систематичні дослідження почалися лише в XX столітті у зв'язку з потребами прикладних наук. Зокрема, вони знайшли своє застосування і в принципі максимуму Л.С. Понтрягіна, що з'явилося в кінці 50-х років минулого століття, що дало потужний поштовх розвитку цього напряму. Ряд авторів в нашій країні Р. Габасов, Г.Л. Харатішвілі, А.С. Матвеєв, М.М. Красовський та ін, а також за кордоном Галану, Чанг, Лі внесли великий вклад у цю справу.

У 1961 р. Г.Л. Харатішвілі узагальнив принцип максимуму Понтрягіна у випадку постійного запізнення фазової змінної. У своїй роботі він розглядав автономних систему диференціальних рівнянь без запізнення в управлінні.

Його сучасники Чанг і Лі в 1966 р. отримали принцип максимуму для неавтономної системи диференціальних рівнянь в лінійно-квадратичній задачі оптимального управління з кратним запізненням в фазової змінної, але без запізнення в управлінні. Під лінійно-квадратичної завданням приймається та, в якій система диференціальних рівнянь є лінійною за фазовою змінною і управлінням, а функція, для якої вирішується екстремальна задача, квадратично залежить від цих же змінних.

Тим часом Галану в 1968 р. довів необхідні умови оптимальності для більш загальної задачі оптимального управління з запізненням як у фазової змінної, так і в управлінні. Він розглянув специфічну систему диференціальних рівнянь в інтегральній формі. Його доведення основане на абстрактному методі множників Хестенса.

Гунн в 1976 р. дав необхідні умови оптимальності у формі існування сполученої. А його сучасник Бакка в 1981 р. отримав принцип максимуму в проблемі оптимального управління з кратним запізненням за допомогою теорії оптимальних полів.

У 1988 р. наш співвітчизник А.С. Матвєєв розглянув більш загальну задачу оптимального управління з запізненням, в якої параметр запізнювання представлений як функція часу. Причому узагальнене запізнювання входить як в фазову змінну, так і в управління. Його результати, як і результати Галанея, мають достатньо абстрактний характер, що ускладнює їх практичне застосування.

Метою даної роботи є розглянути принцип максимуму Понтрягiна для систем диференціальних рiвнянь з запiзненням по аргументу та з нефiксованим часом i фiксованими крайовими умовами.

1. Теоретична частина

.1 Постановка задачі оптимального керування

Нехай модель системи керування має вигляд


Функції  - неперервні по всім аргументам i мають частиннi похiднi по x; функцii ,  - кусково-неперервнi по t, T - нефiксоване додатне число xT - фіксований вектор iз Rn.

Керування  - кусково-неперервнi по t функцiї, для яких виконуються умови


де  - заданi додатнi числа.кi функцiї утворюють множину допустимих керувань, яку будемо позначати через U.

Потрiбно знайти вектор допустимих керувань  та число Т, які б мінімізували критерій якості


де f(.) - невiд'ємна неперервна функцiя.

.2 Принцип максимуму Понтрягіна

Для початку дамо декілька означень.

Означення 1. Функція x(t) називається кусково-неперервною на відрізку [t0, t1], якщо вона неперервна усюди на [t0, t1], за винятком кінцевого числа точок розриву першого роду.

Означення 2. Функція x(t) називається кусково-гладкою на відрізку [t0, t1], якщо вона неперервна, а її похідна x'(t) кусково-неперервна на [t0, t1].

Множина всіх кусочно-неперервних і кусочно-гладких функцій на відрізку [t0, t1], що приймають значення з деякої множини M, позначимо відповідно через KC ([t0, t1], M) і KC1 ([t0, t1], M).

Розглянемо задачу:

 (1)

де  - стан системи, або фазова змінна;  - управління системою, або управляюча змінна;  - множина усіх можливих значень управління; θ1 = const - параметр запізнення фазової змінної; θ2 = const - параметр запізнення управління.

Зміна станів системи описується таким диференціальним рівнянням із запізненням:

. (2)

Щоб гарантувати існування рішення цього рівняння, необхідно задати безперервну функцію x0(⋅) таку, що

 (3)

та кусово-неперервну функцію u0(⋅) таку, що

 (4)

Будемо вважати, що функції

,


визначені у (1), (2) і такі, що


задовольняють наступним умовам: самі вони і їхні часткові похідні по змінним xi, yj (i, j = 1, ..., n) неперервні за сукупністю аргументів в G × U × U. Де G - відкрита множина в просторі R × Rn × Rn.

Моменти часу t0 і t1 будемо вважати фіксованими. Значення верхньої межі t1 може бути як кінцевим, так і нескінченним, але в другому випадку може статися так, що інтеграл в (1) розходиться.

Означення 3.

Назвемо пару (x(⋅), u(⋅)) керованим процесом в задачі (1), (2), (3), (4), якщо:

а) управління u(⋅): [t0, t1] → U - кусково-неперервна функція. Для визначеності будемо вважати, що u(⋅) неперервна справа для t0 ≤ t <t1 і зліва в точці t1;

б) фазова траєкторія x(⋅): [t0, t1] → ℝn кусково-гладка функція і її графік Γ лежить в G

;

в) для всіх t  [t0, t1], крім, можливо, точок розриву управління u(⋅), функція x(⋅) задовольняє диференціальному рівнянню (2).

Керований процес називається допустимим, якщо, крім того, виконуються початкові умови (3) і (4).

Допустимий керований процес  називається оптимальним, якщо знайдеться таке ε > 0, що для всякого допустимого керованого процесу (x(⋅), u(⋅)) такого, що

,

виконується нерівність

.

Введемо деякі позначення

 (5)

Має місце наступна теорема, яку ми назвемо принципом максимуму Понтрягіна в задачі з запізненням.

Теорема 1. Якщо  - оптимальний допустимий процес для задачі (1), (2), (3), (4), то існують множники Лагранжа , не дорівнюють одночасно нулю і такі, що виконано

. Рівняння Ейлера

 (6)

. Принцип максимуму Понтрягіна

 (7)


3. Умова трансверсальності:

(8)

Де


Для простоти будемо розглядати випадок, коли n = 1. Це ніскільки не применшує загального випадку, коли n  ℕ довільно, так як в даному випадку збільшується тільки громіздкість виразів, а їхня суть залишається тією ж.

Визначення голчастою варіації. Почнемо з визначення елементарної - вейєрштрасівської - голчастої варіації. Позначимо через


Зафіксуємо точку , елемент  і число  настільки мале, що

Управління

 (9)

назвемо елементарно. голчастою варіацією управління . Розглянемо диференціальне рівняння з запізненням


з початковою умовою для фазової змінної (3) і початковою умовою для керування (4). Позначимо за xα(t) = xα(t; τ, υ) розвязок цього рівняння. Назвемо xα(t) елементарною голчастою варіацією траєкторії , а пару (xα(t), uα(t)) елементарною варіацією процесу . Пару (τ, υ), яка визначає цю варіацію, будемо називати елементарною голкою.

Лемма 1. (Про властивості елементарної варіації). Нехай елементарна голка (τ, υ) фіксована. Тоді існує таке , що, при , виконується:

. траєкторія xα(t) визначена на всьому відрізку [t0, t1] і при α → 0 + 01  рівномірно на [t0, t1];

. при , , існує і неперервна по α похідна , яка при α = 0 визначена як похідна справа;

. Функція  на інтервалі  задовольняє диференціальному рівнянню

 (10)

з початковою умовою

 (11)

а на відрізку  задовольняє тому ж диференціальному рівнянню, але з початковою умовою

 (12)

де  - значення розв’язку системи рівнянь диференціальних рівнянь (10) з початковими умовами (11) у точці  продовжене за неперервністю.

Доведення леми будемо проводити по частинам. Спочатку доведемо для випадку, коли функція  неперервна. Тоді з (2) і в силу умов, накладених на функцію φ, отримуємо, що траєкторія  неперервно диференційована на [t0, t1]. Розглянемо диференціальні рівняння

 (13)

 (14)

Згідно (9) праві частини цих рівнянь співпадають, при t < τ - α, а так як , при , то за теоремою існування та єдиності розв'язку для рівняння із запізненням, для t < τ - α,  і за неперервністю рішення:

 (15)

Зокрема,  неперервно-диференційована по α, як композиція неперервно-диференційовних функцій, і

 (16)

Позначимо  розв’язок наступної задачі Коші:

 (17)

Можна вважати  настільки малим, що  Тоді для , диференціальне рівняння з запізненням


еквівалентно звичайному диференційному рівнянню (17).

Відповідно до локальної теореми існування і єдиності можна підібрати такі ε1 > 0 і δ1 > 0, що  визначена при


а в силу теореми про диференціальної залежності рішень від початкових даних функція v1 є неперервно-диференційованою по сукупності змінних.

Згідно (9) і (15), для визначення xα(t) на відрізку  ми повинні в (17) покласти  і . Якщо  вибрано так, що , то при  маємо