Поскольку в начальной точке η(t0 )= 0 , то первое слагаемое в последнем выражении будет равно нулю, если положить в конечной точке
∂F |
|
|
|
|
|
|
|
∂ u |
|
= 0 . |
(4.2.36) |
∂f |
|
||
|
|
|
∂ u t f
Тогда из выражений (4.2.34) и (4.2.35) следует, что
|
|
|
∂F |
|
∂f |
|
− |
∂F |
|
∂f |
|
|
|
|
∂F |
|||
t f |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
∂ x |
|
|
∂ u |
∂ x |
|
|
|
∂ u |
||||||||||
∫ |
η |
|
∂ u |
|
|
− |
d |
|
|
dt = 0 . |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
t |
|
|
|
|
|
∂f |
|
|
|
|
|
dt |
∂f |
|
|
|||
|
0 |
|
|
|
|
∂ u |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
∂ u |
|||||
Так как последнее уравнение должно выполняться при произвольных функциях η, нулю должно равняться выражение в квадратных скобках. Таким образом, уравнение Эйлера-Лагранжа для данной задачи оптимального управления примет вид
∂F |
|
∂f |
|
− |
∂F |
|
∂f |
|
|
|
∂F |
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|||||||
∂ x |
|
∂ u |
|
|
∂ u |
|
∂ x |
− |
d |
∂u |
= 0 . |
(4.2.37) |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
∂f |
|
|
|
|
dt |
∂f |
||||||
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∂u |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
∂u |
|
|
|||
Решая последнее уравнение с учётом граничных условий (4.2.28) и (4.2.36), определяем оптимальное управление u(t). Это классическая задача вариационного исчисления с заданными условиями на концах интервала.
226
Аналитическое решение двухточечной краевой задачи возможно только в исключительных случаях, поэтому, как правило, приходится прибегать к методу последовательных приближений. Этот метод состоит в выборе наугад некоторого конечного значения x(tf )= xf и численном
решении уравнения Эйлера-Лагранжа при выбранном значении xf и заданной величине x0. Затем вычисляем разность между полученным
∂F |
|
|
|
|
|
∂u |
и заданным конечными условиями. Поскольку эта разность с пер- |
|
∂f |
||
|
∂u t f
вого раза не будет равна нулю, процесс продолжаем до тех пор, пока эта разность не станет меньше заданной достаточно малой величины.
Можно получить и многомерный аналог уравнения Эйлера-Лагранжа (4.2.37).
4 . 2 . 4 . Учёт о граничений с по мощью м ето да м но жителей Лагр анжа .
До сих пор рассматривались задачи оптимального управления при отсутствии каких-либо ограничений на переменные состояния или на управляющие воздействия. Но на практике всегда имеются некоторые физические ограничения, как на управляемый процесс, так и на управляющие воздействия. Обычно учёт ограничений проводят при помощи множителей Лагранжа. Этот метод даёт изящный подход к решению задачи отыскания экстремума функционала, подчинённого одному или нескольким ограничивающим зависимостям, когда последние настолько сложны, что их трудно использовать для исключения свободных пара-
227
метров. Метод множителей Лагранжа делает не нужным решение уравнений, задающих ограничения с целью исключения свободных параметров.
Обозначим функцию, экстремум которой требуется найти, через
P(u)= P(u1,u2 ,...ur ).
Пусть на управление u накладываются ограничения вида |
|
Q(u)= Q(u1,u2 ,...ur )≤ c , |
(4.2.38) |
где c = [c1 c2 ... cr ]T – r-мерный вектор-столбец.
Тогда вектор u, доставляющий максимум или минимум функции P, можно найти, определив условия максимума или минимума промежуточ-
ной функции |
|
G(u)= P(u)+ λT Q(u), |
(4.2.39) |
где λ = [λ1 λ2 ... λr ]T – r-мерный вектор-столбец, именуемый векторным множителем Лагранжа.
Определив экстремум этой новой функции, получим вектор u как функцию векторного множителя Лагранжа λ. Подставив найденный век-
тор |
|
u(λ)= u(λ1,λ2 ,...λr ) |
(4.2.40) |
в систему ограничительных соотношений (4.2.38), получим r уравнений относительно r компонент вектора λ = [λ1 λ2 ... λr ]T . Решая полу-
228
ченные уравнения, определяем компоненты вектора λ и, подставив эти значения в соотношение (4.2.40), получим вектор оптимального управления.
Пример 4.2.4. Пусть уравнения динамики объекта являются линейными. В общем случае эти уравнения записываются в матричном виде
|
|
|
|
x(t)= Ax(t)+ Bu(t), |
(4.2.41) |
|
|
|
|
ɺ |
|
где x = [x1 |
x2 |
... |
xn ]T |
– как обычно, n-мерный вектор состояния объ- |
|
екта, u = [u1 |
u2 |
... |
ur ]T |
– r-мерный вектор управления, а A и B – мат- |
|
рицы соответствующих размерностей. |
|
||||
Пусть требуется за время Т перевести объект из заданного начального
состояния x(0)= x |
0 |
в конечное состояние1 |
|
|
|
|
|
|
|
x(T )= 0 . |
(4.2.42) |
Найдём вектор оптимального управления u (t), доставляющий минимум интегрального квадратичного критерия
I(u)= T∫uT Hudt , |
(4.2.43) |
0 |
|
где матрица квадратичной формы H является положительно определённой и симметрической.
1 Управление, целью которого является перевод объекта в заданное конечное состояние в заданный момент времени, называется терминальным управлением.
229
Конечное состояние (4.2.42) можно принять за систему ограничительных соотношений.
Согласно методу множителей Лагранжа преобразуем вначале ограничительные соотношения (4.2.42) в интегральную форму, поскольку критерий оптимальности (4.2.43) задан в интегральном виде.
Как известно [1], решение уравнений состояния имеет вид
x(t)= Φ(t)x0 + ∫t Φ(t − τ)Bu(τ)dτ ,
0
где Φ(t)= eAt – переходная матрица.
В конечной точке t=T вектор состояния равен
x(T )= Φ(T )x0 + T∫Φ(T − τ)Bu(τ)dτ .
0
С учётом соотношений (4.2.42) последнее уравнение превратится в уравнение
Φ(T )x0 + T∫Φ(T − τ)Bu(τ)dτ = 0 .
0
Решая это уравнение относительно x0 , и учитывая свойства переходной матрицы, получим
x0 = −T∫Φ−1(t)Bu(t)dt = 0 . |
(4.2.44) |
0 |
|
230