Материал: 6251

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Поскольку в начальной точке η(t0 )= 0 , то первое слагаемое в последнем выражении будет равно нулю, если положить в конечной точке

∂F

∂ u	= 0 .	(4.2.36)
∂f	= 0 .	(4.2.36)
∂f

∂ u t f

Тогда из выражений (4.2.34) и (4.2.35) следует, что

∂F

∂f

−

∂F

∂f

∂F

t f

∂ x

∂ u

∂ x

∂ u

∫

∂ u

−

dt = 0 .

∂f

∂ u

Так как последнее уравнение должно выполняться при произвольных функциях η, нулю должно равняться выражение в квадратных скобках. Таким образом, уравнение Эйлера-Лагранжа для данной задачи оптимального управления примет вид

∂F

∂f

−

∂F

∂f

∂F

∂ x

∂ u

∂ x

−

∂u

= 0 .

(4.2.37)

∂f

∂u

Решая последнее уравнение с учётом граничных условий (4.2.28) и (4.2.36), определяем оптимальное управление u(t). Это классическая задача вариационного исчисления с заданными условиями на концах интервала.

226

Аналитическое решение двухточечной краевой задачи возможно только в исключительных случаях, поэтому, как правило, приходится прибегать к методу последовательных приближений. Этот метод состоит в выборе наугад некоторого конечного значения x(tf )= xf и численном

решении уравнения Эйлера-Лагранжа при выбранном значении xf и заданной величине x0. Затем вычисляем разность между полученным

	∂F

	∂u	и заданным конечными условиями. Поскольку эта разность с пер-
	∂f
	∂f

∂u t f

вого раза не будет равна нулю, процесс продолжаем до тех пор, пока эта разность не станет меньше заданной достаточно малой величины.

Можно получить и многомерный аналог уравнения Эйлера-Лагранжа (4.2.37).

4 . 2 . 4 . Учёт о граничений с по мощью м ето да м но жителей Лагр анжа .

До сих пор рассматривались задачи оптимального управления при отсутствии каких-либо ограничений на переменные состояния или на управляющие воздействия. Но на практике всегда имеются некоторые физические ограничения, как на управляемый процесс, так и на управляющие воздействия. Обычно учёт ограничений проводят при помощи множителей Лагранжа. Этот метод даёт изящный подход к решению задачи отыскания экстремума функционала, подчинённого одному или нескольким ограничивающим зависимостям, когда последние настолько сложны, что их трудно использовать для исключения свободных пара-

227

метров. Метод множителей Лагранжа делает не нужным решение уравнений, задающих ограничения с целью исключения свободных параметров.

Обозначим функцию, экстремум которой требуется найти, через

P(u)= P(u1,u2 ,...ur ).

Пусть на управление u накладываются ограничения вида
Q(u)= Q(u1,u2 ,...ur )≤ c ,	(4.2.38)

где c = [c1 c2 ... cr ]T – r-мерный вектор-столбец.

Тогда вектор u, доставляющий максимум или минимум функции P, можно найти, определив условия максимума или минимума промежуточ-

ной функции
G(u)= P(u)+ λT Q(u),	(4.2.39)

где λ = [λ1 λ2 ... λr ]T – r-мерный вектор-столбец, именуемый векторным множителем Лагранжа.

Определив экстремум этой новой функции, получим вектор u как функцию векторного множителя Лагранжа λ. Подставив найденный век-

тор
u(λ)= u(λ1,λ2 ,...λr )	(4.2.40)

в систему ограничительных соотношений (4.2.38), получим r уравнений относительно r компонент вектора λ = [λ1 λ2 ... λr ]T . Решая полу-

228

ченные уравнения, определяем компоненты вектора λ и, подставив эти значения в соотношение (4.2.40), получим вектор оптимального управления.

Пример 4.2.4. Пусть уравнения динамики объекта являются линейными. В общем случае эти уравнения записываются в матричном виде

				x(t)= Ax(t)+ Bu(t),	(4.2.41)
				ɺ
где x = [x1	x2	...	xn ]T	– как обычно, n-мерный вектор состояния объ-
екта, u = [u1	u2	...	ur ]T	– r-мерный вектор управления, а A и B – мат-
рицы соответствующих размерностей.

Пусть требуется за время Т перевести объект из заданного начального

состояния x(0)= x	0	в конечное состояние1
	0
		x(T )= 0 .	(4.2.42)

Найдём вектор оптимального управления u (t), доставляющий минимум интегрального квадратичного критерия

I(u)= T∫uT Hudt ,	(4.2.43)
0

где матрица квадратичной формы H является положительно определённой и симметрической.

1 Управление, целью которого является перевод объекта в заданное конечное состояние в заданный момент времени, называется терминальным управлением.

229

Конечное состояние (4.2.42) можно принять за систему ограничительных соотношений.

Согласно методу множителей Лагранжа преобразуем вначале ограничительные соотношения (4.2.42) в интегральную форму, поскольку критерий оптимальности (4.2.43) задан в интегральном виде.

Как известно [1], решение уравнений состояния имеет вид

x(t)= Φ(t)x0 + ∫t Φ(t − τ)Bu(τ)dτ ,

где Φ(t)= eAt – переходная матрица.

В конечной точке t=T вектор состояния равен

x(T )= Φ(T )x0 + T∫Φ(T − τ)Bu(τ)dτ .

С учётом соотношений (4.2.42) последнее уравнение превратится в уравнение

Φ(T )x0 + T∫Φ(T − τ)Bu(τ)dτ = 0 .

Решая это уравнение относительно x0 , и учитывая свойства переходной матрицы, получим

x0 = −T∫Φ−1(t)Bu(t)dt = 0 .	(4.2.44)
0

230

Смотрите также:


«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
«ДОХОДЫ, РАСХОДЫ И ПРИБЫЛЬ КОММЕРЧЕСКОГО БАНКА.»
Значение, сущность и содержание социально — педагогической деятельности в организации для детей-сирот и детей, оставшихся без попечения родителей
Проактивные методы PR-деятельности российских авиационных компаний «Россия», «Азимут»
__RGR2
__RGR2
_11_А. Франс для эл версии
_индив анализ данных
- Интерфейс 485 и оптопорт 11