Жизнеописание Л. С. Понтрягина, математика, составленное им самим — страница 70 из 75

u1, u2…, ur, а их совокупность обозначим одной буквой, положив u = (u1, u2…, ur). Здесь u есть вектор, компоненты которого определяют положение рулей. Таким образом, движение самолёта описывается не уравнениями (1), а уравнениями


где в правую часть входит вектор управления u. Вектор управления u меняется со временем по воле пилота самолёта и потому является заданной функцией времени: u = u(t). Таким образом, уравнения (2) в действительности имеют вид


где u(t) есть конкретно осуществляемое в течение времени управление объектом. Систему уравнений (3) уже можно решать.

Следует отметить одно очень важное обстоятельство. Величины u1, u2…, ur, определяющие положение рулей, не могут быть произвольными. Так, если u1 есть величина тяги двигателя, то ясно, что она может меняться лишь в некоторых пределах от 0 до некоторой величины a: 0 ≤ u1a. Точно так же и хвостовой руль может поворачиваться лишь в определённых пределах, так что если u2 есть угол его поворота, то он удовлетворяет некоторым неравенствам: —bu2b.

Чтобы отвлечься от излишней конкретности, мы можем просто сказать, что вектор u не есть произвольный вектор r-мерного пространства, а принадлежит некоторому заданному множеству этого пространства. Система дифференциальных уравнений (2) вместе с заданным множеством Ω даёт математическое описание возможностей поведения управляемого объекта. Такой объект мы будем называть управляемым, поскольку поведение его зависит от того, какой функцией u(t) времени t является управление u объекта.

Для того чтобы начать решать задачу о преследовании одного самолёта другим самолётом, мы должны были бы и второй самолёт описать в виде управляемого объекта, а затем точно сформулировать задачу преследования. Но, как я уже сказал раньше, сама игровая постановка задачи содержит в себе настолько большую странность, что мы предпочли вначале попытаться решить другую задачу, в которой элемент игры отсутствует. Мы предположили, что второй объект неподвижен, или, говоря в терминах самолёта, речь стала идти о том, чтобы перевести самолёт из одного состояния в другое за кратчайшее время.

Математически эта задача формулируется так. В начальный момент времени задаётся некое исходное фазовое состояние объекта, которое мы обозначаем через x0. Кроме того, имеется какое-то другое фазовое состояние объекта — x1. Если, управляя объектом каким-нибудь способом, мы можем перевести его из фазового состояния x0 в фазовое состояние x1, то возникает задача о том, каково должно быть управление, которое переводит объект из фазового состояния x0 в фазовое состояние x1 в кратчайшее время. Это есть задача оптимизации на быстродействие. Получаемое в результате решения этой задачи управление u(t) называется оптимальным в смысле быстродействия, а само движение объекта оптимальным движением в смысле быстродействия.

Если в процессе движения объекта меняется не только время, но и какая-либо другая величина, представляющая для нас особый интерес, например, расходуется топливо, то можно поставить вопрос об оптимизации расхода топлива при переходе из состояния x0 в состояние x1. Такая задача весьма важна, например, при рассмотрении перехода космического корабля с одной орбиты на другую, где минимальность расхода топлива играет огромную роль.

Так сформулированную задачу оптимизации могло бы решать вариационное исчисление, если бы не было ограничения на управляющий вектор u, то есть если бы вектор u был произвольным вектором. То обстоятельство, что вектор u принадлежит к заданному множеству Ω, сразу выводит сформулированную задачу оптимизации из круга тех, которые способно решать классическое вариационное исчисление. Если вектор u произволен, то сформулированная задача является задачей классического вариационного исчисления. Но следует отметить, что она никогда не решалась в вариационном исчислении в той постановке, в какой она приведена здесь. Сформулированные в классическом вариационном исчислении задачи носят более общий характер, чем приведённая здесь, и лишены той конкретности, которая возникла у нас благодаря рассмотрению технического объекта. Оказалось, что этот более конкретный характер вариационной задачи, связанный с тем, что мы рассматриваем управляемый объект, привёл к новым возможностям решения самой задачи, дал возможность прийти к догадкам, к которым в общей вариационной задаче прийти было бы чрезвычайно трудно.

Формулирую теперь то решение, которое было получено нами для задачи на быстродействие. Вводятся вспомогательные величины ψ1, ψ2…, ψn числом n, совокупность которых обозначается одной буквой ψ = (ψ1, ψ2…, ψn). Составляется вспомогательная величина


Сразу видно, что величина H зависит от трёх векторов: ψ, x и u. Новая вспомогательная величина (4) была обозначена через H потому, что нужные для нас уравнения, получаемые из неё, очень похожи на уравнения Гамильтона, всем известные из механики. Они суть следующие:


Полученная система дифференциальных уравнений (5) состоит из 2n уравнений. В них входят неизвестные функции x1, x2…, xnψ1, ψ2…, ψnu1, u2…, ur, то есть число неизвестных функций равно 2n + r. Таким образом, система эта неполна. Решать её невозможно. Однако эта система уравнений дополняется одним условием. Управляющий вектор u должен выбираться так, чтобы при любых фиксированных значениях ψ, x функция H(ψ, x, u) достигала своего максимума при этом значении u. Дополненная этим условием система уравнений (5) уже является полной, и именно эта система соотношений должна решаться при отыскании оптимального по быстродействию решения задачи.

Этот результат был назван принципом максимума. Задача на оптимизацию какой-либо другой величины, а не времени, например расхода горючего, решается очень похожим образом. Здесь я не формулирую её решения. Целью движения объекта мы считаем определённое его фазовое состояние x, то есть прибытие точки в определённое место с определённой скоростью. Принцип максимума годен, однако, и для решения других задач, например целью может служить прибытие в определённое место с произвольной скоростью.

Если управляющий вектор u может принимать произвольные значения, а не связан условием принадлежности к множеству Ω, то из условия максимальности функции H(ψ, x, u) по переменному u следует, что все частные производные этой функции по переменным u1, u2…, ur равны нулю, то есть должны быть выполнены r соотношений


Этот результат вытекает из общих результатов классического вариационного исчисления, но в такой форме он никогда не был сформулирован, так как в классическом вариационном исчислении вообще не рассматривались управляемые объекты. Следует отметить также, что и в случае произвольно меняющегося u соотношение (6) слабее, чем условие максимальности H по u.

Дадим теперь решение одной очень простой задачи оптимизации на быстродействие, которое можно получить при помощи принципа максимума, но невозможно получить методами классического вариационного исчисления.

Рассмотрим математический маятник, то есть движение некоторой точки по прямой, которая притягивается к некоторой фиксированной точке 0 этой прямой с силой, пропорциональной расстоянию до неё. Прямую, по которой движется точка, примем за ось абсцисс, а точку 0 — за начало координат. Координату движущейся точки обозначим через х. Тогда уравнение движения этой точки запишется в виде


где x″ есть вторая производная координаты x по времени, то есть ускорение движущейся точки. Одно уравнение (7) можно переписать в виде двух уравнений первого порядка


Пусть x = x(t), y = y(t) — произвольное решение системы (8). Для геометрического его изображения рассмотрим на фазовой плоскости переменных (x, y) точку [x(t), y(t)], движущуюся с течением времени t. Получаемая в результате движения точки по фазовой плоскости траектория называется фазовой траекторией. Для системы (8) она представляет собой окружность с центром в начале координат, по которой точка движется с постоянной угловой скоростью, равной одному радиану в секунду, причём движение происходит по часовой стрелке. Допустим теперь, что на нашу движущуюся точку x воздействует внешняя сила величины u, которая не может превосходить по модулю единицы. Тогда уравнение движения точки записывается в виде x″ + x = u или в виде системы уравнений


Система уравнений (9) описывает движение управляемого объекта, где u есть управляющий параметр. Постараемся теперь привести точку, находящуюся в начальный момент времени в произвольном положении (