Банк Рефератов - Теории управления - скачать рефераты, бесплатно рефераты

Главная: Рефераты

Рефераты. Теории управления

(2)

Формула (2) - критерий минимума среднеквадратической

ошибки.

2) Требуется получить реккурентную оценку, такую же как в

фильтре Калмана.

В чистом виде получить оптимальную оценку нельзя, есть

лишь приближенные решения, когда функции f(x) и j(x) -

- линеаризуются.

Тейлоровская линеаризация - используется ряд Тейлора,

линейная часть (1-я, 2-го

члена). ( j(x) и f(x) - имеют непрерывные первые про-

изводные).

Разложение в ряд Тейлора в точке

где - оценка, которую мы еще не знаем, но собираем-

ся находить.

Эти линеаризованные функции подставим в (1) и получим

линейную систему :

(2)

Коэффициенты a,b,c,d находятся после подстановки.

и имеют произвольное распределение.

Будем использовать метод наименьших квадратов для на-

хождения оценок .

; ;

Выпишем эмпирический риск :

r - функционал.

После линеаризации :

производная из r берется легко

Продифференцировав и воспользовавшись методом индукции

получаем :

(3)

; - задано

Выводы :

1. В связи с тем, что начальная точка разложения

в ряд Тейлора функции j(x) была выбрана в точ-

ке , то несмотря на линеаризацию, урав-

нение (3) получилось как нелинейное и оно по-

хоже на уравнение (1) модели.

2. В отличие от фильтра Калмана, в , при рек-

курентном его вычислении входит - оценка

‘x’ на первом шаге. Коэффициент усиления можно

вычислить заранее за ‘n’ шагов (в фильтре Кал-

мана). Но здесь этого сделать нельзя. Сущест-

вует так называемая обратная связь.

Пример нелинейной фильтрации :

;

T - период колебания

t - период дискретизации

t - текущее время

- фаза гармонического колебания с амплитудой равной 1

процесс наблюдается на фоне шума

- дискретная частота;

(4)

Отношение сигнал/шум может быть меньше 1. Требуется получить оценку фазы, такую, чтобы разница в квадрате

была минимальной.

. Из (3) получаем :

(5)

Перемножим и пренебрежем 2й гармоникой :

(6) - ФАПЧ

(5) - ФНЧ, фильтрует 2-ю гармонику полностью(раз-

ностное уравнение)

Структурная схема ФАП

- на вход

вх

синтезатор t

опоры

На вход поступает аддитивная смесь.

Принцип работы ФАП

Измеритель фазы является следящей системой с отрицатель-

ной обратной связью. Опорное колебание с фа-

зой - экстраполированная фаза. º. Чем точнее

экстраполяция, т.е. чем меньше , тем точ-

нее будет оценка.

Глава 5

Оптимальное управление дискретными динами-

ческими системами

Существует два типа детерминированных управляемых процес-

сов (детерминированных систем)

(1) - детерминированная система

- управление (некоторая функция от дискретного

времени, которая входит в разностное уравнение

динамической системы)

Стохастическая управляемая система

(2) , где - шум(может быть белым

а может быть и небелым, например, описываться сколь-

зящим средним ().

Критерий оптимального управления

Пусть модель (1) или (2) генерирует случайный процесс :

- управляемый процесс с дискретным

временем, т.е. процесс должен развиваться таким образом,

чтобы минимизировать некоторую функцию риска, тогда уп-

равление называется оптимальным.

Математически это выглядит так :

где f(×) - выпуклая функция

При движении ракеты по некоторой траектории из точки А в

точку В траектория должна быть такой, чтобы минимизиро-

вать энергетические затраты на управление.

Пример 2 :

Существует некоторая эталонная траектория.

Необходимо привести движение про-

цесса к эталону за минимальное

время. Это называется оптимизация

x(t)-эталон по быстродействию. Существует мно-

жество способов аналитического на-

хождения оптимальной функции упра-

x(t) вления.

Метод динамического программирования

Имеется детерминированная система :

(1)

Принцип Бэлмана - состоит в том, что оптимальное управ-

ление ищется с конца в начало (из будущего в прошлое).

Задача решается в обратном направлении.

(2)

Аналитическое решение задачи по Бэлману

Предположим, что мы отправились из и прошли траекторию:

. И предположим, что за ‘k’ шагов управление вы-

брали. Принцип динамического программирования основывает-

ся на том, что любой кусок траектории оптимального управ-

ления является оптимальным.

(3)

Траектория от (k+1) до ‘n’ называется хвостом.

N - последняя точка в управлении

С учетом (3) запишем :

(4)

Допустим, что начиная от шага (k+1) до ‘n’ в формуле (4)

оптимальное управление уже выбрано.

(5)

k=N,N-1,...,1

(6)

Формула (6) называется уравнением Бэлмана (уравне-

ние динамического программирования)

Выводы: (из уравнения (6))

Уравнение (6) позволяет в реккурентной форме вы-

вычислить управление, шаг за шагом, от точки N

до 1 (из будущего в прошлое) получить минимиза-

цию (6) на каждом шаге. Получить . Значе-

ния управления фактически получаются методом пе-

ребора. Оптимальная траектория ) неиз-

вестна до самого последнего шага.

Если задача имеет большую размерность, то

сложность при вычислении очень большая. Если

вводить динамические системы (т.е. модели), то

можно значительно упростить метод нахождения оп-

тимального управления. Т.е. получить управление

в замкнутом виде (в виде некоторой формулы).

Синтез оптимального управления для марковских динамичес-

ких систем.

(1) ; ; ; где -

- управление; - шум динамической системы.

Управление должно менять - траекторию, и изменять ее так, чтобы минимизировать средний критерий качества,

причем управляется динамическая система не по всем коор-

динатам.

- управляемый случайный процесс.

Динамическая система, сама как таковая, не наблюдается, а

наблюдается j()(нелинейно преобразованная фазовая пере-

менная) с шумом. В этом случае говорят, что динамическая система ненаблюдаема напрямую. Для того, чтобы сделать ее

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10