(2)
Формула (2) - критерий минимума среднеквадратической
ошибки.
2) Требуется получить реккурентную оценку, такую же как в
фильтре Калмана.
В чистом виде получить оптимальную оценку нельзя, есть
лишь приближенные решения, когда функции f(x) и j(x) -
- линеаризуются.
Тейлоровская линеаризация - используется ряд Тейлора,
линейная часть (1-я, 2-го
члена). ( j(x) и f(x) - имеют непрерывные первые про-
изводные).
Разложение в ряд Тейлора в точке
где - оценка, которую мы еще не знаем, но собираем-
ся находить.
Эти линеаризованные функции подставим в (1) и получим
линейную систему :
Коэффициенты a,b,c,d находятся после подстановки.
и имеют произвольное распределение.
Будем использовать метод наименьших квадратов для на-
хождения оценок .
; ;
Выпишем эмпирический риск :
r - функционал.
После линеаризации :
производная из r берется легко
Продифференцировав и воспользовавшись методом индукции
получаем :
(3)
; - задано
Выводы :
1. В связи с тем, что начальная точка разложения
в ряд Тейлора функции j(x) была выбрана в точ-
ке , то несмотря на линеаризацию, урав-
нение (3) получилось как нелинейное и оно по-
хоже на уравнение (1) модели.
2. В отличие от фильтра Калмана, в , при рек-
курентном его вычислении входит - оценка
‘x’ на первом шаге. Коэффициент усиления можно
вычислить заранее за ‘n’ шагов (в фильтре Кал-
мана). Но здесь этого сделать нельзя. Сущест-
вует так называемая обратная связь.
Пример нелинейной фильтрации :
;
T - период колебания
t - период дискретизации
t - текущее время
- фаза гармонического колебания с амплитудой равной 1
процесс наблюдается на фоне шума
- дискретная частота;
(4)
t
Т
Отношение сигнал/шум может быть меньше 1. Требуется получить оценку фазы, такую, чтобы разница в квадрате
была минимальной.
. Из (3) получаем :
(5)
Перемножим и пренебрежем 2й гармоникой :
(6) - ФАПЧ
(5) - ФНЧ, фильтрует 2-ю гармонику полностью(раз-
ностное уравнение)
Структурная схема ФАП
- на вход
вх
¬
a
синтезатор t
опоры
На вход поступает аддитивная смесь.
Принцип работы ФАП
Измеритель фазы является следящей системой с отрицатель-
ной обратной связью. Опорное колебание с фа-
зой - экстраполированная фаза. º. Чем точнее
экстраполяция, т.е. чем меньше , тем точ-
нее будет оценка.
Глава 5
Оптимальное управление дискретными динами-
ческими системами
Существует два типа детерминированных управляемых процес-
сов (детерминированных систем)
(1) - детерминированная система
- управление (некоторая функция от дискретного
времени, которая входит в разностное уравнение
динамической системы)
Стохастическая управляемая система
(2) , где - шум(может быть белым
),
а может быть и небелым, например, описываться сколь-
зящим средним ().
Критерий оптимального управления
Пусть модель (1) или (2) генерирует случайный процесс :
- управляемый процесс с дискретным
временем, т.е. процесс должен развиваться таким образом,
чтобы минимизировать некоторую функцию риска, тогда уп-
равление называется оптимальным.
Математически это выглядит так :
,
где f(×) - выпуклая функция
При движении ракеты по некоторой траектории из точки А в
точку В траектория должна быть такой, чтобы минимизиро-
вать энергетические затраты на управление.
Пример 2 :
Существует некоторая эталонная траектория.
Необходимо привести движение про-
цесса к эталону за минимальное
время. Это называется оптимизация
x(t)-эталон по быстродействию. Существует мно-
жество способов аналитического на-
хождения оптимальной функции упра-
x(t) вления.
Метод динамического программирования
Имеется детерминированная система :
(1)
Принцип Бэлмана - состоит в том, что оптимальное управ-
ление ищется с конца в начало (из будущего в прошлое).
Задача решается в обратном направлении.
Аналитическое решение задачи по Бэлману
Предположим, что мы отправились из и прошли траекторию:
. И предположим, что за ‘k’ шагов управление вы-
брали. Принцип динамического программирования основывает-
ся на том, что любой кусок траектории оптимального управ-
ления является оптимальным.
Траектория от (k+1) до ‘n’ называется хвостом.
N - последняя точка в управлении
С учетом (3) запишем :
Допустим, что начиная от шага (k+1) до ‘n’ в формуле (4)
оптимальное управление уже выбрано.
k=N,N-1,...,1
(6)
Формула (6) называется уравнением Бэлмана (уравне-
ние динамического программирования)
Выводы: (из уравнения (6))
Уравнение (6) позволяет в реккурентной форме вы-
вычислить управление, шаг за шагом, от точки N
до 1 (из будущего в прошлое) получить минимиза-
цию (6) на каждом шаге. Получить . Значе-
ния управления фактически получаются методом пе-
ребора. Оптимальная траектория ) неиз-
вестна до самого последнего шага.
Если задача имеет большую размерность, то
сложность при вычислении очень большая. Если
вводить динамические системы (т.е. модели), то
можно значительно упростить метод нахождения оп-
тимального управления. Т.е. получить управление
в замкнутом виде (в виде некоторой формулы).
Синтез оптимального управления для марковских динамичес-
ких систем.
(1) ; ; ; где -
- управление; - шум динамической системы.
Управление должно менять - траекторию, и изменять ее так, чтобы минимизировать средний критерий качества,
причем управляется динамическая система не по всем коор-
динатам.
- управляемый случайный процесс.
Динамическая система, сама как таковая, не наблюдается, а
наблюдается j()(нелинейно преобразованная фазовая пере-
менная) с шумом. В этом случае говорят, что динамическая система ненаблюдаема напрямую. Для того, чтобы сделать ее
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10