ОРГАНИЗАЦИЯ ДВИЖЕНИЙ К ЭКСТРЕМУМУ В ПОИСКОВЫХ АДАПТИВНЫХ СИСТЕМАХ УПРАВЛЕНИЯ
Важным моментом в создании поисковых адаптивных систем управлення является выбор алгоритма поиска экстремума унимодальной функции качества н организация достаточно быстрых движений к экстремуму при изменении условий функционирования системы. Имеется довольно большое число методов отыскания экстремума, подробно изложенных в литературе (например, [36]). Выбор алгоритма движения к экстремуму в поисковых системах зависит от таких факторов, как точность поиска экстремума, быстродействие, условия функционирования системы, и определяется решением конкретной задачи. Остановимся на алгоритмах поиска, применимых для адаптивных систем управления электроприводами. Рассмотрим прежде всего геометрические методы поиска.
Наиболее простым и удобным методом является метод дихотомии. Суть метода заключается в следующем. Если область параметров В представить в виде отрезка AD, внутри которого находится оптимальное значение параметра а*, то отрезок AD делится пополаи и отбрасывается часть, где экстремум отсутствует.
На первом шаге имеем аг =——. В районе ах делаются два измерения показателя качества с целью выяснения, справа или слева от а± находится экстремум. Знак разности
Д<2=« («,+-!)-е(яі—
где е — интервал приращений параметра с учетом помех измерения, обеспечивает получение информации о положении экстремума. Имеем:
а* с аь если AQ > 0;
а* > %, если Д<2 с 0.
Следующая пара измерений производится з районе середины оставшегося
отрезка аі =—т. е. в точках а=аг±. Процедура выбора половины
отрезка повторяется. Деление продолжается до тех пор, пока на А-м интервале к ^ Б. Метод дихотомии дает двукратное уменьшение зоны неопределенности, де расположен экстремум, на два замера показателя качества.
Несколько эффективнее в плане уменьшения зоны неопределенности в про - ессе движения к экстремуму' является метод золотого сечения. Как и метод дихо - мни, он имеег в своей основе геометрические отношения отрезков. При исполь - ании метода золотого сечения отрезок делится на две неравные части, прячем ношение всего отрезка к его большей части равно отношению большей части * меньшей.
Геометрические методы поиска оказываются наиболее просгыми при технической реализации, однако они применимы в основном в тех случаях, когда дрейф экстремума показателя качества отсутствует и производится однократное определение экстремума,
Для огслежнвания дрейфующих экстремумов применяют методы шагового поиска, которые различаются способом формирования пробных и рабочих шагов. Наиболее простые алгоригмы основываются иа том, что перед реализацией рабочего шага делаю гея пробные измерения показателя качества в двух соседних точках а q а а — q, отстоящих друг от друга на расстоянии 2q, не меньшем чем интервал нечувствительности
Рис. 9-10 |
Два измерения показателя качества дают возможность определить, с какой стороны расположен экстремум, и организовать движение к нему. Такой алгоритм поиска называется поиском с парными пробами. Математически этот алгоритм записывается в следующей форме:
<2<+1= ai— С sign [Q (а/ - ь q) - Q (at — q)r
где сц — положение параметра па 1-м этапе поиска; с — рабочий шаг по управляющему параметру; q — пробный шаг; sign — функция знака.
Рассматриваемый алгоритм реализуется по схеме, показанной иа рис. 9-10, а. Прн ращение показателя качества AQ определяется выражением
W^Q(a+q) — Q(a—q).
Операции ^11Ш соответствует выдержка системы В течение Времени Твид в фиксированном состоянии. Выдержка необходима в процессе отслеживания дрейфующего экстремума для того, чтобы уменьшить частоту поисковых движений в квазиустановившемся режиме. Величина Tltbm зависит от интенсивности ухода экстремума. В процессе движения к экстремуму выдержку исключают,
Т. Є. Увыд
В рассматриваемом алгоритме поиска выделяются следующие этапы: 1) проб - иые шаги; 2) принятие решения; 3) рабочий шаг; 4) выдержка. В соответствии с этими этапами складываются и затраты времени /ц иа одни цикл поиска —
" ^ігпоб + ^реш ^раб + ^кыд - у
Рассмотренный алгоритм поиска упрощается, если, например, одну из проб совместить с исходным состоянием а/ на каждом цикле поиска, т. е, выполнять
поиск с непарными пробами либо вообще отказаться от пробных шагов и совместить их с рабочими шагами. Такие алгоритмы могут обеспечить более высокое быстродействие по сравнению с алгоритмами поиска с парными пробами. В последнем случае делаются только рабочие шаги и при этом запоминается полученное значение показателя качества на каждом шаге для сравнения с показателем качества на следующем шаге. Рабочее изменение управляемого параметра на і-м шаге поиска записывается в виде
Да^і=| |
4а-(, если ДQi < 0;
Да,, если ДО/ 5? 0.
Структурная схема, реализующая этот алгоритм, гоказяна на рис. 9-10,6.
реализация алгоритма поиска происходит в три этапа: 1) рабочий шаг; 2) принятие решения; 3) выдержка TKWS. В блоке запоминания «Память Q, Да» происходит запоминание полученного показателя качества после того, как принято решение о направлении очередного рабочего шага, Затраты времени на один цикл определяются как /ц = + /рсП1 + Т? ь-Ж. В рассматриваемом алгоритме время
цикла может быть существенно уменьшено по сравнению со Бременем цикла алгоритма с яребнымн шагами. Алгоритмы поиска с совмещенными пробными н рабочими шагами получили также название алгоритмов спуска.
Оценка алгоритмов поиска производится по двум основным показателям: потерям на поиск и потерям на рыскание. Потерн на поиск выражаются следующей формупой:
^Л. П “
где ta — время одного цикла; Ви — смещение к цели за один цикл поиска (Вк — с).
Потери на поиск уменьшаются с ростом рабочего шага и с уменьшением FpeMeHH цикла. Показатель £п. п характеризует работу алгоритма пояска лишь
при движении к экстремуму. Эффективность поиска в районе экстремума характеризуют потери па рыскарше. Эти потери образуются за счет поисковых движений в районе экстремума. Вычисляются потери на рыскание путем усреднения разности AQ* (/) за время движения в районе экстремума
aq*W=Q(')-Q*.
где Q (f) — текущее значение показателя качества; Q* — наименьшее значение ьоказаіеля качества.
Потери на рыскание выражаются форму юй
т
y ^ [Q(i)-Q*]dt. (9 25)
Если пропесс поиска в районе экстремума циклически повторяется, т. е. AQ* (/) совершает колебания с периодом 7"*, то (9 25) можно записать так:
т*
{ [QW-Q*]#-
Периодически повторяющиеся ситуации поиска в районе экстремума образуют так называемые предельные циклы.
С точки зрения уменьшения потерь на рыскание необходимо уменьшать рабочие шаги с и увеличивать время выдержки Однако эги требования
находятся в противоречии с условием уменьшения потерь на погск. Выбор параметров с, q, Тпиж производится на основании компромисса между требованиями Уменьшения потерь на поиск и на рыскание и с учетом особенностей поведения системы в динамике.
Параметры с и Т *S1 дможно изменять в процессе работы системы, иаилучшилі ^разом приспосабливая нх к двум отмеченным выше показателям работы поис-
новой сгстемы. Делается это на основании адаптивного подхода. Алгоритм адаптации должен предусматривать определение режима, при котором реализуется алгоритм поиска. Для этого определяют знак произведения двух следующих друг за другом рабочих шагов
/i=sign(4a/_,4a().
Если lt > 0, то система находится в режиме движения к экстремуму (оба шага сделаны в одном направлении). Если же l-t ^ 0, то происходит работа в районе экстремума (рабочие шаги либо имеют противоположное направление, либо отсутствуют).
Рис. 9 II |
Алгоритм адаптации для выдержки ТВЫд может Сыть записан в следующем виде:
гр / Т'выд. иакс» если /,*5=0;
1 ВЫДЙ1 і гг I ^ п
V Пыд. М1Ш> если > 0. ]
Алгоритм адаптации рабочего шага с может быть записан в> форме сііі=с* [1 0<Го<ГІ.
Таким образом, адаптивные алгоритмы обеспечивают оптимальную работу системы в каждом режиме поиска.
Для плавных экстремальных функций используются алгоритмы шагового гоиска с расчетом граднента. Градиентом функции одной переменной называют ее производную
grad Q {ii) = dQ/da.
Приближенное вычисление градиента производится по значениям экстремальной функции при достаточно малых изменениях параметра а:
Поиск с расчетом градиента называется градиентным поиском. Рабочий шаг при таком поиске не остается постоянным, а изменяется в зависимости от градиента:
Ддг,- = —■ kgrad Q (а).
Для объектов, у которых характеристики имеют кр гой наклон вдали от экстремума и пологий в районе экстремума, переменность шага, зависимого от градиента, позволяет существенно сократить потери на поиск. Однако при градиентном поиске возможна неустойчивость поиска, что ограничивает его применение для объектов с хорошо изученными функциями качества.
Функциональная схема системы экстремального управления с использованием метода градиентного поиска показана на рис. 9-Л. Генератор пробных шагов (ГПШ) вырабатывает пробные смешения управляемого параметра zfc?. Полученные с помощью элемента памяти (П) приращения AQ, масштабно преоб
разуются в масштабном преобразователе (М/7) в рабочее смещение Работой элементов системы управляет программное устройство (ПУ), которое поочередно включает в соответствии с заданной программой ГПШ, МП и П. В элементе памяти запоминаются предыдущие значения показателя качества для вычисления приращения 4Q,-.
Производная функции качества для целей поиска экстремума применяется также в методе синхронного детектирования. Этот метод применяется только для непрерывных систем управления. Непрерывный модулирующий сигнал поступает иа вход оптимизируемого объекта по управляющему параметру и умножается на выходной сигнал объекта—функцию качества. Усредненное значение этого произведения будет пропорционально производной dQ! da. В качестве модулирующего сигнала а (/) применяются как регулярные сигналы в виде гармонических нли прямоугольных сигналов, так и случайные функции времени. Необходимо только обеспечить равенство нулю среднего значения а (/) и малое значение среднего квадрата a (f).
Информацию о производной dQ! da при использовании метода синхронного детектирования получают на основании следующего подхода [36]. Если, например, модулирующий сигнал формируется в виде гармонического сигнала
а (/)=<х0 sin (9-26)
а ха р актер истина объекта Q (а - j - а) представляет собой гладкую функцию, то она может быть разложена в степенной ряд
Q(a+a) = Q(a) + a§ + +
Ограничиваясь первыми двумя членами разложения вследствие малости членов с а2, о? и т. д., имеем:
Q (а - f «о sin mf) ^ Q (а) - j - Oo sin 黴 ^. (9-27)
Умножив (9-27) на (9-26) и проинтегрировав произведение иа конечном интервале времени Т, получим:
С = ОоQ (о) ^ sin cof dt -{- a* ^ ~ ^ sin® Ы dt. о 0
Предполагая, что интервал времени Т много больше периода модулирующей частоты (Т > 2я/оэ), получим:
Г J т ^
-j, ^ sin o)f dt ^ 0; у, ^ sin2 со/ dt - g-. о о
С учетом этого имеем
г
2 da'
В экстремальной системе с синхронным детектором (рис. 9-12, а) модулирующий сигнал непрерывно подается от генератора (Г) на вход экстремального объекта и на синхронный детектор (СД). С целью компенсации задержки модулирующего сигнала в инерционном объекте сигнал, поступающий от j в СД, сдвигается по фазе на угол <ря. Скорость изменения управляющего параметра пропорциональна углу наклона функции качества с обратным знаком, т. е,
da dQ(a)
dt ~ da *
хде k — масштабный коэффициент.
Изменение управляющего параметра от начального значения в системе с синхронным детектированием может рассматривался как сумма быстрого колебательного движения и медленного усредненного движения а (0 = a (f) 4- а (7),
Приближенный вид переходного процесса в системе по этому параметру показан на рис. 9-12, б.