ОРГАНИЗАЦИЯ ДВИЖЕНИЙ К ЭКСТРЕМУМУ В ПОИСКОВЫХ АДАПТИВНЫХ СИСТЕМАХ УПРАВЛЕНИЯ

Важным моментом в создании поисковых адаптивных систем управлення является выбор алгоритма поиска экстремума унимодальной функции качества н организация достаточно быстрых движений к экстремуму при изменении усло­вий функционирования системы. Имеется довольно большое число методов оты­скания экстремума, подробно изложенных в литературе (например, [36]). Выбор алгоритма движения к экстремуму в поисковых системах зависит от таких фак­торов, как точность поиска экстремума, быстродействие, условия функциони­рования системы, и определяется решением конкретной задачи. Остановимся на алгоритмах поиска, применимых для адаптивных систем управления электро­приводами. Рассмотрим прежде всего геометрические методы поиска.

Наиболее простым и удобным методом является метод дихотомии. Суть метода заключается в следующем. Если область параметров В представить в виде отрезка AD, внутри которого находится оптимальное значение параметра а*, то отрезок AD делится пополаи и отбрасывается часть, где экстремум отсутствует.

На первом шаге имеем аг =——. В районе ах делаются два измерения пока­зателя качества с целью выяснения, справа или слева от а± находится экстремум. Знак разности

Д<2=« («,+-!)-е(яі—

где е — интервал приращений параметра с учетом помех измерения, обеспечи­вает получение информации о положении экстремума. Имеем:

а* с аь если AQ > 0;

а* > %, если Д<2 с 0.

Следующая пара измерений производится з районе середины оставшегося

отрезка аі =—т. е. в точках а=аг±. Процедура выбора половины

отрезка повторяется. Деление продолжается до тех пор, пока на А-м интервале к ^ Б. Метод дихотомии дает двукратное уменьшение зоны неопределенности, де расположен экстремум, на два замера показателя качества.

Несколько эффективнее в плане уменьшения зоны неопределенности в про - ессе движения к экстремуму' является метод золотого сечения. Как и метод дихо - мни, он имеег в своей основе геометрические отношения отрезков. При исполь - ании метода золотого сечения отрезок делится на две неравные части, прячем ношение всего отрезка к его большей части равно отношению большей части * меньшей.

Геометрические методы поиска оказываются наиболее просгыми при техни­ческой реализации, однако они применимы в основном в тех случаях, когда дрейф экстремума показателя качества отсутствует и производится однократное определение экстремума,

Для огслежнвания дрейфующих экстремумов применяют методы шагового поиска, которые различаются способом формирования пробных и рабочих шагов. Наиболее простые алгоригмы основываются иа том, что перед реализацией рабо­чего шага делаю гея пробные измерения показателя качества в двух соседних точках а q а а — q, отстоящих друг от друга на расстоянии 2q, не меньшем чем интервал нечувствительности

Рис. 9-10

Два измерения показателя качества дают возможность определить, с какой стороны расположен экстремум, и организовать движение к нему. Такой алго­ритм поиска называется поиском с парными пробами. Математически этот алгоритм записывается в следующей форме:

<2<+1= ai— С sign [Q (а/ - ь q) - Q (at — q)r

где сц — положение параметра па 1-м этапе поиска; с — рабочий шаг по управля­ющему параметру; q — пробный шаг; sign — функция знака.

Рассматриваемый алгоритм реализуется по схеме, показанной иа рис. 9-10, а. Прн ращение показателя качества AQ определяется выражением

W^Q(a+q) — Q(a—q).

Операции ^11Ш соответствует выдержка системы В течение Времени Твид в фиксированном состоянии. Выдержка необходима в процессе отслеживания дрейфующего экстремума для того, чтобы уменьшить частоту поисковых движе­ний в квазиустановившемся режиме. Величина Tltbm зависит от интенсивности ухода экстремума. В процессе движения к экстремуму выдержку исключают,

Т. Є. Увыд

В рассматриваемом алгоритме поиска выделяются следующие этапы: 1) проб - иые шаги; 2) принятие решения; 3) рабочий шаг; 4) выдержка. В соответствии с этими этапами складываются и затраты времени /ц иа одни цикл поиска —

" ^ігпоб + ^реш ^раб + ^кыд - у

Рассмотренный алгоритм поиска упрощается, если, например, одну из проб совместить с исходным состоянием а/ на каждом цикле поиска, т. е, выполнять
поиск с непарными пробами либо вообще отказаться от пробных шагов и совме­стить их с рабочими шагами. Такие алгоритмы могут обеспечить более высокое быстродействие по сравнению с алгоритмами поиска с парными пробами. В по­следнем случае делаются только рабочие шаги и при этом запоминается получен­ное значение показателя качества на каждом шаге для сравнения с показателем качества на следующем шаге. Рабочее изменение управляемого параметра на і-м шаге поиска записывается в виде

Да^і=|

4а-(, если ДQi < 0;

Да,, если ДО/ 5? 0.

Структурная схема, реализующая этот алгоритм, гоказяна на рис. 9-10,6.

реализация алгоритма поиска происходит в три этапа: 1) рабочий шаг; 2) приня­тие решения; 3) выдержка TKWS. В блоке запоминания «Память Q, Да» происхо­дит запоминание полученного показателя качества после того, как принято реше­ние о направлении очередного рабочего шага, Затраты времени на один цикл определяются как /ц = + /рсП1 + Т? ь-Ж. В рассматриваемом алгоритме время

цикла может быть существенно уменьшено по сравнению со Бременем цикла алгоритма с яребнымн шагами. Алгоритмы поиска с совмещенными пробными н рабочими шагами получили также название алгоритмов спуска.

Оценка алгоритмов поиска производится по двум основным показателям: потерям на поиск и потерям на рыскание. Потерн на поиск выражаются следу­ющей формупой:

^Л. П “

где ta — время одного цикла; Ви — смещение к цели за один цикл поиска (Вк — с).

Потери на поиск уменьшаются с ростом рабочего шага и с уменьшением FpeMeHH цикла. Показатель £п. п характеризует работу алгоритма пояска лишь

при движении к экстремуму. Эффективность поиска в районе экстремума харак­теризуют потери па рыскарше. Эти потери образуются за счет поисковых движе­ний в районе экстремума. Вычисляются потери на рыскание путем усреднения разности AQ* (/) за время движения в районе экстремума

aq*W=Q(')-Q*.

где Q (f) — текущее значение показателя качества; Q* — наименьшее значение ьоказаіеля качества.

Потери на рыскание выражаются форму юй

т

y ^ [Q(i)-Q*]dt. (9 25)

Если пропесс поиска в районе экстремума циклически повторяется, т. е. AQ* (/) совершает колебания с периодом 7"*, то (9 25) можно записать так:

т*

{ [QW-Q*]#-

Периодически повторяющиеся ситуации поиска в районе экстремума обра­зуют так называемые предельные циклы.

С точки зрения уменьшения потерь на рыскание необходимо уменьшать рабочие шаги с и увеличивать время выдержки Однако эги требования

находятся в противоречии с условием уменьшения потерь на погск. Выбор пара­метров с, q, Тпиж производится на основании компромисса между требованиями Уменьшения потерь на поиск и на рыскание и с учетом особенностей поведения системы в динамике.

Параметры с и Т *S1 дможно изменять в процессе работы системы, иаилучшилі ^разом приспосабливая нх к двум отмеченным выше показателям работы поис-
новой сгстемы. Делается это на основании адаптивного подхода. Алгоритм адап­тации должен предусматривать определение режима, при котором реализуется алгоритм поиска. Для этого определяют знак произведения двух следующих друг за другом рабочих шагов

/i=sign(4a/_,4a().

Если lt > 0, то система находится в режиме движения к экстремуму (оба шага сделаны в одном направлении). Если же l-t ^ 0, то происходит работа в рай­оне экстремума (рабочие шаги либо имеют противоположное направление, либо отсутствуют).

Рис. 9 II

Алгоритм адаптации для выдержки ТВЫд может Сыть записан в следующем виде:

гр / Т'выд. иакс» если /,*5=0;

1 ВЫДЙ1 і гг I ^ п

V Пыд. М1Ш> если > 0. ]

Алгоритм адаптации рабочего шага с может быть записан в> форме сііі=с* [1 0<Го<ГІ.

Таким образом, адаптивные алгоритмы обеспечивают оптимальную работу системы в каждом режиме поиска.

Для плавных экстремальных функций используются алгоритмы шагового гоиска с расчетом граднента. Градиентом функции одной переменной называют ее производную

grad Q {ii) = dQ/da.

Приближенное вычисление градиента производится по значениям экстре­мальной функции при достаточно малых изменениях параметра а:

Поиск с расчетом градиента называется градиентным поиском. Рабочий шаг при таком поиске не остается постоянным, а изменяется в зависимости от градиента:

Ддг,- = —■ kgrad Q (а).

Для объектов, у которых характеристики имеют кр гой наклон вдали от экстремума и пологий в районе экстремума, переменность шага, зависимого от градиента, позволяет существенно сократить потери на поиск. Однако при гра­диентном поиске возможна неустойчивость поиска, что ограничивает его приме­нение для объектов с хорошо изученными функциями качества.

Функциональная схема системы экстремального управления с использова­нием метода градиентного поиска показана на рис. 9-Л. Генератор пробных шагов (ГПШ) вырабатывает пробные смешения управляемого параметра zfc?. Полученные с помощью элемента памяти (П) приращения AQ, масштабно преоб­

разуются в масштабном преобразователе (М/7) в рабочее смещение Работой элементов системы управляет программное устройство (ПУ), которое поочередно включает в соответствии с заданной программой ГПШ, МП и П. В элементе памяти запоминаются предыдущие значения показателя качества для вычисле­ния приращения 4Q,-.

Производная функции качества для целей поиска экстремума применяется также в методе синхронного детектирования. Этот метод применяется только для непрерывных систем управления. Непрерывный модулирующий сигнал поступает иа вход оптимизируемого объекта по управляющему параметру и ум­ножается на выходной сигнал объекта—функцию качества. Усредненное зна­чение этого произведения будет пропорционально производной dQ! da. В ка­честве модулирующего сигнала а (/) применяются как регулярные сигналы в виде гармонических нли прямоугольных сигналов, так и случайные функции времени. Необходимо только обеспечить равенство нулю среднего значения а (/) и малое значение среднего квадрата a (f).

Информацию о производной dQ! da при использовании метода синхронного детектирования получают на основании следующего подхода [36]. Если, например, модулирующий сигнал формируется в виде гармонического сигнала

а (/)=<х0 sin (9-26)

а ха р актер истина объекта Q (а - j - а) представляет собой гладкую функцию, то она может быть разложена в степенной ряд

Q(a+a) = Q(a) + a§ + +

Ограничиваясь первыми двумя членами разложения вследствие малости членов с а2, о? и т. д., имеем:

Q (а - f «о sin mf) ^ Q (а) - j - Oo sin 黴 ^. (9-27)

Умножив (9-27) на (9-26) и проинтегрировав произведение иа конечном ин­тервале времени Т, получим:

т т

С = ОоQ (о) ^ sin cof dt -{- a* ^ ~ ^ sin® Ы dt. о 0

Предполагая, что интервал времени Т много больше периода модулирующей частоты (Т > 2я/оэ), получим:

Г J т ^

-j, ^ sin o)f dt ^ 0; у, ^ sin2 со/ dt - g-. о о

С учетом этого имеем

г

2 da'

В экстремальной системе с синхронным детектором (рис. 9-12, а) модулиру­ющий сигнал непрерывно подается от генератора (Г) на вход экстремального объекта и на синхронный детектор (СД). С целью компенсации задержки модули­рующего сигнала в инерционном объекте сигнал, поступающий от j в СД, сдви­гается по фазе на угол <ря. Скорость изменения управляющего параметра пропор­циональна углу наклона функции качества с обратным знаком, т. е,

da dQ(a)

dt ~ da *

хде k — масштабный коэффициент.

Изменение управляющего параметра от начального значения в системе с синхронным детектированием может рассматривался как сумма быстрого коле­бательного движения и медленного усредненного движения а (0 = a (f) 4- а (7),

Приближенный вид переходного процесса в системе по этому параметру показан на рис. 9-12, б.

Комментарии закрыты.