Конспект лекций по тау. Теория автоматического управления для «чайников» к.ю. поляков Общие положения теории автоматического управления

Теория автоматического управления (ТАУ) - научная дисциплина, изучающая процессы автоматического управления объектами разной физической природы. При этом при помощи математических средств выявляются свойства систем автоматического управления и разрабатываются рекомендации по их проектированию.

История

Впервые сведения об автоматах появились в начале нашей эры в работах Герона Александрийского «Пневматика» и «Механика», где описаны автоматы, созданные самим Героном и его учителем Ктесибием: пневмоавтомат для открытия дверей храма, водяной орган, автомат для продажи святой воды и др. Идеи Герона значительно опередили свой век и не нашли применения в его эпоху.

Устойчивость линейных систем

Устойчивость - свойство САУ возвращаться в заданный или близкий к нему установившийся режим после какого-либо возмущения.

Устойчивая САУ - система, в которой переходные процессы являются затухающими.

Операторная форма записи линеаризированного уравнения.

y(t) = y уст (t)+y п = y вын (t)+y св

y уст (y вын ) - частное решение линеаризированного уравнения.

y п (y св ) - общее решение линеаризированного уравнения как однородного дифференциального уравнения, то есть

САУ устойчива, если переходные процессы у n (t), вызываемые любыми возмущениями, будут затухающими с течением времени, то есть при

Решая дифференциальное уравнение в общем случае, получим комплексные корни p i , p i+1 = ±α i ± jβ i

Каждой паре комплексно-сопряженных корней соответствует следующая составляющая уравнения переходного процесса:

Из полученных результатов видно, что:

Критерии устойчивости

Критерий Рауса

Для определения устойчивости системы строятся таблицы вида:

Коэффициенты Строки столбец 1 столбец 2 столбец 3
1
2
3
4

Для устойчивости системы необходимо, чтобы все элементы первого столбца имели положительные значения; если в первом столбце присутствуют отрицательные элементы - система неустойчива; если хотя бы один элемент равен нулю, а остальные положительны, то система на границе устойчивости.

Критерий Гурвица

Определитель Гурвица

Теорема : Для устойчивости замкнутой САУ необходимо и достаточно, чтобы определитель Гурвица и все его миноры были положительны при

Критерий Михайлова

Заменим , где ω - угловая частота колебаний, соответствующих чисто мнимому корню данного характеристического полинома.

Критерий : для устойчивости линейной системы n-го порядка необходимо и достаточно, чтобы кривая Михайлова, построенная в координатах , проходила последовательно через n квадрантов.

Рассмотрим зависимость между кривой Михайлова и знаками его корней (α>0 и β>0)

1) Корень характеристического уравнения - отрицательное вещественное число

2) Корень характеристического уравнения - положительное вещественное число

Соответствующий данному корню сомножитель

3) Корень характеристического уравнения - комплексная пара чисел с отрицательной вещественной частью

Соответствующий данному корню сомножитель

4) Корень характеристического уравнения - комплексная пара чисел с положительной вещественной частью

Соответствующий данному корню сомножитель

Критерий Найквиста

Критерий Найквиста - это графоаналитический критерий. Характерной его особенностью является то, что вывод об устойчивости или неустойчивости замкнутой системы делается в зависимости от вида амплитудно-фазовой или логарифмических частотных характеристик разомкнутой системы.

Пусть разомкнутая система представлена в виде полинома

тогда сделаем подстановку и получим:

Для более удобного построения годографа при n>2 приведём уравнение (*) к «стандартному» виду:

При таком представлении модуль A(ω) = | W(jω)| равен отношению модулей числителя и знаменателя, а аргумент (фаза) ψ(ω) - разности их аргументов. В свою очередь, модуль произведения комплексных чисел равен произведению модулей, а аргумент - сумме аргументов.

Модули и аргументы, соответствующие сомножителям передаточной функции

Сомножитель
k k 0
p ω

После чего построим годограф для вспомогательной функции , для чего будем изменять

При , а при (так как n

Для определения результирующего угла поворота найдём разность аргументов числителя и знаменателя

Полином числителя вспомогательной функции имеет ту же степень, что и полином её знаменателя, откуда следует , следовательно, результирующий угол поворота вспомогательной функции равен 0. Это означает, что для устойчивости замкнутой системы годограф вектора вспомогательной функции не должен охватывать начало координат, а годограф функции , соответственно, точку с координатами

Введение

В число научных дисциплин, образующих науку об управлении, входит теория автоматического управления и регулирования.

Теория автоматического управления (ТАУ) – это научная дисциплина, предметом изучения которой являются информационные процессы , протекающие в системах автоматического управления (САУ).

ТАУ выявляет общие закономерности, присущие САУ различной физической природы, а на основе этих закономерностей разрабатывает принципы построения высококачественных систем управления.

При изучении процессов управления в ТАУ абстрагируются от физических и конструктивных особенностей систем и вместо реальных систем рассматривают их адекватные математические модели, отсюда – основным методом исследования в ТАУ является математическое моделирование . Кроме того, методологическую основу ТАУ образуют:

    Теория обыкновенных дифференциальных уравнений,

    Операционное исчисление,

    Гармонический анализ,

    А также векторно-матричная алгебра.

Взаимосвязь ТАУ с другими техническими науками

ТАУ вместе с теорией функционирования элементов системы управления (датчиков, регистров) образует автоматику . Автоматика является одним из разделов технической кибернетики , науки об управлении техническими объектами. В автоматике также выделяется теория информации – наука, занимающаяся сбором и обработкой информации, необходимой для управления техническими объектами и ТАУ.

Кибернетика  наука об оптимальном управлении сложными системами (технические объекты, технологические процессы, живые организмы, коллективы, предприятия и др.).

Историческая справка

Основоположником предмета теории автоматического управления является русский ученый и инженер И.А. Вышнеградский , который в 1867 г. опубликовал ра­боту о регуляторах прямого действия. В этой работе он впервые доказал, что объект регулирования и регулятор являются единой системой регулирования, и поэтому процессы, проходящие в регуляторе и объекте управления, являются взаимосвязан­ными и должны рассматриваться вместе, т.е. системно.

В это же время в том же направлении работал Максвелл . В дальнейшем выдающиеся русские ученые А.М . Ляпунов и Н.Е . Жуковский создали основы математической теории процессов, протекающих в автоматически управляемых машинах и механизмах.

Развитие современной теории автоматического управления началось в 20-30гг 20-го века с появления статей Минорского , Найквиста , Хазена . Теоретические работы сделали возможным для инженеров повседневно проектировать системы автоматического регулирования, используя классические методы.

В последнее время, когда классические методы достигли своего совершенства, исследовательские работы были направлены на разработку методов оптимизации. Работы современного ТАУ:

А.С . Понтрягин - «принцип максимума».

Р.Беллман и Р.Каллман - «Принцип оптимальности автоматизированного управления».

Основные понятия и определения тау

Системой автоматического управления  называют совокупность управляемого объекта и автоматического управляющего устройства (регулятора), взаимодействующих между собой.

САУ – это такая система, в которой управляющие функции выполняются автоматически, т.е. без участия чело­века.

АСУ (автоматизированная система управления)  это система, в которой часть управляющих функций выполняется автоматическими управляющими устройствами, а часть функций (наиболее важных и сложных) выполняется человеком.

Алгоритм функционирования устройства (системы) – это совокупность предписаний, ведущих к правильному выполнению технического процесса в устройстве (системе).

Объект управления – устройство (совокупность устройств), установка или процесс осуществляющее технический процесс и нуждающееся в специально организованных воздействиях извне для осуществления его алгоритма функционирования.

Алгоритм управления – это совокупность предписаний, определяющая характер воздействий извне на объект с целью осуществления его алгоритма функционирования.

Автоматическое управление  это процесс осуществления воздействий, соответствующих алгоритму управления.

Автоматическое управляющее устройство – устройство, осуществляющее воздействие в соответствии с алгоритмом управления.

Алгоритм функционирования УУ – это и есть алгоритм управления.

Объектом управления в ТАУ могут быть любые технические объекты, технологические процессы, а также более простые САУ.

Любой объект характеризуется рядом величин, определяющих процессы в самом объекте, влияние внешней среды на объект, влияние управляющих сигналов с регулятора.

Воздействиями называют величины, влияющие на объект извне. Воздействия бывают двух типов:

    Управляющее воздействие (управляющий сигнал, управляющая входная величина) – это воздействия, вырабатываемые управляющим устройством (или задаваемые человеком).

    Возмущения  воздействия на объект, не зависящие от системы управления. Возмущения делятся на нагрузку – это внешние воздействия, обусловленные работой системы и помехи  вредное влияние внешней среды, обусловленное побочными явлениями в объекте.

Различают три аспекта воздействия : энергетический (преобразование и передача энергии), метаболический (преобразование формы и состава вещества), информационный – заключается в том, что и при энергетическом, и при метаболическом проявлении каждое воздействие одновременно является носителем информации.

Информационный аспект наиболее важен для изучения процессов в САУ. Эти процессы заключаются в преобразовании сигналов.

Сигнал – это изменение определённой физической величины, которое отображает в соответствии с принятой условностью информацию, содержащуюся в воздействии.

Величины, характеризующие изменения в самом объекте, называются внутренними величинами или состоянием объекта .

Среди них следует выделить управляемую величину , которая характеризует состояние объекта и которую преднамеренно изменяют или поддерживают постоянной.


В современном мире насчитывается великое множество различных автоматических систем, и их количество с каждым годом постоянно возрастает. И все они требуют качественного и наилучшего управления, принципы которого еще на этапе проектирования должен заложить в них инженер разработчик. Ведь умный дом сам нагреет комнату до заданной температуры не потому, что он вдруг обзавелся своим собственным интеллектом, а квадрокоптер так здорово летает не из-за того, что в нем используется магический кристалл. Поверьте в этой вероятности магии никакой нет, во всем просто виновата теория автоматического управления или сокращенно ТАУ.

Чтобы комната нагревалась до заданной температуры, а квадрокоптер отлично летал, нужно иметь информацию об их состоянии в текущий момент времени и об условиях окружающей среды. Умному дому не помешает информация о температуре в помещении, для коптера актуальной информацией является высота и положение в пространстве. Все это собирается определенным типом устройств, которые называют сенсорами или датчиками. Датчиков существует огромное число: датчики температуры, влажности, давления, напряжения, тока, ускорения, скорости, магнитного поля и многие другие.

Затем информацию с датчиков требуется обработать, и этим занимаются специальные регуляторы, которые представляют собой какое-либо математическое выражение, запрограммированное в микроконтроллере (или собранное в электронной схеме), которое на основании данных об управляющем воздействии и данных с сенсоров формирует управляющий сигнал для оптимального управления рабочим органом (нагревательным элементом в системе умного обогревателя, двигателем и т.д.).

Здесь с помощью информационного преобразователя формируется обратная связь, которая позволяет системе автоматического управления САУ всегда быть в курсе последних изменений и не давать задающему воздействию монополию на управление системой, иначе без учета внешних возмущающих воздействий система бы ушла в разнос. Из-за наличия обратной связи такие системы получили название замкнутой. Имеются и разомкнутые системы, у которых нет совсем датчиков или прочих инструментов, информирующих о внешнем пространстве. Но они максимально просты и для управления сложными объектами практически не одходят, т.к требуется досконально знать весь объект, изучить и правильно описать его поведение во всех вероятных ситуациях. Поэтому такие системы не являются комплексными агрегатами и управляются по времени. Например, простейшая схема поливки цветов по таймеру.

Разомкнутые системы не представляют собой практического интереса, поэтому дальше будем рассматривать только замкнутые. На рисунке был показан пример с одним контуром, поскольку обратная связь там всего одна. Но для более точного управления сложными объектами необходимо контролировать несколько величин, влияющих на поведение объекта в целом, а значит требуется несколько сенсоров, несколько регуляторов и обратных связей. В итоге САУ трансформируется в многоконтурную.

С точки зрения структурной организации широкое распространение получили САУ с последовательной и параллельной коррекцией.


САУ с последовательной коррекцией


САУ с последовательной и параллельной коррекцией

Как видно из схем выше, эти САУ имеют различную организацию обратных связей и регуляторов. При последовательной коррекцией выходная величина регулятора внешнего контура является входной для регулятора внутреннего контура, т.е сначала корректируется одна, затем другая величина и умножается на предыдущую и так далее по всей цепочке. Такую САУ также называют системой подчиненного регулирования. При параллельной коррекцией сигналы с преобразователей следуют на вход одного регулятора, который должен все это обработать. В результате у каждой системы есть свои плюсы и минусы. САУ с параллельной коррекцией работают быстро, но очень сложны в отладке,т.к в одном регуляторе требуется учесть все возможные нюансы различных обратных связей. При последовательной коррекции регуляторы настраиваются последовательно и без особых проблем, но быстродействие таких систем не очень, т.к чем больше контуров, тем больше нескомпенсированных временных постоянных, и тем дольше сигнал идет до выхода.

Имеется также комбинированные САУ, которая способна на многое. Но в данном курсе лекций она рассматриваться не будет.

В первой лекции, вы узнаете что такое предмет и дисциплины (ТАУ) и краткая историческая справка
Классификация САУ (систем автоматического управления)

Передаточная функция
Частотные характеристики.
Временные функции и характеристики
Структурные схемы и их преобразование
Типовые звенья и их характеристики
Минимально- и неминимально-фазовые звенья
Частотные характеристики разомкнутых систем
Соединения некоторых типовых звеньев

Понятие устойчивости линейных непрерывных САУ
Критерий устойчивости Гурвица
Критерий устойчивости Михайлова
Критерий устойчивости Найквиста
Понятие запаса устойчивости

Показатели качества
Критерии качества переходного процесса
Последовательная коррекция динамических свойств
Параллельная коррекция

Попов Е.П. Теория линейных систем автоматического регулирования и управления. - М. Наука, 1989. - 304 с.
Теория автоматического управления. Ч.1. Теория линейных систем автоматического управления/ Н.А. Бабаков и др.; Под ред. А.А. Воронова. - М.: Высшая школа, 1986. - 367 с.
Бабаков Н.А. и др. Теория автоматического управления. Ч.1/Под ред. А.А. Воронова. - М.: Высшая школа, 1977. - 303 с.
Юревич Е.И. Теория автоматического управления. - М.: Энергия, 1975. - 416 с.
Бесекерский В.А. и др. Сборник задач по теории автоматического регулирования и управления. - М.: Наука, 1978. - 512 с.
Теория автоматического управления. Ротач В.Я - Рассмотрены положения теории автоматического управления с позиций ее применения целью построения систем управления технологическими процессами.
конспект лекция студента ботаника

ТЕОРИЯ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ ДЛЯ «ЧАЙНИКОВ»

К.Ю. Поляков

Санкт-Петербург

© К.Ю. Поляков, 2008

« В ВУЗе нужно излагать материал на высоком профессиональном уровне. Но поскольку этот уровень проходит значительно выше головы среднего студента, я буду объяснять на пальцах. Это не очень профессионально, зато понятно».

Неизвестный преподаватель

Предисловие

Эта методичка предназначена для первого знакомства с предметом. Ее задача – объяснить «на пальцах» основные понятия теории автоматического регулирования и сделать так, чтобы после ее прочтения вы смогли воспринимать профессиональную литературу на эту тему. Нужно рассматривать это пособие только как фундамент, стартовую площадку для серьезного изучения серьезного предмета, который может стать очень интересным и увлекательным.

Есть сотни учебников по автоматическому управлению. Но вся проблема в том, что мозг при восприятии новой информации ищет что-то знакомое, за что можно «зацепиться», и на этой основе «привязать» новое к уже известным понятиям. Практика показывает, что читать серьезные учебники современному студенту сложно. Не за что зацепиться. Да и за строгими научными доказательствами часто ускользает суть дела, которая обычно достаточно проста. Автор попытался «спуститься» на уровень ниже и выстроить цепочку от «житейских» понятий к понятиям теории управления.

Изложение на каждом шагу грешит нестрогостью, доказательства не приводятся, формулы используются только там, где без них нельзя. Математик найдет здесь много недоговоренностей и упущений, поскольку (в соответствии с целями пособия) между строгостью и понятностью выбор всегда делается в пользу понятности.

От читателя требуются небольшие предварительные знания. Нужно иметь представление

о некоторых разделах курса высшей математики:

1) производных и интегралах;

2) дифференциальных уравнениях;

3) линейной алгебре, матрицах;

4) комплексных числах.

Благодарности

Автор выражает глубокую признательность д.ф.-м.н. А.Н. Чурилову, к.т.н. В.Н. Калиниченко и к.т.н. В.О. Рыбинскому, которые внимательно прочитали предварительную версию пособия и высказали много ценных замечаний, которые позволили улучшить изложение и сделать его более понятным.

© К.Ю. Поляков, 2008

ОСНОВНЫЕ ПОНЯТИЯ ...

Введение.................................................................................................................................................

Системы управления.............................................................................................................................

1.3. Какие бывают системы управления? .................................................................................................

МАТЕМАТИЧЕСКИЕ МОДЕЛИ ..........................................................................................................................

2.1. Что нужно знать для управления? ...................................................................................................

2.2. Связь входа и выхода...........................................................................................................................

Как строятся модели? .......................................................................................................................

Линейность и нелинейность..............................................................................................................

Линеаризация уравнений.....................................................................................................................

Управление...........................................................................................................................................

3. МОДЕЛИ ЛИНЕЙНЫХ ОБЪЕКТОВ .....................................................................................................................

Дифференциальные уравнения...........................................................................................................

3.2. Модели в пространстве состояний..................................................................................................

Переходная функция............................................................................................................................

Импульсная характеристика (весовая функция) .............................................................................

Передаточная функция.......................................................................................................................

Преобразование Лапласа....................................................................................................................

3.7. Передаточная функция и пространство состояний.......................................................................

Частотные характеристики............................................................................................................

Логарифмические частотные характеристики..............................................................................

4. ТИПОВЫЕ ДИНАМИЧЕСКИЕ ЗВЕНЬЯ ................................................................................................................

Усилитель............................................................................................................................................

Апериодическое звено..........................................................................................................................

Колебательное звено...........................................................................................................................

Интегрирующее звено.........................................................................................................................

Дифференцирующие звенья................................................................................................................

Запаздывание.......................................................................................................................................

«Обратные» звенья.............................................................................................................................

ЛАФЧХ сложных звеньев...................................................................................................................

СТРУКТУРНЫЕ СХЕМЫ ....................................................................................................................................

Условные обозначения........................................................................................................................

Правила преобразования.....................................................................................................................

Типовая одноконтурная система......................................................................................................

АНАЛИЗ СИСТЕМ УПРАВЛЕНИЯ ......................................................................................................................

Требования к управлению....................................................................................................................

Процесс на выходе...............................................................................................................................

Точность..............................................................................................................................................

Устойчивость.....................................................................................................................................

Критерии устойчивости....................................................................................................................

Переходный процесс............................................................................................................................

Частотные оценки качества.............................................................................................................

Корневые оценки качества.................................................................................................................

Робастность.......................................................................................................................................

СИНТЕЗ РЕГУЛЯТОРОВ ....................................................................................................................................

Классическая схема.............................................................................................................................

ПИД-регуляторы.................................................................................................................................

Метод размещения полюсов..............................................................................................................

Коррекция ЛАФЧХ..............................................................................................................................

Комбинированное управление.............................................................................................................

Инвариантность.................................................................................................................................

Множество стабилизирующих регуляторов...................................................................................

ЗАКЛЮЧЕНИЕ ..........................................................................................................................................................

ЛИТЕРАТУРА ДЛЯ ПОСЛЕДУЮЩЕГО ЧТЕНИЯ ..........................................................................................................

© К.Ю. Поляков, 2008

1. Основные понятия

1.1. Введение

С древних времен человек хотел использовать предметы и силы природы в своих целях, то есть управлять ими. Управлять можно неодушевленными предметами (например, перекатывая камень на другое место), животными (дрессировка), людьми (начальник – подчиненный). Множество задач управления в современном мире связано с техническими системами – автомобилями, кораблями, самолетами, станками. Например, нужно поддерживать заданный курс корабля, высоту самолета, частоту вращения двигателя, температуру в холодильнике или в печи. Если эти задачи решаются без участия человека, говорят об автоматическом управлении .

Теория управления пытается ответить на вопрос «как нужно управлять?». До XIX века науки об управлении не существовало, хотя первые системы автоматического управления уже были (например, ветряные мельницы «научили» разворачиваться навстречу ветру). Развитие теории управления началось в период промышленной революции. Сначала это направление в науке разрабатывалось механиками для решения задач регулирования , то есть поддержания заданного значения частоты вращения, температуры, давления в технических устройствах (например, в паровых машинах). Отсюда происходит название «теория автоматического регулирования».

Позднее выяснилось, что принципы управления можно успешно применять не только в технике, но и в биологии, экономике, общественных науках. Процессы управления и обработки информации в системах любой природы изучает наука кибернетика . Один из ее разделов, связанный главным образом с техническими системами, называется теорией автоматического управления . Кроме классических задач регулирования, она занимается также оптимизацией законов управления, вопросами приспособляемости (адаптации).

Иногда названия «теория автоматического управления» и «теория автоматического регулирования» используются как синонимы. Например, в современной зарубежной литературе вы встретите только один термин – control theory .

1.2. Системы управления

1.2.1. Из чего состоит система управления?

В задачах управления всегда есть два объекта – управляемый и управляющий. Управляемый объект обычно называют объектом управления или просто объектом , а управляющий объект – регулятором . Например, при управлении частотой вращения объект управления – это двигатель (электромотор, турбина); в задаче стабилизации курса корабля – корабль, погруженный в воду; в задаче поддержания уровня громкости – дина-

Регуляторы могут быть построены на разных принципах.

Самый знаменитый из первых механических регуляторов –

центробежный регулятор Уатта для стабилизации частоты

вращения паровой турбины (на рисунке справа). Когда частота

вращения увеличивается, шарики расходятся из-за увеличения

центробежной силы. При этом через систему рычагов немного

закрывается заслонка, уменьшая поток пара на турбину.

Регулятор температуры в холодильнике или термостате –

это электронная схема, которая включает режим охлаждения

(или нагрева), если температура становится выше (или ниже)

заданной.

Во многих современных системах регуляторы – это микропроцессорные устройства, ком-

пьютеры. Они успешно управляют самолетами и космическими кораблями без участия челове-

© К.Ю. Поляков, 2008

ка. Современный автомобиль буквально «напичкан» управляющей электроникой, вплоть до бортовых компьютеров.

Обычно регулятор действует на объект управления не прямо, а через исполнительные механизмы (приводы ), которые могут усиливать и преобразовывать сигнал управления, например, электрический сигнал может «превращаться» в перемещение клапана, регулирующего расход топлива, или в поворот руля на некоторый угол.

Чтобы регулятор мог «видеть», что фактически происходит с объектом, нужны датчики . С помощью датчиков чаще всего измеряются те характеристики объекта, которыми нужно управлять. Кроме того, качество управления можно улучшить, если получать дополнительную информацию – измерять внутренние свойства объекта.

1.2.2. Структура системы

Итак, в типичную систему управления входят объект, регулятор, привод и датчики. Однако, набор этих элементов – еще не система. Для превращения в систему нужны каналы связи, через них идет обмен информацией между элементами. Для передачи информации могут использоваться электрический ток, воздух (пневматические системы), жидкость (гидравлические системы), компьютерные сети.

Взаимосвязанные элементы – это уже система , которая обладает (за счет связей) особыми свойствами, которых нет у отдельных элементов и любой их комбинации.

Основная интрига управления связана с тем, что на объект действует окружающая среда – внешние возмущения , которые «мешают» регулятору выполнять поставленную задачу. Большинство возмущений заранее непредсказуемы, то есть носят случайный характер.

Кроме того, датчики измеряют параметры не точно, а с некоторой ошибкой, пусть и малой. В этом случае говорят о «шумах измерений» по аналогии с шумами в радиотехнике, которые искажают сигналы.

Подводя итого, можно нарисовать структурную схему системы управления так:

управление

регулятор

возмущения

обратная

измерений

Например, в системе управления курсом корабля

объект управления – это сам корабль, находящийся в воде; для управления его курсом используется руль, изменяющий направление потока воды;

регулятор – цифровая вычислительная машина;

привод – рулевое устройство, которое усиливает управляющий электрический сигнал и преобразует его в поворот руля;

датчики – измерительная система, определяющая фактический курс;

внешние возмущения – это морское волнение и ветер, отклоняющие корабль от заданного курса;

шумы измерений – это ошибки датчиков.

Информация в системе управления как бы «ходит по кругу»: регулятор выдает сигнал

управления на привод, который воздействует непосредственно на объект; затем информация об объекте через датчики возвращается обратно к регулятору и все начинается заново. Говорят, что в системе есть обратная связь , то есть регулятор использует информацию о состоянии объекта для выработки управления. Системы с обратной связью называют замкнутыми , поскольку информация передается по замкнутому контуру.

© К.Ю. Поляков, 2008

1.2.3. Как работает регулятор?

Регулятор сравнивает задающий сигнал («задание», «уставку », «желаемое значение») с сигналами обратной связи от датчиков и определяет рассогласование (ошибку управления ) – разницу между заданным и фактическим состоянием. Если оно равно нулю, никакого управления не требуется. Если разница есть, регулятор выдает управляющий сигнал, который стремится свести рассогласование к нулю. Поэтому схему регулятора во многих случаях можно нарисовать так:

рассогласование

алгоритм

управление

управления

обратная связь

Такая схема показывает управление по ошибке (или по отклонению ). Это значит, что для того, чтобы регулятор начал действовать, нужно, чтобы управляемая величина отклонилась от заданного значения. Блок, обозначенный знаком ≠ , находит рассогласование. В простейшем случае в нем из заданного значения вычитается сигнал обратной связи (измеренное значение).

Можно ли управлять объектом так, чтобы не было ошибки? В реальных системах – нет. Прежде всего, из-за внешних воздействий и шумов, которые заранее неизвестны. Кроме того, объекты управления обладают инерционностью , то есть, не могут мгновенно перейти из одного состояния в другое. Возможности регулятора и приводов (то есть мощность сигнала управления) всегда ограничены, поэтому быстродействие системы управления (скорость перехода на новый режим) также ограничена. Например, при управлении кораблем угол перекладки руля обычно не превышает 30 − 35° , это ограничивает скорость изменения курса.

Мы рассмотрели вариант, когда обратная связь используется для того, чтобы уменьшить разницу между заданным и фактическим состоянием объекта управления. Такая обратная связь называется отрицательной , потому что сигнал обратной связи вычитается из задающего сигнала. Может ли быть наоборот? Оказывается, да. В этом случае обратная связь называется положительной , она увеличивает рассогласование, то есть, стремится «раскачать» систему. На практике положительная обратная связь применяется, например, в генераторах для поддержания незатухающих электрических колебаний.

1.2.4. Разомкнутые системы

Можно ли управлять, не используя обратную связь? В принципе, можно. В этом случае регулятор не получает никакой информации о реальном состоянии объекта, поэтому должно быть точно известно, как этот объект себя ведет. Только тогда можно заранее рассчитать, как им нужно управлять (построить нужную программу управления). Однако при этом нельзя гарантировать, что задание будет выполнено. Такие системы называют системами программного управления или разомкнутыми системами , поскольку информация передается не по замкнутому контуру, а только в одном направлении.

программа

управление

регулятор

возмущения

Слепой и глухой водитель тоже может вести машину. Некоторое время. Пока он помнит дорогу и сможет правильно рассчитать свое место. Пока на пути не встретятся пешеходы или другие машины, о которых он заранее не может знать. Из этого простого примера ясно, что без

© К.Ю. Поляков, 2008

обратной связи (информации с датчиков) невозможно учесть влияние неизвестных факторов, неполноту наших знаний.

Несмотря на эти недостатки, разомкнутые системы применяются на практике. Например, информационное табло на вокзале. Или простейшая система управления двигателем, в которой не требуется очень точно поддерживать частоту вращения. Однако с точки зрения теории управления разомкнутые системы малоинтересны, и мы не будем больше про них вспоминать.

1.3. Какие бывают системы управления?

Автоматическая система – это система, работающая без участия человека. Есть еще автоматизированные системы, в которых рутинные процессы (сбор и анализ информации) выполняет компьютер, но управляет всей системой человек-оператор, который и принимает решения. Мы будем далее изучать только автоматические системы.

1.3.1. Задачи систем управления

Автоматические системы управления применяются для решения трех типов задач:

стабилизация , то есть поддержание заданного режима работы, который не меняется длительное время (задающий сигнал – постоянная, часто нуль);

программное управление – управление по заранее известной программе (задающий сигнал меняется, но заранее известен);

слежение за неизвестным задающим сигналом.

К системам стабилизации относятся, например, авторулевые на кораблях (поддержание заданного курса), системы регулирования частоты вращения турбин. Системы программного управления широко используются в бытовой технике, например, в стиральных машинах. Следящие системы служат для усиления и преобразования сигналов, они применяются в приводах и при передаче команд через линии связи, например, через Интернет.

1.3.2. Одномерные и многомерные системы

По количеству входов и выходов бывают

одномерные системы, у которых один вход и один выход (они рассматриваются в так называемой классической теории управления);

многомерные системы, имеющие несколько входов и./или выходов (главный предмет изучения современной теории управления).

Мы будем изучать только одномерные системы, где и объект, и регулятор имеют один входной и один выходной сигнал. Например, при управлении кораблем по курсу можно считать, что есть одно управляющее воздействие (поворот руля) и одна регулируемая величина (курс).

Однако, в самом деле это не совсем верно. Дело в том, что при изменении курса меняется также крен и дифферент корабля. В одномерной модели мы пренебрегаем этими изменениями, хотя они могут быть очень существенными. Например, при резком повороте крен может достигнуть недопустимого значения. С другой стороны, для управления можно использовать не только руль, но и различные подруливающие устройства, стабилизаторы качки и т.п., то есть объект имеет несколько входов. Таким образом, реальная система управления курсом – многомерная.

Исследование многомерных систем – достаточно сложная задача и выходит за рамки этого пособия. Поэтому в инженерных расчетах стараются иногда упрощенно представить многомерную систему как несколько одномерных, и довольно часто такой метод приводит к успеху.

1.3.3. Непрерывные и дискретные системы

По характеру сигналов системы могут быть

непрерывными , в которых все сигналы – функции непрерывного времени, определенные на некотором интервале;

дискретными , в которых используются дискретные сигналы (последовательности чисел), определенные только в отдельные моменты времени;

© К.Ю. Поляков, 2008

непрерывно-дискретными , в которых есть как непрерывные, так и дискретные сигналы. Непрерывные (или аналоговые ) системы обычно описываются дифференциальными уравнениями. Это все системы управления движением, в которых нет компьютеров и других эле-

ментов дискретного действия (микропроцессоров, логических интегральных схем). Микропроцессоры и компьютеры – это дискретные системы, поскольку в них вся инфор-

мация хранится и обрабатывается в дискретной форме. Компьютер не может обрабатывать непрерывные сигналы, поскольку работает только с последовательностями чисел. Примеры дискретных систем можно найти в экономике (период отсчета – квартал или год) и в биологии (модель «хищник-жертва»). Для их описания применяют разностные уравнения.

Существуют также и гибридные непрерывно-дискретные системы, например, компьютерные системы управления движущимися объектами (кораблями, самолетами, автомобилями и др.). В них часть элементов описывается дифференциальными уравнениями, а часть – разностными. С точки зрения математики это создает большие сложности для их исследования, поэтому во многих случаях непрерывно-дискретные системы сводят к упрощенным чисто непрерывным или чисто дискретным моделям.

1.3.4. Стационарные и нестационарные системы

Для управления очень важен вопрос о том, изменяются ли характеристики объекта со временем. Системы, в которых все параметры остаются постоянными, называются стационарными , что значит «не изменяющиеся во времени». В этом пособии рассматриваются только стационарные системы.

В практических задачах часто дело обстоит не так радужно. Например, летящая ракета расходует топливо и за счет этого ее масса изменяется. Таким образом, ракета – нестационарный объект. Системы, в которых параметры объекта или регулятора изменяются со временем, называются нестационарными . Хотя теория нестационарных систем существует (формулы написаны), применить ее на практике не так просто.

1.3.5. Определенность и случайность

Самый простой вариант – считать, что все параметры объекта определены (заданы) точно, так же, как и внешние воздействия. В этом случае мы говорим о детерминированных системах, которые рассматривались в классической теории управления.

Тем не менее, в реальных задачах точных данных у нас нет. Прежде всего, это относится к внешним воздействиям. Например, для исследования качки корабля на первом этапе можно считать, что волна имеет форму синуса известной амплитуды и частоты. Это детерминированная модель. Так ли это на практике? Естественно нет. С помощью такого подхода можно получить только приближенные, грубые результаты.

По современным представлениям форма волны приближенно описывается как сумма синусоид, которые имеют случайные , то есть неизвестные заранее, частоты, амплитуды и фазы. Помехи, шум измерений – это тоже случайные сигналы.

Системы, в которых действуют случайные возмущения или параметры объекта могут изменяться случайным образом, называются стохастическими (вероятностными). Теория стохастических систем позволяет получать только вероятностные результаты. Например, нельзя гарантировать, что отклонение корабля от курса всегда будет составлять не более 2° , но можно попытаться обеспечить такое отклонение с некоторой вероятностью (вероятность 99% означает, что требование будет выполнено в 99 случаях из 100).

1.3.6. Оптимальные системы

Часто требования к системе можно сформулировать в виде задачи оптимизации . В оптимальных системах регулятор строится так, чтобы обеспечить минимум или максимум какого-то критерия качества. Нужно помнить, что выражение «оптимальная система» не означает, что она действительно идеальная. Все определяется принятым критерием – если он выбран удачно, система получится хорошая, если нет – то наоборот.

© К.Ю. Поляков, 2008

1.3.7. Особые классы систем

Если параметры объекта или возмущений известны неточно или могут изменяться со временем (в нестационарных системах), применяют адаптивные или самонастраивающиеся регуляторы, в которых закон управления меняется при изменении условий. В простейшем случае (когда есть несколько заранее известных режимов работы) происходит простое переключение между несколькими законами управления. Часто в адаптивных системах регулятор оценивает параметры объекта в реальном времени и соответственно изменяет закон управления по заданному правилу.

Самонастраивающаяся система, которая пытается настроить регулятор так, чтобы «найти» максимум или минимум какого-то критерия качества, называется экстремальной (от слова экстремум , обозначающего максимум или минимум).

Во многих современных бытовых устройствах (например, в стиральных машинах) используются нечеткие регуляторы , построенные на принципах нечеткой логики . Этот подход позволяет формализовать человеческий способ принятия решения: «если корабль ушел сильно вправо, руль нужно сильно переложить влево».

Одно из популярных направлений в современной теории – применение достижений искусственного интеллекта для управления техническими системами. Регулятор строится (или только настраивается) на основе нейронной сети , которую предварительно обучает человекэксперт.

© К.Ю. Поляков, 2008

2. Математические модели

2.1. Что нужно знать для управления?

Цель любого управления – изменить состояние объекта нужным образом (в соответствии с заданием). Теория автоматического регулирования должна ответить на вопрос: «как построить регулятор, который может управлять данным объектом так, чтобы достичь цели?» Для этого разработчику необходимо знать, как система управления будет реагировать на разные воздействия, то есть нужна модель системы: объекта, привода, датчиков, каналов связи, возмущений, шумов.

Модель – это объект, который мы используем для изучения другого объекта (оригинала ). Модель и оригинал должны быть в чем-то похожи, чтобы выводы, сделанные при изучении модели, можно было бы (с некоторой вероятностью) перенести на оригинал. Нас будут интересовать в первую очередь математические модели , выраженные в виде формул. Кроме того, в науке используются также описательные (словесные), графические, табличные и другие модели.

2.2. Связь входа и выхода

Любой объект взаимодействует с внешней средой с помощью входов и выходов. Входы – это возможные воздействия на объект, выходы – это те сигналы, которые можно измерить. Например, для электродвигателя входами могут быть напряжение питания и нагрузка, а выходами

– частота вращения вала, температура.

Входы независимы, они «приходят» из внешней среды. При изменении информации на входе меняется внутреннее состояние объекта (так называют его изменяющиеся свойства) и, как следствие, выходы:

вход x

выход y

Это значит, что существует некоторое правило, по которому элемент преобразует вход x в выход y . Это правило называется оператором . Запись y = U означает, что выход y получен в

результате применения оператора U ко входу x.

Построить модель – это значит найти оператор, связывающий входы и выходы. С его помощью можно предсказать реакцию объекта на любой входной сигнал.

Рассмотрим электродвигатель постоянного тока. Вход этого объекта – это напряжение питания (в вольтах), выход – частота вращения (в оборотах в секунду). Будем считать, что при напряжении 1 В частота вращения равна 1 об/сек, а при напряжении 2 В – 2 об/сек, то есть частота вращения равна по величине напряжению1 . Легко видеть, что действие такого оператора можно записать в виде

U[ x] = x .

Теперь предположим, что этот же двигатель вращает колесо и в качестве выхода объекта мы выбрали число оборотов колеса относительно начального положения (в момент t = 0). В этом случае при равномерном вращении произведение x ∆ t дает нам количество оборотов за время ∆ t , то есть y (t ) = x ∆ t (здесь запись y (t ) явно обозначает зависимость выхода от време-

ни t ). Можно ли считать, что этой формулой мы определили оператор U ? Очевидно, что нет, потому что полученная зависимость справедлива только для постоянного входного сигнала. Если напряжение на входе x (t ) меняется (все равно как!), угол поворота запишется в виде инте-

1 Конечно, это будет справедливо только в некотором диапазоне напряжений.


При вопрос по реализации ПИД-регуляторов несколько глубже чем и кажется. Настолько, что юных самоделкиных, решивших, реализовать такую схему регулирования ждет немало открытий чудных, а тема актуальная. Так что надеюсь сей опус, кому-нибудь да пригодиться, поэтому приступим.

Попытка номер раз

В качестве примера попытаемся реализовать схему регулирования на примере управления поворотом в простенькой космической 2D-аркаде, по шагам, начиная с самого начала (не забыли, что это туториал?).


Почему не 3D? Потому что реализация не измениться, за исключением того, что придется воротить ПИД-регулятор для контроля тангажа, рысканья и крена. Хотя вопрос корректного применения ПИД-регулирования вместе с кватернионами действительно интересный, возможно в будущем его и освящу, но даже в NASA предпочитают углы Эйлера вместо кватернионов, так что обойдемся простенькой моделью на двухмерной плоскости.


Для начала создадим сам объект игровой объект космического корабля, который будет состоять из собственно самого объекта корабля на верхнем уровне иерархии, прикрепим к нему дочерний объект Engine (чисто спецэффектов ради). Вот как это выглядит у меня:



А на сам объект космического корабля накидаем в инспекторе всяческих компонент. Забегая вперед, приведу скрин того, как он будет выглядеть в конце:



Но это потом, а пока в нем еще нет никаких скриптов, только стандартный джентльменский набор: Sprite Render, RigidBody2D, Polygon Collider, Audio Source (зачем?).


Собственно физика у нас сейчас самое главное и управление будет осуществляться исключительно через неё, в противном случае, применение ПИД-регулятора потеряло бы смысл. Масса нашего космического корабля оставим также в 1 кг, а все коэффициенты трения и гравитации равны нулю - в космосе же.


Т.к. помимо самого космического корабля есть куча других, менее умных космических объектов, то сначала опишем родительский класс BaseBody , который в себе будет содержать ссылки на на наши компоненты, методы инициализации и уничтожения, а также ряд дополнительных полей и методов, например для реализации небесной механики:


BaseBody.cs

using UnityEngine; using System.Collections; using System.Collections.Generic; namespace Assets.Scripts.SpaceShooter.Bodies { public class BaseBody: MonoBehaviour { readonly float _deafultTimeDelay = 0.05f; public static List _bodies = new List(); #region RigidBody public Rigidbody2D _rb2d; public Collider2D _c2d; #endregion #region References public Transform _myTransform; public GameObject _myObject; ///

/// Объект, который появляется при уничтожении /// public GameObject _explodePrefab; #endregion #region Audio public AudioSource _audioSource; /// /// Звуки, которые проигрываются при получении повреждения /// public AudioClip _hitSounds; /// /// Звуки, которые проигрываются при появлении объекта /// public AudioClip _awakeSounds; /// /// Звуки, которые воспроизводятся перед смертью /// public AudioClip _deadSounds; #endregion #region External Force Variables /// /// Внешние силы воздйствующие на объект /// public Vector2 _ExternalForces = new Vector2(); /// /// Текущий вектор скорости /// public Vector2 _V = new Vector2(); /// /// Текущий вектор силы гравитации /// public Vector2 _G = new Vector2(); #endregion public virtual void Awake() { Init(); } public virtual void Start() { } public virtual void Init() { _myTransform = this.transform; _myObject = gameObject; _rb2d = GetComponent(); _c2d = GetComponentsInChildren(); _audioSource = GetComponent(); PlayRandomSound(_awakeSounds); BaseBody bb = GetComponent(); _bodies.Add(bb); } /// /// Уничтожение персонажа /// public virtual void Destroy() { _bodies.Remove(this); for (int i = 0; i < _c2d.Length; i++) { _c2d[i].enabled = false; } float _t = PlayRandomSound(_deadSounds); StartCoroutine(WaitAndDestroy(_t)); } /// /// Ждем некоторое время перед уничтожением /// /// Время ожидания /// public IEnumerator WaitAndDestroy(float waitTime) { yield return new WaitForSeconds(waitTime); if (_explodePrefab) { Instantiate(_explodePrefab, transform.position, Quaternion.identity); } Destroy(gameObject, _deafultTimeDelay); } /// /// Проигрывание случайного звука /// /// Массив звуков /// Длительность проигрываемого звука public float PlayRandomSound(AudioClip audioClip) { float _t = 0; if (audioClip.Length > 0) { int _i = UnityEngine.Random.Range(0, audioClip.Length - 1); AudioClip _audioClip = audioClip[_i]; _t = _audioClip.length; _audioSource.PlayOneShot(_audioClip); } return _t; } /// /// Получение урона /// /// Уровень урона public virtual void Damage(float damage) { PlayRandomSound(_hitSounds); } } }


Вроде описали все что надо, даже больше чем нужно (в рамках этой статьи). Теперь отнаследуем от него класс корабля Ship , который должен уметь двигаться и поворачивать:


SpaceShip.cs

using UnityEngine; using System.Collections; using System.Collections.Generic; namespace Assets.Scripts.SpaceShooter.Bodies { public class Ship: BaseBody { public Vector2 _movement = new Vector2(); public Vector2 _target = new Vector2(); public float _rotation = 0f; public void FixedUpdate() { float torque = ControlRotate(_rotation); Vector2 force = ControlForce(_movement); _rb2d.AddTorque(torque); _rb2d.AddRelativeForce(force); } public float ControlRotate(Vector2 rotate) { float result = 0f; return result; } public Vector2 ControlForce(Vector2 movement) { Vector2 result = new Vector2(); return result; } } }


Пока в нем нет ничего интересно, на текущий момент это просто класс-заглушка.


Также опишем базовый(абстрактный) класс для всех контроллеров ввода BaseInputController:


BaseInputController.cs

using UnityEngine; using Assets.Scripts.SpaceShooter.Bodies; namespace Assets.Scripts.SpaceShooter.InputController { public enum eSpriteRotation { Rigth = 0, Up = -90, Left = -180, Down = -270 } public abstract class BaseInputController: MonoBehaviour { public GameObject _agentObject; public Ship _agentBody; // Ссылка на компонент логики корабля public eSpriteRotation _spriteOrientation = eSpriteRotation.Up; //Это связано с нестандартной // ориентации спрайта "вверх" вместо "вправо" public abstract void ControlRotate(float dt); public abstract void ControlForce(float dt); public virtual void Start() { _agentObject = gameObject; _agentBody = gameObject.GetComponent(); } public virtual void FixedUpdate() { float dt = Time.fixedDeltaTime; ControlRotate(dt); ControlForce(dt); } public virtual void Update() { //TO DO } } }


И наконец, класс контроллера игрока PlayerFigtherInput :


PlayerInput.cs

using UnityEngine; using Assets.Scripts.SpaceShooter.Bodies; namespace Assets.Scripts.SpaceShooter.InputController { public class PlayerFigtherInput: BaseInputController { public override void ControlRotate(float dt) { // Определяем позицию мыши относительно игрока Vector3 worldPos = Input.mousePosition; worldPos = Camera.main.ScreenToWorldPoint(worldPos); // Сохраняем координаты указателя мыши float dx = -this.transform.position.x + worldPos.x; float dy = -this.transform.position.y + worldPos.y; //Передаем направление Vector2 target = new Vector2(dx, dy); _agentBody._target = target; //Вычисляем поворот в соответствии с нажатием клавиш float targetAngle = Mathf.Atan2(dy, dx) * Mathf.Rad2Deg; _agentBody._targetAngle = targetAngle + (float)_spriteOrientation; } public override void ControlForce(float dt) { //Передаем movement _agentBody._movement = Input.GetAxis("Vertical") * Vector2.up + Input.GetAxis("Horizontal") * Vector2.right; } } }


Вроде бы закончили, теперь наконец можно перейти к тому, ради чего все это затевалось, т.е. ПИД-регуляторам (не забыли надеюсь?). Его реализация кажется простой до безобразия:


using System; using System.Collections.Generic; using System.Linq; using System.Text; namespace Assets.Scripts.Regulator { // Этот атрибут необходим для того что бы поля регулятора // отображались в инспекторе и сериализовывались public class SimplePID { public float Kp, Ki, Kd; private float lastError; private float P, I, D; public SimplePID() { Kp = 1f; Ki = 0; Kd = 0.2f; } public SimplePID(float pFactor, float iFactor, float dFactor) { this.Kp = pFactor; this.Ki = iFactor; this.Kd = dFactor; } public float Update(float error, float dt) { P = error; I += error * dt; D = (error - lastError) / dt; lastError = error; float CO = P * Kp + I * Ki + D * Kd; return CO; } } }

Значения коэффициентов по умолчанию возьмем с потолка: это будет тривиальный единичный коэффициент пропорционального закона управления Kp = 1, небольшое значение коэффициента для дифференциального закона управления Kd = 0.2, который должен устранить ожидаемые колебания и нулевое значение для Ki, которое выбрано потому, что в нашей программной модели нет никаких статичных ошибок (но вы всегда можете их внести, а потом героически побороться с помощью интегратора).


Теперь вернемся к нашему классу SpaceShip и попробуем заюзать наше творение в качестве регулятора поворота космического корабля в методе ControlRotate:


public float ControlRotate(Vector2 rotate) { float MV = 0f; float dt = Time.fixedDeltaTime; //Вычисляем ошибку float angleError = Mathf.DeltaAngle(_myTransform.eulerAngles.z, targetAngle); //Получаем корректирующее ускорение MV = _angleController.Update(angleError, dt); return MV; }

ПИД-регулятор будет осуществлять точное угловое позиционировая космического корабля только за счет крутящего момента . Все честно, физика и САУ, почти как в реальной жизни.


И без этих ваших Quaternion.Lerp

if (!_rb2d.freezeRotation) rb2d.freezeRotation = true; float deltaAngle = Mathf.DeltaAngle(_myTransform.eulerAngles.z, targetAngle); float T = dt * Mathf.Abs(_rotationSpeed / deltaAngle); // Трансформируем угол в вектор Quaternion rot = Quaternion.Lerp(_myTransform.rotation, Quaternion.Euler(new Vector3(0, 0, targetAngle)), T); // Изменяем поворот объекта _myTransform.rotation = rot;


Получившейся исходный код Ship.cs под спойлером

using UnityEngine; using Assets.Scripts.Regulator; namespace Assets.Scripts.SpaceShooter.Bodies { public class Ship: BaseBody { public GameObject _flame; public Vector2 _movement = new Vector2(); public Vector2 _target = new Vector2(); public float _targetAngle = 0f; public float _angle = 0f; public SimplePID _angleController = new SimplePID(); public void FixedUpdate() { float torque = ControlRotate(_targetAngle); Vector2 force = ControlForce(_movement); _rb2d.AddTorque(torque); _rb2d.AddRelativeForce(force); } public float ControlRotate(float rotate) { float MV = 0f; float dt = Time.fixedDeltaTime; _angle = _myTransform.eulerAngles.z; //Вычисляем ошибку float angleError = Mathf.DeltaAngle(_angle, rotate); //Получаем корректирующее ускорение MV = _angleController.Update(angleError, dt); return MV; } public Vector2 ControlForce(Vector2 movement) { Vector2 MV = new Vector2(); //Кусок кода спецэффекта работающего двигателя ради if (movement != Vector2.zero) { if (_flame != null) { _flame.SetActive(true); } } else { if (_flame != null) { _flame.SetActive(false); } } MV = movement; return MV; } } }


Все? Расходимся по домам?



WTF! Что происходит? Почему корабль поворачивается как-то странно? И почему он так резко отскакивает от других объектов? Неужели этот глупый ПИД-регулятор не работает?


Без паники! Давайте попробуем разобраться что происходит.


В момент получения нового значения SP, происходит резкий (ступенчатый) скачок рассогласования ошибки, которая, как мы помним, вычисляется вот так: соответственно происходит резкий скачок производной ошибки , которую мы вычисляем в этой строчке кода:


D = (error - lastError) / dt;

Можно, конечно, попробовать другие схемы дифференцирования , например, трехточечную, или пятиточечную, или… но все равно это не поможет. Ну вот не любят производные резких скачков - в таких точках функция не является дифференцируемой . Однако поэкспериментировать с разными схемами дифференцирования и интегрирования стоит, но потом и не в этой статье.


Думаю что настал момент построить графики переходного процесса : ступенчатое воздействие от S(t) = 0 в SP(t) = 90 градусов для тела массой в 1 кг, длинной плеча силы в 1 метр и шагом сетки дифференцирования 0.02 с - прям как в нашем примере на Unity3D (на самом деле не совсем, при построении этих графиков не учитывалось, что момент инерции зависит от геометрии твердого тела, поэтому переходный процесс будет немножко другой, но все же достаточно похожий для демонстрации). Все величены на грифике приведены в абсолютных значениях:


Хм, что здесь происходит? Куда улетел отклик ПИД-регулятора?


Поздравляю, мы только что столкнулись с таким явлением как "удар" (kick). Очевидно, что в момент времени, когда процесс еще PV = 0, а уставка уже SP = 90, то при численном дифференцировании получим значение производной порядка 4500, которое умножится на Kd=0.2 и сложится с пропорциональным теромом, так что на выходе мы получим значение углового ускорения 990, а это уже форменное надругательство над физической моделью Unity3D (угловые скорости будут достигать 18000 град/с… я думаю это предельное значение угловой скорости для RigidBody2D).


  • Может стоит подобрать коэффициенты ручками, так чтобы скачок был не таким сильным?
  • Нет! Самое лучше чего мы таким образом сможем добиться - небольшая амплитуда скачка производной, однако сам скачок как был так и останется, при этом можно докрутиться до полной неэффективности дифференциальной составляющей.

Впрочем можете поэкспериментировать.

Попытка номер два. Сатурация

Логично, что привод (в нашем случае виртуальные маневровые двигатели SpaceShip), не может отрабатывать сколько угодно большие значения которые может выдать наш безумный регулятор. Так что первое что мы сделаем - сатурируем выход регулятора:


public float ControlRotate(Vector2 rotate, float thrust) { float CO = 0f; float MV = 0f; float dt = Time.fixedDeltaTime; //Вычисляем ошибку float angleError = Mathf.DeltaAngle(_myTransform.eulerAngles.z, targetAngle); //Получаем корректирующее ускорение CO = _angleController.Update(angleError, dt); //Сатурируем MV = CO; if (MV > thrust) MV = thrust; if (MV< -thrust) MV = -thrust; return MV; }

А очередной раз переписанный класс Ship полностью выглядит так

namespace Assets.Scripts.SpaceShooter.Bodies { public class Ship: BaseBody { public GameObject _flame; public Vector2 _movement = new Vector2(); public Vector2 _target = new Vector2(); public float _targetAngle = 0f; public float _angle = 0f; public float _thrust = 1f; public SimplePID _angleController = new SimplePID(0.1f,0f,0.05f); public void FixedUpdate() { _torque = ControlRotate(_targetAngle, _thrust); _force = ControlForce(_movement); _rb2d.AddTorque(_torque); _rb2d.AddRelativeForce(_force); } public float ControlRotate(float targetAngle, float thrust) { float CO = 0f; float MV = 0f; float dt = Time.fixedDeltaTime; //Вычисляем ошибку float angleError = Mathf.DeltaAngle(_myTransform.eulerAngles.z, targetAngle); //Получаем корректирующее ускорение CO = _angleController.Update(angleError, dt); //Сатурируем MV = CO; if (MV > thrust) MV = thrust; if (MV< -thrust) MV = -thrust; return MV; } public Vector2 ControlForce(Vector2 movement) { Vector2 MV = new Vector2(); if (movement != Vector2.zero) { if (_flame != null) { _flame.SetActive(true); } } else { if (_flame != null) { _flame.SetActive(false); } } MV = movement * _thrust; return MV; } public void Update() { } } }


Итоговая схема нашего САУ тогда станет уже вот такой


При этом уже становится понятно, что выход контроллера CO(t) немного не одно и тоже, что управляемая величина процесса MV(t) .


Собственно с этого места можно уже добавлять новую игровую сущность - привод , через которую и будет осуществляться управление процессом, логика работы которой может быть более сложной, чем просто Mathf.Clamp(), например, можно ввести дискретизацию значений (дабы не перегружать игровую физику величинами идущими шестыми после запятой), мертвую зону (опять таки не имеет смысл перегружать физику сверхмалыми реакциями), ввести задержку в упраление и нелинейность (например, сигмоиду) привода, после чего посмотреть, что из этого получится.


Запустив игру, мы обнаружим, что космический корабль стал наконец управляемым:



Если построить графики, то можно увидеть, что реакция контроллера стала уже вот такой:


Здесь уже используются нормированные величены, углы поделены на значение SP, а выход контроллера отнормирован относительно максимального значения на котором уже происходит сатурация.

Ниже приведена известна таблица влияния увеличения параметров ПИД-регулятора (как уменьшить шрифт, а то таблица безе переносов не лезет? ):



А общий алгоритм ручной настройки ПИД-регулятора следующий:


  1. Подбираем пропорциональный коэффициенты при отключенных дифференциальных и интегральных звеньях до тех пор пока не начнутся автоколебания.
  2. Постепенно увеличивая дифференциальную составляющую избавляемся от автоколебаний
  3. Если наблюдается остаточная ошибка регулирования (смещение), то устраняем её за счет интегральной составляющей.

Каких-то общих значений параметров ПИД-регулятора нет: конкретные значения зависят исключительно от параметров процесса (его передаточной характеристики): ПИД-регулятор отлично работающий с одним объектом управления окажется неработоспособным с другим. Более того, коэффициенты при пропорциональной, интегральной и дифференциальной составляющих еще и взаимозависимы.


Попытка номер три. Еще раз производные

Приделав костыль в виде ограничения значений выхода контроллера мы так и не решили самую главную проблему нашего регулятора - дифференциальная составляющая плохо себя чувствует при ступенчатом изменении ошибки на входе регуляторе. На самом деле есть множество других костылей, например, в момент скачкообразного изменения SP "отключать" дифференциальную составляющую или же поставить фильтры нижних частот между SP(t) и операцией за счет которого будет происходить плавное нарастание ошибки, а можно совсем развернуться и впендюрить самый настоящий фильтр Калмана для сглаживания входных данных. В общем костылей много, и добавить наблюдателя конечно хотелось бы, но не в этот раз.


Поэтому снова вернемся к производной ошибки рассогласования и внимательно на неё посмотрим:



Ничего не заметили? Если хорошенько присмотреться, то можно обнаружить, что вообще-то SP(t), не меняется во времени (за исключением моментов ступенчатого изменения, когда регулятор получает новую команду), т.е. её производная равна нулю:





Иными словами, вместо производной ошибки, которая дифференцируема не везде мы можем использовать производную от процесса, который в мире классической механики как правило непрерывен и дифференцируем везде, а схема нашей САУ уже приобретет следующий вид:




Модифицируем код регулятора:


using System; using System.Collections.Generic; using System.Linq; using System.Text; namespace Assets.Scripts.Regulator { public class SimplePID { public float Kp, Ki, Kd; private float P, I, D; private float lastPV = 0f; public SimplePID() { Kp = 1f; Ki = 0f; Kd = 0.2f; } public SimplePID(float pFactor, float iFactor, float dFactor) { this.Kp = pFactor; this.Ki = iFactor; this.Kd = dFactor; } public float Update(float error, float PV, float dt) { P = error; I += error * dt; D = -(PV - lastPV) / dt; lastPV = PV; float CO = Kp * P + Ki * I + Kd * D; return CO; } } }

И немного изменим метод ControlRotate:


public float ControlRotate(Vector2 rotate, float thrust) { float CO = 0f; float MV = 0f; float dt = Time.fixedDeltaTime; //Вычисляем ошибку float angleError = Mathf.DeltaAngle(_myTransform.eulerAngles.z, targetAngle); //Получаем корректирующее ускорение CO = _angleController.Update(angleError, _myTransform.eulerAngles.z, dt); //Сатурируем MV = CO; if (CO > < -thrust) MV = -thrust; return MV; }

И-и-и-и… если запустить игру, то обнаружиться, что на самом деле ничего ничего не изменилось с последней попытки, что и требовалось доказать. Однако, если убрать сатурацию, то график реакции регулятора будет выглядеть вот так:


Скачок CO(t) по прежнему присутствует, однако он уже не такой большой как был в самом начале, а самое главное - он стал предсказуемым, т.к. обеспечивается исключительно пропорциональной составляющей, и ограничен максимально возможной ошибкой рассогласования и пропорциональным коэффициентом ПИД-регулятора (а это уже намекает на то, что Kp имеет смысл выбрать все же меньше единицы, например, 1/90f), но не зависит от шага сетки дифференцирования (т.е. dt ). В общем, я настоятельно рекомендую использовать именно производную процесса, а не ошибки.


Думаю теперь никого не удивит, но таким же макаром можно заменить на , однако останавливаться на этом мы не будем, можете сами поэкспериментировать и рассказать в комментариях, что из этого получилось (самому интересно)

Попытка номер четыре. Альтернативные реализации ПИД-регулятор

Помимо описанного выше идеального представления ПИД-регулятора, на практике часто применяется стандартная форма, без коэффициентов Ki и Kd , вместо которых используются временные постоянные.


Такой подход связан с тем, что ряд методик настройки ПИД-регулятора основан на частотных характеристиках ПИД-регулятора и процесса. Собственно вся ТАУ и крутится вокруг частотных характеристик процессов, поэтому для желающих углубиться, и, внезапно, столкнувшихся с альтернативной номенклатурой, приведу пример т.н. стандартной формы ПИД-регулятора:




где, - постоянная дифференцирования, влияющая на прогнозирование состояния системы регулятором,
- постоянная интегрирования, влияющая на интервал усреднения ошибки интегральным звеном.


Основные принципы настройки ПИД-регулятора в стандартной форме аналогичны идеализированному ПИД-регулятору:

  • увеличение пропорционального коэффициента увеличивает быстродействие и снижает запас устойчивости;
  • с уменьшением интегральной составляющей ошибка регулирования с течением времени уменьшается быстрее;
  • уменьшение постоянной интегрирования уменьшает запас устойчивости;
  • увеличение дифференциальной составляющей увеличивает запас устойчивости и быстродействие

Исходный код стандартной формы, вы можете найти под спойлером

namespace Assets.Scripts.Regulator { public class StandartPID { public float Kp, Ti, Td; public float error, CO; public float P, I, D; private float lastPV = 0f; public StandartPID() { Kp = 0.1f; Ti = 10000f; Td = 0.5f; bias = 0f; } public StandartPID(float Kp, float Ti, float Td) { this.Kp = Kp; this.Ti = Ti; this.Td = Td; } public float Update(float error, float PV, float dt) { this.error = error; P = error; I += (1 / Ti) * error * dt; D = -Td * (PV - lastPV) / dt; CO = Kp * (P + I + D); lastPV = PV; return CO; } } }

В качестве значений по умолчанию, выбраны Kp = 0.01, Ti = 10000, Td = 0.5 - при таких значениях корабль поворачивается достаточно быстро и обладает некоторым запасом устойчивости.


Помимо такой формы ПИД-регулятора, часто используется т.н. реккурентная форма :



Не будем на ней останавливаться, т.к. она актуальна прежде всего для хардверных программистов, работающих с FPGA и микроконтроллерами, где такая реализация значительно удобнее и эффективнее. В нашем же случае - давайте что-нибудь сваям на Unity3D - это просто еще одна реализация ПИД-контроллера, которая ни чем не лучше других и даже менее понятная, так что еще раз дружно порадуемся как хорошо программировать в уютненьком C#, а не в жутком и страшном VHDL, например.

Вместо заключения. Куда бы еще присобачить ПИД-регулятор

Теперь попробуем немного усложнить управление корабля используя двухконтурное управление: один ПИД-регулятор, уже знакомый нам _angleController, отвечает по прежнему за угловое позиционирование, а вот второй - новый, _angularVelocityController - контролирует скорость поворота:


public float ControlRotate(float targetAngle, float thrust) { float CO = 0f; float MV = 0f; float dt = Time.fixedDeltaTime; _angle = _myTransform.eulerAngles.z; //Контроллер угла поворота float angleError = Mathf.DeltaAngle(_angle, targetAngle); float torqueCorrectionForAngle = _angleController.Update(angleError, _angle, dt); //Контроллер стабилизации скорости float angularVelocityError = -_rb2d.angularVelocity; float torqueCorrectionForAngularVelocity = _angularVelocityController.Update(angularVelocityError, -angularVelocityError, dt); //Суммарный выход контроллера CO = torqueCorrectionForAngle + torqueCorrectionForAngularVelocity; //Дискретизируем с шагом 100 CO = Mathf.Round(100f * CO) / 100f; //Сатурируем MV = CO; if (CO > thrust) MV = thrust; if (CO < -thrust) MV = -thrust; return MV; }

Назначение второго регулятора - гашение избыточных угловых скоростей, за счет изменения крутящего момента - это сродни наличию углового трения, которое мы отключили еще при создании игрового объекта. Такая схема управления [возможно] позволит получить более стабильное поведение корабля, и даже обойтись только пропорциональными коэффициентами управления - второй регулятор будет гасить все колебания, выполняя функцию, аналогичную дифференциальной составляющей первого регулятора.


Помимо этого, добавим новый класс ввода игрока - PlayerInputCorvette, в котором повороты буду осуществляться уже за счет нажатия клавиш "вправо-влево", а целеуказание с помощью мыши мы оставим для чего-нибудь более полезного, например, для управления турелью. Заодно у нас теперь появился такой параметр как _turnRate - отвечающий за скорость/отзывчивость поворота (не понятно только куда его поместить лучше в InputCOntroller или все же Ship).


public class PlayerCorvetteInput: BaseInputController { public float _turnSpeed = 90f; public override void ControlRotate() { // Находим указатель мыши Vector3 worldPos = Input.mousePosition; worldPos = Camera.main.ScreenToWorldPoint(worldPos); // Сохраняем относительные координаты указателя мыши float dx = -this.transform.position.x + worldPos.x; float dy = -this.transform.position.y + worldPos.y; //Передаем направление указателя мыши Vector2 target = new Vector2(dx, dy); _agentBody._target = target; //Вычисляем поворот в соответствии с нажатием клавиш _agentBody._rotation -= Input.GetAxis("Horizontal") * _turnSpeed * Time.deltaTime; } public override void ControlForce() { //Передаем movement _agentBody._movement = Input.GetAxis("Vertical") * Vector2.up; } }

Также для наглядности накидаем на коленках скрипт для отображения отладочной информации

namespace Assets.Scripts.SpaceShooter.UI { public class Debugger: MonoBehaviour { Ship _ship; BaseInputController _controller; List _pids = new List(); List _names = new List(); Vector2 _orientation = new Vector2(); // Use this for initialization void Start() { _ship = GetComponent(); _controller = GetComponent(); _pids.Add(_ship._angleController); _names.Add("Angle controller"); _pids.Add(_ship._angularVelocityController); _names.Add("Angular velocity controller"); } // Update is called once per frame void Update() { DrawDebug(); } Vector3 GetDiretion(eSpriteRotation spriteRotation) { switch (_controller._spriteOrientation) { case eSpriteRotation.Rigth: return transform.right; case eSpriteRotation.Up: return transform.up; case eSpriteRotation.Left: return -transform.right; case eSpriteRotation.Down: return -transform.up; } return Vector3.zero; } void DrawDebug() { //Направление поворота Vector3 vectorToTarget = transform.position + 5f * new Vector3(-Mathf.Sin(_ship._targetAngle * Mathf.Deg2Rad), Mathf.Cos(_ship._targetAngle * Mathf.Deg2Rad), 0f); // Текущее направление Vector3 heading = transform.position + 4f * GetDiretion(_controller._spriteOrientation); //Угловое ускорение Vector3 torque = heading - transform.right * _ship._Torque; Debug.DrawLine(transform.position, vectorToTarget, Color.white); Debug.DrawLine(transform.position, heading, Color.green); Debug.DrawLine(heading, torque, Color.red); } void OnGUI() { float x0 = 10; float y0 = 100; float dx = 200; float dy = 40; float SliderKpMax = 1; float SliderKpMin = 0; float SliderKiMax = .5f; float SliderKiMin = -.5f; float SliderKdMax = .5f; float SliderKdMin = 0; int i = 0; foreach (SimplePID pid in _pids) { y0 += 2 * dy; GUI.Box(new Rect(25 + x0, 5 + y0, dx, dy), ""); pid.Kp = GUI.HorizontalSlider(new Rect(25 + x0, 5 + y0, 200, 10), pid.Kp, SliderKpMin, SliderKpMax); pid.Ki = GUI.HorizontalSlider(new Rect(25 + x0, 20 + y0, 200, 10), pid.Ki, SliderKiMin, SliderKiMax); pid.Kd = GUI.HorizontalSlider(new Rect(25 + x0, 35 + y0, 200, 10), pid.Kd, SliderKdMin, SliderKdMax); GUIStyle style1 = new GUIStyle(); style1.alignment = TextAnchor.MiddleRight; style1.fontStyle = FontStyle.Bold; style1.normal.textColor = Color.yellow; style1.fontSize = 9; GUI.Label(new Rect(0 + x0, 5 + y0, 20, 10), "Kp", style1); GUI.Label(new Rect(0 + x0, 20 + y0, 20, 10), "Ki", style1); GUI.Label(new Rect(0 + x0, 35 + y0, 20, 10), "Kd", style1); GUIStyle style2 = new GUIStyle(); style2.alignment = TextAnchor.MiddleLeft; style2.fontStyle = FontStyle.Bold; style2.normal.textColor = Color.yellow; style2.fontSize = 9; GUI.TextField(new Rect(235 + x0, 5 + y0, 60, 10), pid.Kp.ToString(), style2); GUI.TextField(new Rect(235 + x0, 20 + y0, 60, 10), pid.Ki.ToString(), style2); GUI.TextField(new Rect(235 + x0, 35 + y0, 60, 10), pid.Kd.ToString(), style2); GUI.Label(new Rect(0 + x0, -8 + y0, 200, 10), _names, style2); } } } }


Класс Ship также претерпел необратимые мутации и теперь должен выглядеть вот так:

namespace Assets.Scripts.SpaceShooter.Bodies { public class Ship: BaseBody { public GameObject _flame; public Vector2 _movement = new Vector2(); public Vector2 _target = new Vector2(); public float _targetAngle = 0f; public float _angle = 0f; public float _thrust = 1f; public SimplePID _angleController = new SimplePID(0.1f,0f,0.05f); public SimplePID _angularVelocityController = new SimplePID(0f,0f,0f); private float _torque = 0f; public float _Torque { get { return _torque; } } private Vector2 _force = new Vector2(); public Vector2 _Force { get { return _force; } } public void FixedUpdate() { _torque = ControlRotate(_targetAngle, _thrust); _force = ControlForce(_movement, _thrust); _rb2d.AddTorque(_torque); _rb2d.AddRelativeForce(_force); } public float ControlRotate(float targetAngle, float thrust) { float CO = 0f; float MV = 0f; float dt = Time.fixedDeltaTime; _angle = _myTransform.eulerAngles.z; //Контроллер угла поворота float angleError = Mathf.DeltaAngle(_angle, targetAngle); float torqueCorrectionForAngle = _angleController.Update(angleError, _angle, dt); //Контроллер стабилизации скорости float angularVelocityError = -_rb2d.angularVelocity; float torqueCorrectionForAngularVelocity = _angularVelocityController.Update(angularVelocityError, -angularVelocityError, dt); //Суммарный выход контроллера CO = torqueCorrectionForAngle + torqueCorrectionForAngularVelocity; //Дискретизируем с шагом 100 CO = Mathf.Round(100f * CO) / 100f; //Сатурируем MV = CO; if (CO > thrust) MV = thrust; if (CO < -thrust) MV = -thrust; return MV; } public Vector2 ControlForce(Vector2 movement, float thrust) { Vector2 MV = new Vector2(); if (movement != Vector2.zero) { if (_flame != null) { _flame.SetActive(true); } } else { if (_flame != null) { _flame.SetActive(false); } } MV = movement * thrust; return MV; } public void Update() { } } }

Случайные статьи

Вверх