Замкнутые системы и схемы управления

Раздел из главы 6. “Достаточно общая теория управления (в кратком изложении)” работы ВП СССР “Основы социологии”

В подавляющем большинстве случаев объекты (процессы), с которыми мы имеем дело в жизни, не обладают свойством самоуправления в желательном для нас режиме. Соответственно этому обстоятельству мы и оказываемся перед необходимостью решать те или иные задачи управления. Решение их состоит в том, чтобы:

либо выявить в объекте (процессе) некую систему управления и настроить её на управление объектом (процессом) в желательном для нас режиме;
либо построить систему управления и связать её с объектом (процессом), управлять которым мы намереваемся.

И то, и другое приводит к понятию «замкнутая система»:

«Замкнутая система» это — объект управления (процесс), находящийся во взаимодействии со средой, и система управления им, связанные друг с другом цепями прямых и обратных связей.

Назначение системы управления (как компоненты замкнутой системы) — вырабатывать управляющий сигнал и направлять его в объект и среду по прямым связям. Понятно, что система управления должна соответствовать как вектору целей управления, так и объекту управления и воздействию среды на него.

Управление — информационно-алгоритмический процесс — является отображением информации: из объекта и среды, окружающей объект управления, в систему управления объектом — обратные связи; и из системы управления объектом в объект и среду — прямые связи. Прямые связи подразделяются на внутренние и внешние: локализованные в пределах объекта и системы управления им — внутренние прямые связи; уходящие из системы управления и объекта во внешнюю среду — внешние прямые связи.

Аналогичным образом на внешние и внутренние подразделяются и обратные связи: те, по которым поступает информация о состоянии среды, положении объекта в ней, — внешние обратные связи; а те, по которым поступает информация о состоянии элементов объекта и системы управления им, — внутренние обратные связи.

Кроме того обратные связи подразделяются на «положительные» и «отрицательные». Понятие об отрицательных обратных связях отражает факт построения системы управления объектом таким образом, что обнаружение системой управления отклонений объекта от идеального режима, предписанного вектором целей, вызывает появление управляющего воздействия, направленного в сторону возвращения объекта к идеальному режиму. При положительных обратных связях управление помогает возмущению (с момента его обнаружения) увести объект от идеального режима в направлении воздействия возмущения на объект.

Но поскольку возмущение может представлять собой управляющее воздействие со стороны некоего процесса управления извне (его управляющее воздействие — его прямые связи), то при рассмотрении совокупности взаимовложенных процессов управления в отношении любого из вложенных в рассматриваемую совокупность процессов самоуправления их положительные обратные связи могут быть названы «поощряющими», а их отрицательные обратные связи — «гасящими», «подавляющими», «сдерживающими», «тормозящими».

Хотя до настоящего времени (2008 г.) эти термины в теории управления (вне ДОТУ) не употребляются, но они более соответствуют характеру обратных связей в процессе управления, нежели общепринятое подразделение обратных связей на «положительные» и «отрицательные», которое неоднозначно понимается интуитивно и нуждается в дополнительном пояснении. К тому же предлагаемые в ДОТУ определения обратных связей более соответствуют процессам взаимодействия некоего частного (вложенного) управления с объемлющим его иерархически высшим управлением, которое при взгляде с позиций вложенного управления представляется одним из факторов среды.

В зависимости от характера организации контуров прямых и обратных связей возможны различные схемы управления[1]. Все замкнутые системы при структурном и бесструктурном управлении (значение этих терминов будет пояснено далее в разделе 6.8) строятся на основе одной из следующих схем управления и (или) их сочетании в объемлющей замкнутой системе. Разные схемы (не способы) управления обеспечивают для одних и тех же объектов в одних и тех же условиях различную гибкость реагирования на возмущающие воздействия и различный максимально достижимый уровень качества управления. Будучи реализованы на одних и тех же объектах, они обеспечивают им разные запасы устойчивости управления. Схемы управления отличаются одна от другой распределением по компонентам замкнутой системы полной функции управления.

Структура, реализующая схему управления, может быть полностью размещена на объекте, либо какие-то её элементы могут быть размещены вне управляемого объекта по разным причинам. Частным случаем такого варианта является дистанционное управление, когда на объекте размещены преимущественно исполнительные элементы структуры, которые не жалко потерять или которые заведомо невозможно сохранить. Последнее часто имеет место по отношению к команде марионеточных политиков, изображающих реальную власть, а также при употреблении роботов[2] в опасной обстановке.

Программная схема управления. Внешние обратные связи после включения схемы в процесс управления в замкнутой системе отсутствуют: текущая информация о состоянии внешней среды, взаимодействии и положении объекта в ней в системе управления не используется.

Управляющий сигнал является функцией времени и, возможно, — информации, поступающей по каналам внутренних обратных связей, локализованных в объекте.

Учёт влияния на поведение объекта всех возмущающих воздействий производится на стадии проектирования и создания объекта и (или) системы управления им и программы управления. Уровень максимально возможного качества управления является функцией соответствия программы управления реальным условиям её реализации, поскольку замкнутая система не реагирует на реальное воздействие внешней среды. Гибкость поведения отсутствует.

Программно-адаптивная схема управления. Внешние обратные связи в системе есть.

Управляющий сигнал является функцией реальных параметров внешней среды и замкнутой системы, информация о которых поступает по цепям внешних и внутренних обратных связей. Но в то же время управляющий сигнал является и однозначной функцией программы (закона управления) в том смысле, что одинаковой информации, поступающей по цепям обратных связей, всегда соответствует один и тот же управляющий сигнал.

Эту тождественность реакции «вход — выход» можно понимать и в смысле соответствия статистических характеристик управляющего сигнала информации, поступающей по цепям обратных связей. Реакция системы на возмущение до некоторой степени гибкая в том смысле, что управляющий сигнал и реакция замкнутой системы на возмущения — функция этих возмущений.

Программно-адаптивная схема может реализовывать разные принципы управления. Отметим два наиболее часто встречающихся: управление по возмущению, и управление по отклонению. В первом случае система управления вырабатывает управляющий сигнал на основе измерения в процессе управления непосредственно возмущающего воздействия. Во втором случае система управления вырабатывает управляющий сигнал на основе измерения контрольных параметров и оценки их отклонений от значений, характеризующих идеальный режим управления. При необходимости оба принципа могут сочетаться в одной и той же системе управления.

Предположим, что мы проектируем систему автоматического управления температурным режимом в помещении. Мы можем построить её так, что обогреватели будут включаться в результате регистрации системой падения температуры в помещении ниже заданного значения. Это будет реализацией принципа управления по отклонению.

Но мы можем построить систему такого назначения и иначе. Поскольку температура в помещении обычно падает после того, как снизится среднесуточная температура наружного воздуха, остынут стены помещения и в него попадёт холодный наружный воздух, то мы имеем возможность регистрировать температуру наружного воздуха, вычислять среднесуточную температуру, и, не дожидаясь того момента, когда стены остынут и начнётся снижение температуры в помещении, давать команду на включение обогревателя в каком-то режиме немедленно в случае снижения среднесуточной температуры до заданного порогового значения. Это будет реализацией принципа управления по возмущению.

Кроме того, режим функционирования обогревателя может быть функцией разницы среднесуточной наружной температуры и текущего значения температуры в помещении. В последнем варианте в программно-адаптивной схеме управления будут сочетаться оба принципа управления — по возмущению и по отклонению.

Если нет возможности измерять контрольный параметр непосредственно в процессе управления (то есть в отношении него разорваны внешние и внутренние обратные связи), то в таком случае вместо не поддающегося непосредственному измерению значения контрольного параметра может быть использована его косвенная оценка на основе его производных, интегральных и иным образом информационно с ним связанных параметров, которые измеряются непосредственно. Однако в этом случае программно-адаптивное управление имеет свойство неограниченно накапливать с течением времени ошибку рассогласования по контрольному параметру. Причина неограниченного накопления ошибки управления по контрольному параметру — накопление ошибок измерения и преобразования измеренных величин в процессе косвенной оценки необходимой характеристики.

Примерами такого рода ошибок полна летопись морских катастроф, когда навигаторы, не видя берега в течение многих недель, из-за плохой погоды не видя звёзд, вынуждены были определять место корабля по счислению (на основе расчётов), и из-за ошибок в измерении скорости хода, ошибок в оценке влияния ветра и течений, неточности хода корабельных хронометров (часов) и ошибочного показания компасов теряли точные координаты (место) и гибли на камнях, которые по их расчётам должны были находиться за много миль от них. Таков же механизм накопления ошибок инерциальными навигационными системами, употребляемыми в ракетно-космической технике, на подводных лодках и системах оружия, в которых текущие координаты объекта определяются на основе ввода исходных координат, измерения ускорений и их двукратного интегрирования.

Качество управления при употреблении программной схемы ниже в сопоставлении с программно-адаптивной при одинаковой алгоритмике моделирования поведения объекта, положенной в основу формирования управляющего сигнала. Но и возможное качество управления при программно-адаптивной схеме может оказаться ниже минимально необходимого уровня в сложившихся условиях.

Допустим, что в какой-то момент времени вектор ошибки управления равен нулю. Но в какой-то момент времени, даже в тот же самый, замкнутая система будет подвергаться ненулевому возмущающему воздействию. Если бы в состав замкнутой системы входила идеальная система управления, то она формировала бы управляющий сигнал так, что управляющее воздействие в каждый момент времени в точности компенсировало бы возмущающее воздействие, вследствие чего вектор ошибки управления сохранял бы своё нулевое значение неограниченно долгое время.

Но в большинстве случаев возмущающее воздействие прямому измерению не поддаётся. Но даже если что-то и возможно измерить, то существует порог чувствительности средств измерения величин всех факторов, на основе информации о которых формируется управляющий сигнал. Информация при передаче искажается в некоторых пределах в самой системе. Системе управления требуется время на формирование и передачу управляющего сигнала. Средства управления также обладают ограниченным быстродействием. Сам объект управления обладает характеристиками инерции, и ему необходимо время, чтобы отреагировать на возмущающее воздействие, в результате чего возмущённое движение объекта также успевает набрать инерцию и требуется более мощное управляющее воздействие, чтобы вернуть объект к исходному режиму; но объекту необходимо время и для реакции на управляющее воздействие.

По этим причинам управляющее воздействие, соответствующее в некоторой мере вызвавшему его возмущающему воздействию, в программно-адаптивной схеме управления неизбежно запаздывает. Даже если мощность средств управления достаточна, чтобы полностью компенсировать возмущающее воздействие, она не может быть полностью использована вследствие того, что всегда имеет место фазовый сдвиг между возмущающим воздействием и компенсирующим его управляющим. По этой причине объект всегда находится под возмущающим воздействием факторов, реально учитываемых системой управления, не говоря уж о воздействии не учитываемых факторов: неопознанных, признанных мало влияющими, оказавшихся ниже порогов чувствительности средств измерения и т.п.

Соответственно замкнутая система — колебательная система, преобразующая возмущающее воздействие и управляющее воздействие в вектор ошибки управления, изменения которого в устойчивом процессе управления носят колебательный характер.

Потребность уменьшить вектор ошибки управления за счёт повышения эффективности использования располагаемых ресурсов приводит к схеме «предиктор-корректор» — предуказатель-поправщик (предсказатель-поправщик).

Смысл слова «предуказатель» объемлет смысл слова «предсказатель», поскольку включает в себя и многовариантный прогноз, и выбор варианта для осуществления (либо взаимно согласованной совокупности вариантов). Но на Западе и в отечественной научной традиции уже принят термин «предиктор-корректор», однако не в общем управленческом смысле, а в ограниченном: в вычислительной математике[3]. Поэтому мы, оговорив по-русски особенности нашего понимания — «предуказатель-поправщик», а не «предсказатель-поправщик», — сохраняем уже прижившийся на Западе термин «предиктор-корректор», однако расширив область его применения введением в контекст достаточно общей теории управления.

Схема управления предиктор-корректор.

Управление в схеме предиктор-корректор строится на основе прогнозирования в самом процессе управления поведения замкнутой системы, исходя из информации о текущем и прошлых состояниях замкнутой системы и воздействии на неё окружающей среды.

В этом принципиальное отличие схемы управления предиктор-корректор от программной и программно-адаптивной схем управления, в которых решение задачи прогностики полностью вынесено за пределы функционирования схемы в процессе управления.

Структурно-алгоритмически система управления, реализующая схему предиктор-корректор, может быть условно представлена как сочетание:

предиктора, выполняющего функцию прогноза и выработки закона управления (программы управления) — этому соответствуют 1‑й — 4‑й этапы полной функции управления,
и программно-адаптивного модуля, который управляет объектом на основе закона управления, выработанного предиктором, адаптируя его к конкретике обстоятельств, в которых протекает процесс управления, — этому соответствуют 5‑й — 7‑й этапы полной функции управления.

При этом прогнозная информация в форме закона управления подаётся на вход программно-адаптивного модуля системы управления.

Вследствие этого система управления реагирует не только на уже свершившиеся отклонения замкнутой системы от идеального режима, но и на те, которые только имеют тенденцию к осуществлению (в случае, если прогнозирование достаточно точное).

Если программно-адаптивное управление замыкает прямые и обратные связи через настоящее и уже свершившееся прошлое, то в схеме предиктор-корректор некоторая часть прямых и обратных связей замыкается через прогнозируемое будущее.

Информация о свершившемся прошлом и о настоящем в схеме предиктор-корректор, кроме прогнозирования и выработки управляющего сигнала, также используется как основа для минимизации (периодического обнуления) в процессе управления составляющей вектора ошибки, обусловленной накоплением с течением времени ошибок прогнозирования.

При сопоставлении программно-адаптивной схемы и схемы предиктор-корректор на основе вектора состояния, используемого программно-адаптивной схемой[4], одному и тому же вектору состояния в схеме предиктор-корректор будут соответствовать разные управляющие сигналы, поскольку в основе прогноза предиктора-корректора лежит вектор состояния большей размерности, чем в программно-адаптивной схеме. На основе информации, выходящей за пределы тождественной части векторов состояния, используемых в обеих схемах, предиктор-корректор будет получать разные прогнозы, что и выразится в несовпадении управляющих сигналов, вырабатываемых в программно-адаптивных модулях обеих схем управления. То есть предиктор-корректор при адекватной прогностике «умнее» и обеспечивает более гибкое, нешаблонное управление в сопоставлении его с иными — более простыми схемами.

При условии достаточно высокой точности прогноза схема предиктор-корректор позволяет достичь наиболее высокого качества управления за счёт того, что в ряде случаев фазовый сдвиг между возмущающим воздействием и управляющим воздействием, обеспечивающим компенсацию возмущения, сводит до нуля (а при необходимости — до отрицательных величин: это — упреждающее управление).

Это позволяет употребить ресурсы замкнутой системы на повышение запаса устойчивости управления и производительности замкнутой системы в отношении вектора целей управления. При других схемах управления эти резервы не могут быть использованы или расходуются на компенсацию той составляющей отклонений от идеального режима, которая обусловлена запаздыванием управляющего воздействия по отношению к возмущающему в сопоставлении с теоретическим случаем отсутствия фазового сдвига между возмущением и управляющим воздействием.

Разновидностью схемы управления предиктор-корректор является уже упоминавшаяся ранее (при рассмотрении в разделе 6.3 полной функции управления) интеллектуальная схема управления, которая предусматривает творчество системы управления — субъекта-управленца — как минимум в следующих областях:

выявление факторов среды, вызывающих потребность в управлении;
формирование векторов целей;
формирование новых концепций управления;
совершенствование методологии и навыков прогноза при решении вопроса об устойчивости в смысле предсказуемости при постановке задачи управления и (или) в процессе управления по схеме предиктор-корректор (предуказатель-поправщик).

Как уже отмечалось в разделе 5.8, — с точки зрения теории и практики управления, — значимость информации, характеризующей процесс управления как таковой, убывает в следующем порядке:

информация о процессах, течение которых способно привести к открытию возможностей того, что течение процесса управления в будущем может отклониться от нормальных параметров;
объективно открылись (возникли, появились) возможности к тому, что течение процесса управления в будущем может отклониться от нормальных параметров;
возможности начали реализовываться и наметились тенденции к тому, что течение процесса управления отклонится от нормальных параметров;
течение процесса отклонилось от нормальных параметров, но ещё находится в пределах допустимого;
отклонение параметров процесса на грани допустимого;
процесс вышел за допустимые пределы, но катастрофа ещё не произошла;
произошла катастрофа, после которой надо восстанавливать управление (а в ряде случаев и объект), — если есть кому…

И практически нулевой управленческой значимостью обладает информация о том, что всего названного ранее нет, вследствие чего процесс управления протекает нормально.

При этом следует пояснить ещё один аспект учёта возможностей и тенденций в выработке управляющего воздействия. Открываться могут не только неблагоприятные возможности, но и возможности благоприятные, реализация которых позволяет ощутимо повысить качество управления. То же касается и учёта тенденций.

Но учёт в управлении открывшихся возможностей и наметившихся тенденций обеих категорий возможен только в схеме предиктор-корректор; программно-адаптивные схемы управления к этим объективным факторам слепы и в отношении негативных возможностей и тенденций работают по принципу «пока гром не грянет — мужик не перекрестится», а позитивные возможности и тенденции в них оказываются не реализуемыми.

———————

Приведённые в настоящем разделе определения терминов «замкнутая система», «прямые» и «обратные связи», содержат в себе некоторые умолчания, значимые в контексте ДОТУ. Вследствие наличия этих умолчаний — в контексте ДОТУ приведённые определения являются более общими, включающими в себя тот смысл, который не свойственен этим терминам в исторически сложившихся технических версиях теории управления, а сама ДОТУ приверженцам «классики» вследствие этого представляется «неправильной» — выражением невежества её разработчиков, которые якобы не знают и не понимают «классики».

Классическое определение термина «замкнутая система»:

«Замкнутая система управления, система управления, в которой управляющее воздействие формируется в функции отклонения значения управляемой величины от требуемого закона её изменения» («Большая советская энциклопедия», изд. 3, т. 9, с. 325).

Соответственно определениям такого рода, когда говорят о прямых и обратных связях в замкнутой системе, то имеют ввиду только связи с объектом управления, но не со средой. При этом под прямой связью понимают управляющее воздействие, а под обратной — введение в систему управления информации о реакции объекта управления на управляющее воздействие.

По существу в определениях термина «замкнутая система» такого рода речь идёт о том, что в замкнутых системах информация, на основе которой во всякий момент времени вырабатывается управляющее воздействие, включает в себя и информацию об управляющем воздействии, выработанном некогда в прошлом.

Иными словами, некоторые информационные потоки, проходящие через систему управления, замкнуты в кольцевом контуре их обращения, отсюда и проистекает название термина «замкнутая система».

Однако есть связки «объект + система управления», в которых обратных связей в смысле обусловленности текущего управления управлением, выработанным в прошлом, нет. Такова программная схема управления. А в схеме управления предиктор-корректор некоторые из связей, если их относить к категории «обратных» в традиционном понимании этого термина, замыкаются не через прошлое, а через прогнозируемое будущее в том смысле, что текущее управление включает в себя прогноз поведения управляемого объекта, в который входит и информация о вариантах текущего управления.

При этом в исторически сложившихся технических версиях теории управления нет термина для обозначения связки «объект + система управления» в общем случае рассмотрения. Поэтому, излагая ДОТУ, мы оказываемся перед выбором:

либо как-то называть эту связку (при этом само слово «связка» явно не подходит вследствие его употребительности в самых разных контекстах);
либо придать в контексте ДОТУ расширительное толкование терминам «прямые» и «обратные связи», «замкнутая система».

В прошлых редакциях ДОТУ (1991 г., 1992 г., 1998 г.) нашёл выражение расширительный подход, однако он не был пояснён, что у некоторой части читателей (особенно знакомых с какими-то техническими версиями теорий управления) вызывало неприятие, недоумение и вопросы.

В настоящей редакции мы сохраняем расширительный подход к толкованию упомянутых терминов, и потому в контексте ДОТУ следует принять определения прямых и обратных связей с подразделением их на внешние (уходящие в средý и приходящие из среды́) и внутренние (локализованные в пределах объекта управления и системы управления) так, как они даны выше. То же касается определений отрицательных обратных связей как сдерживающих, и положительных как поощряющих.

Также мы придерживаемся расширительного подхода к толкованию термина «вектор целей управления» по отношению к случаям, когда вектор целей может изменяться в процессе управления, будучи функцией времени либо функцией матрицы возможностей течения процесса управления и субъективно избранной алгоритмики управления процессом (вектор целей, изменяющийся таким образом, иногда называют «деревом целей»).

[1] Нами используются термины типа «схема управления», а не типа «принцип управления», употребительные в технических вариациях теории управления, потому, что подразумевается схема архитектуры структуры, осуществляющей процесс управления, т.е. схема каналов информационного обмена элементов структуры друг с другом и внешней средой. А одни и те же «принципы управления» могут быть реализованы на основе различных схем управления.

[2] Хотя в толпо-«элитарном» обществе политики редко не представляют собой роботов — биороботов.

[3] Термин «предиктор-корректор» — название одного из методов вычислительной математики. В нём последовательными приближениями находится решение задачи. При этом алгоритм метода представляет собой цикл, в котором в последовательности друг за другом выполняются две операции: первая — прогноз решения и вторая — проверка прогноза на удовлетворение требованиям к точности решения задачи. Алгоритм завершается в случае, когда прогноз удовлетворяет требованиям к точности решения задачи.

[4] Предиктор-корректор может использовать в прогностике более широкий набор параметров, включающий и те параметры, которые не используются программно-адаптивной схемой для выработки управляющего воздействия.