Текст книги "Достаточно Общая Теория Управления"
Автор книги: (ВП СССР) Внутренний Предиктор СССР
Жанры:
Политика
,сообщить о нарушении
Текущая страница: 12 (всего у книги 27 страниц)
· формирование соборного интеллекта в блоке с поглощением конгломерата в блок до завершения концентрации управления по конгломератно-межрегиональному способу;
· обучение соборного интеллекта блока добру на примере агрессии конгломерата.
В целом же в ходе освоения потенциала развития суперсистемы протекает процесс вытеснения примитивных схем управления более развитыми, обеспечивающими более высокое качество управления в смысле высвобождения ресурсов. При этом структурное и бесструктурное управление становятся неразличимыми.
Ранее было показано, что текущие элементные запасы устойчивости суперсистемы, а следовательно и её производительность, тем выше, чем меньше информационное состояние памяти элементов в процессе их функционирования отличается от опыта памяти суперсистемы в целом, накопленного за всё время её пребывания в среде. К этому можно добавить: и чем быстрее доступны каждому из элементов в процессе его деятельности свободные интеллектуальные ресурсы суперсистемы. Это предполагает высокое быстродействие и пропускную способность каналов информационного обмена между элементами по отношению ко времени, необходимому для обслуживания элементами частной цели, стоящей перед каждым их них.
Пользование внешней информацией, выходящей за пределы возможностей собственного информационного обеспечения элемента, должно вероятностно предопределять более высокое качество его деятельности, чем игнорирование её. Именно по этой причине замусоривание информационной среды суперсистемы ложной информацией соответствует разрушению целостного управления суперсистемой и является средством концентрации управления методом разрушения с последующим поглощением обломков. Распространение ложной информации, однако, позволяет иногда быстро устранять некие текущие ошибки управления, но дальнейшее развитие процесса сопровождается возникновением ошибок управления, вызванных именно этой ложной информацией, которая никуда из суперсистемы не исчезает и на каком-то этапе становится основой ошибочного управления при извлечении ложной информации из памяти.
Именно по этой причине в обществе нет разницы между ложью из своекорыстия и “благодетельной” ложью “во спасение”, хотя общество этого и не понимает и лжёт безбожно. Кроме того, “благодетельная” бескорыстная ложь одного “во спасение” может оказаться “водой” на мельницу чьего-то своекорыстия.
Поэтому, когда заведомо ложная информация распространяется в суперсистеме, то процесс освоения её потенциала сдерживается ею, становление соборного интеллекта тормозится, качество управления падает. И это приводит к вопросу об устойчивости управления в условиях, когда в замкнутую систему возможно поступление недостоверной информации, а также когда недостоверная информация действительно попадает в систему.
Всё разнообразие процессов управления можно соотнести с тремя типами алгоритмов выработки поведения замкнутой системы.
Во всех ниже рассматриваемых случаях речь идёт об управлении по полной функции в ранее определённом смысле этого термина.
ПЕРВЫЙ тип алгоритмов выработки управляющего решения (поведения) показан на рис. 1
Входной поток информации (внешние и внутренние обратные связи) поступает в преобразователь, где на основе сиюминутно текущей информации вырабатывается текущее управленческое решение, которое передаётся к исполнительным органам.
Возможны такие варианты сочетания входного потока информации и характеристик преобразователя информации, вырабатывающего управленческое решение, в результате которых «самоуправляющаяся» таким образом система в действительности оказывается управляемой извне, если кто-то подает на её вход соответствующий поток информации, предвидя реакцию преобразователя на каждый из её вариантов.
Но даже если такого управления извне и нет, то, непрестанно реагируя на сиюминутность и подчиняя текущей сиюминутности почти все свои ресурсы, система оказывается не в состоянии устойчиво ориентироваться на долгосрочную перспективу и, как следствие, – работать на её осуществление.
Для того чтобы устойчиво ориентироваться на длительную перспективу и устойчиво работать на её достижение, эту определённую перспективу необходимо помнить в каждый миг обработки сиюминутно поступающей информации в процессе выработки и осуществления управленческого решения.
Если это достигнуто, то управление протекает по алгоритмам второго и третьего типов.
ВТОРОЙ тип алгоритмов управления показан на рис. 2.
Входной поток информации, попадая в систему, прежде всего загружается в её память. Преобразователь информации, вырабатывающий управленческое решение, осуществляет выборку информации из памяти, соотнося накопленную памятью информацию с непрерывно поступающей информацией. Управленческое решение вырабатывается по существу на основе всей информации памяти, вследствие чего система сохраняет в управлении устойчивую ориентацию на цели долгосрочной перспективы. Она оказывается способной их достичь потому, что не теряет долгосрочных целей в процессе выработки и осуществления управленческих решений в потоке текущей информации. Отфильтровывая на основе информации памяти дестабилизирующую стратегическое управление высокочастотную составляющую всевозможной «суеты», подчиняясь которой в алгоритмах первого типа, система теряет цели долгосрочной перспективы и уклоняется от них в процессе управления, управляясь в русле алгоритмов третьего типа, система сохраняет устойчивость работы.
Тем не менее, при непосредственной загрузке в память поступающей текущей информации возможны поражения содержимого памяти и её структурной организации, аналогичные по своему характеру поражениям компьютерными вирусами файловой системы жёсткого диска и информации файлов, в ней хранящихся. Они могут затрагивать как базы данных, так и алгоритмы, на основе которых преобразователь информации вырабатывает управленческое решение.
Иными словами, необходима защита памяти, – из которой преобразователь черпает необходимую информацию в процессе выработки управленческого решения. Это приводит к алгоритму третьего типа.
ТРЕТИЙ тип алгоритмов управления показан на рис. 3.
В нём всё происходит, как и во втором типе, но перед загрузкой в память входного потока информации он пропускается через алгоритм-сторож, которые выявляет недостоверную и сомнительную информацию, в том числе и попытки прямого и косвенного (опосредованного) управления извне, для того, чтобы выработка управленческого решения исходила бы только на информации, признанной достоверной. В тех случаях, когда возникают затруднения с определением качества информации, алгоритм – сторож памяти – помещает её в специализированную область памяти, показанную на рис. 3 блоком, названным «Карантин», для последующего выяснения её достоверности. Алгоритм, показанный на рис. 3, предполагает, что блок под названием «Преобразователь информации» обладает в системе наивысшими полномочиями. Потому он может перемещать информацию из «Карантина» в область нормальной «Памяти» и изменять «Алгоритм – сторож памяти» по мере накопления системой опыта взаимодействия со средой, что требует в процессе управления переоценки содержимого памяти по категориям «достоверно», «ложно», «сомнительно», «не определённо».
Бросающаяся в глаза разница в поведении систем, управляющихся на основе алгоритмов первого типа и алгоритмов второго и третьего типов, состоит в том, что изменение входного информационного потока в алгоритмах первого типа вызывает немедленное (по отношению к быстродействию «Преобразователя информации») изменение управления; в алгоритмах второго и третьего типа изменение входного потока информации может вообще не вызвать никакого видимого изменения в управлении либо может вызвать изменения в управлении спустя какое-то, подчас весьма продолжительное, время. Если же в алгоритм выработки управленческого решения включается прогноз поведения системы (используется схема «предиктор-корректор»), то изменение управления может упреждать изменение потока входной информации. Однако, несмотря на такое извне видимое безразличие в поведении системы по отношению ко входному потоку информации, в алгоритмах второго и третьего типов входная информация не игнорируется. В сопоставлении их с алгоритмами первого типа в них она обрабатывается иначе: так, чтобы она была подчинённой достижению целей долгосрочной перспективы или, чтобы на её основе выявилась невозможность достижения системой ранее определённой для управления ею перспективы[55]55
Последнее требует переориентации системы на другие цели или обязывает к её ликвидации за ненадобностью.
[Закрыть].
Алгоритмы третьего типа из числа описанных обладают наивысшей помехоустойчивостью как по отношению высокочастотным шумам среды и собственным шумам системы, так и по отношению к попыткам управления системой извне, направленным на то, чтобы подчинить себе управление на основе деятельности её собственного преобразователя информации или исключить его из процесса управления.
Вынужденность перехода в управлении от алгоритма третьего типа к алгоритму первого типа под давлением обстоятельств должна рассматриваться как чрезвычайная ситуация, аварийный режим управления, в котором первоприоритетной задачей управления является выявление внутренних резервов системы и резервов внешних обстоятельств, использование которых позволяет восстановить нормальное управление по алгоритму третьего типа.
Только это позволяет реализовать запас устойчивости системы, поддерживая в течение некоторого времени управление по алгоритмам первого типа. При принципиальном отказе перейти от алгоритмов управления первого типа к алгоритмам управления третьего типа, запас устойчивости системы необратимо исчерпывается. По существу такая стратегия управления является гарантированным переносом необратимой катастрофы в будущее. Эта стратегия достаточно часто находит своё выражение в общеизвестной фразе: «Некогда тут думать и обсуждать? – работать надо: сами видите, какие обстоятельства сложились». Но приверженность этой стратегии приводит к тому, что катастрофа неизбежно наступает, если обстоятельства не изменяются сами собой. Этого, как известно, не бывает, поскольку обстоятельства изменяются под воздействием того или иного управления.
Когда заведомо недостоверная информация в суперсистеме отсутствует либо в ней господствуют алгоритмы управления третьего типа, эффективность которых достаточна, то (в случае освоения потенциала быстродействия и пропускной способности каналов информационного обмена) все структуры в иерархической лестнице – от элемента до суперсистемы – становятся субъективно неустойчивыми. Субъективная неустойчивость понимается в том смысле, что, если структура, несущая какую-то информацию и алгоритмику, сталкивается с непомерным для неё давлением среды, то исходя из повышения качества управления суперсистемой в целом, может оказаться выгоднее перераспределить информационно-алгоритмическую нагрузку элементов суперсистемы. Это под силу только для соборного интеллекта, мощного внешнего управления и иерархически Наивысшего управления.
Поскольку неопределённое внешнее управление может быть и агрессивным по отношению к суперсистеме и её элементам, то вопрос о различении источников внешних информационных потоков в процессе самоуправления суперсистемы – вопрос № 1 всегда.
13.8. Взаимно вложенные суперсистемы с виртуальной структурой
Когда суперсистема выходит в режим устойчивого самоуправления ею со стороны соборного интеллекта, различающего иерархически Наивысшее управление от внешних информационных вторжений и обеспечивающего эту способность и на уровне организации составляющих его интеллектов, она осваивает потенциал развития в кратчайшее время. Изнутри суперсистемы это состояние воспринимается как отсутствие конфликтов самоуправления элементов суперсистемы и их объединений и максимальный уровень защищенности от давления среды, через которую протекает иерархически высшее объемлющее управление.
Общность в процессе самоуправления элементов информационно-алгоритмической и интеллектуальной базы[56]56
Подразумевается возможность порождения соборного интеллекта.
[Закрыть] суперсистемы, в сочетании с господством интеллектуальных схем управления предиктор-корректор на уровне суперсистемы в целом и вложенных в неё иерархических уровнях, делают несущественной мгновенную её структурно-иерархическую упорядоченность, стирают различие между структурным и бесструктурным управлением и процесс видится как взаимная вложенность гибких (виртуальных) структур в общесуперсистемной схеме предиктор-корректор соборного интеллекта.
Повторное обращение к вероятностной памяти с одним и тем же вопросом на этом этапе будет давать в одинаковой обстановке всё меньше разбросов ответов. Но это будет не шаблонность автомата, соответствующего уровню фундаментальной части информационного обеспечения, а оптимальное в некотором смысле решение в данных условиях при данном уровне развития суперсистемы. И то, что воспринимается как “шаблонность решений”, может быть целевым отказом от решений, уступающих оптимальному в данных условиях внешней обстановки и при достигнутом внутреннем уровне развития.
По завершении освоения потенциала развития суперсистема может служить одной из основ для следующего шага эволюции.
После введения понятия взаимная вложенность суперсистем изложение достаточно общей теории управления вряд ли может быть чем-либо иным, кроме как своего рода «описанием устройства и принципов работы оргáна». Для того, чтобы быть органистом, знать устройство данного инструмента необходимо, но нужна ещё техника игры, репертуар, вкус, в основе чего лежит потенциал развития музыканта, чей организм в свою очередь является взаимным вложением суперсистем, построенных на клетках, физических полях, информационных и энергетических потоках. Если же не знать «устройства оргáна» и не играть на нём, то кто-то на “рояле в кустах” будет играть препротивные “пьесы”, от которых некуда будет деться.
Это означает, что необходимо не только воспринимать поток событий жизни своими чувствами и вниманием, но и выработать систему образно-логических представлений о процессах управления как таковых. Мы живём в такое время, когда это проще всего сделать на основе инструмента, получившего название «метод динамического программирования».
14. Метод динамического программирования как алгоритмическое выражение достаточно общей теории управления
В изложении существа метода динамического программирования мы опираемся на книгу “Курс теории автоматического управления” (автор Палю де Ла Барьер: французское издание 1966 г., русское издание – “Машиностроение”, 1973 г.), хотя и не повторяем его изложения. Отдельные положения взяты из курса “Исследование операций” Ю.П.Зайченко (Киев, “Вища школа”, 1979 г.).
Метод динамического программирования работоспособен, если формальная интерпретация реальной задачи позволяет выполнить следующие условия:
1. Рассматриваемая задача может быть представлена как N‑шаговый процесс, описываемый соотношением:
Xn + 1 = f(Xn, Un, n), где n – номер одного из множества возможных состояний системы, в которое она переходит по завершенииn-ного шага;Xn – вектор состояния системы, принадлежащий упомянутому n-ному множеству; Un – управление, выработанное на шаге n (шаговое управление), переводящее систему из возможного её состояния вn-ном множестве в одно из состояний (n + 1)‑го множества. Чтобы это представить наглядно, следует обратиться к рис. 4, о котором речь пойдет далее.
2. Структура задачи не должна изменяться при изменении расчетного количества шагов N.
3. Размерность пространства параметров, которыми описывается состояние системы, не должна изменяться в зависимости от количества шагов N.
4. Выбор управления на любом из шагов не должен отрицать выбора управления на предыдущих шагах. Иными словами, оптимальный выбор управления в любом из возможных состояний должен определяться параметрами рассматриваемого состояния, а не параметрами процесса, в ходе которого система пришла в рассматриваемое состояние.
Чисто формально, если одному состоянию соответствуют разные предыстории его возникновения, влияющие на последующий выбор оптимального управления, то метод позволяет включить описания предысторий в вектор состояния, что ведёт к увеличению размерности вектора состояния системы. После этой операции то, что до неё описывалось как одно состояние, становится множеством состояний, отличающихся одно от других компонентами вектора состояния, описывающими предысторию процесса.
5. Критерий оптимального выбора последовательности шаговых управлений Un и соответствующей траектории в пространстве формальных параметров имеет вид:
V = V0(X0, U0) + V1(X1, U1) + …+ VN – 1(XN– 1, UN – 1) + VN(XN).
Критерий V принято называть полным выигрышем, а входящие в него слагаемые – шаговыми выигрышами. В задаче требуется найти последовательность шаговых управлений Un и траекторию, которым соответствует максимальный из возможных полных выигрышей. По своему существу полный “выигрыш” V – мера качества управления процессом в целом. Шаговые выигрыши, хотя и входят в меру качества управления процессом в целом, но в общем случае не являются мерами качества управления на соответствующих им шагах, поскольку метод предназначен для оптимизации управления процессом в целом, а эффектные шаговые управления с большим шаговым выигрышем, но лежащие внеоптимальной траектории, интереса не представляют. Структура метода не запрещает при необходимости на каждом шаге употреблять критерий определения шагового выигрыша Vn, отличный от критериев, принятых на других шагах.
С индексом n – указателем-определителем множеств возможных векторов состояния – в реальных задачах может быть связан некий изменяющийся параметр, например: время, пройденный путь, уровень мощности, мера расходования некоего ресурса и т. п. То есть метод применим не только для оптимизации управления процессами, длящимися во времени, но и к задачам оптимизации многовариантного одномоментного или нечувствительного ко времени решения, если такого рода “безвременные”, “непроцессные” задачи допускают их многошаговую интерпретацию.
Теперь обратимся к рис. 4 – рис. 6, повторяющим взаимно связанные рис. 40, 41, 42 из курса теории автоматического управления П. де Ла Барьера.
На рис. 4 показаны начальное состояние системы – «0» и множества её возможных последующих состояний – «1», «2», «3», а также возможные переходы из каждого возможного состояния в другие возможные состояния. Всё это вместе похоже на карту настольной детской игры, по которой перемещаются фишки: каждому переходу-шагу соответствует свой шаговый выигрыш, а в завершающем процесс третьем множестве – каждому из состояний системы придана его оценка, помещенная в прямоугольнике. Принципиальное отличие от игры в том, что гадание о выборе пути, употребляемое в детской игре, на основе бросания костей или вращения волчка и т. п., в реальном управлении недопустимо, поскольку это – передача целесообразного управления тем силам, которые способны управлять выпадением костей, вращением волчка и т. п., т. е. тем, для кого избранный в игре «генератор случайностей» – достаточно (по отношению к их целям) управляемое устройство.
Если выбирать оптимальное управление на первом шаге, то необходимо предвидеть все его последствия на последующих шагах. Поэтому описание алгоритма метода динамического программирования часто начинают с описания выбора управления на последнем шаге, ведущем в одно из завершающих процесс состояний. При этом ссылаются на «педагогическую практику», которая свидетельствует, что аргументация при описании алгоритма от завершающего состояния к начальному состоянию легче воспринимается, поскольку опирается на как бы уже сложившиеся к началу рассматриваемого шага условия, в то время как возможные завершения процесса также определены.
В соответствии с этим на рис. 5 анализируются возможные переходы в завершающее множество состояний «3» из каждого возможного состояния в ему предшествующем множестве состояний «2», будто бы весь предшествующий путь уже пройден и осталось последним выбором оптимального шагового управления завершить весь процесс. При этом для каждого из состояний во множестве «2» определяются всеполные выигрыши как сумма = «оценка перехода» + «оценка завершающего состояния». Во множестве «2» из полученных для каждого из состояний, в нём возможных полных выигрышей, определяется и запоминается максимальный полный выигрыш и соответствующий ему переход (фрагмент траектории). Максимальный полный выигрыш для каждого из состояний во множестве «2» взят в прямоугольную рамку, а соответствующий ему переход отмечен стрелкой. Таких оптимальных переходов из одного состояния в другие, которым соответствует одно и то же значение полного выигрыша, в принципе может оказаться и несколько. В этом случае все они в методе неразличимы и эквивалентны один другому в смысле построенного критерия оптимальности выбора траектории в пространстве параметров, которыми описывается система.
После этого множество «2», предшествовавшее завершающему процесс множеству «3», можно рассматривать в качестве завершающего, поскольку известны оценки каждого из его возможных состояний (максимальные полные выигрыши) и дальнейшая оптимизация последовательности шаговых управлений и выбор оптимальной траектории могут быть проведены только на ещё не рассмотренных множествах, предшествующих множеству «2» в оптимизируемом процессе (т. е. на множествах «0» и «1»).
Таким образом, процедура, иллюстрируемая рис. 5, работоспособна на каждом алгоритмическом шаге метода при переходах из n-го в (n – 1) – е множество, начиная с завершающего N‑ного множества до начального состояния системы.
В результате последовательного попарного перебора множеств, при прохождении всего их набора, определяется оптимальная последовательность преемственных шаговых управлений, максимально возможный полный выигрыш и соответствующая им траектория. На рис. 6 утолщённой линией показана оптимальная траектория для рассматривавшегося примера.
В рассмотренном примере критерий оптимальности – сумма шаговых выигрышей. Но критерий оптимальности может быть построен и как произведение обязательно неотрицательных сомножителей.
Поскольку результат (сумма или произведение) не изменяется при изменении порядка операций со слагаемыми или сомножителями, то алгоритм работоспособен и при переборе множеств возможных состояний в порядке, обратном рассмотренному: т. е. от исходного к завершающему множеству возможных состояний.
Если множества возможных состояний упорядочены в хронологической последовательности, то это означает, что расчетная схема может быть построена как из реального настоящего в прогнозируемое определённое будущее, так и из прогнозируемого определённого будущего в реальное настоящее. Это обстоятельство говорит о двух неформальных соотношениях реальной жизни, лежащих вне алгоритма:
1. Метод динамического программирования формально алгоритмически нечувствителен к характеру причинно-следственных обусловленностей (в частности, он не различает причин и следствий). По этой причине каждая конкретная интерпретация метода в прикладных задачах должна строиться с неформальным учетом реальных обусловленностей следствий причинами.
2. Если прогностика в согласии с иерархически высшим объемлющим управлением, а частное вложенное в объемлющее управление осуществляется квалифицировано, в силу чего процесс частного управления протекает в ладу с иерархически высшим объемлющим управлением, то НЕ СУЩЕСТВУЕТ УПРАВЛЕНЧЕСКИ ЗНАЧИМОЙ РАЗНИЦЫ МЕЖДУ РЕАЛЬНЫМ НАСТОЯЩИМ И ИЗБРАННЫМ БУДУЩИМ.
Процесс целостен, по какой причине ещё не свершившееся, но уже нравственно избранное и объективно не запрещённое Свыше будущее, в свершившемся настоящем защищает тех, кто его творит на всех уровнях: начиная от защиты психики от наваждений до защиты от целенаправленной “физической” агрессии. То есть, если матрица возможных состояний (она же матрица возможных переходов) избрана в ладу с иерархически высшим объемлющим управлением, то она сама – защита и оружие, средство управления, на которое замкнуты все шесть приоритетов средств обобщённого оружия и управления.
Объективное существование матриц возможных состояний и переходов проявляется в том, что в слепоте можно “забрести” в некие матрицы перехода и прочувствовать на себе их объективные свойства. Последнее оценивается субъективно, в зависимости от отношения к этим свойствам, как полоса редкостного везения либо как нудное “возвращение на круги своя” или полоса жестокого невезения.
Но для пользования методом динамического программирования и сопутствующими его освоению неформализованными в алгоритме жизненными проявлениями матриц перехода, необходимо СОБЛЮДЕНИЕ ГЛАВНОГО из условий:
В задачах оптимизации процессов управления метод динамического программирования <реального будущего: – по умолчанию> работоспособен только, если определён вектор целей управления, т. е. должно быть избрано завершающее процесс определённое состояние.
В реальности это завершающее определённое состояние должно быть заведомо устойчивым и приемлемым процессом, объемлющим и несущим оптимизируемый методом частный процесс. Но выбор и определение определённых характеристик процесса, в который должна войти управляемая система по завершении алгоритма метода лежит вне этого метода – в области “мистики” или в области методов, развитых в нематематических по своему существу науках и ремёслах.
«Каково бы ни было состояние системы перед очередным шагом, надо выбирать управление на этом шаге так, чтобы выигрыш на данном шаге плюс оптимальный выигрыш на всех последующих шагах был максимальным», – Е.С.Вентцель, “Исследование операций. Задачи, принципы, методология.” (М., “Наука”, 1988 г., стр. 109).
Неспособность определить вектор целей управления (достижением которого должен завершиться оптимизируемый в методе процесс) и (или) неспособность выявить исходное состояние объекта управления не позволяет последовать этой рекомендации, что объективно закрывает возможности к использованию метода динамического программирования, поскольку начало и конец процесса должны быть определены в пространстве параметров, на которых построена математическая (или иная) модель метода, которая должна быть метрологически состоятельной, что является основой её соотнесения с реальностью. Причём определённость завершения оптимизируемого процесса имеет управленчески большее значение, чем ошибки и некоторые неопределённости в идентификации (выявлении) начального состояния объекта управления.
Это тем более справедливо для последовательных многовариантных шаговых переходов, если матрица возможных состояний вписывается в пословицу «Все дороги ведут в “Рим”», а которые не ведут в “Рим”, – ведут в небытие. Для такого рода процессов, если избрана устойчивая во времени цель и к ней ведут множество траекторий, то при устойчивом пошаговом управлении “расстояние” между оптимальными траекториями, идущими к одной и той же цели из различных исходных состояний, от шага к шагу сокращается, вплоть до полного совпадения оптимальных траекторий, начиная с некоторого шага. Это утверждение тем более справедливо, чем более определённо положение завершающего процесс вектора целей в пространстве параметров. По аналогии с математикой это можно назвать асимптотическим множеством траекторий: асимптотичность множества траекторий выражается в том, что «все дороги ведут в “Рим”…»
И в более общем случае, рекомендации Нового Завета и Корана утверждают возможность обретения благодати, милости Вседержителя вне зависимости от начального состояния (греховности человека) в тот момент, когда он очнулся и увидел свои дела такими, каковы они есть.
Другое замечание относится уже к практике – к вхождению в матрицу перехода. Если начальное состояние системы определено с погрешностью, большей чем допустимая для вхождения в матрицу перехода из реального начального состояния в избранное конечное, то управление на основе самого по себе безошибочного алгоритма метода динамического программирования приведет к совсем иным результатам, а не расчетному оптимальному состоянию системы. Грубо говоря, не следует принимать за выход из помещения на высоком этаже открытое в нём окно.
То есть методдинамического программирования, необходимостью как определённости в выборе конечного состояния-процесса, так и выявления истинного начального состояния, сам собой защищён от применения его для наукообразной имитации оптимизации управления при отсутствии такового. Это отличает метод динамического программирования, в частности от аппарата линейного программирования[57]57
О линейном программировании см. специальную литературу.
[Закрыть], в который можно сгрузить экспромтные оценки “экспертами” весовых коэффициентов в критериях оптимизации Min (Z) либоMax (Z).
***
Эта сама собой защищённость от недобросовестного использования косвенно отражена и в литературе современной экономической науки: поскольку она не определилась с тем, что является вектором целей управления по отношению к экономике государства, то не встречаются и публикации об использовании аппарата динамического программирования для оптимизации управления макроэкономическими системами регионов и государств в целом на исторически длительных интервалах времени.
Примерами тому “Математическая экономика на персональном компьютере” под ред. М.Кубонива[58]58
Перевод с японского, Москва, «Финансы и статистика», 1991 г. на основе японского издания 1984 г. – ликбез-справочник.
[Закрыть], в которой глава об управлении в экономике содержит исключительно макроэкономические интерпретации аппарата линейного программирования (прямо так и названа “Управление в экономике. Линейное программирование и его применение”), но ничего не говорит о векторе целей управления и средствах управления; в ранее цитированном учебнике Ю.П.Зайченко описание метода динамического программирования также построено на задачах иного характера.
Однако при мотивации отказа от макроэкономических интерпретаций метода динамического программирования авторы обычно ссылаются на так называемое в вычислительной математике «проклятие размерности», которое выражается в том, что рост размерности пространства параметров задачи N вызывает рост объема вычислений, пропорциональный N k, где показатель степени k > 1. Такой нелинейный сверхпропорциональный рост объема вычислений действительно делает многие вычислительные работоспособные процедуры никчемными в решении практических задач как из-за больших затрат машинного времени компьютеров, так и из-за накопления ошибок в приближённых вычислениях. Но это «проклятие размерности» относится не только к методу динамического программирования, но и к другим методам, которые, однако, встречаются и в их макроэкономических интерпретациях.