EcoSimulation — 02. Предназначение и структура модели

Д.А. Шабанов
Конспект курса
"
Имитационное моделирование сложных биосистем
(с использованием Microsoft Excel)
"

Основные понятия Предназначение и структура модели Экспоненциальный рост
Имитационное моделирование биосистем-01  Имитационное моделирование биосистем-02 Имитационное моделирование биосистем-03

 

Какую пользу биолог может получить от использования модели?

В самом широком смысле, познание чего бы то ни было тоже является моделированием. Моделирование вообще является одной из главных функций нашего мозга. Мы не только реагируем на поток стимулов, поступающих из среды, но строим в нашей психике модель действительности, которую используем для приспособления к ней. Если эта модель оказывается хорошей, мы благодаря ней можем предсказать действительный ход событий (тот самый, который влияет на нашу приспособленность). Моделями являются, к примеру, физические формулы и физические законы. Помимо потока информации, который обеспечивают наши органы чувств, и обработки этого потока путем построения на его основе моделей, никаких других способов взаимодействия со средой не существует в принципе! Исходя из этого, все, чем мы занимаемся, может быть представлено как создание и усовершенствование моделей. Тем не менее, для нас важно установить, какую пользу биолог (и эколог в том числе) может получить от использования моделей.

Большинство биологов видит пользу от моделирования в возможности прогноза динамики системы-оригинала. Однако прогнозированием польза от имитационного моделирования не исчерпывается. Здесь будет рассмотрено еще два механизма, которые могут сделать имитационное моделирование полезным для биолога. Работа обоих этих механизмов  проверена на собственном опыте автором этого пособия.

 

Прогнозирование

Использование моделей для прогнозирования — самый распространенный и легче всего воспринимаемый непрофессионалами способ использования моделей. Динамика системы-оригинала регистрируется на определенной совокупности состояний (в данном контексте эту совокупность можно назвать "учителем"). Создается модель, которая обеспечивает на "учителе" ту же динамику, что и у оригинала. Это соответствие динамик может быть достигнуто самыми разными способами. В случае аналитических моделей, исследователь может надеяться на то, что он вскрыл сущность связи между входными и выходными параметрами. В случае модели на нейронной сети в типичном случае нет никакой надежды на то, что модель отражает причинно-следственные связи внутри оригинала: важно, что модель умеет предсказывать его динамику. На следующем этапе с помощью модели узнают, как будет вести себя система-оригинал за пределами набора состояний, которые юыли использованы для ее обучения.

Надо подчеркнуть: если модель используется для исследования состояний оригинала, которые принадлежат к уже изученным типам состояния оригинала, есть надежда, что модельный прогноз будет столь же (или почти столь же) хорошо соответствовать динамике модели-оригинала, как поведение модели соответствовало оригиналу на "учителе". К сожалению, часто модель пытаются использовать для прогноза динамики оригинала в состояниях, относящихся к ранее не изученным или не наблюдавшимся типам! Одним из примеров такого использования может быть модель "ядерной зимы". Изучая динамику атмосферы Земли в наблюдавшемся диапазоне режимов ее функционирования, американские и советские авторы климатических моделей пытались определить, как эта система будет себя вести в ранее не наблюдавшихся условиях. В результате двумя коллективами был получен сценарий т.н. "ядерной зимы" (проиллюстрированный в этой модели). Реалистичность этого сценария должным образом не обоснована (что не помешало ему сыграть заметную роль в мировой политике). Итак, хотя модельный прогноз доказать невозможно, он может быть использован в ходе принятия решений как один из возможных сценариев.

 

Уточнение представлений об объекте в ходе их формализации

В типичном случае биолог в своей работе использует неформализованные ("рыхлые") системы представлений об изучаемых объектах. Естественно, такая система тоже является моделью. "Рыхлость" ее проявляется, в частности, в том, что разные аспекты таких представлений могут противоречить друг другу. Чтобы построить имитационную модель, он должен формализовать свои представления, т.е. перевести их в непротиворечивый конечный набор однозначных утверждений. На этом этапе можно будет говорить о формализованной концептуальной модели. Такая модель выделяет внутри системы-оригинала ряд подсистем и формулирует предположения о характере связей этих подсистем. 

Формализация при создании концептуальной модели — непростая задача. Очевидно, что действительность сложнее и богаче любой схемы, и в ходе формализации исходных представлений отражение действительности приходится в эту схему "впихивать", "обрезая" и отбрасывая множество деталей. Любая модель всегда проще действительности! Именно потому, что формализация является результатом серьезной работы по созданию непротиворечивого (хотя бы внешне!) описания действительности, она обладает самостоятельной ценностью. В ходе формализации зачастую удается выявить противоречия внутри имевшихся представлений, упростить используемые способы описания. Типичной является ситуация, когда в ходе моделирования становится ясным, какого рода эмпирических данных недостает. В таком случае модель позволяет создать программу для направленного сбора недостающих данных.

Созданная в результате формализации концептуальная модель может быть воплощена в различных имитационных моделях (например, отличающихся по тому, на какой программной платформе они созданы). На этапе воплощения модели также может происходить конкретизация и улучшение и самой концептуальной модели, и исходной системы представлений. Обратные связи, приводящие к совершенствованию используемых моделей, условно показаны на схеме, взятой из работы М. А. Кравченко, посвященной моделированию популяционных систем зеленых лягушек (рис. 2.1).

Рис. 2.1. Работа обратных связей, способствующих уточнению моделей, в ходе имитационного моделирования (Кравченко, 2013)

Утверждение, что модель приносит пользу исследователю еще до того, как начнет работать, кажется парадоксальным, но оно подтверждается практикой использования имитационного моделирования для решения исследовательских задач.

 

Тестирование гипотез, отраженных в вариативной части модели

Как уже было указано, модель позволяет проанализировать результаты одновременного действия целого "букета" взаимовлияющих цепочек причинно-следственных связей. При решении такого класса задач наша система мышления и наша логика часто срабатывают с ошибками. В то же время даже простой алгоритм имитационной модели способен "раскрутить" то, чем мы не можем эффективно оперировать в своей голове. После того, как модель запущена, она может продемонстрировать неадекватное поведение, связанное с тем, что некоторые из использованных при ее построении предположений противоречат друг другу. В таком случае, как указано в предыдущем пункте, реализация имитационной модели позволяет откорректировать концептуальную модель или общую систему представлений об оригинале.

Способность модели проверять разные предположения, на основании которых строились ее алгоритмы, можно использовать и специально. Для этого следует разделить алгоритма модели на две части: инвариантную и вариативную. Инвариантная часть алгоритма модели реализуется в любом случае, так как отражает те особенности оригинала, которые можно считать твердо установленными. Вариативная часть алгоритма может быть представлена несколькими альтернативными вариантами, каждый из которых отражает определенную гипотезу о неизвестных аспектах функционирования системы-оригинала.

Как проявится противоречия между определенной гипотезой, отраженной в одном из вариантов вариативной части модели, и надежно установленными фактами? Не только в неадекватности работы модели. Результаты моделирования можно протестировать на соответствие имеющимся результатам наблюдений за системой-оригиналом. Вот как этот процесс был описан в работе, посвященной моделированию разнообразия ГПС (гемиклональных популяционных систем) гибридогенного комплекса зеленых лягушек (рис. 2.2).

Рис. 2.2. Тестирование гипотез, отраженных в вариативной части модели (Шабанов, 2015)

В левом верхнем углу рис. 2.2 схематически показано эмпирически наблюдаемое разнообразие ГПС. Причины такого разнообразия рассматривает система представлений, которая строится исследователем. Система представлений неформализованная; кроме установленных фактов она включает презумпции (предположения, принимаемые "по умолчанию", до того, как появятся основания заменить их на какие-то альтернативы) и гипотезы. Гипотезы и те презумпции, справедливость которых хочет проверить автор модели, включаются в вариативную часть модели. Исследование проводится с принятием разных вариативных частей модели; в каждом из этих случаев модель порождает определенное разнообразие состояний моделируемых систем. Это дает возможность сравнить результаты моделирования с эмпирическими данными.

В примере, который условно показан на схеме, вариант вариативной части модели, обозначенный А, порождает распределение состояний, отличающееся от эмпирического. Это является основанием счесть комплекс предположений, положенный в основу этого варианта, опровергнутым. Вариант В порождает разнообразие состояний, соответствующее эмпирическим данным. Считать доказанным его нельзя (справедливость модели доказать вообще невозможно), но можно заключить, что он с успехом прошел эту проверку.   

 

Структура модели

Мы указали, что работа модели может быть представлена так: W(X)=Y. Используем эти обозначения, чтобы описать структуру модели. Модель — это система, в минималистском варианте состоящая из следующих подсистем:

  • X — входные (начальные) параметры:

  • W — система преобразований:

    • расчетные величины:

    • связи — формулы и условия, по которым осуществляется вычисление расчетных величин и выходных параметров на основании входных параметров и, при необходимости, других расчетных величин:

  • Y — выходные (итоговые) параметры.

В некоторых случаях имитационные модели обладают более сложной структурой. Так, для описания упоминаемых в этом курсе моделей потребуется следующая развернутая структура:

  • I — информационное поле (с названием модели и необходимыми пояснениями);

  • X — входные (начальные) параметры:

    • значения входных параметров;

    • средства редактирования и визуализации входных параметров;

  • W — система преобразований:

    • V — вариативная часть модели: отражение в алгоритме обработки входных параметров определенных гипотез, описывающих функционирование системы-оригинала: 

      • значения вариативных параметров, используемых при вычислениях;

      • условия, описывающие определенный вариант алгоритма вычислений;

    • I — инвариантная часть модели:

      • промежуточные значения:

        • расчетные величины;

        • случайные величины, заданные генератором псевдослучайных чисел;

      • связи — формулы и условия, по которым осуществляется вычисление расчетных величин и выходных параметров на основании входных параметров, других расчетных величин, а также случайных величин;

  • Y — выходные (итоговые) параметры:

    • значения выходных параметров;

    • средства визуализации выходных параметров.

Вы можете убедиться, что развернутая структура отличается от минималистской в нескольких важных отношениях. Развернутая структура описывает стохастическую (вероятностную) модель, поскольку использует в вычислениях случайные числа. Минималистская структура описывает детерминистскую модель, в которой любому определенному набору входных параметров однозначно соответствует определенных набор выходных параметров. В развернутой структуре система преобразований разделена на две части: вариативную (V) и инвариантную (I). Наконец, развернутый вариант предусматривает более богатый набор средств редактирования и, особенно, визуализации.