Дипломная работа: Автоматизация и ускорение нахождения оптимальных параметров модели SIR+A и проведение сравнительного анализа Интенсивности заражения

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

Модель SIRS

Данная модель подразумевает потерю иммунитета через некоторый промежуток времени. Дифференциальные уравнения принимают такой вид:

где g -- средняя скорость утраты иммунитета.

Модель SEIS

Модель SEIS отличается от модели SIS тем, что в SEIS вводится дополнительная медико-социальная группа людей: заболевшие индивиды, болезнь которых находится в скрытом состоянии. Излечившиеся при этом снова становятся восприимчивы к вирусу.

Система имеет вид:

где Z - средний уровень рождаемости, - период инкубации.

Модель SEIR

Модификацией вышеупомянутой модели является модель, где к инфицированным в скрытом состоянии добавляется группа людей, которые приобрели иммунитет к инфекции r(t). В этом случае уравнения выглядят так:

Разберем подробно на каких предположениях основана данная модель и ее модификации, какие ограничения она имеет:

-Модели действительны только для достаточно больших популяций,

-Необходимо однородное смешивание популяций,

-Все индивиды должны считаться однотипными,

-Не учитывается случайный характер эпидемий, так как модели детерминированные.

Следует отметить, что чем больше факторов учитывается в модели, тем более точным получается анализ. Классическая SIR модель позволяет получать лишь оценки для данных показателей, иногда тот факт, что она не учитывает множество важных моментов и случайный характер явлений, может приводить к существенным ошибкам.

Тем не менее, ученые О.В. Бароян и Л.А. Рвачев [4] в 1960-1970-х годах сумели получить 80% точность прогнозов эпидемий на территории Советского Союза, используя модифицированную SIR модель, которую они разработали. Разберем ее подробнее.

Основополагающие идеи модели Барояна-Рвачева:

В основе любого инфекционного процесса лежит динамика изменений двух параметров: динамика активности патогенной популяции, то есть динамика активности вируса и динамика защитных сил организма каждого отдельно взятого человека. Для того, чтобы оценивать текущую ситуацию, необходимо как-то оценивать данные параметры, то есть ввести меру. Для патогенной популяции берется ее численность, или величина ей пропорциональная. Причем она зависит от времени - ц(t). Что касается меры защиты, вводится величина, которая фиксирует отклонение активности патогенной популяции в эталонной среде и в текущем положении - ш(t). Тогда инфекционный процесс можно описать изменением этих двух величин во времени. Их легко представить на плоскости. Тогда каждый человек и его состояние в данный момент будет как материальная частица, находящаяся на этой плоскости на координатах (ц, ш).

Рис.1 Распределение индивидов на плоскости по осям ц и ш

Соответственно изменения во времени состояния каждого отдельного человека будут выглядеть как непрерывная траектория на этой плоскости.

Если представить множество индивидов на данной плоскости, то они приблизительно равномерно заполнят данную плоскость. Если учесть изменение и движение каждой частицы, то наглядной является аналогия с движением сплошной среды, например, воды. Таким образом для достаточно большого количества людей становится возможным приводить данные аналогии и использовать математический аппарат механики сплошных сред.

Пусть дан массив людей Р в какой-то момент времени t. Разместим их по точкам плоскости (ц, ш) в зависимости от их состояния в момент t. Тогда распределение x (ц, ш, t) представляет собой численность людей, которые в момент t имели одинаковое состояние (ц, ш). Если известны значения x (ц, ш, t) для всех точек плоскости, то это означало бы знание других необходимых эпидемиологических величин.

Простейшая модель (4) эпидемического процесса для населения Р:

где t - календарное время, - индивидуальное время, прошедшее с момента заражения, - плотность в момент t распределения по здоровых людей, где уровень защиты в момент получения инфекции, - плотность в момент времени t распределения по людей, которые заразились в момент t -, и крайние левая и правая границы по области S, которая определяется как та часть плоскости ф, внутри которой люди являются инфицирующими

) -- кривые, представляющие собой соответственно нижнюю и верхнюю границы области S на плоскости (ф, ), л -- коэффициент пропорциональности, который интерпретируется как средняя частота передачи инфекции. Данная модель является локальной и применима в рамках одного города, так как принимается во внимание однородное перемешивание людей.

Но модель была адаптирована для большой территории Советского Союза. Для этого модель (4) построили для каждого города отдельно, так что для системы из n городов ввели 2n множеств (индекс i означает номер города в некоторой единой нумерации), а затем объединили эти модели в единую систему путем учета переходов между множествами различных городов. Эти переходы в случае гриппа обусловлены, очевидно, обменом населения между городами в результате функционирования транспортной сети.

Чтобы обобщить модель, в правые части внесли слагаемые, которые для каждой пары городов i, j описывают пассажирооборот за время t между этими городами лиц данного типа.

Через обозначена вероятность для лица, принадлежащего некоторому типу А, перейти за время от t до t +в некоторый другой тип В. Тогда вероятность переходов, связывающих города в единую систему, можно записать в следующем виде:

где -- интенсивность пассажирооборота между городами i и j в реальной транспортной сети; -- население города i, -- коэффициенты пропорциональности.

Тот факт, что при моделировании распространения эпидемии по территории страны авторы пренебрегают сельскими местностями, обоснован, так как:

-- основной ущерб от эпидемии гриппа заключается в ее социально-экономических последствиях, что проявляется почти всецело лишь в урбанизированных ареалах

-- по городам мы можем располагать необходимыми для дальнейшей работы и для проверки модели данными о ежедневной заболеваемости.

С учетом транспортных сетей и перемещений населения получаем для n территорий следующие модификации модели (4):

Остановимся подробнее на данной модели локального характера для дальнейшего сравнения. Эта модель в упрощенном виде запишется следующим образом: так как , то

где доля восприимчивых к болезни,начальная заболеваемость, средняя частота передачи инфекции, ) - основные параметры, характеризующие эпидемический процесс.

Для приближенных расчетов были предложены следующие формулы для локальной модели, которая сейчас представляет для нас наибольший интерес.

распределение начальной заболеваемости, p -- население местности, доля восприимчивых к болезни, средняя частота передачи инфекции.

С помощью данной модели, зная основные параметры ), можно построить оценку количества заболевших людей.

Выше были разобраны основные модели эпидемических ситуаций. Отдельного рассмотрения требует модель, на которой основана моя программная реализация.

1.2 Модель SIR+A

В основе данной модели лежит система дифференциальных уравнений SIR модели. От системы дифференциальных уравнений проделан переход к рекуррентным соотношениям и в рассмотрение добавлен фактор агрессивности внешней среды А.

где расчетная заболеваемость за текущую неделю, количество невосприимчивых к болезни на начало текущей недели, количество больных на начало текущей недели, - интенсивность заражения, µ - интенсивность выздоровления, г - скорость потери иммунитета, А - агрессивность внешней среды, r - среднее число людей, приобретающих иммунитет в течение текущей недели (включая вакцинированных), t = 1 неделе, N - население изучаемой местности, N = I+R = const.

С помощью данной модели (5) находятся оценки для количества заболевших людей для текущей недели, а также оценки для больных и невосприимчивых людей. В работе [5] приведен пример вычисления данных оценок при найденных ранее оптимальных параметрах. Но в данной работе [5] параметры вычисляются практически вручную, с помощью пакета «Поиск решения» в Excel. Программная реализация данной модели позволяет получать оценки и параметры автоматически.

Ввиду того, что моей текущей задачей является вычисление оптимальных параметров с помощью модели и реальных данных, рассмотрим некоторые другие подходы, примененные в этой сфере.

1.3 Обзор имеющихся подходов к вычислению оптимальных параметров в моделях эпидемических ситуаций

Одними из наиболее распространенных методов оценки параметров математических моделей являются метод наименьших квадратов, его различные модификации и метод нахождения оценок с помощью функции максимального правдоподобия. Данные методы часто применяются при обработке экспериментальных данных, создании и оценке экономических и социальных моделей.

Стандартным методом нахождения оценок параметров является решение оптимизационной задачи на минимум целевой функции. Этот метод позволяет решать задачу подбора параметров функции для приближённого описания зависимости величины результативного признака от величины факторных признаков, оказывающих влияние на результативный признак. В качестве целевой функции выступает сумма квадратов отклонений расчетных значений заболеваемости от ее фактических значений или иная ее модификация. Осуществляется перебор значений параметров из допустимых диапазонов. Таким образом, оптимальными могут считаться те параметры, при которых достигается минимум целевой функции.

Такой метод применялся в работе, посвященной анализу и математическому моделированию распространения ВИЧ-инфекции [6] для вычисления параметров усложненной SIR модели. Вид целевой функции может быть несколько иным, и представлять собой уравнение для коэффициента передачи инфекции. Подобная оптимизационная задача решается и в работе Мельниченко О.А. и Романюхи А.А., в которой разбирается модель эпидемии туберкулёза и оценка параметров данной модели [7]. Они составляют функционал, который необходимо минимизировать и задают интервал, в котором меняется основной параметр - коэффициент трансмиссии. Решая данную задачу минимизации, они находят оптимальные параметры для каждого из регионов России по эпидемической ситуации туберкулеза.

Иной подход к нахождению параметров SIR модели использовался в работе [8] A. S. Talawar и U. R. Aundhakar, где нахождение параметров SIR модели осуществляется с помощью предположений об апостериорных распределениях параметров, найденных с помощью функции максимального правдоподобия и байесовского анализа с методом Монте-Карло по схеме Марковской цепи (MCMC).

Данные распространенные подходы отличаются по сложности своей реализации, метод наименьших квадратов, как правило, проще реализуем, чем метод Монте-Карло. Но во втором случае использовалась стохастическая SIR модель, что делало оценки более приближенными к реальным данным. Алгоритмы байесовского подхода к тому же сопровождаются большим объемом вычисления и подсчет оценки может занимать от нескольких часов до нескольких дней на современной технике.

Исходя из имеющихся моделей распространения инфекций и существующих методов нахождения оптимальных параметров, можно оценить тот метод, который использовался в данной работе. Разберем подробно в чем состоит моя задача в рамках этого исследования.

1.4 Постановка задачи

Пусть имеется модель SIR+A [5; 9], предложенная Гришуниной Ю.Б. и Контаровым Н.А., описанная выше.

Если известны все параметры модели, такие как л, µ, г, А и r для каждого временного интервала, могут быть получены соответствующие оценки для - количества заболевших в начале недели t. А имеющиеся оценки позволят прогнозировать поведение эпидемии и проводить сравнительный анализ. Рассмотрим подробнее подбор параметров. Все параметры модели SIR+A можно условно поделить на две группы.

Таблица 1.

Деление параметров модели SIR+A

Постоянные

Вариативные

- интенсивность заражения

µ - интенсивность выздоровления

г - скорость потери иммунитета

А - агрессивность внешней среды

r - среднее число людей, приобретающих иммунитет

- интенсивность заражения, параметр, показывающий среднее число людей, которых может заразить один больной в течение одной недели. Этот параметр в первую очередь определяется частотой контактов, а также силой и свойствами возбудителя инфекции. То есть, если контагиозность близка к 100%, то приближённо равняется среднему числу контактов больного человека со здоровыми людьми в единицу времени. Под контактом в данном случае понимается время, достаточное для передачи инфекции. Таким образом, может считаться постоянным параметром, характеризующим местность и уровень жизни в регионе, так как частота контактов зависит от плотности населения, от транспорта и от прочих социально-экономических факторов. Данный параметр не может быть взять из справочников, так как его вычисляли только для больших территорий и данный параметр желательно вычислять с периодичностью в несколько лет. В идеальном случае данный показатель должен вычисляться на основе статистических данных для небольших территорий, округов или районов и пересчитываться через определенный промежуток времени.