Оглавление
Введение.
1. Обзор проблематики и постановка задач.
1.1 Актуальность и основные модели распространения инфекций.
1.2 Модель SIR+A
1.3 Обзор имеющихся подходов к вычислению оптимальных параметров в моделях эпидемических ситуаций
1.4 Постановка задачи
1.5 Выбор методов решения
2. Описание решений
2.1 Возможности программы для решения задач
2.2 Детализация функционала программ
2.2.1 Этап работы с Excel
2.2.2 Этап вывода данных реальной заболеваемости
2.2.3 Модель и основной алгоритм
2.2.4 Вывод графиков и результатов по поликлиникам
2.2.5 Группировка данных заболеваемости по округам Москвы
2.2.6 Реализация поиска пяти параметров «л, I, R, µ, г»
3. Результаты и применение
Заключение.
Список используемой литературы
Приложение
Приложение 1.Образец Excel таблицы
Приложение 2. Пример графика данных реальной заболеваемости
Приложение 3. Код рекуррентных соотношений
Приложение 4. Пример работы программы для одной поликлиники
Приложение 5. Фрагмент автоматически полученной таблицы в Excel
Приложение 6. Коэффициенты корреляции и сравнительный график
Приложение 7. Сводная таблица и сравнительный график для округов Москвы по 2016 году
Приложение 8. Результат работы программы по пяти параметрам для Москвы
Приложение 9. Свидетельство о государственной регистрации программы
Введение
Научно-техническая проблема, которая ставится в данной работе, заключается в получении оценки параметров модели эпидемической ситуации. Существует большое разнообразие моделей, которые могут описывать распространение инфекций, а также используются различные методы нахождения оптимальных параметров. Основными математическими инструментами в области эпидемиологии являются SIR-подобные модели, в каждой из которых добавляются новые факторы или изменяется точность оценок модели. Что же касается нахождения параметров модели с использованием данных реальной статистики, то распространенным является метод наименьших квадратов отклонений реальных данных от данных модели. Таковы классические подходы к прогнозированию и оцениванию эпидемических ситуаций.
С развитием вычислительной техники, модели распространения инфекций стали усложняться и уточняться благодаря возможности обработки большого объема данных. Повысилась точность и надежность прогнозов. Данные, полученные с помощью моделирования, могли служить основанием для изменения мер по защите населения от эпидемий различных заболеваний, а также для определения стратегий финансового обеспечения сферы здравоохранения. В настоящее время эпидемические модели применяются для прогнозирования различных заболеваний, таких как туберкулез, ОРВИ и грипп, ВИЧ, гепатит В и других.
Математические модели эпидемических ситуаций основаны на теории дифференциальных уравнений. Все модели можно поделить на стохастические и детерминированные. Дифференциальные уравнения отражают динамику изменения численности подгрупп населения, на которые оно условно делится при рассмотрении каждого конкретного заболевания. Имеются работы, расчеты в которых применяется аналитический подход, но также имеются исследования с использованием средств программирования. Данная работа опирается на математическую модель эпидемической ситуации SIR+A, в исходном исследовании которой оценки были найдены с помощью возможностей Excel, что являлось лишь отчасти автоматизированным и нахождение параметров было затруднительным. Конкретно в данной работе основную часть занимает подбор оптимальных параметров модели SIR+A, которые могли бы адекватно отразить реальную ситуацию заболеваемости ОРВИ и гриппом в городе Москве. При помощи статистических методов и математического моделирования произведен расчет параметров эпидемической ситуации для разных районных территорий и округов города Москвы.
Действительно, применение и анализ различных моделей заболеваемости и распространения болезней в мегаполисе имеет колоссальное значение, ведь при большой плотности населения и заболевания могут переходить в масштабные эпидемии. Важно построить оптимальную модель и научиться предсказывать динамику изменения заболеваемости при вариации тех или иных факторов.
Цель данной работы: автоматизация и ускорение нахождения оптимальных параметров модели SIR+A и проведение сравнительного анализа «Интенсивности заражения» в период фоновой заболеваемости по районным территориям и округам Москвы.
Следующие задачи должны быть решены: во-первых, выбрать оптимальные средства программирования с учетом особенностей задачи. Во-вторых, осуществить интегрированную работу исходных данных (в форме таблиц Excel) и средств языка программирования, а также переложить математические формулы и алгоритмы на язык программирования. В-третьих, реализовать визуализацию данных и свести все результаты в наглядные для сравнения таблицы. В-четвертых, обработать результаты и сделать выводы о статистике, о целесообразности применения модели, о заболеваемости в конкретных поликлиниках и округах.
Новизна данной работы в том, что теперь для прогнозирования эпидемий будут найдены параметры, дающие лучшее приближение эпидемической ситуации в конкретной местности. С помощью найденных параметров, может осуществляться корректное прогнозирование эпидемической ситуации, отражающей реальную заболеваемость в каждой конкретной местности. Данная модель и алгоритм поиска будут полностью автоматизированы с помощью языка программирования Python, что позволит обработать 57 таблиц со статистическими данными быстро и эффективно, получить наглядные результаты.
Планируемые результаты исследования заключаются в получении кода программ, которые будут реализовывать вывод визуализаций реальных данных, алгоритм нахождения оптимальных параметров, заполнение таблиц с найденными параметрами, сравнительные и результирующие иллюстрации данных заболеваемости и оптимальных параметров. Также планируется провести сравнение между 2016 и 2017 годами и подсчитать коэффициенты корреляции для различных комбинаций параметров; сформулировать основные тенденции и составить руководство по использованию данной программы; составить методическое руководство для внедрения данного исследования в образовательный процесс; зарегистрировать данную программу в Реестре программ для ЭВМ.
В первой главе данной работы определяется актуальность данного исследования, описываются основные имеющиеся эпидемические модели, рассматриваются подходы к нахождению параметров, ставится задача и обосновываются средства для решения задач.
Во второй главе конкретизируются этапы решения технической задачи, приводятся примеры и описание способов решения.
В третьей главе приведены основные результаты и сравнительный анализ.
1. Обзор проблематики и постановка задач
1.1 Актуальность и основные модели распространения инфекций
Развитие науки и компьютерных технологий способствовало внедрению математического моделирования в различные прикладные науки и сферы деятельности. Выяснилось, что распространение болезней и развитие эпидемий также подчиняется математическим законам и может быть выражено через некоторые соотношения на языке математики. Возможность собирать и обрабатывать большие объемы статистической информации обеспечила более точный анализ и позволила сравнивать реальные и модельные данные. Таким образом, как только математический и технический аппарат были достаточно развиты, а именно в 20-30-ых годах ХХ века, появилось множество различных эпидемических моделей.
В современном мире многие инфекционные заболевания удалось проконтролировать, обеспечить своевременное вакцинирование и уменьшить риски массовых эпидемий, но раньше погибало колоссальное количество людей от различных заболеваний. Развитие медицины и практики вакцинации в корне изменило ситуацию, особенно когда появились прогнозы эпидемий и надлежащее количество вакцин было готово в срок, назначались грамотные профилактические меры. ОРВИ и Грипп не являлись причиной массового вымирания населения, тем не менее государства несли огромные экономические убытки от неработающего в данные периоды большого количества людей. Однако следует отметить, что текущая ситуация во всем мире такова, что наблюдается повсеместная миграция людей, вирусы могут перемещаться с континента на континент быстро и беспрепятственно. Глобализация и перемещение населения развивающихся стран с плохими санитарно-гигиеническими условиями приводит к распространению серьезных болезней. Более того, с развитием генной инженерии начали появляться новые модифицированные вирусы. Данная проблема в настоящее время является актуальной, по сей день важно уметь моделировать эпидемические процессы и прогнозировать исходы.
В целом, все модели отражают процесс инфицирования и изменения состояний людей с течением времени. Модели распространения заболеваний различаются по срокам наблюдений и прогнозов, по охвату рассматриваемой местности и по целям исследований. Рассмотрим данные типы моделей подробнее.
Эпидемиологический прогноз может выполняться для различных сроков и целей. Краткосрочным считается прогноз на несколько недель вперед и бывает полезен для оперативного вмешательства и определения вспышек заболеваний. Среднесрочный прогноз от 2 до 6 месяцев часто на практике оказывается наиболее полезным. Его точность позволяет использовать данный прогноз, времени оказывается достаточно для проведения подготовительных и превентивных мероприятий. Долгосрочные прогнозы могут проигрывать в точности, но для оценки количества вакцин и оснащения поликлиник он полезен и зачастую необходим. Подробнее различные типы прогнозов описаны в работе Кондратьева М. А. [1].
Все имеющиеся модели условно можно поделить также по принципу охвата местности, для которой проводится исследование. Модели бывают локального характера и модели, охватывающие целые государства. Последние учитывают миграцию и перемещение людей из города в город рамках одного государства. Примером модели, учитывающей миграции, является модель Барояна-Рвачева [2].
Цели, ради которых строятся модели, очень разнообразны, например:
-- получение прогноза,
-- добыча информации о количестве вакцин,
-- решение о принятии мер в области здравоохранения,
-- оценка параметров модели с учетом реальных данных для уточнения прогнозов.
Все основные модели, которые будут разобраны в данном обзоре, можно применить для ОРВИ и гриппа. Грипп и ОРВИ занимают ведущее место среди инфекционных болезней человечества и, несмотря на все проводимые противоэпидемические мероприятия, заболеваемость ими не имеет тенденции к снижению как в России, так и за рубежом. Поэтому многие из моделей были предложены специально для анализа распространения гриппа. С другой стороны, техники прогнозирования гриппа подходят непосредственно или могут быть легко применены для других инфекций, передающихся воздушно-капельным и контактно-бытовым путем.
Моделирование эпидемиологических и социальных процессов отличается от естественно-научных моделей. Для того чтобы построить адекватную модель, необходимо понимать, что изначальные данные могли быть неточными, и учитывать этот фактор. Отсутствие четкого математического описания переменных и параметров также может внести свои коррективы в создание модели и повлиять на ее точность. Важно принимать во внимание, что имеется вероятность отклонения статистических и реальных значений, ошибок, полученных в результате сбора статистики.
Рассмотрим основные модели распространения инфекций.
SIR Модель.
Классической SIR-модель (Susceptible-Infected-Removed) была предложена У. Кермаком и А. Маккендриком в 1927 г.[3]. Модель эпидемии описывается с помощью системы дифференциальных уравнений. Популяция делится на три группы: восприимчивые ??(??), инфицированные ??(??), невосприимчивые ??(??):
-- ??(??) обозначает неинфицированных людей или предрасположенных к заболеванию,
-- ??(??) обозначает инфицированных людей (больных), способных распространить заболевание,
-- ??(??) обозначает выздоровевших, либо умерших людей.
??+ ?? + ?? = ???????????????? = ??.
SIR-модель может быть выражена следующим:
где л - коэффициент, показывающий скорость контакта, учитывающий вероятность получения болезни в случае контакта восприимчивого с больным; ?? = 1/V, где V - время болезни, скорость выздоровления. Начальные условия в момент времени ?? = 0: ??(0) ? 0, ??(0) ? 0, ??(0) ? 0.
Правая часть уравнения (1.1) описывает уменьшение популяции восприимчивых людей за счет заражения больными людьми восприимчивых. Первое слагаемое правой части уравнения (1.2) описывает увеличение популяции инфицированных людей за счет заражения восприимчивых; второе слагаемое описывает уменьшение популяции инфицированных людей за счет выздоровления или смерти. Правая часть уравнения (1.3) показывает увеличение количества невосприимчивых людей за счет выздоровления или смерти инфицированных. Стоит отметить, что правые части уравнений (1.1), (1.2), (1.3) в сумме дают ноль, важное свойство данной модели.
На данный момент существует огромное количество усложненных и видоизмененных SIR-моделей, в которых добавляются в рассмотрение новые факторы. Рассмотрим примеры таких моделей.
SIR модель с рождаемостью и смертностью.
Для некоторых заболеваний оказывается важным учитывать приток в популяцию новых индивидов, восприимчивых к инфекции. Для этого добавляют в рассмотрение рождаемость и смертность. Пусть темпы одинаковы и описываются коэффициентом м. Уравнения SIR модели будут выглядеть так:
Пусть 1/?? - средняя продолжительность жизни. Модель представима набором следующих дифференциальных уравнений:
C начальными условиями в момент времени ?? = 0: ??(0) ? 0, ??(0) ? 0, ??(0) ? 0.
Модель SIS с учетом рождаемости и смертности
Модель SIS можно получить из модели SIR если допустить, что излечившиеся вновь могут заразиться. Это особенно актуально для ОРВИ с большим разнообразием типов вирусов.
Без уравнения, описывающего прирост выздоровевшей части населения, получаем систему: