Порівняльний аналіз моделей машинного навчання для прогнозування поширення коронавірусу COVID-19 в різних країнах

Н.І. Недашківська, д-р техн. наук, С.О. Лупаненко
Інститут прикладного системного аналізу
Національного технічного університету України
«Київський політехнічний інститут ім. Ігоря Сікорського»
Україна, 03056, Київ, пр-т Перемоги, 37,
тел. +38 067 899 1473; e-mail: Ця електронна адреса захищена від спам-ботів. Вам необхідно увімкнути JavaScript, щоб побачити її.;
тел. +38 098 671 0950; e-mail: Ця електронна адреса захищена від спам-ботів. Вам необхідно увімкнути JavaScript, щоб побачити її.

Èlektron. model. 2020, 42(5):51-65
https://doi.org/10.15407/emodel.42.05.051

АНОТАЦІЯ

Побудовано математичні моделі опису поширення коронавірусу COVID-19 в різних країнах. Проведено порівняльний аналіз цих моделей для США, Мексики, Росії, Бельгії та України. Початкові дані щодо кількості випадків отримано зі щоденних звітів Все­світньої організації охорони здоров’я та Центру системних наук та інженерії при Уні­верситеті Джона Хопкінса. Для моделювання поширення коронавірусу обрано два по­тужних методи машинного навчання, що прогнозують нелінійні часові ряди: опорних векторів та багатошарових нейронних мереж прямого розповсюдження. Вияв­лено переваги і недоліки цих методів, розглянуто питання регуляризації. Побудову і навчання моделей часових рядів для опису поширення коро­навірусу COVID-19 в різних країнах світу, вибір найкращої моделі, побу­дову прогнозу поширення та візуалізацію результатів виконано у реалі­зованому програмному модулі в середовищі python з використанням су­часних бібліотек scikit-learn, pandas та matplotlib. За допомогою методу решітчастого пошуку з крос-валідацією підібрано найкращі параметри нейронних мереж та опорних векторів в моделях опису поширення COVID-19 в США, Мексиці, РФ, Бельгії та Україні. На основі по­будованих моделей виконано прогнозування кількості приросту захворю­вань на COVID-19 в цих країнах.

КЛЮЧОВІ СЛОВА:

метод опорних векторів, багатошарові нейронні мережі прямого розповсюдження, регуляризація, COVID-19, прогнозування поширення епідемії.

СПИСОК ЛІТЕРАТУРИ

  1. World Health Organization. Coronavirus disease (COVID-19) outbreak situation. 2020. Режим доступу: https://www.who.int/emergencies/diseases/ novel-coronavirus-2019. (Accessed: 20.07.2020)
  2. Міністерство охорони здоров’я України. Актуально про COVID-19. Режим доступу: https://moz.gov.ua/koronavirus-2019-ncov. (Accessed: 20.07.2020)
  3. Коронавірус в Україні. Офіційний інформаційний портал Кабінету Міністрів України. Режим доступу: https://covid19.gov.ua/. (Accessed: 20.07.2020)
  4. Всесвітня організація охорони здоров’я. Coronavirus disease (COVID-2019) situation Режим доступу: https://www.who.int/emergencies/diseases/novel-coronavirus-2019/ situation-reports (Accessed: 20.07.2020)
  5. Coronavirus COVID-19 Global Cases by the Center for Systems Science and Engineering at Johns Hopkins University. Режим доступу: https://coronavirus.jhu.edu/map.html. (Accessed: 20.07.2020)
  6. Карта розповсюдження і смертності коронавірусу COVID-19 в світі. Режим досту­пу: https://www.currenttime.tv/a/covid-19-interactive-map/30484955.html (Accessed: 20.07. 2020)
  7. Fanelli D., Piazza F. Analysis and forecast of COVID-19 spreading in China, Italy and France // Chaos, Solitons & Fractals, 2020, Vol. 134. Doi: 1016/j.chaos.2020.109761.
  8. Rainisch G., Undurraga E.A., Chowell G. A dynamic modeling tool for estimating healthcare demand from the COVID19 epidemic and evaluating population-wide interventions// International Journal of Infectious Diseases, 2020, Vol. 96, pp. 376—383. Doi: 10.1016/j.ijid.2020.05.043.
  9. Sarkar K.,  Khajanchi S.,  Nieto J.J. Modeling and forecasting the COVID-19 pandemic in India// Chaos, Solitons & Fractals, 2020, Vol. 139. Doi: 10.1016/j.chaos.2020.110049.
  10. Salgotra R.,  Gandomi M.,  Gandomi A.H. Time Series Analysis and Forecast of the COVID-19 Pandemic in India using Genetic Programming // Ibid, 2020, Vol. 138. Doi: 10.1016/j.chaos.2020.109945.
  11. Chintalapudi N.,  Battineni G.,  Sagaro G.G.,  Amenta F. COVID-19 outbreak reproduction number estimations and forecasting in Marche, Italy// International Journal of Infectious Diseases, 2020, Vol. 96, pp. 327—333. Doi: 10.1016/j.ijid.2020.05.029.
  12. Singh S., Parmar K.S., Kumar J., Makkhan S.J.S. Development of new hybrid model of discrete wavelet decomposition and autoregressive integrated moving average (ARIMA) models in application to one month forecast the casualties cases of COVID-19// Chaos, Solitons & Fractals, 2020, Vol. 135. Doi: 10.1016/j.chaos.2020.109866.
  13. Chakraborty T., Ghosh I. Real-time forecasts and risk assessment of novel coronavirus (COVID-19) cases: A data-driven analysis// Ibid, 2020, Vol. 135. Doi: 10.1016/j.chaos. 109850.
  14. Yousaf M.,  Zahir S.,  Riaz M. et al. Statistical analysis of forecasting COVID-19 for upcoming month in Pakistan// Ibid, 2020, Vol. 138. Doi: 10.1016/j.chaos.2020.109926.
  15. Aviv-Sharon E.,  Aharoni A. Generalized logistic growth modeling of the COVID-19 pandemic in Asia// Infectious Disease Modelling. Available online 24 July 2020. Doi: 10.1016/j.idm.2020.07.003.
  16. Middelburg R.A.,  Rosendaal F.R. COVID-19: How to make between-country comparison // International Journal of Infectious Diseases, 2020, Vol. 96, pp. 477—481. Doi: 10.1016/j.ijid.2020.05.066.
  17. Гудфеллоу Я., Бенджио И., Курвилль А. Глубокое обучение / Пер. с англ. А.А. Слинкина. 2-е изд., испр. М.: ДМК Пресс, 2018, 652 с.
  18. Бринк Х., Ричардс Дж., Феверолф М. Машинное обучение. СПб.: Питер, 2017, 336 с.
  19. Aurelien Geron. Hands-On Machine Learning with Scikit-Learn and TensorFlow. O'Reilly Media Inc., Sebastopol, CA, 2017, 760 c.
  20. Плас Дж.В. Python для сложных задач. Наука о данных и машинное обучение. СПб.: Питер, 2018, 576 c.
  21. Scikit-Learn Documentation. Режим доступу: https://scikit-learn.org. 2020. (Accessed: 20.07.2020)
  22. Pandas Documentation. Режим доступу: https://pandas.pydata.org/docs/.(Accessed: 20.07.2020)
  23. Matplotlib Documentation. Режим доступу: https://matplotlib.org/contents.html. (Accessed: 20.07.2020)
  24.  Бідюк П.І., Романенко В.Д., Тимощук О.Л. Аналіз часових рядів. Київ: Політехніка, 2012, 360 с.

НЕДАШКІВСЬКА Надія Іванівна, д-р техн. наук, доцент кафедри ММСА Інституту прикладного системного аналізу Національного технічного університету України «Київський політехнічний інститут ім. Ігоря Сікорського», який закінчила у 2004 р. Область наукових досліджень — системи і методи підтримки прийняття рішень, бага­токритеріальний аналіз, аналіз ризиків, системний аналіз, машинне навчання, ін­те­лектуальний аналіз даних, моделювання.

ЛУПАНЕНКО Софія Олександрівна, студентка Інституту прикладного системного аналізу Національного технічного університету України «Київський політехнічний інститут ім. Ігоря Сікорського». Область наукових досліджень — машинне навчання, інтелектуальний аналіз даних, моделювання.

Повний текст: PDF