疫情什么时候才能结束?菜鸟用Python进行预测

开发 后端
什么时候能去武大看樱花?什么时候才能再去重庆吃麻辣火锅?什么时候才能再去海南冲浪?什么时候才能再去大理看风花雪月?2020年的春节显得格外漫长,一切的计划似乎都被突如其来的新冠肺炎疫情给打断了。

 什么时候能去武大看樱花?什么时候才能再去重庆吃麻辣火锅?什么时候才能再去海南冲浪?什么时候才能再去大理看风花雪月?2020年的春节显得格外漫长,一切的计划似乎都被突如其来的新冠肺炎疫情给打断了。

[[317628]]

究竟什么时候生活才能恢复正常?本文将试图用python对疫情的趋势做个预测,待疫情结束之时,一起去武汉看樱花,一起去春熙路看小姐姐可好。

1.准备工作

编程环境:anaconda下Spyder。

数据来源:整理自国家卫生健康委员会官网。

 

需要安装的依赖库有:scipy。scipy是一个用于数学、科学等领域的开源科学计算库,其建立在Numpy之上,可用于处理积分、优化、常微分方程数值解的求解、信号处理等问题。本文主要用于函数拟合。

2.算法流程

1).理论解释

如何预测新冠肺炎的累计确诊人数,目前常用的方法有基于SIR的传染病模型,以及基于Logistic方程的方法等。SIR模型实现起来相对较复杂,本文将基于一个更简单的模型——利用Logistic方程进行预测。

Logistic方程可用于描述,物种增长模型,当一个物种迁入到一个新生态系统中后,若该物种在非理想生态系统(存在天敌,食物、空间等资源紧缺等)中存在生存阻力,则物种数量大致呈现S型增长。开始产生一个缓慢的增长期,慢慢的呈现指数型爆发,后期随着环境阻力的变化,逐渐趋于稳定。

 

用函数可以表示为:

参数的含义如下:

:表示随着时间的变化,环境中物种的数量。

:表示环境中物种能达到的极限值。

:表示环境开始时期,物种的数量。

:表示增长速率,在图形中展现的就是曲线的陡峭程度,越大,物种数量越快逼近N值。

:表示时间。

2).程序实现

程序中,首先定义待拟合函数,然后获取“累计确诊”人数数据,并利用curve_fit()函数进行参数拟合,得出需要拟合的参数。最后将拟合曲线和实际确诊人数在同一图中显示,直观观测出模型效果。

 

通过将1月20日至2月8日的数据进行Logistic方程拟合,在2月9-11日三天预测数据和实际数据较为吻合。但在2月12日,官方的数据突然激增,这让我们的模型失效。

 

在重新调整训练数据,我们选择将1月20日至2月26日的数据作为训练数据,2月27-28日数据作为对照数据,可得到新的拟合曲线,预测值和实际值都相对较为吻合。

结论:

(1)利用Logistic方程进行预测的数据统计口径很关键,统计标准一致,可以让整个拟合曲线更为平滑。

(2)通过预测曲线预计累计确诊人数将在3月上旬达到最大值(预计为8万余人),之后疫情将逐渐趋于稳定。

休息了那么久,在疫情即将结束之际,也希望大家新的一年里,不要被疫情耽误,尽快进入工作。山花烂漫之时,一起去旅行。

责任编辑:华轩 来源: 菜鸟学Python
相关推荐

2020-03-09 14:45:03

技术周刊

2015-07-08 15:55:01

NSStringcopystrong

2015-02-01 09:45:46

2021-03-24 11:35:03

人工智能

2019-04-16 13:27:36

2017-05-15 09:55:07

2020-05-12 11:25:50

MySQLES数据库

2019-01-14 08:26:55

程序员团队职业

2013-01-08 15:27:12

App网页应用协作

2012-09-24 10:20:39

JavaScriptJS

2013-11-28 16:03:24

2017-06-28 15:06:51

PythonLambda函数

2022-05-19 10:27:34

机器学习人工智能

2021-08-13 11:31:23

HTTP

2021-01-30 19:59:37

性能项目开源

2012-07-26 10:27:31

PHP

2020-01-05 23:28:51

MQ消息进程

2015-03-02 14:44:48

AngularJS jQuery超越

2023-06-06 16:54:00

2011-10-18 16:41:23

编程
点赞
收藏

51CTO技术栈公众号