个人资料
正文

全美疫情的分析和估计 ---- 从峰值到拐点

(2020-04-12 08:03:11) 下一个

全美疫情的分析和估计 ---- 从峰值到拐点

十天前的四月二日曾写一篇短文 《全美疫情的分析和估计 ---- 拐点在即》(https://blog.wenxuecity.com/myblog/73449/202004/2632.html),当时新冠肺炎(Covid-19)的确诊人数节节攀升,股票市场中的三大指数经历了四次融断、二次攀升后平均下跌25%,全美大地哀鸿遍野,人们心理的阴影达到了最黑暗的时候。

图一 股票市场的反应

我们感到恐惧,看不到希望,因为我们不知前面将会发生什么,不知未来发展的趋势。如果我们知道面临灾难,知道会有死亡,并能估计到灾难的程度,估计到死亡的大致人数,那么我们就会直面灾难,而不是选择逃避。

首先我们关心疫情的拐点,所谓拐点就是单日增量达到最大,之后只有下降没有上升的那一点所对应的日期。在数学上,拐点定义在函数的一阶微分达到最大,二阶微分为零所对应的横座标的数值。在十天前的文章中预计四月十五日左右达到拐点,拐点时的当日新增人数四万左右(4.0±0.5万)。

几天前,医生朋友建议 Update 数据和分析,那么更新和更正就一并做了。先看两张最新的数据,截止日期4/11。图二,累计确诊人数(总量N)和现存病患人数(现存病患人数=累计确诊人数-康复人数-病死人数),数据来源于《一亩三分地》(https://coronavirus.1point3acres.com/ )。该网站具有适时性,除了当天的数据变化之外,几天前的数据也不时变动,增减不一。这可能是我们文化的特性,毕竟该网站流着中华文化的血脉。为了不使数据乱变,就从 Coronavirus Disease (COVID-19) Statistics and Research (https://ourworldindata.org/coronavirus) 中取确诊人数的数据。三月三日:103;三月十一日:1025;三月二十日:14250;三月二十八日:104686。在二十五天内百变千,千变万,万变十万,完成了四个数量级的跳跃,平均每天的指数增长达到32%。这样的数据使人感到除了恐惧还是恐惧,除了崩溃还是崩溃。

图二 累计确诊人数(总量N)和现存病患人数

图三表达每日新增的确诊人数(增量 DN),数据来源于《一亩三分地》和 Coronavirus Disease,后者的数据虽有一天的滞后,但不会胡乱变动。在图三中只见一波接着一波地强劲攀升,根本看不到拐点所在。峰谷起伏居然涨落近万,已经不是统计误差所能解释的了。这反应疫情多批次,多地域,多时间段的次第爆发,几十甚至几百个大小不等的波峰相互叠加。就像华盛顿、纽约、密西根三,疫情先后爆发。

图三 全美每日新增的确诊人数(增量 DN)

华盛顿州最先爆发,最先死人,但该州应对控制很好,四月四日越过它的拐点,迄今为止总的确诊人数10416人,病亡率2.6%,现趋于缓慢平复。纽约疫情似乎火如荼,但4/11的新增数据骤降,标志在四月十日越过拐点。几天前的四月八日曾写一篇短文《纽约疫情 --- 数据和估》(https://blog.wenxuecity.com/myblog/73449/202004/5159.html ),如今的发展基本在当初的预料之内。

密西根最晚爆发,曾经发展迅猛,虽然它的病死率迄今为止最高(5.6%),但它在四月五日越过了拐点。密西根的数据量大,整体的发展进程短,具有统计学上的意义。图四、图五、图六为密西根州的数据。下面以密西根为例,看看COVID-19疫情的发展进程。

图四 密西根州的累计确诊人数(总量N

图五 密西根州的每日新增病患人数(增量 DN)

图六 密西根州的每日增长率

根据密西根州的统计数据,此类流行性感冒的发展进程大概有四个段。(1)爆发前的混乱阶段(Chaos),(2)爆发阶段,(3)燃烧阶段,和(4)平复阶段。

(1)爆发前的混乱阶段(Chaos),在这期间由于人们的认识不足,测试样本偏小,检测手段不完备,试剂测出的结果真假也分辨不清,再加上无症状感染者,导致此时的数据杂乱无章,毫无可信度。但烽火狼烟已起,社会群体中的少数医护人员(如李文亮)最先得到一个信息 ---- 狼来了。如果此时应对正确,疫情可以被及时扑灭。此前的一个例子是2009年SARS 病毒在安徽泄露,感染了几个人后就被扑灭。此时的传播因子(R0)毫无意义。以密西根州为例,3月11、12、13日三天的累计确诊为2、12、23人,那么12、13两日的传播因子就分别为5和1,这个差别也太大了。既然号称因子,就应是个常数,至少变化不会太大。Chaos 的阶段大约会持续几天、十几天、以致一个月(比如加州)。

(2)爆发阶段,这期间的特性是累计确诊(N)和增长率(Growth Rate)均按指数迅猛增长,并达到增长率的峰值。密西根州的爆发阶段只用了三天(3月18、19、20),这三天的平均增长率达到106%。而全美的这个阶段用了25天,(3月3 – 3月28),时间上比密西根州拉长了八倍,平均增长率达到了32%。此阶段可以勉强谈谈传播因子 RT,这个RT 是我定义的,和R0 不同,与时间有关,表达的是平均每天传染几人。密西根州的 RT=1,而全美的 RT=0.32 。可见传播因子和病毒类型无关。那么,怎么说好呢,传播因子啊 。。。。。。

(3)燃烧阶段,我把这个时间段定义为从增长率的峰值(图六中 3/19,172% 的那一点)到5天平均增量(《DN》)最大值(图五中 4/5, 1635 的那一点)所对应的两个时间点之间的区间。在此阶段每天的增量继续上升,而增长率按e指数下降。以密西根州为例,燃烧阶段从3月19到4月5日,历时18天。人们在此期间看不到希望,心情沮丧。这个阶段正是黎明前的黑暗。

(4)平复阶段,增量(DN)达到最大值后逐日下降。增长率的下降的方式和第(3)阶段的一样,先快后慢,这是由e 指数衰减的形式决定的。南韩的数据显示,虽然2月29日达到拐点,但至今还拖着一个长长的尾巴,每天新增病患40-50人。就全美疫情来看,五月初每天仍可检测到新增病患过万;六月初过千;七月初过百。

绕了一大圈,回到主题 ---- 美国疫情。图七表示全美新增病患人数的增长率(Growth rate %),这一数字正逐步、稳定地下降。结合图三和图七,预计今后每天的新增人数将在3万至3万5之间徘徊几天,然后一路下降。由于多源头、多批次、多地点的疫情爆发,对于全美来讲,拐点已不再是一个特定的日子,而是一个区间。这个拐点区间的时间范围大约起于4/5, 终于4/15, 十天左右。在这期间的每日新增病患的人数起伏波动,在3万5左右(3.5±0.5万)。这是病毒最后的有规模的挣扎,剩下搏住苍龙只是时间的问题了。

图七 全美病患人数的增长率(Growth rate %)

图八是累计病患的数据和预测,在COVID-19 的疫情中全美将有大约一百二十万人染病 (120±10 万人),以病死率4%计,全美因此流感而挂掉的人数约五万。

图八 累计病患及其预测

结论:

1 全美COVID-19疫情的拐点为一个十天左右的时间段,从4/5 到 4/15。拐点期间每天新增病患在三万五左右 (3.5±0.5 万),起伏还比较大,近万呢。

2 全美COVID-19疫情所产生的累计病患将达到一百二十万左右,(120±10 万),以病死率4%计,病死人数接近五万。

3 疫情有尾巴,长长的,七月份仍可检测到。尾大难掉。

当我们理解了疫情发展的完整过程,我们对疫情的趋势、危害也就洞若观火了。朋友们,我们越过了峰值,正跋涉于拐点的缓坡,面对着黎明前的黑暗,曙光即将来临。让我们迎接疫情解放自由民主的明天。

[ 打印 ]
阅读 ()评论 (8)
评论
唐山故乡 回复 悄悄话 回复 'jay_walker' 的评论 : 谢谢。一直相信老美科技多么厉害,以为病死率最多2%,现在的数据大约是4%。 这个病毒还是很凶猛的。
jay_walker 回复 悄悄话 赞!分析的有谱!两个星期前当trump说会死10到20万的时候,我的直觉估计死亡会在3万到5万之间。现在看来5万概率较大。
唐山故乡 回复 悄悄话 回复 'ncpga' 的评论 : 紧紧握你的手。
ncpga 回复 悄悄话 让我们迎接疫情解放自由民主的明天。
唐山故乡 回复 悄悄话 回复 '枕寒流' 的评论 : 谢谢来访,很高兴认识新朋友。
唐山故乡 回复 悄悄话 回复 'Wtp003' 的评论 : 谢谢来访,很高兴认识新朋友。
枕寒流 回复 悄悄话
Wtp003 回复 悄悄话 好文
登录后才可评论.