关于KFF发布的美国部分州打过疫苗和没打疫苗的发病、住院、死亡病例的占比数据

来源: slow_quick 2021-08-10 11:21:40 [] [博客] [旧帖] [给我悄悄话] 本文已被阅读: 次 (4972 bytes)
本文内容已被 [ slow_quick ] 在 2021-08-10 14:05:32 编辑过。如有问题,请报告版主或论坛管理删除.

我对 《TBz:美国部分州打过疫苗和没打疫苗的发病、住院、死亡病例的占比》 跟帖中谈了数据解释问题。

为了让更多人看到我的分析,这里另开一贴,加了几行字。

=============================================

TBz:美国部分州打过疫苗和没打疫苗的发病、住院、死亡病例的占比

https://bbs.wenxuecity.com/health/985536.html

数据来源:
https://www.kff.org/policy-watch/covid-19-vaccine-breakthrough-cases-data-from-the-states/

数据很有用,但也有不足的地方。一是时间段,overall cases/hospitalization/deaths,我的理解是从新冠开始以来计算。二是并没有说打过或没打过疫苗的占人口的百分比。

这两点不清楚很容易误导观众。我举一个与新冠无关的极端例子:

比如说交通事故,把某国某年车祸事件都拿来(事件 C),看看驾驶者是A: 10岁以下与B: 10岁以上各占车祸的比例。你一定会看到Share of Overall Cases by A Among C = # in A and C / # in C 是非常低的。但你总不能说10岁以下小孩开车更安全吧?

要直接比较Share of Overall Cases by A Among C vs. Share of Overall Cases by B Among C,A 与 B 最好占总体比例差不多。比如 A: Male,B: Female

打过疫苗的(A)与没打过疫苗的(B)目前比例比较接近,但 A 总的来说经历的时间短些,B 总的来说经历的时间长些。直接比较的话,有点类似比较 A: 2021年时 25-35岁 (i.e. born in 1996-2006) 驾驶者,B: 2021年时 35-45 (i.e. born in 1986-1996) 驾驶者,多年所有车祸记录 C。B组驾驶年份长,车祸总量也许更多。但你不能据此而说B组开车更不安全吧?

保险公司最应该比较的是:
(# in A & C) / (# in A) vs. (# in B & C) / (# in B)

用原来英文讲就是:Share of Overall Cases by C Among A vs. Share of Overall Cases by C Among B

用条件概率的符号就是:

KFF 报道的是:P(A|C) vs. P(B|C) [这两个数加起来是100%]

我们更感兴趣的是: P(C|A) vs. P(C|B) [注意这两个数加起来不是100%]

二者之间的关系可以用Bayes公式表达:

   P(C|A) = P(A|C)*P(C)/P(A) vs. P(C|B) = P(B|C)*P(C)/P(B)

可惜KFF的数据没有P(C)/P(A), P(C)/P(B)

如果A是打(完)疫苗的,B是未打(完)疫苗的(简化一下,把打了一半与没打到放一起),那么保护率(或有效率)计算就是:[P(C|B)-P(C|A)]/P(C|B)

 

=====================================

TBz: 你都把数据来源贴出来了,就愣是不往下看一眼

数据来源:
https://www.kff.org/policy-watch/covid-19-vaccine-breakthrough-cases-data-from-the-states/

数据很有用,但也有不足的地方。一是时间段,overall cases/hospitalization/deaths,我的理解是从新冠开始以来计算。二是并没有说打过或没打过疫苗的占人口的百分比。
==============================================

数据来源里面的 Table 1: COVID-19 Breakthrough Event Data, Source, and Notes by State

表格列得清清楚楚,第一列就是每个州的取样时间段。

可以看出,大部分的州是从今年年初开始累计数字的,按每周观察数字

我就不再截屏了

===================================

我的回答:对不起,我眼花看成2020年起了,不过...

即使从2021年初起,那还是有不少是比较后期才打疫苗的。

我不是否认疫苗的作用。我只是说,KFF表达的数字,容易引起误导,我看是夸大了疫苗的保护作用。

反过来的是媒体关于CDC Providencetown breakthrou的表达方式,"74% of people in a Covid-19 outbreak were vaccinated"。方舟子的视频 《不要把德尔塔变异说得太可怕》 https://www.youtube.com/watch?v=hW-vd2nQxqA 说明了怎么计算更客观些。

我们既不要夸大也不要贬低疫苗的保护作用。

所有跟帖: 

你都把数据来源贴出来了,就愣是不往下看一眼? -TBz- 给 TBz 发送悄悄话 TBz 的博客首页 (1984 bytes) () 08/10/2021 postreply 12:41:59

对不起,我眼花看成2020年起了。不过。。。 -slow_quick- 给 slow_quick 发送悄悄话 slow_quick 的博客首页 (778 bytes) () 08/10/2021 postreply 13:46:59

:-) -TBz- 给 TBz 发送悄悄话 TBz 的博客首页 (0 bytes) () 08/10/2021 postreply 13:56:30

一个重要点是从5月开始delta的流行很有可能改变了发病、住院、死亡病例占比数据,因此,累计数据对当下疫苗的讨论意义就有限了 -三丝- 给 三丝 发送悄悄话 (0 bytes) () 08/10/2021 postreply 12:45:31

99% ICU的病人都是没打的和将来99% ICU的病人都是打过的同样是不能说明疫苗的有效性 -三丝- 给 三丝 发送悄悄话 (0 bytes) () 08/10/2021 postreply 12:53:59

检测门槛和以前不一样了。一般发烧咳嗽根本不再测新冠了 -julie116- 给 julie116 发送悄悄话 julie116 的博客首页 (0 bytes) () 08/10/2021 postreply 15:39:59

标题中“打过疫苗的和没打过疫苗”应改成“完全接种疫苗和未完全接种疫苗” -阿明.- 给 阿明. 发送悄悄话 (0 bytes) () 08/10/2021 postreply 13:11:17

同意,应该是”打完疫苗的“、”未打(完)疫苗的“ -slow_quick- 给 slow_quick 发送悄悄话 slow_quick 的博客首页 (0 bytes) () 08/10/2021 postreply 13:59:27

这个统计是从1月份或2月份起~7月底,不同州上报的COVID-19 Cases实际数据来的。 -pickshell- 给 pickshell 发送悄悄话 (490 bytes) () 08/10/2021 postreply 13:34:53

请您先登陆,再发跟帖!

发现Adblock插件

如要继续浏览
请支持本站 请务必在本站关闭/移除任何Adblock

关闭Adblock后 请点击

请参考如何关闭Adblock/Adblock plus

安装Adblock plus用户请点击浏览器图标
选择“Disable on www.wenxuecity.com”

安装Adblock用户请点击图标
选择“don't run on pages on this domain”