如果原本就是疫情不严重的时间段,那就比较容易出好数据。辉瑞和Moderna疫苗的有效率计算,都有这个问题。
打个比方:
一个实验数据是1米人群,有15人没打疫苗的感染,打疫苗的,有2个人感染。
另一个实验数据是,一共有1百个人参与实验,打疫苗的15人感染,没打的,也是2人感染。
这样的两组数据,疫苗有效性都是(15-2)/15 =86.7%
可是,作为专家,你扪心自问,这两组数据,能一样吗?肯定是下一组数据,更让人对疫苗放心。
原因?第一组数据,随机性太大了。出现一个cluster,就可以改变很多。换句话,在两组数据获得时,不但是单组人群内,每个个体暴露给virus的概率不同,而不是均等。而且,两个实验组内的个体,暴露给病毒的可能性的平均值也是不一样的。后一组,概率要大。