人口统计中通常有三个各自独立且不相干的样本:人口总数统计数据,年度死亡人数统计数据,年度新生人口统计数据。
一般来说,死亡人口和新生人口是总人口的千分之几,不正常的时候,最多也不过百分之几,因此总人口数据相对来说是大数。各年度的总人口波动起伏接近百分之一,统计过程本身也会有千分之几的误差,若是用总人口统计数据来估算死亡人口,相近的两个大数相减会产生很大的误差(相对于死亡人口来说),这类计算不可靠。至于美国,还需考虑人口迁移的因数,因为美国是一个有大量移民的国家,更不能用总人口数据来计算死亡人口的变化。按照标准的统计理论,总可以计算出一个期望值,但同时还必须给出误差范围,误差太大时(接近甚至超过100%):可靠性太低、计算结果失去意义必须放弃。
从死亡人数统计数据的波动,可以计算非正常死亡的概率,中国1961年左右的情形,就是人们常说的“饿死多少人的大饥荒”事件,可以用统计方法估算。到底饿死多少人? 采用标准的统计方法,我给出的计算结果是 1200±200 万。用新生人口统计数据,或是年度人口数据,还可以由统计理论计算出另一个数值:人口出生异常值。将之用到中国60年代,可以估算出少生人口:4.5±1 千万。当然统计方法的计算结果多多少少带有一些认为假设,这些假设都应该明确列示,并在检查可靠性时考虑。
人们的观点和看法常常是跟政治立场牵连,往往偏颇,这在"大饥荒饿死几千万"的争论的"众生像"中体现的很充分。