在下为什麽相信李成瑞,答两个黄鹂和144021

来源: 龙剑 2007-07-19 10:57:42 [] [博客] [旧帖] [给我悄悄话] 本文已被阅读: 次 (11019 bytes)
为了更好地和两个黄鹂及144021讨论,在下先摘录讨论时将涉及的李成瑞文章的一些内容,因为在下觉得两个黄鹂和144021发帖子时似乎没有仔细阅读这篇文章,造成一些误解。

‘直到1983年,国家统计局报经国务院批 准才将这些数字列入了1983年出版的《中国统计年鉴》,第一次向国内外公布了1949年到1982年户口登记的每个年度的人口数字。
国外研究中国人口的著述中,影晌较大的是美国人口与人口学委员会主席、菩林斯顿大学教授安斯利•科尔(Anstey J Coale)提出的研究报告。他在洛克菲勒基金会和美国全国研究理事会的资助下,带领他的助手进行了详细研究,写成《从1952年到1982年中国人口的急剧变化》一书,作为美国全国研究理事会行为与社会科学及教育委员会的《人口与人口学第27号报告》公开出版友行。

科尔在上述著作中以将近一半的篇幅对来自中国的大量数据的质量进行了评价,总的结论是:“这些数据按性别及逐个年龄人数结合比较,它们经受住了一系列精度与一致性的严格检验。”“确实,现 在中国人口情报资料的精度和细度,已超过我们目前所知道的世界上一切发展中国家。”科尔运用一系列推算方法通过电子计算 机的反复计算,对1952年到1982年我国历年人口出生率与死亡率进行了重新估算。

科尔重估的人口出生率是依据我国1‰生育率抽样调查中回忆 性资料所提供的各个年龄的妇女的生育率推算出来的,同时对阴历13 个月的闰年与非闰年的数字作了一些调整。科尔估计的死亡率是以他 推算的各年出生人口为基数,减去实际存活的人口数估算出来的。
 
  科尔的估算方法和步骤,根据笔者的理解,大体有如下五步:第一步,依倨我国1‰生育率抽样调查中回忆性资料所提供的各年度 生育率,结合他推算的各年育龄妇女数,计算出历年出生人数。第二步,由各年出生人数算出两个普查间隔期,即1953至1964年和1964至1982年的出生人口总数。从出生总数减去同一期间的人口实际增加总数(以三次普查年的总人数相比而得),求出相应期间的死亡人口总数。第三步,将估算的两个普查间隔期的死亡人口总数与官方登记的相应期间的死亡总数相比,求得官方登记死亡人数的完整率:1953年至1964年期间登记的完整率为62%(漏报率为 38%),1954年至1982年期间的完整率为84.3%(漏报率为15.7%) 。第四步,将两个间隔期间的死亡登记完整率分配到各个年度,作为计算各个年度死亡人数的依据。这是一个较困难的问题。据科尔书中说:分年度的“调整死亡数是根据假设做出的,即从1953年到1956年登记的死亡人数 (完整率)为55%,然后在1964年登记的完整率上升到84%(记录的完整性可能有所改进)、平均完整率为62%。”关于1964至1982 年这个普查间隔期各年度的登记完整率,是“假设”大体保持着84% 同一水平。以户口登记的历年死亡人数为基础,按照上述“假设”分 配的各年登记完整率 推算出各年死亡人数和死亡率。 第五步,按线性趋势算出1958至1963年的线性死亡人数,与估算的实际死亡人数相比,求得超纯线性死亡人数。

笔者和我国一些人口学家在1985年曾应邀参加了国际人口科学研究联合会于6月 5日至12日在意大利佛罗伦萨市召开的第二十届大合。会上笔者宣读了题为《中国 1982年人口普查资料可靠性》的论文,并听取了各国学者对我国人口问题研究的意见。参加会议回来,写 了《国际人口学会佛罗伦萨会议对我国1982年人口普查结果的评价和 提出的问题》(该文在《人口研究》双月刊1985年第6期摘要发表),并于1985年8月间在全国人口科学讨论会发言中提出了四条建议,其中第一条就是加强对建国以来人口出生率和死亡率的研究,包括“大跃进”引起的人口变动的研究。笔者要求此项研究能坚持严格的客观性,不掺入任何主现因素,并在人口学和统汁学理论和方法上能达到 较高的国际水平。这是一个难度较大的任务。经过多方“招贤”,最后由当时任西安交通大学人口研究所所长的蒋正华教授承担了这一任务。

蒋正华主持的研究工作,首先着力于选取质量最好的调查数据作依据。经过对各种数据的深入评审和比较,确认三次人口普查所取得年龄、性别数据是可靠性很高的。三次普查相应年龄组数据的高度吻合也证明了它的高质量。关于人口出生率和死亡率,则以1982年人口普查取得的普查前一年(1981年下半年和1982年上半年)的数据为基础。这些数据的高质量已从普查后的现场复查中得到证实。

  蒋正华根据上述资料编制了1981年我国人口的完全生命表,然后结合 1953年和1964年两次普查资料,通过建立参数估计模型等方法,编制了1953年到1981年历年的完全生命表,井根据这些生命表推 算出生率和死亡率。

蒋正华的研究得出初步成果后,曾由国务院人口普查办公室、中国人口学会与西安交通大学人口研究所联合召开专家会议进行评审。 国家统计局、公安部、国家计划生育委见会、中国科学院、中国社会 科学院、中国人民大学等单位的专家学者参加了评审。与会者对研究的方法和初步成果给予了基本肯定,同时提出了若干改进意见。蒋正华吸收这些意见进行了一些修订。上述数字是修订后的数字。

  蒋正华把这一研究成果写成了题为《中国人口动态估计的方法和 结果》 的学术论文,在《西安交通大学学报》1986年第3期发表。

蒋正华的估算方法初步骤。 大体有如下5步:第一步,依据1982年人口普查所取得的上年死亡分性别、年龄的数据和本年实有的分年龄、性别人口的数据,用自修正迭代法生成1981年一岁一组的,分性别的完全生命表,第二步,建立“凸规划”型的参数估计模型,用来估计两次普查年间每一年分年龄、分性别的人口留存率,例如,依据三次人口普查的结果,可以确知1953年0岁 (未满周岁) 人数到 1964年11岁时的留存数和死亡数,以及这一批人到1982年25岁时的留 存数和死亡数。现在通过参数估计模型,可以进一步求得这一批人在 28年中每一年的死亡数和留存数,第三步,对于按参数估计模型所求得的解进行一致优化,以减少误差,第四步,进行时点修正,由于人 口普查的标准时间是7月1日,所谓的人口年龄结构相当于年中时刻,因而各年的生命表也是本年7月1日至下年6月30日间的生命表。与《统计年鉴》和其他日历年制资料不可比,所以需要加以修正,最 后生成1953年至1981年共27年的完全生命表,并由此算出各个年度的 出生率和死亡率。第五步,在生成生命表过程中,出现平均预期寿命 降低、死亡率升高的不正常年份,要按平均预期寿命正常变化规律,另行计算分年龄、分性别的预期寿命和正常死亡人数再与推算出的1958至1963年实际死亡人数相比,求得非正常死亡人数。

在人口学中按年出生率或死亡率计算年出生人口或死亡人口、都是以年平均人口为基数的年平均人口在理论上应按365天的人口平均计算,但这种方法实际上难以做到。通常使用的简便方法,是以上年年末的人口加本年年末人口除以2得出平均值,作为本年平均人口。
人口学中把同年出生的一批(同龄的一批人)随着年龄的增长而陆续死亡的人数列成一种表格,称为死亡表。由于它反映了这一 批人从出生到死亡的整个生命过程,所以也叫生命表。又因此表可以 计算人口的平均寿命,又叫寿命表。这种表格是分析和研究人口再生 产过程的基本工具之一。在表的编制方法上,如要实际观察一批同龄 人从出生到死亡的全过程,需要花费百年左右的功夫,实际很难做到,即
使真的经过百年观察编制出这样一张表,也已成为历史的追述,失去观察和分析现状的作用。因此编制生命表的方法是把同时存在的 各个不同年龄的人的状况作力一代人处在各个不同年龄的状况来看待,这样就可以根抿一年或几年的统计资科来确定一批人分年龄的死亡率,并计算出平均预期寿命。生命表有1岁为一组的完全生命表,也有5岁为一组的简略生命表。’
仔细阅读,就可以发现两个黄鹂和144021的质疑已经给与答复了,文章甚至考虑得更周详。
科尔的研究只在计算1958至1963年的正常死亡人数时,按他所推算的1957年和1964年的死亡人数(他认为这两年的死亡人数是正常死亡人数)为端点值,按线性趋势算出1958至1963年的正常死亡人数,所以他称之为线性死亡人数。此前的推算并没有用线性回归(144021叫做线性拟合不够规范),自然不会发生(用三倍钧方差)剔除数据的问题,也不产生置信度之类的问题。上面的摘录中已经介绍了科尔和蒋正华研究工作的大概步骤,在下希望能够解决144021的疑问。
两个黄鹂一再说统计数数不足为凭,在最近的帖子中直截了当地责之为编造出来的。李成瑞并没有否认数据存在误差,除了人口普查年以外,抽样调查的年份即使在较好的情况,完整率也只有84.3%,1964年以前甚至仅55%。正因为如此,科尔(还有其他一些国外学者)才会花很大力气、很长时间(差不多一年吧)、很多资金重新推算1952-1982年的中国人口真实状况,李成瑞称这项研究是开拓性的。李在佛罗伦萨国际会议上了解到这一情况,回国后立即组织人员继续开展这项研究,要求客观地得出真实情况,不要掺杂任何主观因素,结果就有了蒋正华的研究,这项研究还得到国内许多人口学方面的主要专家学者的补充和修正。
首先,两项研究都花很多精力探讨原始数据的可靠性(例如在科尔的书中几乎占了一半篇幅),证实了它们是高质量的数据之后,才取作为研究的依据。其次,研究者的知识和能力是足以胜任此项工作的。他们都是在人口学领域浸淫多年的专业人士,且已被广泛认可。第三,研究方法是经过慎重考虑,妥当可行的。研究中用了人口学、统计学、规划论等工具,计算结果应该经过反复核对无误,才正式发表公诸于众的。最后,研究态度是严肃认真的。国外学者没必要造假,李成瑞在研究开始时就要求客观反映真实情况,不掺杂主观因素。与一万步就算出于政治目的造假,也只会尽可能减少困难时期过多死亡人数,决不会夸大。所以在下这几天觉得很奇怪,动辄说困难时期饿死三、四千万人的朋友到现在还没有帖子反对在下的论证,反而有人一再发帖子声称困难时期过多死亡人数只有百万数量级,不可能达到千万数量级。
且不说大多数网友的知识结构(就以在下为例,虽然在下曾从事过数理统计的研究,但对人口学的知识只有皮毛的了解),就拿所掌握的原始数据,绝对没有李成瑞他们那麽丰富和全面。我们究竟应该更相信那一个结果呢?为了更能说明问题,下面探讨一下两个黄鹂在《废墟中的桃花源》一文中所给出论证的问题。
两个黄鹂文章开头的数据表是来自1983年出版的《中国统计年鉴》公布的1949年到1982年户口登记的每个年度的人口数字。李文已明确表示这些数据不正确,所以才需要重新研究予以修正。即便按照这些数据推算,两个黄鹂可能还没有搞清楚这里的人口总数是每年年末的数字,而出生率和死亡率是根据每年平均人口总数计算的,至少没注意直接用表里的数据计算会引起不必要的误差。
两个黄鹂最怀疑的是表中1957年的数据,在下可以同样怀疑1955年和1956年的数据。如果在人口增长数这一栏55年加200万,56年加100万,57年减300万,其它数据不动,(人口总数栏作相应变动)就可以消除两个黄鹂的怀疑了。在下这样做恐怕比两个黄鹂更合理些,因为55年,56年正是学苏联提倡光荣妈妈的时候,人口应该增长的开一些,而不是如表所示人口增长数反而低了。
两个黄鹂说大跃进是57年开始,记得金笔也说过这个话,你们太年轻了,在下毕竟痴长了几岁,确实知道大跃进是58年开始。那一年大约在年中召开的中国共产党八届?中(记不清,但容易查到)全会上提出了‘鼓足干劲,力争上游,多快好省的建设社会主义’的总路线,接下来就是大跃进,超英赶美,大炼钢铁,什麽1070万吨钢,一吨也不能少,这一年的七月第一个人民公社,河南信阳的七里营人民公社成立。所谓三面红旗就是指总路线、大跃进和人民公社。不相信可回家问问父辈。李成瑞他们是过来人,对此事比在下更清楚,所以才把1957年看成是正常年份。一点没错,受大跃进影响人口出生率降低,死亡率升高,但那是58年,特别是59年以后的事,即所谓三年困难时期。
两个黄鹂没有掌握基本的原始数据,所用计算方法过于简单,无法较充分的利用数据所提供的信息,且计算有误(如没搞清楚出生率和死亡率的计算依据)。进行定性分析又搞错年代,因此在下认为两个黄鹂的结论不可信。不过能提出一些理由来证明自己看法,比只提看法不讲理由的朋友要好得多,这促使在下深入思考,努力弄清历史真相,再次向这些朋友表示感谢。当然也对提供资料的明前雨前茶那些朋友表示感谢,不过在下也希望明前雨前茶那些朋友性子不要太急,不管是谁先说的,都不要在坛上以牙还牙。人生难免被误解,多一些宽容(在下在文化走两上有一个题为《人性啊人性》的帖子,谈到过这一点),这样本坛的气氛就会更好。
李成瑞在文章第五部分第(三)段详细比较了两项研究后,指出蒋正华的研究结论更精确,在下同意这看法。因此困难时期过多死亡人数在1500万更接近于历史真相。造成过多死亡的原因李成瑞在文章中也讲到过,在下不多啰嗉。两个黄鹂认为饿死和营养不良致死并不相同,这种说法也许有道理。但若是饥饿引起的营养不良,那麽这两种死亡也相差不远。最后再讲一句,两个黄鹂调查了周围一千多人,没有一个人说他有亲属在困难时期饿死,在下相信这是真的。明前雨前茶转贴了一些网友,说他们有亲属在困难时期饿死,在下相信这也不是编的。在下有一个堂叔死于困难时期,闹不清楚是饿死还是死于营养不良,反正家父说他堂弟是饿死的。




























  


所有跟帖: 

heihei -两只黄鹂- 给 两只黄鹂 发送悄悄话 两只黄鹂 的博客首页 (309 bytes) () 07/19/2007 postreply 11:11:04

您的跟贴要说明什麽问题? -龙剑- 给 龙剑 发送悄悄话 龙剑 的博客首页 (650 bytes) () 07/19/2007 postreply 18:56:47

heihei -两只黄鹂- 给 两只黄鹂 发送悄悄话 两只黄鹂 的博客首页 (169 bytes) () 07/19/2007 postreply 19:10:46

用计算方法来推算非正常年代的死亡率是否正确? -Do_u_read?- 给 Do_u_read? 发送悄悄话 (608 bytes) () 07/19/2007 postreply 12:52:59

同感 回复:用计算方法来推算非正常年代的死亡率是否正确? -密码老不对- 给 密码老不对 发送悄悄话 密码老不对 的博客首页 (0 bytes) () 07/19/2007 postreply 13:01:59

it is a method -两只黄鹂- 给 两只黄鹂 发送悄悄话 两只黄鹂 的博客首页 (1398 bytes) () 07/19/2007 postreply 13:25:41

it is 52-82, not 58-82 -两只黄鹂- 给 两只黄鹂 发送悄悄话 两只黄鹂 的博客首页 (0 bytes) () 07/19/2007 postreply 14:02:09

科尔不是用线性计算方法来推算非正常年代的死亡率 -龙剑- 给 龙剑 发送悄悄话 龙剑 的博客首页 (190 bytes) () 07/19/2007 postreply 17:53:14

回复:科尔不是用线性计算方法来推算非正常年代的死亡率 -两只黄鹂- 给 两只黄鹂 发送悄悄话 两只黄鹂 的博客首页 (26 bytes) () 07/19/2007 postreply 18:52:39

这种争论的意义不大 -统计资料不完整- 给 统计资料不完整 发送悄悄话 (246 bytes) () 07/19/2007 postreply 16:30:33

you got it. -两只黄鹂- 给 两只黄鹂 发送悄悄话 两只黄鹂 的博客首页 (421 bytes) () 07/19/2007 postreply 19:20:26

请您对这两项研究所用数据质量做出评价,无需评论其它数据。 -龙剑- 给 龙剑 发送悄悄话 龙剑 的博客首页 (0 bytes) () 07/19/2007 postreply 19:45:48

请您注意国内外专家对文中这两项研究所采用的数据是高质量的评价 -龙剑- 给 龙剑 发送悄悄话 龙剑 的博客首页 (0 bytes) () 07/19/2007 postreply 19:51:17

你以为谎话说了三遍就是真理了? -两只黄鹂- 给 两只黄鹂 发送悄悄话 两只黄鹂 的博客首页 (734 bytes) () 07/19/2007 postreply 20:39:18

简单的说 -两只黄鹂- 给 两只黄鹂 发送悄悄话 两只黄鹂 的博客首页 (640 bytes) () 07/20/2007 postreply 12:19:00

在下是愚人,这样理解准确度和精确度不知道对不对? -龙剑- 给 龙剑 发送悄悄话 龙剑 的博客首页 (354 bytes) () 07/20/2007 postreply 13:11:00

问题是这里不指一个数据 -两只黄鹂- 给 两只黄鹂 发送悄悄话 两只黄鹂 的博客首页 (280 bytes) () 07/20/2007 postreply 13:34:35

懂了,谢谢。看来还需要继续讨论。 -龙剑- 给 龙剑 发送悄悄话 龙剑 的博客首页 (122 bytes) () 07/20/2007 postreply 14:17:16

yes -两只黄鹂- 给 两只黄鹂 发送悄悄话 两只黄鹂 的博客首页 (0 bytes) () 07/20/2007 postreply 15:00:26

各种数据很多,选择的余地很大,不同的数据选择组合,自然会得出不同的结论。 -统计资料不完整- 给 统计资料不完整 发送悄悄话 (524 bytes) () 07/20/2007 postreply 10:34:30

不再加入讨论是因为没有那么多时间来整这些东西,总之你 -金笔- 给 金笔 发送悄悄话 金笔 的博客首页 (52 bytes) () 07/19/2007 postreply 21:02:07

请您先登陆,再发跟帖!

发现Adblock插件

如要继续浏览
请支持本站 请务必在本站关闭/移除任何Adblock

关闭Adblock后 请点击

请参考如何关闭Adblock/Adblock plus

安装Adblock plus用户请点击浏览器图标
选择“Disable on www.wenxuecity.com”

安装Adblock用户请点击图标
选择“don't run on pages on this domain”