甲。数据非常大,可靠性和安全性要求非常高(法定要求:所有数据保存七年以上)。这些历史原因导致从业人员的技能偏重于数据管理,而不是数据分析。其结局就是:那个数字从来都搞不对!:) -- 常见的现象是:一个组的人搞一个星期都拿不到数,搞两个星期,搞到了,却不对:),再搞,还不对。。。然后滚蛋,重新来过。。。。。
乙。会算数的,其训练背景通常都是算小数的,不算大数,根本就玩不转数据!更别说这么大的数据。俺一看人使的那个家伙式 -- 什么 Matlab, Mathematica, Statistica, 画图画得特漂亮的那种,人就最喜欢 show 您那个 image,俺一般就直接开玩笑了(What's new with that volcano?)。所有这些俺家伙式俺一概将其称为 rubber gun -- it does shoot, with the smoke just too little。
丙。还有大量的同志是使 Access 的,那些家伙式 are not even gun。
丁。就目前来说,唯一的一把枪就是 SAS -- 要用足全部功能,从 data steps, 到 Proc SQL, 到hash,到很多分析程序尤其单变量程序 -- 这些是保证分析质量的要点!:)那些搞不对数的原因就在这里!更不用说他们脑子里没有计算效率的概念 -- 直接就往上硬干,也没有个测量法啊算法啊的想法。可不就是经常地连锅端嘛!
戊。邻之祸乃君之福也!自由资本主义世界,能对付这些真正的问题,真正的挑战,那还愁工作和生意?!