数据的“忽悠”功能

来源: 数据有道 2013-10-29 11:30:58 [] [博客] [旧帖] [给我悄悄话] 本文已被阅读: 次 (6574 bytes)


作者:数据化管理 


    在新浪微博玩了一年有余,基本上见证了各时期的大事件,最大的感受是很多脖友为了博眼球,增加粉丝,不惜说假话,移花接木,歪曲事实。真是“语不惊人誓不休,为赋新词强说愁”。很多脖友为了证明自己观点的正确性,不惜创造“数据”。

       比如某著名脖友的微博:50%白领认为,房租上涨影响了生活质量(2010年7月23日的微博)。首先,50%这个数据可能是创造出来,没有标明来源。 其次如果我是已经买了房产的白领,房租上涨多少对我来说没有丝毫影响,相反如果我有好几套房,我可能因为房租收入高了反而提高生活质量。第三房租上涨了多 少会影响生活的质量,10%?20%?当然不可否认这个微博达到了吸引眼球的作用!

       对于企业的管理人员来说,这种“假”数据是深恶痛疾。原因不言而喻:造成资源浪费,决策失误,贻误战机等等。简单总结一下“有问题数据”的几个方面来源,帮助大家早日练成火眼金睛。(注:有问题的数据并不代表一定是假的数据)

一、随意编造假的数据来忽悠客户或老板

       这种情况随处可见,对于某些人或组织来说,数据的严肃性根本就是一句空话,他们是要什么数据就编什么数据,他们是的名字叫”编“委。对于这种情况,我们一定要多问几个为什么,问清楚数据源就可以了。记住“无数据(源)就没有真相”。

    这种情况还有个极端就是创造“数据”。比如报纸的发行量永远是世界上最难解的谜题,我也不知道答案。我只知道:

    1. 媒体自己公布的发行量实际上是他们的最高发行记录,一般来讲大家习惯去掉“最高”二字;

    2. 当年某些报纸为了创造最高发行量,直接把报纸从印刷厂拉倒垃圾站,这种情况是公然而无耻的作假,后被禁止;

    3. 前几年北京地铁流行买一份1元的报纸送你一瓶价值1~2元的饮料,也是为了变相的创造最高纪录。对外宣传是为了让大家“试看”。

二、定向取值问题

       这是比一更具有隐蔽性和欺骗性的手段。何为定向取值?就是先假定一个结论,然后选取最利于这个结论的人群进行市场调查或研究,最后号称这个规律或结论具 有普遍性。比如平均工资,我要让他高,就去写字楼访问,我要让他低,那就如劳务市场吧!这种方法是一种骗人的伎俩,要不得,可是很多人很热衷!

       把这种方法用到极致的是市场调查公司和政府机关。比如某年某地区某高官说要在半年内将房价降价多少以上,半年以后他们真的做到了,可是老百姓并没有感到 房价下降的趋势,为什么呢?原来他们玩了个数字游戏,半年前的样本是城区的房价平均,半年后加上了郊区的房价后取平均。很简单吧!鄙视这种行为。

       市场调查公司我认为基本上是做良心品质。很多企业的老板会要求市调公司按照他们的结论来采样调查,然后用这个数据去公关或说服消费者。好的调查公司这种 业务是不接的。可是现在的无良公司很多,对于这种市场调查数据最好是能了解到调查公司是那家,自己分析判断。

       当然遇到好的调查公司的调查数据(意味着调查数据是真实的),有些企业也可以定向取结论。比如(此事例是为了说明问题,假设的数据,千万不要当真),比 如某种牙膏宣传:使用该品牌的牙膏后将使蛀牙减少23%,这个数据是市场调查后的数据。当然这个数据对你一定是有诱惑力的。因为你认为减少的反义词就是没 减少!可你是否知道他的背后有可能是这样的:23%的人蛀牙减少,40%的人没有任何反应,37%的人蛀牙反而增多了(当然这种可能性不大)。

三、系统误差

       前两种情况都是数据人为误差,有的时候数据分析还有系统误差出现。好的调查公司的数据很多时候也是有问题的,这个倒不一定是定向取值的问题。举说明例。 假设你要在一个公司内部调查一下大家对新来的总经理的看法,选项有三个:喜欢,没感觉,不喜欢。并且要求匿名投票,收回选票后数据显示如下:喜欢 -70%,没感觉-20%,不喜欢-10%。由于是匿名投票你可能认为这个数据没问题了吧(假设没有拍马屁的现象)。

       我的回答是不一定。因为很可能还有很多员工根本就没有投票。他们不投票的原因有可能是不知道,忙没来得及投等,还有就是这些弃权票很可能都是要投“不喜 欢”的人,他们不想表达自己的真实想法,所以他们有目的的放弃了投票。想想联合国大会的弃权票吧,有点这个意思的吧。

四、眼见为虚

       如果上面的几点还不能忽悠你,那再来个数据加图表,双重忽悠。让你觉得有图有真相。看看下面这两张图,你喜欢那张?
   

 

   
       发现不同了吗?其实上面两张图的数据源一模一样,市场占有率都是从05年的23.5%增长到2010年24.8%,仅仅增长了1.3%。第一张图初一看 市场占有率增长得气势如虹,第二张毫无亮点!有些公司更缺德,把左边的数据比率还給隐藏起来,名为保护公司机密!如果那样你就彻底被忽悠了。

       这两张图各有用处,比如第一张可以給消费者看,第二张在向董事局要钱的时候可以給董事看!但是这样都是不对的,正确的做法是挑一个适当的比例尺。

       我们来看看这种情况是不是随处都有,比如最新一期淘宝网的数据魔方上的一张图,大家看看是不是似曾相识(下边这张图):
 


   
       Y轴的值一般EXCEL会自动调整,当然也可以人为调整,但如果调整过大(比如本例)就一定要醒目的标注出来,否则就有误导之嫌! 

       数据障眼法很多,特别是在这个盛产山寨和骗子的地方,所以各位,还是擦亮你的眼睛的。祝你早日练成火眼金睛。

请您先登陆,再发跟帖!