大数据时代,所以俺搞这么个东东。提起这个题目的另一个原因是:看有不有人有主意,有能力把这些东西中文化 -- 底层做起,是真正的中文,全中文,在计算过程中每一个字都是定义过的。 R 和 Hadoop 都是开源的,是由社区发展的 -- R 是唯一对 SAS 构成有效挑战的分析工具(没有一个商业软件搞得过SAS); Hadoop 最先是Google 内部发展,迫于社区压力公布的(只发表文章,不发表代码 -- 现在的东东是社区从新发展的)。