不是这么简单,更不是自封专家就可以获得权威:)

本帖于 2014-07-22 08:49:00 时间, 由普通用户 数据分析 编辑

只是对信息利用不同历史阶段的不同的挑战而已,英文嘛,用常规字表达实际概念(不同于中国文化背景里读书人,爱琢磨个雅词以显高深,唬人方便点,再自封个专家,哪怕只是个七窍通了六窍的冬烘先生)。

信息嘛,用铅笔写也可以,只是量小,生产力不够。上世纪有了计算机,储存量大了,当然生产力就上去了,这么多人不就是靠那个吃饭的嘛(所谓生存) -- 事实上吃得很好,以前 Oracle 按处理器个数收钱的,所以养的人都是高薪。人看这眼红,也来抢吃的(如 Microsoft SQL Server,走廉价路线)。但,这些都是数据管理,而不是数据分析(SQL 也可以做一点点,效率低,拿这么高薪的人搞个数一个礼拜都拿不出来,搞十回都不对。。。,更不用说做模型了。。。 -- 这么大的数据,他就跟个猛子似的直接往上干,还埋怨“哪有大数据”?:))

好了,咱不说分析的事 -- 咱把话挑白:摸着了边的不多。光说数据管理本身,过去那些工具也扛不住了,所以 Google 给取的这个名,另起炉炤再开一摊,好使,高度保密(最高机密,谁敢泄露立即开人,甭管是谁),但在社区压力下,把东西发表了出来(white papers -- big table)。

是竞争!--人比您管的数据多,格式可以自由化,安全(multi-node storage, fail-safe),扛得住恶劣环境,算得快,算的准,能有效服务于商业要求,还便宜(commodity hardware),高下立见(如文学城不是扛不住流量,要么军管,要么回到老办法减少 features,而且实行分舵管理,各立山头)。

其它说法都对,当然是 “garbage in, garbage out”,但那个不够!(何况吃的是这碗饭,搞的就是信息流程的支持和数据管理,干嘛给别人 garbage?)

请您先登陆,再发跟帖!