big data其实不是一个技术术语,专业的称呼叫distributed data system.他有几个方向

来源: 熙来熙往 2017-03-21 19:58:25 [] [旧帖] [给我悄悄话] 本文已被阅读: 次 (680 bytes)

1. Distributed data system administrator. 做这部分,大学数学过得去就行了。主要要对各个framework的配置比较熟悉。linux 系统要玩的流畅,shell script写得好就行了。

2. Distributed data system developer. 这部分,主要是参照各个系统的api, 进行计算。数学厉害的话,可以写底层的算法。数学一般的话,也可以混的好。主要还是要java或python写的好。会 scala也有帮助。

3. Distributed data scientist/engineer. 这部分,基本要懂主流的算法,数学越好,越能做优化和customization. 要在这个方向混的好,基本要数学好。

所有跟帖: 

谢谢。和数据库有关系吗?是否需要先学数据库才能做big data? -非肥不可- 给 非肥不可 发送悄悄话 (0 bytes) () 03/21/2017 postreply 20:17:00

Big data主要用的noSQL 数据库。如果想做big data, 文件系统,noSQL数据库,算法都应该懂一些 -熙来熙往- 给 熙来熙往 发送悄悄话 (35 bytes) () 03/21/2017 postreply 20:22:08

好的,有点明白了,谢谢 -非肥不可- 给 非肥不可 发送悄悄话 (0 bytes) () 03/21/2017 postreply 20:31:48

请您先登陆,再发跟帖!