谢谢指点。最后一个是什么? Machine Language?

来源: 有可不可无 2014-11-20 18:07:11 [] [旧帖] [给我悄悄话] 本文已被阅读: 次 (0 bytes)

所有跟帖: 

Machine Learning。 基于Java的有Spark/MLib, Mahout.Scala有点意思。其他的如语音图像识 -easycity- 给 easycity 发送悄悄话 (0 bytes) () 11/20/2014 postreply 18:10:47

谢谢。我朋友公司号称做big data的top 100 USA company 之一,但其实后面还是database queri -有可不可无- 给 有可不可无 发送悄悄话 (64 bytes) () 11/20/2014 postreply 18:53:38

插入6千万行数据进入一个表,Cassandra需2小时,同样条件插入MYSQL需要36小时,完全不是一个级别的. -望乡- 给 望乡 发送悄悄话 (0 bytes) () 11/20/2014 postreply 20:07:55

大数据真的只适用于新型的应用,TB级的数据,用户在线等结果。Relational DB没法承担。Spark很好 -easycity- 给 easycity 发送悄悄话 (267 bytes) () 11/20/2014 postreply 20:53:43

在SPARK面前,HADOOP的MR太繁杂,效率太低,远比上SPARK的线程操作。 -望乡- 给 望乡 发送悄悄话 (0 bytes) () 11/20/2014 postreply 21:01:07

Spark比MapReduce快30到100倍。伯克利的作者成了MIT教授。推荐他的博士论文,写得太棒了 -easycity- 给 easycity 发送悄悄话 (74 bytes) () 11/20/2014 postreply 21:08:18

这是真正的大牛之一。在美华人不要多提印度人,有雄心就照着Spark作者Zaharia去干。 -easycity- 给 easycity 发送悄悄话 (0 bytes) () 11/20/2014 postreply 21:10:14

对!罗马尼亚的加拿大籍小伙子,相当牛,老中应该学习之。 -望乡- 给 望乡 发送悄悄话 (0 bytes) () 11/20/2014 postreply 21:20:32

2小时vs36小时,不可完成的使命 -85858585- 给 85858585 发送悄悄话 (0 bytes) () 11/25/2014 postreply 23:54:35

加跟帖:

  • 标题:
  • 内容(可选项): [所见即所得|预览模式] [HTML源代码] [如何上传图片] [怎样发视频] [如何贴音乐]