星期五看了一个同事的 code, 服了他

算存储在两个文件中的两列数的 correlation, 他先全部读进来, 存在 hash table 里, 然后才算。 他用 16 G 内存。 已经造成若干次停机。

不知道这样的是要避开还是要帮他。

所有跟帖: 

文件当然是比较大。 -乱弹- 给 乱弹 发送悄悄话 乱弹 的博客首页 (0 bytes) () 02/22/2009 postreply 12:15:50

呵呵,要是面试时像那位仁兄那样写code会很危险的。 -吴用先生- 给 吴用先生 发送悄悄话 (0 bytes) () 02/22/2009 postreply 12:25:06

帮他~~ -云河- 给 云河 发送悄悄话 云河 的博客首页 (0 bytes) () 02/22/2009 postreply 14:33:05

对,帮他! 把 16 G 的 Hash 再分成 4 个 4 G 的就没问题了。 -多哥- 给 多哥 发送悄悄话 (0 bytes) () 02/22/2009 postreply 14:36:52

其实零内存就可以了。 -乱弹- 给 乱弹 发送悄悄话 乱弹 的博客首页 (0 bytes) () 02/22/2009 postreply 14:38:46

呵呵乱兄,我是开玩笑。他这样做 -多哥- 给 多哥 发送悄悄话 (143 bytes) () 02/22/2009 postreply 14:47:55

文件是在另外的机器上,但是网络很快。而且是 offline 的, -乱弹- 给 乱弹 发送悄悄话 乱弹 的博客首页 (88 bytes) () 02/22/2009 postreply 15:12:51

嗯,只是不好提起, 因为他没问我。我跟他同时进公司的。 -乱弹- 给 乱弹 发送悄悄话 乱弹 的博客首页 (0 bytes) () 02/22/2009 postreply 14:37:25

没觉得不好,正确算法是什么呀? -waitGC- 给 waitGC 发送悄悄话 (0 bytes) () 02/22/2009 postreply 17:44:58

就是开两个 pipelines, 对齐,update 和,积之类。 不是什么高深东西。 -乱弹- 给 乱弹 发送悄悄话 乱弹 的博客首页 (0 bytes) () 02/22/2009 postreply 18:53:08

请您先登陆,再发跟帖!