算存储在两个文件中的两列数的 correlation, 他先全部读进来, 存在 hash table 里, 然后才算。 他用 16 G 内存。 已经造成若干次停机。
不知道这样的是要避开还是要帮他。
星期五看了一个同事的 code, 服了他
所有跟帖:
•
文件当然是比较大。
-乱弹-
♂
(0 bytes)
()
02/22/2009 postreply
12:15:50
•
呵呵,要是面试时像那位仁兄那样写code会很危险的。
-吴用先生-
♂
(0 bytes)
()
02/22/2009 postreply
12:25:06
•
帮他~~
-云河-
♀
(0 bytes)
()
02/22/2009 postreply
14:33:05
•
对,帮他! 把 16 G 的 Hash 再分成 4 个 4 G 的就没问题了。
-多哥-
♀
(0 bytes)
()
02/22/2009 postreply
14:36:52
•
其实零内存就可以了。
-乱弹-
♂
(0 bytes)
()
02/22/2009 postreply
14:38:46
•
呵呵乱兄,我是开玩笑。他这样做
-多哥-
♀
(143 bytes)
()
02/22/2009 postreply
14:47:55
•
文件是在另外的机器上,但是网络很快。而且是 offline 的,
-乱弹-
♂
(88 bytes)
()
02/22/2009 postreply
15:12:51
•
嗯,只是不好提起, 因为他没问我。我跟他同时进公司的。
-乱弹-
♂
(0 bytes)
()
02/22/2009 postreply
14:37:25
•
没觉得不好,正确算法是什么呀?
-waitGC-
♀
(0 bytes)
()
02/22/2009 postreply
17:44:58
•
就是开两个 pipelines, 对齐,update 和,积之类。 不是什么高深东西。
-乱弹-
♂
(0 bytes)
()
02/22/2009 postreply
18:53:08