这是拜坛贴:想与同好讨论切磋。 刚刚把 Hadoop 搞好(一个node),从 ebay 拍了两台寡机器(总共~120 USD),准备把 cluster 搞好。下一步就是数据模拟 -- 模拟健康照顾行业都数据结构,然后展开数据分析。所有的结构和流程都在 Ubuntu 下。 有愿意探讨的吗?