【所言】大数据时代的工业搜索引擎

来源: 舒啸 2015-04-06 08:04:13 [] [博客] [旧帖] [给我悄悄话] 本文已被阅读: 次 (5627 bytes)
大数据时代的工业搜索引擎


2008年,谷歌的一个研究团队推出了“谷歌流感趋势”。
在世界顶级科学杂志《自然》上,谷歌宣布无需任何实际医疗数据,仅根据汇总、分析搜索数据,“谷歌流感趋势”近乎实时地对全美的流感疫情进行预测。一时,“谷歌流感趋势”成了大数据的象征。这几年,更有人进而宣称传统数据分析和管理工具已经过时,“统计已死”,甚而“理论的终结”。工业搜索引擎在这“大数据时代”的价值也遭到质疑。

然而,去年另一份世界顶级学术杂志《科学》发表了一份文章,
追踪2011年以来“谷歌流感趋势”的准确性。结果发现,绝大部分月份里,“谷歌流感趋势”的预测是错的,而且错得不是一星半点。自此,“大数据”的哀歌鹊起。而一定范围中,工业搜索引擎的重要性又为人提及。

其实,这些嘈嘈杂杂的喧闹,都至少忽略了两件很基本的原则:

1. “大数据”不等于”大信息“或“大分析”

“大数据”不应该只是“大”,也不应该只是“数据”。“大数据”
应该是海量数据、数据技术、和应用的组合。数据技术又包括了收集、存储、管理、挖掘、分析、可视化等等。大数据之“大”,有四个特征(即所谓大数据的四个V):海量(Volume)、多来源和形式(Variety)、低质量和低密度(Veracity)、高速度(Velocity)。如果不能有效地从数据中通过分析获取信息,再海量的数据也没有价值。

相信谷歌会努力改进“谷歌流感趋势”。“谷歌流感趋势”的现状,
并不是大数据的失败,只是告诉我们大数据需要有大分析才能产生大信息。而我们尚未进入大分析的乐园。或许“数据足够多了的时候,数据自已就会说话”是盲目的乐观。或许传统数据分析方法并未过时,我们需要应用其思想和精髓。或许理论并未终结,而对专业的深刻理解对获取大信息会起关键的作用。

2. 工业搜索引擎和大数据分析要服务的对象、解决的问题、
提供的价值都是不同的。

大数据的特征决定了他在商业上的价值:优化产业客户细分,
能够为所谓“工业4.0” 的个性化和数字化的智能制造服务;模拟真实环境,探索新的需求,提高投资回报率;提高管理链和产业链的效率;寻找隐藏的线索进行产品和服务创新,等等。

工业搜索引擎,尤其是产品设备信息平台,
服务的对象是该行业的专业人员,如设计师、工程师、项目采购人员等,最大的特点是要提供精准可靠的信息。这对于工业搜索引擎的要求是:1) 数据的高度标准化、结构化、参数化;2)引擎提供强大的搜索和细化功能。二者缺一不可。这使得工业搜索引擎,尤其是产品设备信息平台,不同于大数据系统,也在系统功能和数据管理的深度和细化上,为流行的工业黄页望尘莫及。

在大数据时代,工业搜索引擎的价值依旧是无法替代的。
从某种意义上,愈加重要

加跟帖:

  • 标题:
  • 内容(可选项): [所见即所得|预览模式] [HTML源代码] [如何上传图片] [怎样发视频] [如何贴音乐]