搞 machine learning,等等。
但这么说碰上专家面试,你还是不太容易过关的。比如人家会问你,对于那么多 open source 的 machine learning algorithms,你如何选择,并使你的模型运行更为有效、正确。再比如为什么要 cross-validation,或简单地问你如何着手选择数据,开始你的模型构造,等等。也许会给你预设一组数据,听听你的见解,等等。
最好先找一些比较实际的工作,以你的特长,去搞些容易上手的所谓新东西,求发展。
============
AI 的真正开发应用,不是这么讲的。很多人只是在用现成的模型通过软件来提报告而已,谈不上 AI 。
很多来自统计或数学领域内的专家,变成所谓的 data scientists,但他们都要归于软件自动化系统开发的门下,才有其一技之长得以发挥的余地。直接在生产领域,这些人基本都在应用已开发的分析模型程式,通过模型应用软件在制作报告而已。做的事情,也远远谈不上 AI 的开发或应用。这种情况下,他们的作用,比那些企事业自己长期培养的数据分析师,不会高明到哪里。进一步讲,如果他们用已开发程式, 比如 Google 或 微软以及其它谁家的,根据生产实际需要从数据库整理数据,搞些模型,也同样不会有根本性突破或能产生更为精确的预测结果。因为这些,企事业自己培养的数据分析师,也就是这么一直在做。
所谓软件自动化系统开发,目的在于将整个数据分析平台,归入一个统一的生产流程管理自动化应用软件系统之下。那么数据分析平台所依据的原始数据,就能直接来自于一套经过统一设计并使生产流程规范化的自动化应用软件程式,而不是靠数据分析师们自己,从各个相关生产部门以文件的形式去收集而来。这样,就确保了数据分析平台所需要的原始数据的准确性。
另外,有了这套生产流程管理自动化应用软件系统,所谓的 real-time streaming analytics,也就有了能得以产生的平台和可靠的原始数据。进一步有关特定领域内的智能 (AI)开发,也有了相同意义的可靠数据。其智能产品,也就能对于生产流程管理阶段中输入的实际数据,作出更为正确的在线(real-time)预测或智能化的在线反应。