看到data science 首先要问的是这个问题:
Is data science to be understood as the science of data, or as science with data?
其实两者都包含,发明牛逼的工具来处理data,然后从data中获取有用的知识,反过来再推动工具的发展。
Data science is concerned with all aspects of the creation, management, analysis, and communication of data focusing particularly on the application of computational methods to digital data。
说白了就是data science的目的就是为了从 data 中获取有用的知识。
Data science = Data Curation + Data Analytics,在实际中,人们花费了大部分人的人力金钱和时间在data curation, 我知道花了大概 80% 时间在处理数据上。
由于data science的范围太广了,所以它的工种也是万千种,大家崇拜的 ML/AI也可以归到data science.
Data science并不像紫檀理解的那么低门槛,相反相当的高大上。没有好的data,ML/AI喝西北风。
