Data mining和machine learning这两个领域有哪些交集,有哪些是各自独有的? 举报 理由 举报 取消 2017年8月27日 4 条回复 950 次浏览 学习,数据挖掘,机器,统计学
回复 ( 4 )
下面的数据挖掘是研究的概念。
首先,数据挖掘这个item具体指找出一堆数据里面的隐含信息。由于定义出发点在数据,所以它的指代范围很广——包括根据任务目的来寻找数据来源,数据前期分析,数据建模和定算法,数据清洗和重新组织,数据特征提取,跑模型做实验等等。如果范围在学术上,它就侧重于这个过程中各阶段的研究。
所以数据挖掘研究,并不仅仅局限在算法研究上。只是挖掘算法是当中主流,仅此而已。
其次,由于从数据出发,它没具体定义使用什么手段挖掘。一切手段(包括机器学习以及非机器学习手段),只要能挖掘数据信息的,也可以用于数据挖掘。
所以数据挖掘研究的算法,更侧重于算法对你用的数据的adapt。
相反,机器学习更加在意模型在各种情况下的性质和效果。
同时机器学习的应用比数据挖掘更加泛。因为数据挖掘仅仅是研究提取信息,但机器学习是研究模型和算法本身,而这些模型和算法用来提取信息很多时候只是中间过程,更多时候我们可以用来构建各种高大上的应用。
就像采矿和冶金。
数据挖掘注重对海量数据中有效规则的提炼。
机器学习注重用大量数据训练出来的有效模式。
利用的算法规则大体相似。
data mining 一个广泛的定义, machine learning 是data mining的一种方法