发起人:Universe 管理大师

我只有一天的回忆!

回复 ( 4 )

  1. HatMatrix
    理由
    举报 取消

    个人觉得,熟练使用Python/R的数据挖掘框架,能够读C++或者Python/R写的代码,必要的时候能够修改。

    不过我还真见过基本不会写代码人在做所谓的数据挖掘,蛤蛤蛤

  2. 张远
    理由
    举报 取消

    谢壮士邀请。

    懂矩阵,包括空间的概念,模的概念,矩阵的各种分解。

    懂最优化算法,包括图优化,凸优化等。

    懂英文,能看懂最新的工作,熟悉各种专业名词。

    懂概率统计,懂数据库技术,懂微积分,懂算法,懂并行化计算等等等等。

    对数据要敏感,计算所卜东波老师有句话:“算法和雕塑很类似,就像每块石头包含一个雕塑一样,算法使得问题露出本来的面目。”

    数学和英语,是数据挖掘和机器学习等工作的基础。保持不断的实践,才能保持对模型的熟悉。

    我觉得编程能力相比之下算是最不重要的吧。。。

  3. Rorschach
    理由
    举报 取消

    我同意 @张远 先生提到的所有那些理论知识都是重要的,但是那不是全部。 已现实的工作场景来说, 做 Data Mining 的人首先需要有能力处理小规模数据集,熟悉 R 或者 Python 的数据处理工具链。 同时如果是做大规模数据分析的话,主流的大规模数据处理平台总要熟悉一种才行。

    如果编码能力弱,你将会严重的依赖其他 engineer 来帮你提供数据集,帮你把分析结果转化成产品等等。 这些都会严重的影响个人工作的 scope 和效率,所以维持水准以上的编程水平相当重要。

我来回答

Captcha 点击图片更换验证码