logistics回归中,当样本数据量很大时还是否需要regularization正则化以防止过拟合?
查看全文机器学习、数据挖掘有必要拥有坚实的数学基础吗?
之前在知乎看到别人回答说机器学习不想统计那样有严密的数学基础,机器学习预测性很强,但是不容易像统计那样证明,我想在一些对数据很敏感的行业应该还是要求数学基础的,大家怎么看,
查看全文只有机器学习就够了吗?
要实现大家真正先要的那个程度的人工智能,只有机器学习就够了吗?为什么没人开发新的学科?只要继续发明新的机器学习算法就能够达成那种程度的AI了吗?
查看全文机器学习需要读博吗?
现在研一在读,电子科大信号处理方向。但是从本科大四起对机器学习有关注,感兴趣。现在有修机器学习的课程,关于入门的话题已在知乎上看过答案。想问的是,第一,毕竟不是本专业,自己学习的话可能比不上科班出来(?),在考虑是否有必要读博。第二个就是在想自己是否适合读博,当然也搜过相关问题,但还是想问,特别是在看过一个答案说 机器学习真心是给聪明人玩的。这句有点让我引发思考,是否脑子够用?比如现在用书PRML,看英文版稍微有点慢,但多看下还是可以理解。但觉得自己对机器学习还是很感兴趣的,觉得有意思(可能没开始看论文,不知水深浅吧)。第三,如果读博,毕竟不是本专业,怎么参与到论文发表,科研之中,想提高自己申请博士的竞争力。暂时就这些,希望各位前辈 […]
查看全文基于密度的聚类算法,其聚类结果的意义是什么?
这里默认用欧氏距离评价点的相似度。这些聚类算法对数据点的划分是符合“人类直觉”的,如上图的数据集会被划分成一大一小两个簇,但是对于橙色点A及其周围的点而言,它们虽然属于黑色簇,但是平均而言和绿色簇中的点更为相似,对黑色簇整体提取特征的话,结果也会和A的特征大相径庭。此时聚类结果的意义是什么?
查看全文都说现在是数据的时代,那数据造假或误导怎么办?
从每次平均工资,许多国人就有意见就可以看出,当然话也不能那么绝对,尽管也许不造假,可能也是报喜不报忧,把好的数字报上去而隐藏了差的数据那么问题来了,在这个互联网平台,都喜欢把某某数据列表(如销量啊,增产啊,用户量各种等等)挂起来,那么这些数据的来源是哪里,比如说我打开了一个网站,里面挂了该网站或者其它网站的数据增加列表,那么,这个表是谁给的,忽悠你怎么办,毕竟你只是一个用户,这些东西也不可能透明化,你也没他们后台帐号(2333)那么,以后是不是,想要塑造自己的口碑,制造一些舆论,随便挂个不知道从哪里找来的数据就可以了?是不是有监管?
查看全文请问机器学习或者数据挖掘有什么目前很火的研究方向或企业重视的应用?
鄙人研究生一枚,仍没确定好细的研究方向,发现并没有什么科研潜力。现在希望能深入学习一下目前比较火的,企业需要的方向,为找工作而准备。大家有什么好的意见或者建议么?
查看全文sql server、my sql、oracle与hadoop哪个才是未来趋势?到底有什么区别?
自学有一段时间了,除了听到别人说处理数据库的大小不同,就没看出来有什么具体的差别,感觉一直找不到方法,求高手帮忙解答下!
查看全文