帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

拒绝推断问题?

问题是0、1分类有分类器A,分类器A(也是用于同一分类,暂且认为这个分类器是有效的,好于随机但也不够理想)判断为1以后,才可以知道样本的真实标签,换句话说,样本有两个标签,真实标签和是否通过分类器A。如果没有通过分类器A,那么也没有真实标签。问:现在需要训练分类器B取代分类器A,但可以用的有真实标签的样本是已经通过了分类器A的。现在分类器A已经没有了,而且不可知。如果只用知道样本的真实标签的数据进行训练比如会出现偏差(因为分类器A已经过滤了一部分)。怎么处理这个问题?或者说怎么将原本没有通过A的样本的标签表示出来?

查看全文

二本应届毕业生想要成为一名优秀的数据挖掘工程师?

本人湖南二本数学(信息与计算科学)应届毕业生,考研对外经济贸易大学—数据挖掘与电子商务,分数估计略低复试分数线,调剂的话只能走二本经济类专业。但想成为一名数据挖掘工程师,二战,调剂,工作不知如何抉择,该怎样成长为数据挖掘工程师。

查看全文

数据仓库和数据挖掘有必要学吗?

目前在香港念研究生,一共一年,现在是下学期了,看到有开这门课,这边一门课都是一周才上一次,一共也就十几周,总共这学期这门课的上课时间也就二十几个小时。这门课的大纲是这样的:数据存储和数据挖掘就是XML数据库,模式翻译,模式集成,星型模式,数据立方,数据转换和集成,OLAP,关联规则挖掘,网络挖掘,决策树,聚类,神经网络,遗传算法。一共三个project,一个期中考试,期末考试。相对来说还是很占精力和时间的。各位觉得这么短的时间内,学这门课有必要吗?如果没有必要,我就选另外一个简单的课,留点时间找工作了,毕竟马上就要毕业了。

查看全文

目前的时间序列预测的state of the art 方法?

注意,是时间序列的预测问题(特别是只预测一个y值)。实际问题场景如下描述:首先是时间轴,共5个月,每天中的每个时间段(24个)的y值,然后预测第六个月(或只是第六个月第一周)的每天的24个时间段的y值。这里的y值是类似于某一公园的总客流量这样的变量。因此y值受当天天气、节假日等因素的影响。关于预测方法,我查过之后,得知主要有三类方法:1,线性回归之类的,这类方法我比较熟悉,可以将上述(天气、节假日)的因素提取特征加进去;2,ARIMA类的经典时间序列方法;3,RNN和LSTM等机器学习方法。只是我对2和3了解很少,不知道如何将上述(天气、节假日)的因素提取特征加进去?所以,1:目前这类问题最好的方法是哪一类?2:如果使用LSTM或R […]

查看全文

请问网易游戏(广州)数据挖掘研究员的情况?

求助万能的知乎~前段时间拿到了那边的offer,但是对这个职位一直处于不了解的状态。个人比较喜欢做数据挖掘方面的事情,家也在南方,所以投递了这个职位。有以下一些疑虑,想向知情人士询问:(1) 游戏里的数据挖掘目前似乎还没有发展起来,这方面的资料也较少。是不是从侧面上说明,游戏里的数据挖掘是否相对冷门且起的作用并不大(相较于游戏角色设计、场景设计及相关美工等)?这会不会对今后的职业发展有所限制?(2) 这个职位的主要工作是什么?听说主要是数据的清洗、统计和存储相关,那么是否能用到常用的机器学习方面的模型和算法?有什么应用场景?希望能得到相关人士的回答,非常感谢。

查看全文