帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

有什么常用的数据分析以及数据处理的方法或者书籍?

工作中经常会提取出一堆数据【十万级】在不同维度的特征,这些数据中存在异常点,经验估计异常点数量占比约10%左右,具体在哪些特征上异常未知,并且没有标注数据,我的问题有两个:1)包含比例的特征,比如同样是100%,10/10,和100/100是不同的,有哪些方法可以衡量,2)如何发掘这些数据中比较异常的点?

查看全文

拒绝推断问题?

问题是0、1分类有分类器A,分类器A(也是用于同一分类,暂且认为这个分类器是有效的,好于随机但也不够理想)判断为1以后,才可以知道样本的真实标签,换句话说,样本有两个标签,真实标签和是否通过分类器A。如果没有通过分类器A,那么也没有真实标签。问:现在需要训练分类器B取代分类器A,但可以用的有真实标签的样本是已经通过了分类器A的。现在分类器A已经没有了,而且不可知。如果只用知道样本的真实标签的数据进行训练比如会出现偏差(因为分类器A已经过滤了一部分)。怎么处理这个问题?或者说怎么将原本没有通过A的样本的标签表示出来?

查看全文

我现在努力的结果,仅仅是达到我的家庭就已经达到的高度,甚至还不如,那么我离家独自打拼还有没有意义?

我家里的条件还不错,至于有多好我不多说,也没什么可说。从小就活在“小富二代”“你妈真厉害,你这辈子都不用愁啦”“老板~(平辈之间的玩笑话)”等等这种话,不懂事儿的时候听,还真有点沾沾自喜,但是越长大,就月觉得刺耳,再往后,听到只能干笑。渐渐的竟然开始会觉得有些隐藏得自卑,也许这辈子都活在我家那掌柜的阴影里。我是23岁那年开始决定要自己出去创一番,自己背个包独自一人离家到了杭州,所有的都要靠自己了。也许是教育原因,总觉得很多事情可以用钱解决,但我又排斥用钱解决,所以再工作中生活里,很多未遇到的问题,我都会不知所措无从下手。当然,现在渐渐好了起来,我已经25了。一切都按照自己的想法在成长,仍然会幼稚,仍然会迷茫,会犯蠢。再过一年我就要开 […]

查看全文

在现在社会上学有什么用?

我是一名即将参加中考的考生。每个老师都说中考是比中考还重要,因为中考不可以重新考。但是我感觉就算考上一个好的高中也未必能考上一个好的大学。难道只有学习好才能成才。自己也有很多想法以后想干一票。但是成绩实在是很差。家庭条件也不好。难道一辈子只能过平平淡淡的一生吗??

查看全文

目前的时间序列预测的state of the art 方法?

注意,是时间序列的预测问题(特别是只预测一个y值)。实际问题场景如下描述:首先是时间轴,共5个月,每天中的每个时间段(24个)的y值,然后预测第六个月(或只是第六个月第一周)的每天的24个时间段的y值。这里的y值是类似于某一公园的总客流量这样的变量。因此y值受当天天气、节假日等因素的影响。关于预测方法,我查过之后,得知主要有三类方法:1,线性回归之类的,这类方法我比较熟悉,可以将上述(天气、节假日)的因素提取特征加进去;2,ARIMA类的经典时间序列方法;3,RNN和LSTM等机器学习方法。只是我对2和3了解很少,不知道如何将上述(天气、节假日)的因素提取特征加进去?所以,1:目前这类问题最好的方法是哪一类?2:如果使用LSTM或R […]

查看全文

请问网易游戏(广州)数据挖掘研究员的情况?

求助万能的知乎~前段时间拿到了那边的offer,但是对这个职位一直处于不了解的状态。个人比较喜欢做数据挖掘方面的事情,家也在南方,所以投递了这个职位。有以下一些疑虑,想向知情人士询问:(1) 游戏里的数据挖掘目前似乎还没有发展起来,这方面的资料也较少。是不是从侧面上说明,游戏里的数据挖掘是否相对冷门且起的作用并不大(相较于游戏角色设计、场景设计及相关美工等)?这会不会对今后的职业发展有所限制?(2) 这个职位的主要工作是什么?听说主要是数据的清洗、统计和存储相关,那么是否能用到常用的机器学习方面的模型和算法?有什么应用场景?希望能得到相关人士的回答,非常感谢。

查看全文