帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

毕业的时候去投数据挖掘有戏吗,该如何定位自己?

刚刚研一3个月,本科某理工985信息工程,C9(非清北)软院的双证硕士(两年制),想知道现在这样的水平毕业的时候找数据挖掘岗位(偏向代码的不是做分析的)还有戏吗?Java(jdk源码只读过基本的List和Map部分),会使用spring,mybatis(仅仅是使用)。数据结构:PAT刷过一半advanced级别(没有全部完全做对)机器学习:coursera上的机器学习课程全部看完。入门的算法基本能够推导,支持向量机还不能解出那个凸优化。但是能够理解核函数是如何产生的。python:熟练掌握和使用里面numpy库,最近写了一个文章句子重要性排名的小demo(400行,把文章生成图,用pagerank算法算出信息量比较大的句子),最后在 […]

查看全文

求问如何保证文本的特征向量维数一样大?

问题:目前在做微博聚类,对微博分词之后,采用Google开源的Word2Vec进行词向量的训练,每个词对应一个1*N维的向量,然后对微博进行关键 词提取,由于微博的长度不一致导致会产生每个微博提取出来的关键词个数不同,怎么才能保证每条微博由关键词词向量构成的特征向量维数一样呢?除了将每个词 向量加起来求平均还没有有其他方法?

查看全文

在阿里做机器学习是一种怎样的体验?

阿里哪些团队使用机器学习比较多,主要的业务场景,以及使用了哪些机器学习技术?工作方式是怎样的?团队氛围如何?————————-更新分割线(2015.9.26)————————–几个答案以及大家的赞同,都是在说机器学习在阿里的应用不够广泛和深入,之前也听一些阿里的同学吐槽过。以阿里的体量,有些业务是绕不开机器学习的,比如,广告,搜索等,想知道这些部门的相关团队的积累和氛围如何,期待更多答案。这个问题还是只用来讨论机器学习在阿里的使用, […]

查看全文