帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

如何获得足够多正负样本进行大数据征信?

有个问题不太理解,大多数人都在说大数据征信如何提取特征可以提升预测能力,但是实际的业务问题是,在互联网上,没有信用卡的人很多(比如学生),没有在平台上借贷过的人也很多(比如二三线的用户),如何获得足够多带有正负label的样本来进行机器学习呢?如何进行实际业务的冷启动呢?

查看全文

如何看待互联网公司市值过高的问题?

神州专车自去年1月28日正式推出,7月1日完成2.5亿美元的A轮融资,9月17日再完成5.5亿美元B轮融资,神州专车用8个月的时间拿下8亿美元融资,创造了中国互联网公司前两轮融资时间最短、金额最高的纪录。同时,相比于A轮融资时12.5亿美元的估值,神州专车B轮融资时估值达35.5亿美元,增长了2倍多。可是事实上市场占有率以及推广方面的变化并不大。其实神舟专车还是属于非常不错的,毕竟实有资产以及从业人员都是真实存在的,陌陌估值30亿美元,大众点评美团150亿美金,支付宝400亿+美金,除了少数开始盈利的,百分之九十的互联网企业还没有正式盈利,某二手车交易平台成交量不足一千笔,且中间问题多多,就这样估值20亿美金,我想问,针对这系列的泡 […]

查看全文

物品相似度计算?

最近在学习推荐系统,想问下,有没有在bat做过类似的工作的朋友。计算物品相似度是用什么来写的?是直接拿mapreduce或spark通过余弦或者同现矩阵的方式实现的吗?还是用mahout写的呢?坐等~~~~~~~~~~~~~~~

查看全文