帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

如何解决FTRL算法的波动性问题?

Google在2013年提出来Logistic回归的FTRL的online training方法之后,据说很多公司的点击率预测系统都使用了FTRL算法,我们最近也在对FTRL算法做评估,我们发现FTRL在流式的online training的情况下,AUC的波动会比较大,不知道大家有没有遇到过类似的问题?有没有什么好的解决办法呢?

查看全文

机器能学习机器学习吗?

1、机器学习现在有多种算法,很多问题的解决是将这些算法合理地组织起来,再加以训练,本质上是对算法策略的搜索,理论上是否可能训练机器来搜索最优的组合策略?2、进一步地,理论上是否可能以机器学习的算法为训练集,演绎出新的机器学习算法?

查看全文

matlab中gscatter函数多种颜色如何?

在使用MATLAB中遇到一些问题,求教各位在使用MATLAB中的gscatter函数作图的时候,需要对点进行着色。如果用matlab系统提供的关键字的话 只有y,m,c,r,g,b,w,k八种颜色,如果我想使用超过10中颜色进行着色,那么应该如何使用gscatter函数呢?附上我的着色语句:gscatter(output_xi, output_yi, train_labels10 ,’ymcrgbwk’, ‘.’);output_xi output_yi 分别是x,y坐标train_labels10是分成的是个聚类的标号,现在想给将所有的点按照聚类的标号标为10中颜色,请问应该如何操作 […]

查看全文

Distance based outlier detection in large dataset?

如题。 问题是有一个存在硬盘上的数据库,数据库大小约是内存的20倍,其中恰好有一个 outlier, 怎么用furthest nearest neighbor的方法(每个点都有许多neighbors, 把离某点O最近的neighbor与O的距离记作r_O, 这里要求的是找出使r_O最大的O。)找出这个outlier? 要求是数据库的scan次数不超过三次。 (从数据库读入的次数不超过三次, 但是从数据库读入内存后对数据的的读取次数并没有限制)我查了不少文献,也查到了不超过3次scan找出outlier的方法,但是这些方法都需要给定 参数,比方说给定(r,k) (表示某个点O 周围r半径内的object不超过k个则这个点判断 为out […]

查看全文

百度大数据部机器学习

我参加了今年的校招,拿到了百度的大数据部机器学习-数据挖掘工程师offer和腾讯的SNG事业群数字音乐部PC客户端开发offer。个人现在倾向于百度 这个offer,但是对百度这个部门是否算是其核心部门以及这个部门的这个职位是否还不错不够了解,我也查过相关的资料,但是没找到满意的,希望了解的给点建议,谢谢~还有,腾讯的这个职位大家如果觉得发展还不错的话也可以提供一些信息,谢谢

查看全文

模式识别用python更好还是matlab?

马上要成为模式识别的研究僧了。现在想知道模式识别用python更好还是matlab?听说模式识别属于机器学习,看网上的博客都是用python之类的~请各位知乎大神各抒己见吧~

查看全文