帐户注册

登录

找回密码

忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。

如何解决FTRL算法的波动性问题?

Google在2013年提出来Logistic回归的FTRL的online training方法之后,据说很多公司的点击率预测系统都使用了FTRL算法,我们最近也在对FTRL算法做评估,我们发现FTRL在流式的online training的情况下,AUC的波动会比较大,不知道大家有没有遇到过类似的问题?有没有什么好的解决办法呢?

查看全文

机器能学习机器学习吗?

1、机器学习现在有多种算法,很多问题的解决是将这些算法合理地组织起来,再加以训练,本质上是对算法策略的搜索,理论上是否可能训练机器来搜索最优的组合策略?2、进一步地,理论上是否可能以机器学习的算法为训练集,演绎出新的机器学习算法?

查看全文

matlab中gscatter函数多种颜色如何?

在使用MATLAB中遇到一些问题,求教各位在使用MATLAB中的gscatter函数作图的时候,需要对点进行着色。如果用matlab系统提供的关键字的话 只有y,m,c,r,g,b,w,k八种颜色,如果我想使用超过10中颜色进行着色,那么应该如何使用gscatter函数呢?附上我的着色语句:gscatter(output_xi, output_yi, train_labels10 ,’ymcrgbwk’, ‘.’);output_xi output_yi 分别是x,y坐标train_labels10是分成的是个聚类的标号,现在想给将所有的点按照聚类的标号标为10中颜色,请问应该如何操作 […]

查看全文

Distance based outlier detection in large dataset?

如题。 问题是有一个存在硬盘上的数据库,数据库大小约是内存的20倍,其中恰好有一个 outlier, 怎么用furthest nearest neighbor的方法(每个点都有许多neighbors, 把离某点O最近的neighbor与O的距离记作r_O, 这里要求的是找出使r_O最大的O。)找出这个outlier? 要求是数据库的scan次数不超过三次。 (从数据库读入的次数不超过三次, 但是从数据库读入内存后对数据的的读取次数并没有限制)我查了不少文献,也查到了不超过3次scan找出outlier的方法,但是这些方法都需要给定 参数,比方说给定(r,k) (表示某个点O 周围r半径内的object不超过k个则这个点判断 为out […]

查看全文