Google在2013年提出来Logistic回归的FTRL的online training方法之后,据说很多公司的点击率预测系统都使用了FTRL算法,我们最近也在对FTRL算法做评估,我们发现FTRL在流式的online training的情况下,AUC的波动会比较大,不知道大家有没有遇到过类似的问题?有没有什么好的解决办法呢?
查看全文机器能学习机器学习吗?
1、机器学习现在有多种算法,很多问题的解决是将这些算法合理地组织起来,再加以训练,本质上是对算法策略的搜索,理论上是否可能训练机器来搜索最优的组合策略?2、进一步地,理论上是否可能以机器学习的算法为训练集,演绎出新的机器学习算法?
查看全文如果想去南大周志华教授那里读研,应该如何准备呢?
本人目前在SHU通信工程读大一,对机器学习非常感兴趣,对就业前景不敏感,想要读到博士。请考上的知友分享一下人生经验。
查看全文matlab中gscatter函数多种颜色如何?
在使用MATLAB中遇到一些问题,求教各位在使用MATLAB中的gscatter函数作图的时候,需要对点进行着色。如果用matlab系统提供的关键字的话 只有y,m,c,r,g,b,w,k八种颜色,如果我想使用超过10中颜色进行着色,那么应该如何使用gscatter函数呢?附上我的着色语句:gscatter(output_xi, output_yi, train_labels10 ,’ymcrgbwk’, ‘.’);output_xi output_yi 分别是x,y坐标train_labels10是分成的是个聚类的标号,现在想给将所有的点按照聚类的标号标为10中颜色,请问应该如何操作 […]
查看全文数学和行业经验在机器学习、人工智能领域中的作用有多大?
看到知乎上很多人都在讲算法,计算机语言、数据仓库的作用很大,我就想问问 数学和行业经验有多少重要性,另外还有什么很重要
查看全文Distance based outlier detection in large dataset?
如题。 问题是有一个存在硬盘上的数据库,数据库大小约是内存的20倍,其中恰好有一个 outlier, 怎么用furthest nearest neighbor的方法(每个点都有许多neighbors, 把离某点O最近的neighbor与O的距离记作r_O, 这里要求的是找出使r_O最大的O。)找出这个outlier? 要求是数据库的scan次数不超过三次。 (从数据库读入的次数不超过三次, 但是从数据库读入内存后对数据的的读取次数并没有限制)我查了不少文献,也查到了不超过3次scan找出outlier的方法,但是这些方法都需要给定 参数,比方说给定(r,k) (表示某个点O 周围r半径内的object不超过k个则这个点判断 为out […]
查看全文百度大数据部机器学习
我参加了今年的校招,拿到了百度的大数据部机器学习-数据挖掘工程师offer和腾讯的SNG事业群数字音乐部PC客户端开发offer。个人现在倾向于百度 这个offer,但是对百度这个部门是否算是其核心部门以及这个部门的这个职位是否还不错不够了解,我也查过相关的资料,但是没找到满意的,希望了解的给点建议,谢谢~还有,腾讯的这个职位大家如果觉得发展还不错的话也可以提供一些信息,谢谢
查看全文假如知乎要把每個話題分難易度 機器學習要怎麼理解某個話題所包含的知識背景在某些領域中的難易程度?
學習數學一定要先理解加法再理解減法、乘法、除法、四則運算再來才能理解方程式等等 透過這些關係可以建構一個知識樹那怎麼透過計算機判斷我現在問的這個問題跟他的回答可能會在知識樹的哪個位置
查看全文模式识别用python更好还是matlab?
马上要成为模式识别的研究僧了。现在想知道模式识别用python更好还是matlab?听说模式识别属于机器学习,看网上的博客都是用python之类的~请各位知乎大神各抒己见吧~
查看全文