如题用excel或者access直接读文件都是可以自动转换成正确格式的,但是尝试用Python读取的时候尝试了各种代码,读出来的数据都并成一坨,不能很好地分割,求大神指教T^T
查看全文如何解决FTRL算法的波动性问题?
Google在2013年提出来Logistic回归的FTRL的online training方法之后,据说很多公司的点击率预测系统都使用了FTRL算法,我们最近也在对FTRL算法做评估,我们发现FTRL在流式的online training的情况下,AUC的波动会比较大,不知道大家有没有遇到过类似的问题?有没有什么好的解决办法呢?
查看全文请问,怎么从客观了解、分析BI工具?
最近在了解一些BI开源工具,例如pentaho、spa ngobi,自己对Mstr,tableau等一些商业工具有一定了解,但是突然间去分析一些开源工具,却没有一个好的认知BI工具方案。请各位大神加入这个问题。
查看全文机器能学习机器学习吗?
1、机器学习现在有多种算法,很多问题的解决是将这些算法合理地组织起来,再加以训练,本质上是对算法策略的搜索,理论上是否可能训练机器来搜索最优的组合策略?2、进一步地,理论上是否可能以机器学习的算法为训练集,演绎出新的机器学习算法?
查看全文matlab中gscatter函数多种颜色如何?
在使用MATLAB中遇到一些问题,求教各位在使用MATLAB中的gscatter函数作图的时候,需要对点进行着色。如果用matlab系统提供的关键字的话 只有y,m,c,r,g,b,w,k八种颜色,如果我想使用超过10中颜色进行着色,那么应该如何使用gscatter函数呢?附上我的着色语句:gscatter(output_xi, output_yi, train_labels10 ,’ymcrgbwk’, ‘.’);output_xi output_yi 分别是x,y坐标train_labels10是分成的是个聚类的标号,现在想给将所有的点按照聚类的标号标为10中颜色,请问应该如何操作 […]
查看全文数学和行业经验在机器学习、人工智能领域中的作用有多大?
看到知乎上很多人都在讲算法,计算机语言、数据仓库的作用很大,我就想问问 数学和行业经验有多少重要性,另外还有什么很重要
查看全文电动汽车的运行数据有哪些价值可以深入挖掘?
电动汽车的日常运行数据,主要是启动,关闭,充电开始,充电结束这些时刻的整车和电池的数据,没有位置信息,没有驾驶员信息。
查看全文Distance based outlier detection in large dataset?
如题。 问题是有一个存在硬盘上的数据库,数据库大小约是内存的20倍,其中恰好有一个 outlier, 怎么用furthest nearest neighbor的方法(每个点都有许多neighbors, 把离某点O最近的neighbor与O的距离记作r_O, 这里要求的是找出使r_O最大的O。)找出这个outlier? 要求是数据库的scan次数不超过三次。 (从数据库读入的次数不超过三次, 但是从数据库读入内存后对数据的的读取次数并没有限制)我查了不少文献,也查到了不超过3次scan找出outlier的方法,但是这些方法都需要给定 参数,比方说给定(r,k) (表示某个点O 周围r半径内的object不超过k个则这个点判断 为out […]
查看全文