具体来说就是从几个维度匹配公司的相似度或者说是匹配度 或者说是合作可能性。这个机遇机器学习算法如何实现
查看全文组合数据排序算法问题?
组合数据排序算法问题,254个有位置的数,顺序错乱,分别是 1,2,3 组成。需要得到的结果是从前往后相加为3或者本身自己就是3,求排序方法和排序顺序数值。数据如下:1 2 2 2 1 3 2 3 2 2 3 3 3 3 3 3 1 1 1 1 1 1 2 1 2 1 1 1 1 1 2 2 1 1 2 1 1 1 1 1 2 1 1 1 1 1 1 3 1 1 2 3 3 1 1 1 1 2 2 3 3 3 1 2 1 2 2 3 3 3 1 1 1 1 2 2 1 1 1 1 1 2 2 2 1 1 1 1 2 1 1 1 2 2 1 1 1 1 1 1 2 2 1 1 2 1 1 2 1 1 1 1 1 2 1 1 1 2 2 […]
查看全文机器学习模型如何上线或者online学习?
目前公司模型都是使用R或者PYTHON在线下建好模型,保存好模型参数,然后打包成接口,供JAVA进行调用。 那么现在的问题是:1. 打包上线的模型长期不会进行更新,因为模型参数被固定了,也不会去主动学习新的资料2.模型出现问题很难找出原因。因为JAVA只会报错JAVA的error,不会报出R或者PYTHON的error3. 本地离线建模受到机器配置的限制。经常几个G的数据电脑就会卡死,或者out of memory尝试使用JAVA直接建模,但是发现自己JAVA功底很弱,很难写出像样的算法。。特地想请教下各位前辈:1. 你们是怎么部署模型上线的?2. 怎么使得模型不断的学习新的资料3. 除了打包这种方式,是否还有其他的更好的方式进行上 […]
查看全文支付宝离线支付条形码生成的算法是怎样的??
1. 离线可使用2. 根据一串数字可以获取user信息3. 保证所有用户不生成同样的一串数字4. 可以更新,生成新的一串数字(可以离线手动更新,几秒钟就换一个)怎样的算法能做到这一点?
查看全文有哪些应该去实现一遍的机器学习和自然语言处理的算法?
NLTK和sklearn等python类库已经实现了一项任务中大多数需要的工具。理解算法后也能够应用,包括一些调参的部分。但总感觉工程能力不足,只能流程化得完成一项任务。中间总觉得差点什么。是不是应该去实现一些算法和基础ETL代码来增加编程能力?
查看全文如何准备才能找到数据挖掘方向的工作?
本人工程硕士,研一新生,有一年as3页游开发经验。毕业后希望从事数据挖掘方向工作,如推荐系统方向。目前本人正在学习书籍machine learning in action,以及林轩田老师的机器学习基石课程以入门机器学习。计划在完成这两项后,在dblp上阅读一些KDD,ICML,NIPS,IJCAI,AAAI等相关会议近年的论文,追踪热点。由于目前可能选不到匹配方向的导师,工程硕士也只有1年的时间学习相关知识和准备找工作,不知道怎样学习才能效率最优。列出了以后可能需要学到的知识:学习MapReduce,GPU Computing参加如Kaggle,天池等数据竞赛累计经验实现一些经典算法(用什么语言?)不知道上述是要做加法还是做减法?重 […]
查看全文