NLTK和sklearn等python类库已经实现了一项任务中大多数需要的工具。理解算法后也能够应用,包括一些调参的部分。但总感觉工程能力不足,只能流程化得完成一项任务。中间总觉得差点什么。是不是应该去实现一些算法和基础ETL代码来增加编程能力?
查看全文怎样看阿里巴巴的后台数据?
想做变频器在网络销售情况的分析。淘宝有数据魔方和知己知彼可以查淘宝上的销售数据,阿里巴巴上的销售数据有什么办法查呢?
查看全文国内有哪些专注于做数据的公司?
研究生毕业面临找工作,想找数据挖掘、机器学习方面的工作。目前国内有哪些专注于做数据挖掘的公司?除了37degree、星环科技,还有别的公司么?能否对比一下?
查看全文有没有能够获取任意两个词同时出现的概率的数据库?
类似我在百度上搜索这个:“有向无环图” “前额叶皮质”引号不能去掉,否则关键词会被拆分。只能搜到8个结果。这两个词同时出现的概率应该是相当低了。我想要大量调用这个功能,估计用百度调用次数多了肯定会被限制,有没有什么地方能够下载这种数据库或者无限调用这个东西?不需要非常全,只要能大幅度减少调用百度的次数就行了。
查看全文机器学习和.net web开发选哪个方向?
我是研二的学生,自己在学习机器学习,看了一遍Andrew NG的视频,他的讲义刷了两遍,讲义中的公式基本都自己推导过,然后看了两遍李航老师的《统计学习方法》。目前正在看《机器学习实战》这本书,用python把算法一一实现一遍。我本来计划找个机器学习的实习岗位,但看了很多公司的实习岗位要求我都没达到,感觉比较难。 最近老师给我推荐了一个实习,是做.net web开发的,做前端的。 我目前非常纠结,我非常需要一个实习经验,因为我的机器学习是我自己完全凭兴趣自学的,没有项目经验。而这个.net web的开发实习机会又跟我想做的机器学习相去甚远。我喜欢数学,当时选择机器学习这个方向就是因为舍不下这么多年学的数学。 请各位赐教,谢谢。R […]
查看全文如何准备才能找到数据挖掘方向的工作?
本人工程硕士,研一新生,有一年as3页游开发经验。毕业后希望从事数据挖掘方向工作,如推荐系统方向。目前本人正在学习书籍machine learning in action,以及林轩田老师的机器学习基石课程以入门机器学习。计划在完成这两项后,在dblp上阅读一些KDD,ICML,NIPS,IJCAI,AAAI等相关会议近年的论文,追踪热点。由于目前可能选不到匹配方向的导师,工程硕士也只有1年的时间学习相关知识和准备找工作,不知道怎样学习才能效率最优。列出了以后可能需要学到的知识:学习MapReduce,GPU Computing参加如Kaggle,天池等数据竞赛累计经验实现一些经典算法(用什么语言?)不知道上述是要做加法还是做减法?重 […]
查看全文