现在大数据很热,有陆续冒出来很多数据交易平台,有之前广告看到的发源地数据交易平台,还有电话接到的贵阳大数据交易平台,请问大家网站的行为数据更适合在哪个平台上交易?都说很有价值。
查看全文为什么beta分布可以写成二项分布的和,gamma分布可以写成泊松分布的和?
如题。看过关于gamma表示成指数函数和的解释,两个都是连续性分布还比较好理解,但是连续型分布能表示成离散型的和,本质原因是什么呢?泊松分布和二项分布之间的关系,可否类推到gamma和beta之间?
查看全文Python 3 网络爬虫学习建议?
如题,题主python只是比较熟悉numpy和scipy、matplotlib这三个包,都是做科研的时候在用。最近心血来潮自己写了几个机器学习算法,然后想去网站上去爬一些东西玩玩,因为以后可能会想把它接到自己还没写完的自动交易程序里,但也只是个雏形,还有很长的路要走。但在办公室琢磨了一下午,发现网络爬虫这里又是个大坑,现阶段了解的就是scrapy其实并不适合python3,于是我现在只是在学习requests和beautifulsoup这俩包了。想请教网络爬虫这一块的行家,有没有什么推荐看的教程或者教学、博客什么的,真的想在这块在仔细学习一下。先谢过啦!
查看全文运筹学IEOR如何转型data science(机器学习machine learning)?
本人正在在读运筹学IEOR的研究生,本来是应该注重在supply chain中的分析应用,但是在偶然的机会下在工作中上了一些machine learning的公开课,粗略入门了一下,目前只能做一个入门python调包侠,所以想问一下以后如何更深入地学习一下machine learning相关的知识。虽然知道找工程师,data scientist 之类的工作与科班出身的同学很难竞争,但是如果能够独立比较好地解决一些问题,找一下相关IT/DATA consultant之类的职位可能更合适一些,想必各位大牛也看不上吧LOL 另外发现在Supply Chain领域中弄六西格玛优化的时候发现machine learning的一些方法还真能起到 […]
查看全文如何用R语言画广东省地图(划分出21个地级市的边界)?
问题描述:除了画出广东省的轮廓,还要画出广东省21个地级市的边界,我按照这篇文章的做法:Editor: R绘制中国地图,并展示流行病学数据画出来的图是这样的:画出来的边界划分太详细了,我试着先画出各个地级市的图,再用ggplot2添加在一起,貌似数据有缺失,请问要怎么画?求大家推荐一些相关文章,或者给一点思路.问题已解决,参见@Allen Shen的回答,感谢各位的关注和回答。
查看全文未来想做大数据+金融方面的结合,应该如何拓展自己的技能树?
去年自己国内top5数学系本科毕业,现在美国top30大学data science研究生,数学很有信心,统计不错(不算最顶尖),会写java, python(数据结构水平,多线程那些不懂,汇编不懂),熟练MySQL, R,另外hadoop, spark刚入门,熟练机器学习和数据挖掘模型,包括文本挖掘(可以自己用java, python, R)中的任何一门语言实现。现在在和一个老师做网络数据的分析,准备投今年的ACM IMC会议。暑假在纽约一个小的金融机构做data analyst实习。自己以后肯定回国,目标是1:类似于阿里巴巴大数据平台,蚂蚁金服之类的部门 2:基金或者银行的数据挖掘岗位 3:国内的量化基金 请问一下自己应该在哪方面 […]
查看全文大规模图数据划分方法的资料/书籍怎么找?
发现百度这个只有笼统的,找不到详细介绍的,该搜什么或从哪些书籍可以看到关于这方面知识的?要是有异构图划分的就更好
查看全文