经常听别人说在用hadoop、hive的时候会遇到数据倾斜问题,到底什么是数据倾斜,查了各百科都没有查到,好像只有在统计学里有分布的偏度(左偏、不偏,右偏)。难道这个词是民间传出来的?有没有一个确切的定义和解释呢?
查看全文99.99%和100%的差距影响到底有多大?
99.99%和100%的影响真的有那么大么?0.01%真的存在影响么?别说什么下电影99%这类的回答……修改一下,在无线大的基数下,的确会有很大的影响,那∞和∞+1的区别难道就能说是1和0的区别么?
查看全文网络广告商和主流网站合作期如何做到广告的精准投放?
曾经搜索过的内容。会有相关的广告在你下次的使用中弹射出来。身处某地就弹射某地的广告。这在某种意义上是否可以说明你的隐私已经被暴露。主流网站检索过你的信息?
查看全文古代有什么著名的关于估算的故事?
记得以前在哪里看过的,说有人看到通过一些毫不相关的数据或现象就能推测出另一数据。比如说看到树的的直径推测它的树叶数,只是比喻,那文章写得比这玄乎多了。但后面解释其实是说各种现象背后都有一定的相关性 ,古人就是用这样的方法来推测的。这是有点冷门的内容,希望知乎能有人解答。
查看全文如何评价路透社称亚洲最贵城市中国有11个城市上榜,上海跃居亚洲最贵城市头名?
路透社12月10日报道称,ECA国际称,包括香港在内,中国有11个城市上榜。今年,上海从去年的第三跃居亚洲最贵城市头名。亚洲最贵20城中国上榜11个 上海居首北京第二 _法治频道 _光明网;utm_medium=ppc&utm_campaign=onebox全球城市生活成本排名:中国大幅上升 三城位居前十 _法治频道 _光明网个人觉得没那么夸张?尤其是全球排名,北欧无一城市入围,是否并不客观?其实这两条新闻是想抛砖引玉,特别想知道,中国的城市生活成本在世界上到底是怎样的位置。在权重方面,个人觉得肉蛋奶蔬菜、生活日用品、公共交通、两居室租金比电影票、车价、哈根达斯一个球的价格重要。还有的比如优衣库里维斯,在西方廉价但在中国一般 […]
查看全文职业上,数据分析想转机器学习方向,有优势么?
进了一家公司做数据分析,发觉是偏业务的,也会用到到一些传统的机器学习算法和一些数据分析的思路,但是我喜欢的是深度学习,分布式一类的方向,应该怎么做?
查看全文应届生想应聘bat的数据分析或者数据挖掘岗,该如何准备?
题主是一名普通211学校的统计学研二学生,本科专业是渣二本的信息与计算科学。 什么样的条件才是bat这类公司(最好是在成都)所需要的呢?我数据分析和数据挖掘的都会一点,但不深Excel,spss,R,matlab,SQL,Python等这些工具都只能基本能用,没几个学的好的,不百度谷歌的话,只能写点小程序(我说的小程序是指一百行以内的代码 )理论方面还稍微好点,统计的和统计学习的基础知识都还有点,就像机器学习的模型推导在我看来比实用编程亲切多了。 现在在一家大数据公司实习,当然只是名义上的,根本接触不到项目只是在SQL查查数据,或者做做因子分析,k-means聚类,决策树什么的。Hadoop和spark就别想了,当然我也不会。 那么 […]
查看全文本科生如何规划并将自己培养成数据分析师?
某211工业工程(工学)本科生,准备考研。考哪个专业是和数据分析师对口的?管理科学与工程下设大数据下的商务管理方向,不知是否有关。愿前辈不吝赐教
查看全文