1. 欧氏距离 2. 曼哈顿距离 3. 切比雪夫距离 4. 闵可夫斯基距离 5. 标准化欧氏距离 6. 马氏距离 7. 夹角余弦 8. 汉明距离 9. 杰卡德距离 & 杰卡德相似系数 10. 相关系数 & 相关距离 11. 信息熵
查看全文Pandas如何将Series的复合索引提取为列?
使用Python的Pandas库处理数据,现在有一个DataFrame,比如TMP=DataFrame({‘key1’:[‘A’,’B’,’A’,’B’],’key2′:[‘X’,’X’,’X’,’X’],’key3′:[1,2,3,4]}),执行TMP=TMP.groupby([‘key1′,’key2’]).sum(),之 […]
查看全文提取的csv文件出了问题。?
具体是这样的,原数据在表格中有4400行,但是用r语言读取了XX.CSV以后,变成了只有3800行。我用fix(XX)以后发现少掉的那些是缺失值,但是用excel打开该文件后发现那些在r中的缺失值其实不是缺失的,就是他读取上去了以后变成了缺失的。不懂这是为什么,这些数据是含有中文的分类属性
查看全文主元分析方法中特征向量选取的问题?
主元分析方法中,对主元特征向量的选取一般按照累计方差贡献率达到85%所对应的特征向量作为主元,但是查阅了很多资料,也没有很具体的介绍为什么要设定为85%,只有人模糊地说,达到85%就说明保留了主要的信息,我想弄明白为什么要这样选择,或者想研究研究怎么样选取主元特征比较合适。。
查看全文如何评价 MIT Deep Learning 这本书?
很多人都推荐说 MIT 的 Deep Learning 是比较权威的一本学习 深度学习 的书。 大家怎么看?此书还未出版,详见官方网站 : Deep Learning
查看全文在 NBA 球队中谋求一份数据分析师相关的工作可行性大吗?
本人本科数学系,目前大四,未来的工作选择上很希望可以用数学处理自己喜欢的领域,比如篮球。由此联想到是否可以在未来从事NBA数据分析相关的工作。虽然大致上知道目前美国各类职业体育都越来越重视数据分析的力量,但具体到一家NBA球队而言,他们对这个职位重视到什么程度呢?会专门雇佣数据分析师么?还是说对这份工作的人选有什么特别的背景要求么(比如要求有篮球运动背景)?另外,我目前的规划是先在美国读一个Data Science的Master,再去找这样一份工作,不知道有没有人可以对此提供更具体的建议或者career path?谢谢!
查看全文