大数据分析挖掘,了解原理、算法、思路、最后是自己学习开发相关软件。希望给我推荐几本入门级书籍?

理由
举报 取消

求大数据分析挖掘入门级书籍,去了解它并使用相关的语言开发学习领悟其中的原理.

2017年6月25日 2 条回复 1194 次浏览

发起人:Skyfancy 初入职场

回复 ( 2 )

  1. 匿名用户
    理由
    举报 取消

    转载请注明:原作者北风教育社区小编

    一、入门级

    1、《大数据时代》[英] 维克托•迈尔•舍恩伯格(Viktor Mayer-Schönberger) / 周涛译 / 浙江人民出版社 / 2012-12

    《大数据时代》是国外大数据系统研究的先河之作,本书作者维克托•迈尔•舍恩伯格被誉为“大数据商业应用第一人”,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历,早在2010年就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。维克托最具洞见之处在于,他明确指出,大数据时代最大的转变就是“放弃对因果关系的渴求,而取而代之关注相关关系”。也就是说只要知道“是什么”,而不需要知道“为什么”。这颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。本书认为大数据的核心就是预测。大数据将为人类的生活创造前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。书中展示了谷歌、微软、亚马逊、IBM、苹果、facebook、twitter、VISA等大数据先锋们最具价值的应用案例。让人知道大数据究竟有什么作用。

    2、《大数据思维与决策》[美]伊恩·艾瑞斯 / 宫相真 / 人民邮电出版社 /
    2014-9-1

    没有数字就没有真相!传统的社会专家靠直觉,甚至是个人感情好恶来做研究,而未来属于数字。统计是一个非常强大的研究社会问题的手段。NCAA篮球中有没有球队参与赌球?拉斯维加斯的一个赌博项目是每场比赛的胜负分差(Point
    Spread)?比如宾夕法尼亚大学对哈佛大学,赌场开出的分差是14.5分,也就是说如果你押宾大,他们必须赢至少15分你才能赌赢。如果你考察每场比赛的实际分差,和赌场事先开出来的比赛分差,其相差值几乎完美地符合正态分布(平均值是0)。这样一来,正好有50%的时候,胜者实际赢了对手多少分比赌场预测值高,50%的时候比预测值低。也就是说赌博的赔率几乎是50%,这种50%概率正是赌场最喜欢的赌赢概率。

    3、《大数据》涂子沛 / 广西师范大学出版社 / 2013-4-1

    正在到来的数据革命,以及它如何改变政府、商业与我们的生活的呢本书通过讲述美国半个多世纪信息开放、技术创新的历史,以别开生面的经典案例——奥巴马建设“前所未有的开放政府”的雄心、公共财政透明的曲折、《数据质量法》背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,以及云计算、Facebook和推特等社交媒体、Web3.0与下一代互联网的未来图景等等,为您一一细解,数据创新给公民、政府、社会带来的种种挑战和变革。

    美国是全书主体,但又处处反观中国当下的现实。回望中国,胡适批评“差不多先生”,黄仁宇求索“数目字管理”,作者从太平洋对面看到中美两国的差距,深知中国缺少什么、需要什么,故将十多年观察、思索所得,淘洗成这一本书。

    入门级还会有更新,请继续等待。。。。。。

    二、专业级

    1、《Hadoop权威指南 (第2版)(中文版)》Tom White / 周敏奇、王晓玲、金澈清、钱卫宁、周傲英 / 清华大学出版社 / 2011-7

    《Hadoop权威指南(第2版)(修订•升级版)》从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。全书共16章,3个附录,涉及的主题包括:Haddoop简介;MapReduce简介;Hadoop分布式文件系统;Hadoop的I/O、MapReduce应用程序开发;MapReduce的工作机制;MapReduce的类型和格式;MapReduce的特性;如何构建Hadoop集群,如何管理Hadoop;Pig简介;Hbase简介;Hive简介;ZooKeeper简介;开源工具Sqoop,最后还提供了丰富的案例分析。

    《Hadoop权威指南(第2版)(修订•升级版)》是Hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行Hadoop集群。

    2、《数据新闻概论:操作理念与案例解析》 /方洁编/ 中国人民大学出版社/ 2015-6

    数据新闻虽然是近年来新兴的新闻业务,但与之相关的精确新闻报道和计算机辅助新闻报道等课程在西方高校早已于上世纪80年代即得到开展。如今,大数据时代的到来促使新闻从业者必须提升自己的专业技能,具备数据分析和数据叙事的能力。以美国为例,许多新闻传播院系都把培养学生的数据分析技能视为重要目标,如西北大学梅迪尔学院自从2008年起已经开始有“程序员记者”毕业,该项目招收程序员背景的人来学习新闻报道与写作。雪城大学纽豪斯学院甚至强制在校生至少学习一门与数据分析相关的课程,否则无法毕业。哥伦比亚大学新闻学院2011年开始招收学生,攻读计算机科学与新闻理学双硕士学位,通过工程学院和新闻学院的合作,帮助学生掌握如何在计算机支持下从事新闻采访和数字媒体制作等技能。

    还会更新,请继续等待。。。。。。

  2. moozik
    理由
    举报 取消

    数据挖掘入门书籍,也是非常难看懂得,需要各种数学功底,统计学,算法,我买了本经典数据挖掘书籍,根本看不懂

我来回答

Captcha 点击图片更换验证码