用户名*
邮箱*
密码*
确认密码*
验证码* 点击图片更换验证码
找回密码
忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。
大数据
建议你从公开课入手。
我们这里正好有一篇文章,推荐你去看下,公开课都是免费高质量的。如果你真对大数据很感兴趣,欢迎关注我们的公众号,ID:idacker
【推荐】9个针对初学者的数据科学公开课
如果你想自学,网络是一个非常好的地方,这里有太多的资源,有大神 Devendra Desale就挑选出了网络公开课中优秀的数据科学课程推荐给大家。
关于这些课程的指导方针:
你需要考虑到需要的条件,决定所需的学时和持续时间看是否适合自己。
所有课程是基于有统计学背景的假设上。
有些课程中需要编程语言或者软件工具当做工具。
The Analytics Edge (麻省理工学院)
水平: Beginners-Expert
学时: 10 – 15小时/周
状态: Archived
持续时间: 12周
需要的条件: 无
工具: R
这是用R来学习数据分析的最好课程。课程提供基于一些业务案例的专题和大量的练习。这个课程对学习时间要求很严格,但是绝对值得。案例包括《点球成金》、eHarmony、弗雷明汉心脏研究,Twitter,IBM Watson和Netflix。通过这些例子,我们会教你以下分析方法:线性回归,逻辑回归,各种树、文本分析、集群化、可视化和优化组合。
地址:The Analytics Edge
数据库 (斯坦福大学)
水平: 初学者
学时: 8 – 10小时/周
状态:Self-paced
持续时间: 10周
工具: SQL、XML查询
如果你要处理数据,数据库是不可避免的。本课程涵盖了数据库设计和数据库管理系统应用程序的使用。它包括广泛覆盖的关系模型,包含XML数据,DTDs模板、XML模板的内容,同时包含查询和转换语言XPath,Xquery和XSLT的内容。课程包括UML中的数据库设计,基于依赖关系和正常形式的相关设计原则。
Home | Stanford Lagunita
编码矩阵:线性代数在计算机科学的应用 (布朗大学)
水平: Beginner-Intermediate
学时: 10 – 14小时/周
工具: Python
线性代数不仅是计算机科学的重要组成,而且机器学习、图形和统计数据都需要。这是一个杰出的课程,将指导你完成真正的案例和python任务。你需要编写程序实现基本矩阵和向量的功能和算法,并使用这些实现任务:二维图形变换、脸变形、人脸检测、图像转换、模糊和边缘检测、图像视角移除、分类肿瘤恶性或良性、整数分解、纠错编码和秘密共享。另一个更基础的课程是德克萨斯奥斯丁大学的LAFF。
Coursera – Free Online Courses From Top Universities
学习数据 (加州理工学院)
水平: Intermediate-Expert
需要的条件: 概率矩阵,微积分
工具: 没有限制
对机器学习爱好者来说这是有史以来最好的公开课。这是机器的学习入门课程(ML),覆盖基本理论、算法和应用程序,但是需要一个有良好的线性代数,微积分和概率背景以及编程技能。教授这门课的是Yaser S.Abu-Mostafa ,他是加州理工学院电气工程和计算机科学教授,不仅是亚马逊里机器学习的畅销书的作者,也是一个会简化学习方法的教授。
Learning From Data
CSCI E-109 Data Science(哈佛扩展学校)
学时: 7 – 12小时/周
持续时间: 16周
工具: Python,d3
非常优秀的课程。本课程介绍五个关键方面的调查方法: 通过data wrangling,清洗和采样得到合适的数据集;数据管理能够快速、可靠访问大数据;探索性数据分析生成假说;基于统计方法如回归和分类来预测;通过可视化、故事和易理解的总结来和他人沟通。
CS109 Data Science
数据科学概论 (华盛顿大学)
需要的条件: 编程
工具: Python,R,SQL
介绍数据科学的基础知识,通过实践经验从大数据中提取价值。本课程教你一些数据科学的基本技术,包括SQL和NoSQL大规模数据管理解决方案(例如 MapReduce和时代),数据挖掘算法(如聚类和关联规则挖掘)和基本统计建模(例如线性和非线性回归)。
网络、人群和市场 (康奈尔大学)
学时: 4 – 8小时/周
工具: 无
这项课程将通过研究社会、经济和技术在世界上是如何连接的基本问题的探索现代生活的相互联系。学生将探索博弈论,互联网结构,社会传播,社会力量传播的普及,信息瀑布。链接分析的另一个重要的知识来源是SNAP。
Networks, Crowds and Markets
数据分析: Take It to the MAX() (DelftX)
水平: Intermediate
学时: 4 – 6小时/周
状态: On-demand
持续时间: 8周
需要的条件:基本的电子表格。
工具: MS-excel,python
即使在大数据时代,有大量的数据分析师还是严重依赖于电子表格收集意见。对于那些想要使用excel增强分析能力的人这是一个优秀的课程。你将深入探究电子表格数据分析:数据透视表,VLOOKUPS,Named ranges,what-if分析,并做出图形——这些将在第一周的课程中讲授。之后,你将学习的电子表格模型的质量,尤其是如何确保您的电子表格保持无差错和强大。最后,你还需要学习Python编程语言,帮助我们分析和操作电子表格中的数据。
Data Analysis: Take It to the Max
(二维码自动识别)
我觉得,打好基本功,学好专业课,考研,上名校,进好的实验室,你会发现,你的师叔伯是业内公司大拿,师兄弟是业内公司小牛,你毕业就能直接去对口部门,这样看,是不是顺很多呢
个人意见。利用课余时间,首先,你要了解什么是大数据,有哪些现有理论研究(研究现状)?其次,大数据已经应用在哪些方面的实际问题,自己是否喜欢做这些方面?尽量不要轻易觉得大数据很热,很好找工作,一厢情愿的想往这个方向发展。有需求才有进展,在你慢慢理清自己思路的同时,也就逐渐清晰自己需要了解以及学习哪些知识了,只停留在“想”的这个激情上,怎么会有成效!祝楼主学习顺利!
投入时间和精力,以兴趣来驱动,由浅入深的学习。
Java语言基础:
Java语言基础、Java流程控制、Java字符串、Java数组与类和对象、数字处理类与核心技术、I/O与反射,多线程、Swing程序与集合类;
HTML、CSS与JavaScript:
PC端网站布局、HTML5+CSS3基础、WebAPP页面布局、原生javascript交互功能开发、Ajax异步交互、jQuery应用;
JavaWeb和数据库:
数据库、javaWeb开发核心、JavaWeb开发内幕;
Linux基础:
Linux安装与配置、系统管理与目录管理、用户与用户组管理、Shell编程、服务器配置、Vi编辑器与Emacs编辑器;
Hadoop生态体系:
Hadoop起源与安装、MapReduce快速入门、Hadoop分布式文件系统、Hadoop文件I/O详解、MapReduce工作原理、MapReduce编程开发、Hive数据仓库工具、开源数据库HBase、Sqoop与Oozie;
Spark生态体系:
Spark部署和运行、Spark程序开发、Spark编程模型、作业执行解析、Spark SQL与DataFrame、深入Spark Streaming、Spark MLlib与机器学习、GraphX与SparkR、spark项目实战、scala编程、Python编程;
Storm实时开发:
storm基本知识、拓扑详解与组件详解、Hadoop分布式系统、spout详解与bolt详解、zookeeper详解、storm安装与集群搭建、storm-starter详解、开源数据库HBase、trident详解;
昵称*
E-Mail*
回复内容*
回复 ( 4 )
建议你从公开课入手。
我们这里正好有一篇文章,推荐你去看下,公开课都是免费高质量的。如果你真对大数据很感兴趣,欢迎关注我们的公众号,ID:idacker
【推荐】9个针对初学者的数据科学公开课
如果你想自学,网络是一个非常好的地方,这里有太多的资源,有大神 Devendra Desale就挑选出了网络公开课中优秀的数据科学课程推荐给大家。
关于这些课程的指导方针:
你需要考虑到需要的条件,决定所需的学时和持续时间看是否适合自己。
所有课程是基于有统计学背景的假设上。
有些课程中需要编程语言或者软件工具当做工具。
The Analytics Edge (麻省理工学院)
水平: Beginners-Expert
学时: 10 – 15小时/周
状态: Archived
持续时间: 12周
需要的条件: 无
工具: R
这是用R来学习数据分析的最好课程。课程提供基于一些业务案例的专题和大量的练习。这个课程对学习时间要求很严格,但是绝对值得。案例包括《点球成金》、eHarmony、弗雷明汉心脏研究,Twitter,IBM Watson和Netflix。通过这些例子,我们会教你以下分析方法:线性回归,逻辑回归,各种树、文本分析、集群化、可视化和优化组合。
地址:The Analytics Edge
数据库 (斯坦福大学)
水平: 初学者
学时: 8 – 10小时/周
状态:Self-paced
持续时间: 10周
需要的条件: 无
工具: SQL、XML查询
如果你要处理数据,数据库是不可避免的。本课程涵盖了数据库设计和数据库管理系统应用程序的使用。它包括广泛覆盖的关系模型,包含XML数据,DTDs模板、XML模板的内容,同时包含查询和转换语言XPath,Xquery和XSLT的内容。课程包括UML中的数据库设计,基于依赖关系和正常形式的相关设计原则。
Home | Stanford Lagunita
编码矩阵:线性代数在计算机科学的应用 (布朗大学)
水平: Beginner-Intermediate
学时: 10 – 14小时/周
状态: Archived
持续时间: 10周
需要的条件: 无
工具: Python
线性代数不仅是计算机科学的重要组成,而且机器学习、图形和统计数据都需要。这是一个杰出的课程,将指导你完成真正的案例和python任务。你需要编写程序实现基本矩阵和向量的功能和算法,并使用这些实现任务:二维图形变换、脸变形、人脸检测、图像转换、模糊和边缘检测、图像视角移除、分类肿瘤恶性或良性、整数分解、纠错编码和秘密共享。另一个更基础的课程是德克萨斯奥斯丁大学的LAFF。
Coursera – Free Online Courses From Top Universities
学习数据 (加州理工学院)
水平: Intermediate-Expert
学时: 10 – 14小时/周
状态: Archived
持续时间: 10周
需要的条件: 概率矩阵,微积分
工具: 没有限制
对机器学习爱好者来说这是有史以来最好的公开课。这是机器的学习入门课程(ML),覆盖基本理论、算法和应用程序,但是需要一个有良好的线性代数,微积分和概率背景以及编程技能。教授这门课的是Yaser S.Abu-Mostafa ,他是加州理工学院电气工程和计算机科学教授,不仅是亚马逊里机器学习的畅销书的作者,也是一个会简化学习方法的教授。
Learning From Data
CSCI E-109 Data Science(哈佛扩展学校)
水平: Beginners-Expert
学时: 7 – 12小时/周
状态: Archived
持续时间: 16周
需要的条件: 无
工具: Python,d3
非常优秀的课程。本课程介绍五个关键方面的调查方法: 通过data wrangling,清洗和采样得到合适的数据集;数据管理能够快速、可靠访问大数据;探索性数据分析生成假说;基于统计方法如回归和分类来预测;通过可视化、故事和易理解的总结来和他人沟通。
CS109 Data Science
数据科学概论 (华盛顿大学)
水平: Beginner-Intermediate
学时: 10 – 14小时/周
状态: Archived
持续时间: 10周
需要的条件: 编程
工具: Python,R,SQL
介绍数据科学的基础知识,通过实践经验从大数据中提取价值。本课程教你一些数据科学的基本技术,包括SQL和NoSQL大规模数据管理解决方案(例如 MapReduce和时代),数据挖掘算法(如聚类和关联规则挖掘)和基本统计建模(例如线性和非线性回归)。
Coursera – Free Online Courses From Top Universities
网络、人群和市场 (康奈尔大学)
水平: Beginners-Expert
学时: 4 – 8小时/周
状态: Archived
持续时间: 10周
需要的条件: 无
工具: 无
这项课程将通过研究社会、经济和技术在世界上是如何连接的基本问题的探索现代生活的相互联系。学生将探索博弈论,互联网结构,社会传播,社会力量传播的普及,信息瀑布。链接分析的另一个重要的知识来源是SNAP。
Networks, Crowds and Markets
数据分析: Take It to the MAX() (DelftX)
水平: Intermediate
学时: 4 – 6小时/周
状态: On-demand
持续时间: 8周
需要的条件:基本的电子表格。
工具: MS-excel,python
即使在大数据时代,有大量的数据分析师还是严重依赖于电子表格收集意见。对于那些想要使用excel增强分析能力的人这是一个优秀的课程。你将深入探究电子表格数据分析:数据透视表,VLOOKUPS,Named ranges,what-if分析,并做出图形——这些将在第一周的课程中讲授。之后,你将学习的电子表格模型的质量,尤其是如何确保您的电子表格保持无差错和强大。最后,你还需要学习Python编程语言,帮助我们分析和操作电子表格中的数据。
Data Analysis: Take It to the Max
(二维码自动识别)
我觉得,打好基本功,学好专业课,考研,上名校,进好的实验室,你会发现,你的师叔伯是业内公司大拿,师兄弟是业内公司小牛,你毕业就能直接去对口部门,这样看,是不是顺很多呢
个人意见。利用课余时间,首先,你要了解什么是大数据,有哪些现有理论研究(研究现状)?其次,大数据已经应用在哪些方面的实际问题,自己是否喜欢做这些方面?尽量不要轻易觉得大数据很热,很好找工作,一厢情愿的想往这个方向发展。有需求才有进展,在你慢慢理清自己思路的同时,也就逐渐清晰自己需要了解以及学习哪些知识了,只停留在“想”的这个激情上,怎么会有成效!祝楼主学习顺利!
投入时间和精力,以兴趣来驱动,由浅入深的学习。
Java语言基础:
Java语言基础、Java流程控制、Java字符串、Java数组与类和对象、数字处理类与核心技术、I/O与反射,多线程、Swing程序与集合类;
HTML、CSS与JavaScript:
PC端网站布局、HTML5+CSS3基础、WebAPP页面布局、原生javascript交互功能开发、Ajax异步交互、jQuery应用;
JavaWeb和数据库:
数据库、javaWeb开发核心、JavaWeb开发内幕;
Linux基础:
Linux安装与配置、系统管理与目录管理、用户与用户组管理、Shell编程、服务器配置、Vi编辑器与Emacs编辑器;
Hadoop生态体系:
Hadoop起源与安装、MapReduce快速入门、Hadoop分布式文件系统、Hadoop文件I/O详解、MapReduce工作原理、MapReduce编程开发、Hive数据仓库工具、开源数据库HBase、Sqoop与Oozie;
Spark生态体系:
Spark部署和运行、Spark程序开发、Spark编程模型、作业执行解析、Spark SQL与DataFrame、深入Spark Streaming、Spark MLlib与机器学习、GraphX与SparkR、spark项目实战、scala编程、Python编程;
Storm实时开发:
storm基本知识、拓扑详解与组件详解、Hadoop分布式系统、spout详解与bolt详解、zookeeper详解、storm安装与集群搭建、storm-starter详解、开源数据库HBase、trident详解;