用户名*
邮箱*
密码*
确认密码*
验证码* 点击图片更换验证码
找回密码
忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。
本文会给大家讲解:从入门到精通:如何用图表做好数据分析?
随着精益化运营的概念不断深入人心,数据分析已经成为了互联网人的必修课。相比于高深的概率统计、算法模型,简单、直观的图表工具得到了更为广泛的应用。
那么图表都有哪些类型?不同类型的图表又该怎么用?在这篇文章中我们结合互联网产品和运营的业务需求,由浅入深地给大家解答这些问题。
Part 1 | 初阶:维度和指标
初阶的图表简单易懂,能满足简单的数据分析需求,具体包括趋势、频数、比重、表格等类型。图表数据分析的前提就是将自己需要呈现的指标,以一定的维度拆分,在坐标系中以可视化的方式呈现出来。
1. 趋势图
趋势分析是最基础的图表分析,包括线图、柱状图、堆积图等多种形式。
线图可以观察一个或者多个数据指标连续变化的趋势,也可以根据需要与之前的周期进行同比分析。柱状图可以观察某一事件的变化趋势;如果将整体拆分可以做成堆积图,同时观察到部分所占比重及变化趋势。
图 1 – GrowingIO
图 2 – GrowingIO
产品经理和运营人员通过趋势图分析流量的实时走向,如每日 pv、uv、DAU 等基本数量指标以及停留时长、平均访问页面数等质量指标,可以及时把握产品的变化趋势。一旦趋势周期对比发生异常(异常高和异常低),我们需要及时介入排查原因、解决问题。
2. 频数图
根据业务需求对指标按照一定维度拆分,对比不同组别的频数,便于分清轻重缓急。
图 3 – GrowingIO
条形图清晰展示了用户在不同类别上的频数,并且按照数量从大到小排序。上图展示的是某产品用户使用浏览器的频数分布,在资源有限的情况下产品可以先适配 Chrome 和 IE 浏览器以提升绝大部分用户体验。
图 4 – GrowingIO
上面的双向条形图展示了某 B 端产品的客户平均停留时长极端情况(非常高和非常低),企业 1-5 非常活跃,可以让运营人员促进客户增购、续约,而企业 6-10 活跃度非常低,即将流失,需要运营人员立刻介入干预。
3. 比重图
比重分析主要是用来了解不同部分占总体的比例。横向比较,扇形图、环形图可以满足这类需求;纵向比较,百分比堆积图可以显示不同部分所占比例的趋势变化。
图 5 – GrowingIO
图 6 – GrowingIO
环形图(图 5)显示了某节点访问用户来源渠道比例,百分比堆积图(图 6)则动态显示了不同渠道比例的变化趋势,市场或者运营人员可以据此动态优化我们的资源投放。
4. 表格
表格信息密集,可以同时分析多维度、多指标数据,适合对数据敏感的人群使用。虽然表格能看到具体的数值,但是不能直观看到趋势、比重。
图 7 – GrowingIO
通过表格(图7)不难发现,移动端访问用户占了非常大的比例,但是跳出率非常高。这样的表格数据启示我们有必要优化移动端产品,提升整体访问深度。
5. 其他图表
下面介绍的是气泡图,气泡图用来展示一个事件与多个维度之间的关系,如分析B端产品客户成单周期与客户活跃度、登录账号数量之间的关系。
图 8 – GrowingIO
除了上述常见的图表,还有散点图、箱线图、股价图、雷达图等图表,在此不一一赘述。
Part 2 | 进阶:用户行为洞察
正如前面所言,初阶图表能满足简单的业务需求。但要想深入洞察用户行为,还需要紧密结合业务实践,用更加专业的图表辅助数据分析。在这里,我和大家分享三个实用的工具:漏斗图、留存图和热(力)图。
1. 漏斗图
漏斗图主要用于转化过程,例如注册流程、商品购买流程,分析用户在不同阶段的转化或者流失情况。
图 9 – GrowingIO
产品运营应该关注重点转化路径的转化率,对于转化率非常低的环节、或者转化率突然下降的情况,都需要及时排查原因。
2. 留存图
留存是指用户首次访问你的网站,多少天后又重新回访的情况。利用留存曲线可以对留存进行深入分析。
图 10 – GrowingIO
某问答社区通过留存曲线(图 10)发现,通过搜索引擎来源的新用户(红色)留存度和活跃度远远高于一般新用户(绿色),这启示社区运营者:搜索引擎可能成为社区的下一个增长点。
3. 热(力)图
热图,又称热力图,显示的是用户在你产品页面上的点击、停留偏好。借助热图产品经理可以优化产品页面布局,运营可以优化内容,确实是一个好工具。
图 11 – GrowingIO
Part 3 | 高阶:用数据驱动增长
随着数据可视化技术的不断发展,图表的类型越来越丰富,我们不可能在一篇文章中将其穷尽。但是图表数据分析的本质不会变,其最终目还是要辅助人们的决策。
1. 搭建属于自己的数据看板
人们的工作在不断细分,需要分析和决策的内容也不太一样。同样都是市场部门的同事,负责内容营销的与负责 SEM 的需要关注的数据差异很大,而这就需要搭建属于自己的数据看板。
图 12 – GrowingIO
例如 SEM 主管根据工作需要搭建数据看板,将广告投放(表格)、访客来源(百分比堆积图)、访问用户量(线图)、登录用户量(柱状图)和注册转化率(漏斗)等重要数据集中在一个看板中。数据看板能帮助我们以合适的方式展示数据,集中精力做好业务决策。
2. 在实践中践行 MVP
用图表做好数据分析并非易事,它绝非一朝一日之功,但也并不是无规律可循。
首先是对业务的理解,能洞察数字背后的商业意义。其次是灵活选择维度拆分指标,在图表坐标系中以合适的形式进行可视化展示。最后一定要从图表数据分析中发现问题,并指导业务决策。在这样不断反复的过程中,不断优化我们的图表数据分析过程,用数据来驱动业务增长。
本文作者:GrowingIO 增长团队,集工程、产品、市场、分析多重角色于一身,负责拉新和用户活跃,用数据驱动业务增长。
注:文中所有图表功能均来自于 GrowingIO – 硅谷新一代数据分析产品
数据可视化平台有很多既定的图表类型,这些图表都有各自使用的场景,各自使用的优势、劣势呢!表格就不多说了,因为表格只是展示数据,感觉每个场景可能都能用,只是不够直观罢了。
1.柱状图
适用场景:适用场合是二维数据集(每个数据点包括两个值x和y),但只有一个维度需要比较。
优势:柱状图利用柱子的高度,反映数据的差异,肉眼对高度差异很敏感。
劣势:柱状图的局限在于只适用中小规模的数据集。
(百分比堆积柱状图)
2.条形图
适用场景:显示各个项目之间的比较情况,和柱状图类似的作用;
优势:每个条都清晰表示数据,直观;
3.折线图
适用场景: 折线图适合二维的大数据集,还适合多个二维数据集的比较。
优势:容易反应出数据变化的趋势。
4.地图
适用场景:适用于有空间位置的数据集;
优劣势:特殊状况下使用,涉及行政区域;
(全国地图,只要有经纬度数据全球地图都能做)
(区域地图,通过放大镜可以放大或缩小区域)
5.饼图(环图)
适用场景:适用简单的占比比例图,在不要求数据精细的情况适用。
优势:明确显示数据的比例情况,尤其合适渠道来源等场景。
劣势:肉眼对面积大小不敏感。
6.雷达图
适用场景:雷达图适用于多维数据(四维以上),且每个维度必须可以排序,适用场合较有限。
优势:主要用来了解公司各项数据指标的变动情形及其好坏趋向。
劣势:理解成本较高。
7.漏斗图
适用场景:漏斗图适用于业务流程多的流程分析。
优势:在网站分析中,通常用于转化率比较,它不仅能展示用户从进入网站到实现购买的最终转化率,还可以展示每个步骤的转化率,能够直观地发现和说明问题所在。
劣势:单一漏斗图无法评价网站某个关键流程中各步骤转化率的好坏。
8.词云
适用场景: 显示词频,可以用来做一些用户画像、用户标签的工作。
优势:很酷炫、很直观的图表。
劣势:使用场景单一,一般用来做词频。
9.散点图(调整尺寸大小就成气泡图了)
适用场景:显示若干数据系列中各数值之间的关系,类似XY轴,判断两变量之间是否存在某种关联。
优势:对于处理值的分布和数据点的分簇,散点图都很理想。如果数据集中包含非常多的点,那么散点图便是最佳图表类型。
劣势:在点状图中显示多个序列看上去非常混乱。
10.面积图
适用场景:强调数量随时间而变化的程度,也可用于引起人们对总值趋势的注意。百分比堆积面积图、堆积面积图还可以显示部分与整体之间(或者几个数据变量之间)的关系。
11.指标卡
适用场景:显示某个数据结果&同环比数据。
优势:适用场景很多,很直观告诉看图者数据的最终结果,一般是昨天、上周等,还可以看不同时间维度的同环比情况。
劣势:只是单一的数据展示,最多有同环比,但是不能对比其他数据。
12.计量图
适用场景:一般用来显示项目的完成进度。
优势:很直观展示项目的进度情况,类似于进度条。
劣势:表达效果很明确,数据场景比较单一。
13.瀑布图
适用场景:采用绝对值与相对值结合的方式,适用于表达数个特定数值之间的数量变化关系,最终展示一个累计值。
优势:展示两个数据点之间的演变过程,还可以展示数据是如何累计的。
劣势:没有柱状图、条形图的使用场景多。
14.桑基图
适用场景:一种特定类型的流程图,始末端的分支宽度总各相等,一个数据从始至终的流程很清晰
,可以用来分析网站用户变化情况等,参考
15.树图
适用场景:和旭日图和类似;
16.双轴图
适用场景:柱状图+折线图的结合,适用情况很多,数据走势、数据同环比对比等情况都能适用。
优势:特别通用,是柱状图+折线图的结合,图表很直观。
劣势:这个好像没什么劣势,个人感觉。
所有的支持图片均来自,可支持黑白主题切换,黑白效果如上图!图表的适用场景不一,用得好可以更好理解数据的含义!
通常而言,取决于你的数据的类型以及你所想表达的关系。
对于一元的连续型变量,可能会尝试探究他的分布情况(密度图)
下图是泰坦尼克号基于生存情况的年龄分布图(R ggplot2).
如果数据是随着时间变化的可以做出其时序图,好看点可能会给出Horizon Plot(下面这张是我同学的一次可视化作业(Python Matplotlib))。
Source:https://raw.githubusercontent.com/Casyfill/PUI2015_Philipp/master/HW8/horisont_Moscow.png
散点图实际上是一个非常值得深究的图。从最基本的位置关系(x,y)到引入颜色来反映不同类别,再到利用大小来反应不同数量(这种又叫做气泡图)。
这张半成品图(= = )的横坐标是人均收入,纵坐标是预期寿命,颜色代表来自哪个大洲,大小表示其国家人口(数据均来自2008年)(d3.js)
对于分类变量而言,最常见的就是条形图,比如反应泰坦尼克号上生存和死亡的情况(R ggplot2)。
如果想对于两个变量的不同水平进行比较,可以使用堆积条形图(这张图比较的是在泰坦尼克号上不同性别的人生存情况):
如果你还想加变量的话就会变成马赛克图,下图就是加入了不同仓位的泰坦尼克生存情况图(R ggplot2)
有时候我们为了减少条形图所造成的视觉混乱(比如有太多的类别),就会使用Cleveland点图来表现数据。下图是1975-2015年美国各大学博士毕业后成为phd导师的Cleveland点图(因为数据库是购买来的所以省去了坐标轴。)(R ggplot2)
如果想表达分类数据的分布情况还有直方图,箱线图等等。 强烈推荐:
R数据可视化手册 (豆瓣)
图表有很多种,分析作报告时会用到饼图,散点图,线图,柱状图,条形图,区域图,树状图,气泡图,地图,雷达图等。
下面是我用 大数据魔镜魔镜—行业领先的大数据可视化分析平台 6.0
散点图:散点图又称散点分布图,是以一个变量为横坐标,另一变量为纵坐标,利用散点(坐标点)的分布形态反映变量统计关系的一种图形。特点是能直观表现出影响因素和预测对象之间的总体关系趋势。优点是能通过直观醒目的图形方式反映变量间关系的变化形态,以便决定用何种数学表达方式来模拟变量之间的关系。散点图不仅可传递变量间关系类型的信息,也能反映变量间关系的明确程度。
线图:折(曲)线的上升或下降来表示统计数量的增减变化的统计图,叫作折(曲)线统计图与条形统计图比较,折(曲)线统计图不仅可以表示数量的多少,而且可以反映同一事物在不同时间里的发展变化的情况。
条形图或柱状图:柱状图也就是条形统计图,用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按一定的顺序排列起来。从条形统计图中很容易看出各种数量的多少。
区域图:面积图又称区域图,强调数量随时间而变化的程度,也可用于引起人们对总值趋势的注意。堆积面积图还可以显示部分与整体的关系。
树状图:树状图 dendrogram 亦称树枝状图,为了用图表示亲缘关系,把分类单位摆在图上树枝顶部,根据分枝可以表示其相互关系,具有二次元和三次元。在数量分类学上用于表型分类的树状图,称为表型树状图(phenogram),掺入系统的推论的称为系统树状图(cladogram)以资区别。表型树状图是根据群析描绘的,系统树状图是根据一种模拟的假定的性状进化方向即用电子计算机描绘的。
气泡图:排列在工作表的列中的数据(第一列中列出 x 值,在相邻列中列出相应的 y 值和气泡大小的值)可以绘制在气泡图中。
地图
雷达图:雷达图(Radar Chart),又可称为戴布拉图、蜘蛛网图(Spider Chart),是财务分析报表的一种。即将一个公司的各项财务分析所得的数字或比率,就其比较重要的项目集中划在一个圆形的图表上,来表现一个公司各项财务比率的情况,使用者能一目了然的了解公司各项财务指标的变动情形及其好坏趋向。
南丁格尔玫瑰图
矩形图
圈图
漏斗图
参考一下,具体还是看需求。
知乎搜索数据可视化工具,他们代表了所有
图有多种,通用先要确定你的数据是什么类型,做什么用,受众是什么类型,如果是用来做演讲,可以考虑采用生动点将数据可视化,这种类型的图一般都能看懂或基本不要求太专业,受众通常是普通人。
如果是写文章报告等,一般就是做统计图,最常见的就是柱图和线图。做什么样的图还是根据你的数型类型所定。你提问范围太大,不是几句话能表达清楚的。
1,剔除异常数据,然后分析异常数据.(如果过程不稳定就最主要的)
2,将大量数据汇总分析,作出控制图(分析过程能力)
昵称*
E-Mail*
回复内容*
回复 ( 9 )
本文会给大家讲解:从入门到精通:如何用图表做好数据分析?
随着精益化运营的概念不断深入人心,数据分析已经成为了互联网人的必修课。相比于高深的概率统计、算法模型,简单、直观的图表工具得到了更为广泛的应用。
那么图表都有哪些类型?不同类型的图表又该怎么用?在这篇文章中我们结合互联网产品和运营的业务需求,由浅入深地给大家解答这些问题。
Part 1 | 初阶:维度和指标
初阶的图表简单易懂,能满足简单的数据分析需求,具体包括趋势、频数、比重、表格等类型。图表数据分析的前提就是将自己需要呈现的指标,以一定的维度拆分,在坐标系中以可视化的方式呈现出来。
1. 趋势图
趋势分析是最基础的图表分析,包括线图、柱状图、堆积图等多种形式。
线图可以观察一个或者多个数据指标连续变化的趋势,也可以根据需要与之前的周期进行同比分析。柱状图可以观察某一事件的变化趋势;如果将整体拆分可以做成堆积图,同时观察到部分所占比重及变化趋势。
图 1 – GrowingIO
图 2 – GrowingIO
产品经理和运营人员通过趋势图分析流量的实时走向,如每日 pv、uv、DAU 等基本数量指标以及停留时长、平均访问页面数等质量指标,可以及时把握产品的变化趋势。一旦趋势周期对比发生异常(异常高和异常低),我们需要及时介入排查原因、解决问题。
2. 频数图
根据业务需求对指标按照一定维度拆分,对比不同组别的频数,便于分清轻重缓急。
图 3 – GrowingIO
条形图清晰展示了用户在不同类别上的频数,并且按照数量从大到小排序。上图展示的是某产品用户使用浏览器的频数分布,在资源有限的情况下产品可以先适配 Chrome 和 IE 浏览器以提升绝大部分用户体验。
图 4 – GrowingIO
上面的双向条形图展示了某 B 端产品的客户平均停留时长极端情况(非常高和非常低),企业 1-5 非常活跃,可以让运营人员促进客户增购、续约,而企业 6-10 活跃度非常低,即将流失,需要运营人员立刻介入干预。
3. 比重图
比重分析主要是用来了解不同部分占总体的比例。横向比较,扇形图、环形图可以满足这类需求;纵向比较,百分比堆积图可以显示不同部分所占比例的趋势变化。
图 5 – GrowingIO
图 6 – GrowingIO
环形图(图 5)显示了某节点访问用户来源渠道比例,百分比堆积图(图 6)则动态显示了不同渠道比例的变化趋势,市场或者运营人员可以据此动态优化我们的资源投放。
4. 表格
表格信息密集,可以同时分析多维度、多指标数据,适合对数据敏感的人群使用。虽然表格能看到具体的数值,但是不能直观看到趋势、比重。
图 7 – GrowingIO
通过表格(图7)不难发现,移动端访问用户占了非常大的比例,但是跳出率非常高。这样的表格数据启示我们有必要优化移动端产品,提升整体访问深度。
5. 其他图表
下面介绍的是气泡图,气泡图用来展示一个事件与多个维度之间的关系,如分析B端产品客户成单周期与客户活跃度、登录账号数量之间的关系。
图 8 – GrowingIO
除了上述常见的图表,还有散点图、箱线图、股价图、雷达图等图表,在此不一一赘述。
Part 2 | 进阶:用户行为洞察
正如前面所言,初阶图表能满足简单的业务需求。但要想深入洞察用户行为,还需要紧密结合业务实践,用更加专业的图表辅助数据分析。在这里,我和大家分享三个实用的工具:漏斗图、留存图和热(力)图。
1. 漏斗图
漏斗图主要用于转化过程,例如注册流程、商品购买流程,分析用户在不同阶段的转化或者流失情况。
图 9 – GrowingIO
产品运营应该关注重点转化路径的转化率,对于转化率非常低的环节、或者转化率突然下降的情况,都需要及时排查原因。
2. 留存图
留存是指用户首次访问你的网站,多少天后又重新回访的情况。利用留存曲线可以对留存进行深入分析。
图 10 – GrowingIO
某问答社区通过留存曲线(图 10)发现,通过搜索引擎来源的新用户(红色)留存度和活跃度远远高于一般新用户(绿色),这启示社区运营者:搜索引擎可能成为社区的下一个增长点。
3. 热(力)图
热图,又称热力图,显示的是用户在你产品页面上的点击、停留偏好。借助热图产品经理可以优化产品页面布局,运营可以优化内容,确实是一个好工具。
图 11 – GrowingIO
Part 3 | 高阶:用数据驱动增长
随着数据可视化技术的不断发展,图表的类型越来越丰富,我们不可能在一篇文章中将其穷尽。但是图表数据分析的本质不会变,其最终目还是要辅助人们的决策。
1. 搭建属于自己的数据看板
人们的工作在不断细分,需要分析和决策的内容也不太一样。同样都是市场部门的同事,负责内容营销的与负责 SEM 的需要关注的数据差异很大,而这就需要搭建属于自己的数据看板。
图 12 – GrowingIO
例如 SEM 主管根据工作需要搭建数据看板,将广告投放(表格)、访客来源(百分比堆积图)、访问用户量(线图)、登录用户量(柱状图)和注册转化率(漏斗)等重要数据集中在一个看板中。数据看板能帮助我们以合适的方式展示数据,集中精力做好业务决策。
2. 在实践中践行 MVP
用图表做好数据分析并非易事,它绝非一朝一日之功,但也并不是无规律可循。
首先是对业务的理解,能洞察数字背后的商业意义。其次是灵活选择维度拆分指标,在图表坐标系中以合适的形式进行可视化展示。最后一定要从图表数据分析中发现问题,并指导业务决策。在这样不断反复的过程中,不断优化我们的图表数据分析过程,用数据来驱动业务增长。
本文作者:GrowingIO 增长团队,集工程、产品、市场、分析多重角色于一身,负责拉新和用户活跃,用数据驱动业务增长。
注:文中所有图表功能均来自于 GrowingIO – 硅谷新一代数据分析产品
数据可视化平台有很多既定的图表类型,这些图表都有各自使用的场景,各自使用的优势、劣势呢!表格就不多说了,因为表格只是展示数据,感觉每个场景可能都能用,只是不够直观罢了。
1.柱状图
适用场景:适用场合是二维数据集(每个数据点包括两个值x和y),但只有一个维度需要比较。
优势:柱状图利用柱子的高度,反映数据的差异,肉眼对高度差异很敏感。
劣势:柱状图的局限在于只适用中小规模的数据集。
(百分比堆积柱状图)
2.条形图
适用场景:显示各个项目之间的比较情况,和柱状图类似的作用;
优势:每个条都清晰表示数据,直观;
3.折线图
适用场景: 折线图适合二维的大数据集,还适合多个二维数据集的比较。
优势:容易反应出数据变化的趋势。
4.地图
适用场景:适用于有空间位置的数据集;
优劣势:特殊状况下使用,涉及行政区域;
(全国地图,只要有经纬度数据全球地图都能做)
(区域地图,通过放大镜可以放大或缩小区域)
5.饼图(环图)
适用场景:适用简单的占比比例图,在不要求数据精细的情况适用。
优势:明确显示数据的比例情况,尤其合适渠道来源等场景。
劣势:肉眼对面积大小不敏感。
6.雷达图
适用场景:雷达图适用于多维数据(四维以上),且每个维度必须可以排序,适用场合较有限。
优势:主要用来了解公司各项数据指标的变动情形及其好坏趋向。
劣势:理解成本较高。
7.漏斗图
适用场景:漏斗图适用于业务流程多的流程分析。
优势:在网站分析中,通常用于转化率比较,它不仅能展示用户从进入网站到实现购买的最终转化率,还可以展示每个步骤的转化率,能够直观地发现和说明问题所在。
劣势:单一漏斗图无法评价网站某个关键流程中各步骤转化率的好坏。
8.词云
适用场景: 显示词频,可以用来做一些用户画像、用户标签的工作。
优势:很酷炫、很直观的图表。
劣势:使用场景单一,一般用来做词频。
9.散点图(调整尺寸大小就成气泡图了)
适用场景:显示若干数据系列中各数值之间的关系,类似XY轴,判断两变量之间是否存在某种关联。
优势:对于处理值的分布和数据点的分簇,散点图都很理想。如果数据集中包含非常多的点,那么散点图便是最佳图表类型。
劣势:在点状图中显示多个序列看上去非常混乱。
10.面积图
适用场景:强调数量随时间而变化的程度,也可用于引起人们对总值趋势的注意。百分比堆积面积图、堆积面积图还可以显示部分与整体之间(或者几个数据变量之间)的关系。
11.指标卡
适用场景:显示某个数据结果&同环比数据。
优势:适用场景很多,很直观告诉看图者数据的最终结果,一般是昨天、上周等,还可以看不同时间维度的同环比情况。
劣势:只是单一的数据展示,最多有同环比,但是不能对比其他数据。
12.计量图
适用场景:一般用来显示项目的完成进度。
优势:很直观展示项目的进度情况,类似于进度条。
劣势:表达效果很明确,数据场景比较单一。
13.瀑布图
适用场景:采用绝对值与相对值结合的方式,适用于表达数个特定数值之间的数量变化关系,最终展示一个累计值。
优势:展示两个数据点之间的演变过程,还可以展示数据是如何累计的。
劣势:没有柱状图、条形图的使用场景多。
14.桑基图
适用场景:一种特定类型的流程图,始末端的分支宽度总各相等,一个数据从始至终的流程很清晰
,可以用来分析网站用户变化情况等,参考
15.树图
适用场景:和旭日图和类似;
16.双轴图
适用场景:柱状图+折线图的结合,适用情况很多,数据走势、数据同环比对比等情况都能适用。
优势:特别通用,是柱状图+折线图的结合,图表很直观。
劣势:这个好像没什么劣势,个人感觉。
所有的支持图片均来自,可支持黑白主题切换,黑白效果如上图!图表的适用场景不一,用得好可以更好理解数据的含义!
通常而言,取决于你的数据的类型以及你所想表达的关系。
对于一元的连续型变量,可能会尝试探究他的分布情况(密度图)
下图是泰坦尼克号基于生存情况的年龄分布图(R ggplot2).
如果数据是随着时间变化的可以做出其时序图,好看点可能会给出Horizon Plot(下面这张是我同学的一次可视化作业(Python Matplotlib))。
Source:https://raw.githubusercontent.com/Casyfill/PUI2015_Philipp/master/HW8/horisont_Moscow.png
散点图实际上是一个非常值得深究的图。从最基本的位置关系(x,y)到引入颜色来反映不同类别,再到利用大小来反应不同数量(这种又叫做气泡图)。
这张半成品图(= = )的横坐标是人均收入,纵坐标是预期寿命,颜色代表来自哪个大洲,大小表示其国家人口(数据均来自2008年)(d3.js)
对于分类变量而言,最常见的就是条形图,比如反应泰坦尼克号上生存和死亡的情况(R ggplot2)。
如果想对于两个变量的不同水平进行比较,可以使用堆积条形图(这张图比较的是在泰坦尼克号上不同性别的人生存情况):
如果你还想加变量的话就会变成马赛克图,下图就是加入了不同仓位的泰坦尼克生存情况图(R ggplot2)
有时候我们为了减少条形图所造成的视觉混乱(比如有太多的类别),就会使用Cleveland点图来表现数据。下图是1975-2015年美国各大学博士毕业后成为phd导师的Cleveland点图(因为数据库是购买来的所以省去了坐标轴。)(R ggplot2)
如果想表达分类数据的分布情况还有直方图,箱线图等等。 强烈推荐:
R数据可视化手册 (豆瓣)
图表有很多种,分析作报告时会用到饼图,散点图,线图,柱状图,条形图,区域图,树状图,气泡图,地图,雷达图等。
下面是我用 大数据魔镜魔镜—行业领先的大数据可视化分析平台 6.0
散点图:散点图又称散点分布图,是以一个变量为横坐标,另一变量为纵坐标,利用散点(坐标点)的分布形态反映变量统计关系的一种图形。特点是能直观表现出影响因素和预测对象之间的总体关系趋势。优点是能通过直观醒目的图形方式反映变量间关系的变化形态,以便决定用何种数学表达方式来模拟变量之间的关系。散点图不仅可传递变量间关系类型的信息,也能反映变量间关系的明确程度。
线图:折(曲)线的上升或下降来表示统计数量的增减变化的统计图,叫作折(曲)线统计图与条形统计图比较,折(曲)线统计图不仅可以表示数量的多少,而且可以反映同一事物在不同时间里的发展变化的情况。
条形图或柱状图:柱状图也就是条形统计图,用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按一定的顺序排列起来。从条形统计图中很容易看出各种数量的多少。
区域图:面积图又称区域图,强调数量随时间而变化的程度,也可用于引起人们对总值趋势的注意。堆积面积图还可以显示部分与整体的关系。
树状图:树状图 dendrogram 亦称树枝状图,为了用图表示亲缘关系,把分类单位摆在图上树枝顶部,根据分枝可以表示其相互关系,具有二次元和三次元。在数量分类学上用于表型分类的树状图,称为表型树状图(phenogram),掺入系统的推论的称为系统树状图(cladogram)以资区别。表型树状图是根据群析描绘的,系统树状图是根据一种模拟的假定的性状进化方向即用电子计算机描绘的。
气泡图:排列在工作表的列中的数据(第一列中列出 x 值,在相邻列中列出相应的 y 值和气泡大小的值)可以绘制在气泡图中。
地图
雷达图:雷达图(Radar Chart),又可称为戴布拉图、蜘蛛网图(Spider Chart),是财务分析报表的一种。即将一个公司的各项财务分析所得的数字或比率,就其比较重要的项目集中划在一个圆形的图表上,来表现一个公司各项财务比率的情况,使用者能一目了然的了解公司各项财务指标的变动情形及其好坏趋向。
南丁格尔玫瑰图
矩形图
圈图
漏斗图
参考一下,具体还是看需求。
知乎搜索数据可视化工具,他们代表了所有
图有多种,通用先要确定你的数据是什么类型,做什么用,受众是什么类型,如果是用来做演讲,可以考虑采用生动点将数据可视化,这种类型的图一般都能看懂或基本不要求太专业,受众通常是普通人。
如果是写文章报告等,一般就是做统计图,最常见的就是柱图和线图。做什么样的图还是根据你的数型类型所定。你提问范围太大,不是几句话能表达清楚的。
1,剔除异常数据,然后分析异常数据.(如果过程不稳定就最主要的)
2,将大量数据汇总分析,作出控制图(分析过程能力)