I am a designer and coder, play with digits, pixels and bits. I build data visualizations that are elegant and informative, revealing the hidden insights behind the numbers and coordinates. I believe that Information can be beautiful, and that the next era of designers will use data as their medium.
回复 ( 10 )
谢谢 @derful wang 的邀请,我来介绍一下我了解的数据可视化,以及我的同事何珊的成果。
一、可视化主要的四个采用源
所谓数据可视化呢,就是把客观的数据变成带有观点的信息,传递给他人。其形式包括但不限于平面图片、软件、视频、实物装置等等……大致归纳,数据可视化目前主要是在以下几类机构和行业当中被采用:
1.互联网公司
这里举例的是我所在的公司Uber。
下面三张图是为了反映Uber北京一年发展历程而进行的可视化工作。
我们将一天Uber乘客的所有行程依据时间与起终点转变成流动的线条,通过时间和空间在一个比例尺下的真实反映,绘制出北京移动地图。
2014年1月份的时候,我们还是这样的:
2014年7月份的时候,我们就已经很壮大啦:
知乎不能上动图,不如看视频感受下:
视频:DataVis-Beijing
MIT团队与可口可乐合作的案例,将可口可乐旗下各产品在不同城市的销售情况以可视化的方式展现出来。
视频在此:
她现在是我的同事,在Uber总部的可视化团队负责核心工作。有机会邀她本人来到知乎答一答,我先介绍一下她怎么看待数据可视化。
何珊是这样谈可视化的:
(引自何珊的LinkedIn:
何珊本人是如何获得这三项能力的呢?
何珊在本科时在清华大学学习建筑,积累了图形、平面等设计的经验和技能;当她毕业后加入设计公司Blu Homes时,她接触到了三维空间可视化网页,开始学习网站设计。这次可视化接触让她开始想要学习更多的技术,于是进入了MIT学习program design communication以及python等各种编程工具。为了学以致用,她毕业后作为一名研究员加入了MIT SENSEable Lab,开始接手一系列数据可视化项目。此后,何珊加入Uber,正式开始了她的数据可视化职业生涯。
三、Uber的可视化
我曾经好奇问过何珊,为什么你会选择来Uber做可视化?
何珊说,数据可视化的基础是优质的数据。Uber的出行数据具有时间、空间上高度的依赖以及精准,通过Uber的数据能够充分洞察用户,这是其他科技公司不能拥有的。
具体来看的话,Uber的数据可视化有以下特点:
这个特点能够让她有不断的挑战和新作品。
例如,何珊将Uber在美国九大城市的出行行程进行对比,可以看到人们出行时的偏好和重合路径。它可以成为Uber决策的工具(如Uber是否需要推出拼车服务);更为政府对于交通的管理提供借鉴。
点开链接,可以看到九大城市的出行热点:
所以,在Uber做数据可视化,就像在做一个翻译家,将后端冗杂、艰涩的数据转换成给消费者愉悦地欣赏的美丽图景,现在这些美丽的线条已经变成Uber的识别icon了,真是超级精彩!
数据可视化是数据信息的一种表达方式,在国内外有很多这样的公司,比如行业化通用的Tableau,Qlikview,国内的帆软FineBI和FineReport;细分行业的话有互联网方向,地理测绘、交通;按业务分的话有营销、销售等等。
数据可视化一词,目前太泛滥,能做个图表的似乎都叫数据可视化。优秀的数据可视化讲究场景应用,结合数据分析逻辑,制定高效决策。
这方面,帆软公司有足够清醒的认识,从其两大产品线可以看出。目前数据分析的用户无非是两类人,一类是业务分析员,一类是IT开发人员。业务分析人员更多的是与业务逻辑和数据呈现打交道,IT人员更多的是与数据库、数据平台,平台开发打交道。而对于IT人员,接触的是数据底层,从抽取、处理到展现有一些列过程,一旦需求发生变化,动则全身。对于业务人员,最麻烦的是工具的使用。
因此,所以报表工具FineReport 数据决策系统
帆软是在业务场景使用上占据优势。另一个我觉得比较牛逼的是Tableau,真的是在可视化方面下足了功夫。数据与可视化之间更侧重可视化。
最近一直在搜集一些动画和数据表格可视化的资料,看了一些可视化的网站,实在只有你想不到,没有做不到,真正感受了什么叫数据之美,上周推荐了个微软的数据可视化软件SandDance,很cool,具体详情在另一个问下的回答数据可视化的软件,个人使用的,求推荐,最好多说几个,多多益善? – 知乎用户的回答
但这周发现了些更美的数据可视化网站,几乎将历史事件或者生活动态完美的用可视化效果呈现出了,废话不多说,直接上图:
1.第一个是A Day in the Life of Americans看的尼玛有点彩虹糖的赶脚
随后在某个时间点各个点数的多少绘制路径,就能看出某个时间活动的频繁程度
2.下面是第二个神器earth :: a global map of wind, weather, and ocean conditions当然它也有很多数据类型可以切换,比如风速,温度,还可以显示大气或者海洋等等
然后换个视图,还是很震撼
除了膜拜,没有什么好说的
3.第三个是个特别的数据库可视化,Out of Sight, Out of Mind: A visualization of drone strikes in Pakistan since 2004
4.第四个也是和美帝有关,U.S. Gun Deaths当你进行Filter筛选后,比如 Shotgun(猎枪), Aisan, Female,显示出来的数字2个,此时总的数据会翻转到下半部分,被筛选出的数据显示在上班部分,这样让对比起来更加的直观
——————————————————————————————————————————————–
5.来更新了,Gapminder: Unveiling the beauty of statistics for a fact based world view.1800年开始,也是没谁了
可以看出它的数据的维度还是很大的,膜拜
还是不得不感叹,数据之美
———————————————————未完待续 持续更新——————————————————–
说到达人,怎么能不提邱南森(Nathan Yau)大神。UCLA 统计专业博士。
他的博客 FlowingData 充满了数据可视化的真知灼见,很多文章还附上了详细的实现过程,夫复何求。如果成为付费会员,可以获得里面的教程。但这个可以通过他写作的两本书来获得一些。
一本是《鲜活的数据 (豆瓣)》,里面讲到了实现数据可视化可以用到的详细技术,而且有非常多的资源指引。这本书对于可视化入门是极好的,但会略显杂乱繁琐。
另一本是《数据之美 (豆瓣)》,主要从可视化形式和展示的角度来讲怎么做可视化。我只看了一次,不做过多评价。
两本书都非常强调“通过数据讲故事”这一观点。不一定把数据可视化成炫酷之极就是好的,反而可能让人一头雾水。能用数据把问题和现象描述清晰无歧义,描述得引人入胜易于理解,这才是最重要的。
两本书都讲了很多用数据讲故事的技巧,非常实用。我感受最深的是《鲜活的数据》里面分析历年大胃王冠军的例子,用最简单的柱形图讲了一个非常有趣的故事。其中调色,背景说明,哪里要加重那里要弱化都讲得非常漂亮。《数据之美》里面则一开始就用自己的婚礼作为例子,把婚礼拍摄的照片流作为分析对象,虽然没有大胃王的例子贴题,但是这活学活用的玩法实在是大开眼界。
还有其它一些数据可视化的资源:
Information is Beautiful 有可视化,有数据,有代码,极好。不过各种链接不翻墙打不开。
information aesthetics 满满的都是案例,都是干货。
visualcomplexity.com 如网站名,是复杂的可视化,主要是复杂网络的可视化。比较严谨,部分有文献支持。与数据讲故事不同,这个是通过数据可视化来找到隐含的规律和模式(pattern)。这是可视化的另一种方向。
IBM 的可视化小组,值得一看。
谢邀。
利益相关,我司对外宣传口号是“中国大数据可视分析领导者”。
以下代表我司官方观点:
数据可视化是可以与图形用户界面相提并论的事,其意义在于让专业人士以外的普通人理解和利用数据,正如图形用户界面让非专业的普通人利用计算机一样。可视化一定程度上和应用软件开发商竞争,和报表软件供应商竞争。
数据可视化对于大数据有更重要的意义。个人对大数据的理解,大数据和占用存储的数量级没什么必然的联系,大指的不是字节数,大数据其实是相对于传统数据类应用来说的,传统的以数据库为核心的应用程序,最重要的特点是封闭性。封闭性体现在元数据是固定不变的,数据的结构和含义都需要严格按照事先的约定。封闭性的数据应用和强类型的编程语言是相匹配的,数据不变类型就不会变。今天之所以弱类型语言大行其道,就是因为系统的封闭性被打破了,强类型语言在开放数据面前没有优势。大数据其实是开放的,多样性的,没有严格约定的数据,处理大数据,一方面需要更灵活的编程语言和系统架构,以及相应的算法;另一方面也需要更加高效的人机交互方式,含义依赖于价值观,只有人可以为数据赋予含义,因此必须大大提高人对数据的认知和评价能力。
海云数据的优势在于艺术与数据科学的结合,结合点是人类的视觉认知和空间思维能力。相较于其他大数据可视化公司,海云数据更倡导倡导“大数据+“的概念,也就是说将大数据切实的与各行业相结合。通过与各行业实际场景的思考,将结构化与非结构化的数据以最易理解以及高水准的方式呈现,是海云数据目前的优势。
以下是我司过去的一些可视化案例,比较老了,最新案例涉及商业秘密不便公开,见谅。
2013 雾霾话题可视化
2013 银行业务可视化
2014 航空公司关键业务指标可视化
2015 制药企业全球专利进展可视化
很惭愧,就做了一点微小的工作,谢谢大家!
回答的太少了。
补充一个,本人设计开发的平台,XScope
一直知道漂亮的交互是大势所趋,做技术的这些年没太过理会外面的情况,感觉一夜之间可视化就被炒的如火如荼。上图,视频比较大,不太好处理吧。
————–
完全的桌面端,定位是基于应用分析交互的三维GIS可视化系统平台和浏览器上不太一样,完全自己定制,非常灵活。
———/———/
补充一下:
北京空擎信息技术有限公司
考虑数据可视化的技术困难程度,大公司其实一般很少会选择自己直接招募研究团队做数据可视化方案的底层开发。数据可视化的实现一般依赖开源程序作为backbone。目前来说有两支力量是目前数据可视化商业和非商业方案的主心骨。一是来自东海岸MIT的processing,另外一支是斯坦福走出来的D3.js。
Processing’s website:
Processing.org
D3.js website:
D3.js – Data-Driven Documents
相关的具体作品和源码实现可以上程序员交友社区github获得详情。注意到, @萨麦蒂合 有提到mbostock。恩,他就是d3.js的主要贡献者之一。
谈到数据可视化的实现,不得不提一下细节。
学术界的数据可视化大多基于R语言进行静态绘图,这主要是为统计学家服务的。而在商业环境中的可视化往往是非统计学家使用,并且往往展示给普通大众看。交互式方案往往是更好的选择。processing和D3.js都提供了基于javascript的实现。他们都基于DOM(Document Object Model)以方便做交互性数据展示。这样的设计能让人以直观而简洁的方式和数据做互动。
哪些公司做得好是一个非常宽泛的问题。首先必须点明什么是好的数据可视化方案。一个好的方案一定包含两方面:一是将复杂数据背后的隐藏关系挖掘出来,二是将这些关系用简单直观的图形准确地展示出来。
先说第二点。可视化这方面其实学术界研究得也不少。因为人的想象力及其有限,能让我们方便理解数据的可视化方案并不多——撑死了人只可以看到最多四维度的数据可视化(空间三维加颜色渐变),而更高维的数据是难以想象的。所以在具体实现数据展示方案时,我们只能选取很有限的变量和数据来表达自己观点,剩下的内容实际更关乎美学。幸运的是,以上两个工具已经提供了大量的数据可视化案例来学习——无论是展示的形式还是美工。
再说第一点。在现实中,我们往往面对的是复杂数据,而第一点看起来是数据挖掘的内容,它貌似应该是数据可视化之前完成的事。那为什么它也很重要呢?在这里我要引用MIT 01年的data mining course PPT中的一句话(仅提供大意;我忘了quote谁的):“好的模型需要可视化,好的可视化需要好的模型”。这就是为什么往往我们需要交互式可视化的原因——因为我们对未知数据需要进行EDA(Exploratory Data Analysis)或可视化才能做出好的模型,才能挖掘到有效的知识;而有了有效的知识我们才能从数据中选择少量变量来进行可视化。得到有用结果的过程一定是一个循序渐进,不断发现的过程。
再回答哪些公司做得好,目前我心里只有一个名字符合要求:Palantir。原因有两点:1.P家的可视化有能力将来源不同的海量数据整合在一起(甚至于能让NSA通过可视化方案来抓恐怖分子)2.P家始终坚持human-centric model。有兴趣的同学可以围观P司的估值和他们的开源项目。
必须是Tableau啊
我不懂,但要抢答。
Github上有一些Data visualisation,看着挺炫酷。链接在此:
Data visualization · GitHub
炫酷的作品在这里,mbostock的gallary:
Gallery · mbostock/d3 Wiki · GitHub
请允许我安利一下我们公司 ⊙ω⊙
我觉得我们公司在数据可视化的方面做的还是很不错的~_(:3」∠)_
————正文分割线———–
数字冰雹
北京数字冰雹信息技术有限公司致力于提供具有最好人机交互体验的大数据可视化分析决策系统。
公司秉承“将科技艺术化呈现”的理念,提供集设计、程序开发、硬件集成为一体的一站式系统解决方案。 系统兼备顶级视觉效果与高性能操控,可广泛用于航空航天、国防军工、商业智能、智慧城市等领域, 助您站在行业前沿,统领掌控全局,成就大智决策。
公司自主研发的核心平台产品AVE™(Advanced Visualization Engine先进可视化引擎)是一套包括二三维地理信息系统、逻辑拓补、数据图表、 三维机械结构等在内的基础组件平台,可以高效高质构建多种专业的系统展现、交互界面。
公司通过了国家高新技术企业及软件企业认证,拥有军工三级保密资质,员工近百人。经过十余年的不断探索与积累沉淀, 在航空航天、国防军工、政府机构、能源电力、通信运营、工业制造、商业金融、城市管理等行业积累了众多优质客户和广泛的战略合作伙伴, 在业内拥有良好的口碑和品牌形象。
数字冰雹是一个年轻而担当的团队,我们怀揣梦想,志向高远,愿与中国企业在大数据应用探索历程上携手并进, 愿在中华民族的伟大复兴之路上留下一迹坚实的脚步。
—————-放波图片—————
—————-公司网址—————
——————————————
图文均来自公司微信,我只是个搬运工。
By digihail.codedoge