用户名*
邮箱*
密码*
确认密码*
验证码* 点击图片更换验证码
找回密码
忘记密码了?输入你的注册邮箱,并点击重置,稍后,你将会收到一封密码重置邮件。
给几个简单的思路吧!
1.地域性:沿海地区/内陆地区/南方人/北方人/北上广深/一线城市/二线城市的用户是否更喜欢***类读物?
2.相关性:喜欢财经的用户是否同时会喜欢学术文化?喜欢文学的是否同时喜欢小说?
3.聚类:那几个省份在某些书籍模块相似?是否属于同一片区?哪几类书籍相似,是否属于同一类型?
4.其他:为什么北京人那么喜欢综合文化?他们还喜欢别的吗?上海人有什么特点?
希望有所帮助!
我看一眼觉得这是卖出版物。
给你一个办法,你把这些数据绘制成柱状图,然后你分析下柱状图。
可以总结如下,哪些东西再哪个地方受欢迎,哪些地方受欢迎是具有共性,哪些东西在某地最不受到欢迎。然后总结下未来可以如何去推广,好的做得更好,差的如何弥补之类的。
你要是做运营,这些数据肯定不难看懂吧!
纯手打,对大数据感兴趣欢迎加我信微:idacker
– -! 看你们说得这么深入,我来说些肤浅的吧。
省份那一列,升序排列一下,然后可以得到两组数据,第一组是同一省份的不同出版物,并列出最高与最低和平均值,第二组就是该省份的销量(第三列的,不知道是不是销量还是盈亏)
继而就是按照现在的原表不动,也可以得到两组数据,第一组是同一出版物不同省份的组成比例,第二组是不同出版物的销量。
然后画各种柱状图来评估所需要的信息。
1)分维度汇总,分析占比。 可以非别按照产品线和省份(省份部分还可以结合地域纬度。)汇总,并给出占比。取top N等。结合该公司产品发挥下业务含义 。
2)数值的正负分布统计。而且可以结合(1)的纬度
看着好像是图书发行的数据,对这行不了解。
那么在业务不熟悉的情况下,咱们怎么做数据分析?
首先要做的,应该是进行整理,对数据做简化。先看一下简化后的数据,能否找出规律性的东西,然后再对规律进行验证。
另外,既然这是面试的题目,那么结果什么的其实不是很重要,重要的应该是体现专业化的分析思路。
具体到题主的案例,可以先对数据做分组化处理
1、先对每个城市的净发量做分组排序,可以获得各个城市的净发量组数据,包括最大值、最小值、中位数。
2、然后所有的净发量组进行排序,然后分成5组,分别记成1~5。
3、表中大约有10种类型的书籍,按顺序排列对应的净发量分组编码。
3、样就可以获得每个城市的10位数净发分组编码,比如北京应该就是5,555,555,555,各个类型的净发量都是最大的一组。还可以把相近的类型合并到一个位数,进一步缩短分组编码的长度。
4、这样简化后的分组编码表,可以比较容易地看出各位城市的分布规律。比如某个城市的编码是1,511,111,111,说明对某一类型的图书需求量很大,大部分编码位都是5的城市,说明城市的图书市场容量很大,是重点城市。
另外,按城市分组后,还可以计算出单个城市内各类型图书净发量与组内最大值的百分比,然后分组编码,观察各个城市对图书类型的需求分布。
也可以按书籍类型进行分组观察,相关类型书籍的分组等等。
总之做数据分析,应该先想办法做简化归类,这样才好观察出共性。
运营以数据作为支撑,数据反映运营的好坏
答案已经这么多了,就随便胡诌几句;
首先,这属于传统商业分析的范畴,和新兴的数据分析行业关系不是太大;
另外这种结构化的数据一般可以遵循总~分的逻辑去分析,即先看数据总览都能看出些什么问题,再抽丝剥茧的看细项维度;
最后,多问几个为什么,将统计描述作为分析结果是分析中的大忌,想想你的分析目的是什么,根据分析目的去找答案;譬如”同样一个主题的产品,为什么每个省相差如此之大,是人口导致的还是收入导致还是竞争者太强等等”,所以这张表不是终点,还需要其他资料辅助
活用透视表,用筛选做多维度分析
以曲线柱图的形式展现,最终通过数据分析得出结论
用excel拉一张透视表,基本就能简单的总结一下数据体现内容了。
具体也不好说,毕竟各行如隔山,我还只是个画原型的= =
要汇总,分维度分析呀!
昵称*
E-Mail*
回复内容*
回复 ( 10 )
给几个简单的思路吧!
1.地域性:沿海地区/内陆地区/南方人/北方人/北上广深/一线城市/二线城市的用户是否更喜欢***类读物?
2.相关性:喜欢财经的用户是否同时会喜欢学术文化?喜欢文学的是否同时喜欢小说?
3.聚类:那几个省份在某些书籍模块相似?是否属于同一片区?哪几类书籍相似,是否属于同一类型?
4.其他:为什么北京人那么喜欢综合文化?他们还喜欢别的吗?上海人有什么特点?
希望有所帮助!
我看一眼觉得这是卖出版物。
给你一个办法,你把这些数据绘制成柱状图,然后你分析下柱状图。
可以总结如下,哪些东西再哪个地方受欢迎,哪些地方受欢迎是具有共性,哪些东西在某地最不受到欢迎。然后总结下未来可以如何去推广,好的做得更好,差的如何弥补之类的。
你要是做运营,这些数据肯定不难看懂吧!
纯手打,对大数据感兴趣欢迎加我信微:idacker
– -! 看你们说得这么深入,我来说些肤浅的吧。
省份那一列,升序排列一下,然后可以得到两组数据,第一组是同一省份的不同出版物,并列出最高与最低和平均值,第二组就是该省份的销量(第三列的,不知道是不是销量还是盈亏)
继而就是按照现在的原表不动,也可以得到两组数据,第一组是同一出版物不同省份的组成比例,第二组是不同出版物的销量。
然后画各种柱状图来评估所需要的信息。
1)分维度汇总,分析占比。 可以非别按照产品线和省份(省份部分还可以结合地域纬度。)汇总,并给出占比。取top N等。结合该公司产品发挥下业务含义 。
2)数值的正负分布统计。而且可以结合(1)的纬度
看着好像是图书发行的数据,对这行不了解。
那么在业务不熟悉的情况下,咱们怎么做数据分析?
首先要做的,应该是进行整理,对数据做简化。先看一下简化后的数据,能否找出规律性的东西,然后再对规律进行验证。
另外,既然这是面试的题目,那么结果什么的其实不是很重要,重要的应该是体现专业化的分析思路。
具体到题主的案例,可以先对数据做分组化处理
1、先对每个城市的净发量做分组排序,可以获得各个城市的净发量组数据,包括最大值、最小值、中位数。
2、然后所有的净发量组进行排序,然后分成5组,分别记成1~5。
3、表中大约有10种类型的书籍,按顺序排列对应的净发量分组编码。
3、样就可以获得每个城市的10位数净发分组编码,比如北京应该就是5,555,555,555,各个类型的净发量都是最大的一组。还可以把相近的类型合并到一个位数,进一步缩短分组编码的长度。
4、这样简化后的分组编码表,可以比较容易地看出各位城市的分布规律。比如某个城市的编码是1,511,111,111,说明对某一类型的图书需求量很大,大部分编码位都是5的城市,说明城市的图书市场容量很大,是重点城市。
另外,按城市分组后,还可以计算出单个城市内各类型图书净发量与组内最大值的百分比,然后分组编码,观察各个城市对图书类型的需求分布。
也可以按书籍类型进行分组观察,相关类型书籍的分组等等。
总之做数据分析,应该先想办法做简化归类,这样才好观察出共性。
运营以数据作为支撑,数据反映运营的好坏
答案已经这么多了,就随便胡诌几句;
首先,这属于传统商业分析的范畴,和新兴的数据分析行业关系不是太大;
另外这种结构化的数据一般可以遵循总~分的逻辑去分析,即先看数据总览都能看出些什么问题,再抽丝剥茧的看细项维度;
最后,多问几个为什么,将统计描述作为分析结果是分析中的大忌,想想你的分析目的是什么,根据分析目的去找答案;譬如”同样一个主题的产品,为什么每个省相差如此之大,是人口导致的还是收入导致还是竞争者太强等等”,所以这张表不是终点,还需要其他资料辅助
活用透视表,用筛选做多维度分析
以曲线柱图的形式展现,最终通过数据分析得出结论
用excel拉一张透视表,基本就能简单的总结一下数据体现内容了。
具体也不好说,毕竟各行如隔山,我还只是个画原型的= =
要汇总,分维度分析呀!