至于书籍,可以先看看Frederick J.Gravetter的《 Statistics for the behavioral sciences》(有一定统计基础的请忽略),这本书可以让你快速的理解统计的基本原理,而且不枯燥乏味。中高级的话就需要学习些data mining 的知识了,以后这个肯定是趋势。书籍推荐两本目前在学的:Jiawei Han的《Data mining:concepts and techniques》、Yanchang Zhao的《R and Data Mining: Examples and Case Studies》,这两本我用着感觉不错。另外,也可以在网上学习下公开课,data mining这块,国外的发展还是比较成熟的。可以去Coursera,Edx,Udacity上去找自己感兴趣的课,有很多,目前我正在学习MIT的 The Analytics Edges。
学习完基础的概率统计知识之后,就是一系列的数据分析方法了。很多数理统计的教科书都没有系统地介绍数据分析方法,比如我们本科学的《概率统计(理工类)》(Probability and Statistics for Engineering and the Sciences) 这本书中仅仅介绍了方差分析(包括双因素方差分析)。想短时间内了解完所有的数据分析方法是不现实的,但是就用户研究领域而言,最常用的数据分析方法并不是很多,短时间内了解还是完全没有问题的。之所以强调短时间,是因为我觉得要想系统地学习学科知识,最好的办法就是快速地上手,而将中间的原理、推导暂时忽略,待后来遇到问题的时候再去了解方法的来龙去脉。
阅读过的 CHI 论文不多,基本上都会使用到方差分析(单因素、多因素、多元)、因子分析、主成分分析、相关性分析、回归分析这些常见的数据分析方法等等。这里引用一下东京大学 Koji Yatani 教授的课程网站的内容:
Some Statistics Basics (Or “before doing an experiment or analysis”)
Types of data
Null Hypothesis Significance Testing
Some tips for R
Graphics in R
Methods to Complement Null Hypothesis Significance Testing
Parametric vs. Non-parametric
Effect Size
Power Analysis
Normality and Data transformation (Shapiro-Wilk test and Kolmogorov-Smirnov test)
Outlier Detection and Removal
Parametric Tests
F-test
t-test
ANOVA (Analysis of Variance) for comparing the means
Post-hoc tests
Non-parametric Tests
Chi-square test, Fisher’s exact test, and McNemar’s test
Cochran’s Q test
Mann-Whitney’s U test
Wilcoxon Signed-Rank test
Kruskal-Wallis and Friedman test
Correlation
Correlation
Coefficients of association (Correlation for nominal data)
Agreement and Inter-rater Reliability (Cohen’s Kappa)
journal of marketing这类顶级营销期刊上每100篇论文中估计也就只有那么1-2篇是水晶艺术品(绝世佳作)。为什么说顶级的营销学术论文或者研究就像是一件水晶艺术品呢。首先,你需要提出一个好的、有趣的、反常识idea,基于这个idea你需要寻找到最恰当的理论与逻辑分析来推导出你的假设,这个假设提出与逻辑推导的过程可以让别人看了拍案叫绝,这就好比是精湛的雕刻工艺。随后,你还需要对你提出的假设进行完美证明。你需要考虑所有可能发生的、会影响到你结果可信性的因素。比如(1)你需要努力并且认真地对待与解决内生性问题,你可能需要找到一个非常好的工具变量,或者是寻找一次自然实验,或者是直接通过实验的方法,很多方法可以帮助你解决与减轻内生性问题,但是往往各个方法都有其弊端,你可能需要通过几种方法的结合来相互补偿(比如你在实验室实验以外,可能还需要做一个现场实验,或者是利用一次自然实验配合二手数据来弥补实验室实验外部效度不足的问题),从而得到一个最优,最强有力的结果,确保你的研究结果是对于因果关系的揭示;(2)在数据采集方面你也需要充分考虑到样本选择性偏误、同源性方差等因素所带来的问题。你需要通过利用一些统计计量方法(比如heckman二步回归),以及独特的数据采集手段(自变量用问卷因变量用二手数据,或是自变量是一个人填写因变量换另一个人填写等)来避免这些问题的影响;(3)你还要充分考虑数据自身的特质,是否存在异质性的因素、是否存在异方差、因变量是何种分布等,从而选择最适合的参数估计方法;(4)你需要对研究结果进行稳健性的检验,需要利用不同样本、不同模型、不同测量方式来反复再现你的结果;(5)你需要直观、简洁、可视化地呈现你最终的研究结果,使其具有极强的可读性。因此,好的实证研究就像是一块无瑕透明的水晶原石,你在其中找不到一点杂质(上述讲到的这些问题点)。实证的过程如水晶般地透明,然后在水晶原石的基础上加上精湛的雕琢工艺,那最终就成了一件绝世佳作。水晶般地透明(完美的实证过程)与精湛的雕琢工艺(idea、假设提出与理论推导)两者缺一不可。没有精湛的雕琢工艺的水晶原石只是一块透明的石头,而缺少完美的实证过程那顶多也就是一块用烂木头做的小工艺品而已。
—————————————————————
营销民科在掌握了大专程度的知识后(不一定要大专文凭,只需要知识足矣),就可以看大部分的营销顶级期刊了,最初可能因为不熟悉会看不懂,但是看多了知道了套路后自然就懂了。一般“起点”最低的期刊是JCR(journal of consumer research),为什么说她起点最低呢。第一:JCR里面的数理统计最简单,大部分都是基于实验结果数据的简单统计,比如做个方差分析,只要大概看过点数理统计的书,搞清楚一些基本分布、p值、显著性、方差分析、回归分析就足够了,所以说只要大专生的数理统计水平就可以看懂JCR的实验结果部分;第二:而其理论部分一般名称虽然比较晦涩,但是只要认真百度,再加一点心理学的参考书籍都可以理解与明白,大多数都是属于常识与利用自省法就能够理解的范围;第三:实证模型与实验设计的结构与过程十分单调与老套。JCR的理论创新主要在其心理机制与环境条件的发现,心理机制是中介变量,环境条件是调节变量。所以你在看JCR前先去百度一下搞清什么是自变量、因变量、中介变量与调节变量,以及他们间的关系就行了。然后看JCR的实证与实验过程就一目了然。比如,一般JCR上来先讲个“故事”,从中提出一些现象间的关联。比如A影响C,或者A与C是有相关性的。然后就是渐渐通过利用一个心理学的成熟理论(JCR用的理论都是心理学成熟理论)来解释A为什么会影响C,即中间的心理机制是什么。A一般是一个刺激、或者是一种可操控的东西。JCR实验的自变量都是可以被操控或是外生的东西,不然实验就无法揭示因果关系了(这个参考计量经济学中的内生性问题,是一个道理)。而C一般是一种消费者的行为或是意向。B就是消费者的心理机制,也是JCR论文的创新之处了。JCR一般的第一个实验就是先检验一下A可以影响C,然后接下来做A可以通过B来影响C,最后可能会再进一步加入调节变量。一般一篇文章都是由4-5个实验构成的,每个实验间相关重叠与递进,你需要通过不同的样本、操控方式、测量方法来再现前一个实验结果的基础上进一步地检验中介与调节变量的参与。这里举个例子:比如有人发现个人主义/集体主义可以影响消费者对于产品购买的偏好,个人主义更倾向于购买趋利型产品(驾驭性好、舒服的汽车),而集体主义的人倾向于购买避害型产品(带有安全系统的汽车)。这个现象可以先通过一个实验来验证,个人主义/集体主义既可以通过一些手法来操控(让被试读个故事),也可以直接利用长期稳定的外生变量(不同国家文化的样本)。在验证后,就要开始找中介机制了,有的人就通过调节定向理论(即个人买产品前会设定一个目标,不同的人对于产品所带来的期望利益需求是不同的)来做。从而发现并且进一步验证了个人主义/集体主义->调节定向目标(促进调节目标/预防调节目标)->产品偏好,这样就是一个比较完整的研究了。如果你是第一个提出用机制B来解释A与C间的因果关系,并且用实验进行证实,那你的文章就可以发表了。从这个例子可以看到,民科看懂JCR是难度最低的,但是想做JCR上的研究缺比较难。除了该刊对于idea创新要求高外,你需要做大量的实验。你如果不是在学校,一般是很难召集样本做这样的实验的,当然如果你有一定的财力那肯定是没有问题的。有的人认为如果是在企业中从事营销工作,是不是就有优势。我可以告诉你,企业从事营销工作的人对于做JCR这类研究是毫无优势可言的,因为企业一般很少做lab实验,就算做也不可能完全满足JCR学术论文的要求,企业做研究都需要考虑成本与经济性,JCR上的研究都有极大的创新性,创新性就意味着极高的失败风险,这些是商业研究无法承受的。但是,好在JCR上的实验一般被试都不需要很多人数,大多可以用学生来做。所以自己掏钱一般也是可以承受的。一个实验加一起的花费1-2万,对于有财力的民科朋友还是可以承受的。一个研究一般需要4-5个实验,包括预测试以及失败的实验,顺利的情况下花费在10-15万左右。但是在实验前一定要保证将相关领域的文献全部看过,而且保证自己的研究内容是创新的,实验过程设计也需要尽可能地参考现有文献,在没把握的情况下多做几个预测试。至于数据分析与处理就太容易了,一般就是SPSS点击下的事情了。当然国内别说民科了,先官科都没几个发得了JCR,所以可以作为一种生活乐趣与人生追求,成事在天。好了,有空再写写其他几本顶级期刊的论文与研究情况。
—————————————————————
journal of marketing是营销学术界的NO.1期刊,AMA一手拉扯大的大儿子,至于小儿子搞学术的朋友应该也知道是journal of marketing research。JM这本期刊相比JCR,可以说是营销学术领域的另一个世界。无论是理论、题材还是研究方法与JCR完全不一样。由于我本人在企业工作,同时也长期经营企业,相比消费者行为我个人更加喜欢看营销战略方面的论文,所以JM是我每期必看的,JCR则是选择性看。要看懂JM要比看JCR难多了,不是光有点营销常识与好奇心就能够看懂的。首先,民科要看懂JM必要好好学习计量经济学与统计学。回归分析与结构方程模型是JM最常用的两种方法。我们需要从OLS开始,从初级往中高级学。极大似然估计、面板回归、heckman二步法这种一个不能少。同时结构方程模型、HLM模型也是必须要的,我花了2年时间来学习相关理论与软件的使用,因为我平时还忙于工作,业余自学所以用了2年,有点长。在方法基础打好了后,就可以开始根据自己的兴趣看论文了。一般消费者相关理论比较好理解,因为你自身也是一个消费者,可以从消费者视角利用自省法来理解。而B2B的研究除非你在企业中是从事这类工作的,不然你很难理解。有些行家看了拍案叫绝的东西,你不是这行的可能看了会觉得没啥了不起。因此,建议没有丰富营销实务经验的朋友还是专注于消费者相关的题材比较好,B2B可能不适合你。接下来就是要说JM上的论文题材了,我个人觉得顾客资产、关系营销、创新理论、渠道治理绝对是JM的“发表大户”,现任的JM主编kumar本人就是顾客资产(数据库营销)方面的权威。这类研究的理论体系十分庞大与成熟,而且就那几个权威在搞,几个人发表了大部分的文章。所以一般的人想切入进去弄点东西是十分难的。除非你能弄到一些十分独特的数据,或是有一些别人都没想到的idea(这个跟中彩票一样的概率,一般不用指望),否则大部分人就看看的份儿了。当然最近这几年在这些大题材领域,也有些学者通过做meta分析来发表文章的,但是这个需要很好的总结与归纳能力,特别是选题角度一定要独到,meta分析的看点在收敛现有的文献争议与研究调节变量,这个搞meta分析的朋友估计一说就能理会,不搞的朋友我说了也不知为何物,所以就不细讲了。由于顾客资产、关系营销、创新理论、渠道治这些领域发文太难,因此近几年就有一年年轻学者从网络营销这一新兴题材切入,从而成功发表其论文,当然其中也有一些中国人。网络营销的特点就是需要运用一些IT技术,IT技术好的朋友可以试试,国内我觉得武汉大学的黄敏学就是一个代表人物,最近看到JMR上有他一篇挂名的文章。JM总的来说,讲的故事不如JCR有趣,但是JM由于是营销战略,从而讲的东西都很大气,研究结论更加容易被企业所实践与运用。JM上面实验法的文章不多,大部分还是用二手数据与问卷法来做的。当然现在也逐渐出现了同时使用几种数据源(问卷、实验数据、二手数据等)与研究方法的文章,并且对待变量内生性的态度也越来越严格了。这就需要我们在研究前就要对数据来源、数据处理方法、实证模型都做好慎重规划与设计了,特别是无名学者更要重视方法的规范性,因为你的思想质量别人无法马上观察与品位(大牛应该都很忙),只能先从实证研究的规范性来判断你的水平了。这也是我们在看JM前要先苦学计量经济学的最主要原因了。
—————————————————————
最后再谈一下journal of marketing research(JMR)吧,感觉这本期刊比较适合那些技术方法控,以及一些理论功底不是那么扎实但是有一些好idea的文章。或是JCR上发不了的文章(这个看看JCR再看看JMR就马上明白了)。如果说JM是个十分稳重与成熟的中年人的话,那JMR这本期刊就有点像一个稚气未脱的少年精英。上面发的文章idea都十分新颖,同时也会用一些比JM、JCR更复杂与亮炫的技术,比如今年上半年有一期是脑神经营销的专题论文,有兴趣的朋友可以去找来看看,几乎都是用亮炫的技术与工具来实证一些我们已经知道的东西,不过我个人认为这类研究对于营销的科学性提升还是很有帮助的。AMA成员可以免费选择两本学术期刊,所以JM之外另一本一般都是选择JMR了(除非你对国际营销感兴趣,那你可以选择JIM)。JMR是中国很多学者起步的国际顶级期刊,上面的文章对于理论深度与创新的要求低于JM、JCR,这点你看JMR的写作格式就可以知道,其理论回顾与假设提出一般都在2-3页(这部分JM一般在5页及其以上),而对于数据与模型的描述则要花费3-4页。JMR所用的研究方法的复杂度与创新度则比MS(marketing science)低很多。很多民科朋友都在企业从事营销实务,你手上可能有很多独特的数据,而且你也可能掌握了一些复杂新颖的技术,那你就可以试试JMR。你可以从数据驱动来看看是否能够挖掘出一些有趣、反常识的现象。然后倒过去寻找可以解释这些奇特现象的理论来自圆其说。但是请记住,你的数据一定要足够的奇特、发现要够劲爆。
回复 ( 10 )
结合个人目前的一点经历,来说说想法吧。
用户研究需要结合定性和定量的研究,对于定量如何做,这个要取决于公司的产品。初级的分析可以看看各种趋势,统计图,中级点的可以看看聚类、回归、关联、预测等,高级点的可以看看时序、文本、社交网络分析等。分析方法很多,依次系统学肯定很慢,跟不上工作的节奏,如果楼主有一定的统计背景,跟着项目学起来应该会很快。
至于书籍,可以先看看Frederick J.Gravetter的《 Statistics for the behavioral sciences》(有一定统计基础的请忽略),这本书可以让你快速的理解统计的基本原理,而且不枯燥乏味。中高级的话就需要学习些data mining 的知识了,以后这个肯定是趋势。书籍推荐两本目前在学的:Jiawei Han的《Data mining:concepts and techniques》、Yanchang Zhao的《R and Data Mining: Examples and Case Studies》,这两本我用着感觉不错。另外,也可以在网上学习下公开课,data mining这块,国外的发展还是比较成熟的。可以去Coursera,Edx,Udacity上去找自己感兴趣的课,有很多,目前我正在学习MIT的 The Analytics Edges。
说到这里,应该有人能看出来我用什么工具了,哈哈。。。SPSS+R+Python。工具还有其他的,根据不同的需求,工具也不同,比如数据可视化的工具,楼主可以自行百度下。工具不是重点,重点是数据的提取+数据的思维+数据对商业的价值点。
要不要学数据挖掘,我觉得这个取决于用研人员能达到的深度。个人认为,用研人员如果有研究思维,数据思维,产品思维,商业思维,创新思维,再加上体验设计思维,服务设计思维,战略规划,基本上就可以召唤神龙了,哈哈。。。这个也要取决于公司和个人。
阶段一:基本数学了解
1、90%的用研需要的数据分析基础基本就是中学的数据基础就够了,就好像财务管理中杜邦分析法一样,就是数字加减乘除,关键是你要学会进行对比,描述,分类,差异的分析。
2、进一步建议需要了解一些概率与数理统计的知识,其实这方面的知识用相应的统计工具都能够给出来,你只是需要了解一些具体的含义,不需要你去计算。
阶段二:统计工具熟悉
3、统计工具中,你需要了解,描述、交叉分析、因子分析、回归、相关、聚类几项基本内容,以及各种假设检验
4、进阶可以了解如何用工具做一些决策树、神经网络的 分类或者预测分析
阶段三:自己建模跑数据
5、更牛一点你可以自己建复杂模型,这个阶段基本上各种数学都可能用得上。不过一般做用研,5年内能碰上1-2个就不错了。呵呵,屠龙术。
总的来说,不建议单独学习数据分析,在用研过程中,带着问题去研究数据分析更有效一些。用研做数据分析的目的还是要探索和发现用户需求的规律,这就是从定量中找到定性的结论。
在进行体系化的学习之前,请先用一些现有的数据开始做一些用户行为和业务发展状况的洞察。等你积累一定的case之后,再来看自己现在的提问,也许你想另外开一个题了。
首先,不管是什么学科的数据分析,总是避不开最基本的概率论和数理统计知识。这一点一般的数理统计教科书都能够满足入门的要求。除此之外,还需要自学实验设计的方法,例如 Within-Subject Design & Between-Subject Design 等等,了解这些基本的实验设计方法才能更容易理解之后的数据分析知识。
学习完基础的概率统计知识之后,就是一系列的数据分析方法了。很多数理统计的教科书都没有系统地介绍数据分析方法,比如我们本科学的《概率统计(理工类)》(Probability and Statistics for Engineering and the Sciences) 这本书中仅仅介绍了方差分析(包括双因素方差分析)。想短时间内了解完所有的数据分析方法是不现实的,但是就用户研究领域而言,最常用的数据分析方法并不是很多,短时间内了解还是完全没有问题的。之所以强调短时间,是因为我觉得要想系统地学习学科知识,最好的办法就是快速地上手,而将中间的原理、推导暂时忽略,待后来遇到问题的时候再去了解方法的来龙去脉。
阅读过的 CHI 论文不多,基本上都会使用到方差分析(单因素、多因素、多元)、因子分析、主成分分析、相关性分析、回归分析这些常见的数据分析方法等等。这里引用一下东京大学 Koji Yatani 教授的课程网站的内容:
这里包含了绝大部分常用的数据分析方法,使用 R 语言作为示例,对概念都有生动的例子进行解释,还是很容易看懂的。
当然,如果已经了解了上面提到的数据分析方法,那么阅读 CHI 论文应该没有什么很大问题了。于是,就可以开始学习统计分析软件了,例如 IBM SPSS、SAS 等等,当然如果有代码基础的话,可以学习 R、Python 这些编程语言等,这两种语言都有大量的数据分析的包,用来做数据分析还是非常方便的。
如果还是学有余力,还能再去了解数据挖掘的知识就更好了。
学习途径:
1. 基础的概率和数理统计知识很多 MOOC 讲得都不错,这里尤其推荐可汗学院的统计学,很多课堂上听得一头雾水的概念,他一解释就懂了。
2. 数据分析的话,我也没找到 MOOC,参考中给出两个都是不错的自学教材。
3. 数据挖掘还没有深入学习,所以也不能给出建议和推荐。
参考:
[1] Quantifying User Experience – Practical Statistics for User Research, Jeff Sauro & James R. Lewis
[2] HCI Statistics, hcistats:start [Koji Yatani’s Course Webpage]
===== 原回答 ======
正好最近也在苦恼这个问题,占个坑,一会回去答。
(更新:加入了数据清洗和数据可视化部分)
在谈数据分析之前,先明白一点,工具永远是手段,重要的是思考能力和对产品的了解。”基本的道理永远就那么多,而针对同一问题的广度、深度、以及视野高度是永远的修行”——刘津。
就整个数据分析的流程来说可以分为:数据清洗和核心的分析部分,如果深入可以进行数据挖掘和模型建立,最后可以进行数据可视化。
数据清洗:
(这部分是需要动手操作的,要自己尝试做数据清洗,只看理论不行)
数据清洗通常在整个数据分析中的占据大部分的时间,因为raw data质量好不好就在那里,但是数据清洗的质量直接关系到数据分析的效果和最终的结论。通常包括以下工作:
1, 了解数据(看数据集说明、人工查看);
2, 删掉或替换缺失值;
3, 统一格式(日期、字符)或逻辑错误的数据;
4, 不必要的部分删掉;
数据分析的工作就是很繁琐,要有耐心。
数据分析方法:
这部分是需要功底的,有时间最好系统学习,理论很重要。但是学习这部分的深入程度取决于你的职业规划。如果你想横向向产品方向发展,那么可能就不需要对数据分析方法特别高的要求;当然现在好多公司都在找擅长定量的用研,你也可以向这个方向钻研,具体还是要自己权衡。通常包括下面的方法:
描述统计、假设检验、方差分析、相关分析、回归分析、主成分和因子分析;决策树、关联分析、聚类分析、时间序列分析;
一般心理学出身的用研对前半部分的方法都有了解。后面的几种属于数据挖掘的内容,但是也都是用研常用的,需要看相关书籍了解。以聚类分析和关联分析为例:
聚类分析:将个体按相似程度(距离远近)划分类别。例如在用户细分过程中,可以通过聚类分析划分不用的用户类别。
关联分析:一个典型例子购物篮分析,通过发现顾客放入其购物篮中的不同物品之间的联系,分析顾客的购买习惯。通过了解哪些产品频繁地被顾客同时购买,这种关联的发现可以帮助制定营销策略。也就是喜欢什么东西的人往往喜欢什么;做了这个事的人一般接下来会做什么。经典的啤酒&尿布。
营销管理分析方法:
SWOT/PEST/4P/5W2H/用户行为理论。
网站分析:
(这部分也要动手实践,涉及到埋点的一些内容)
用户行为路径分析VS漏斗分析,用户点击行为分析,眼动分析,流量、转化率、跳出率三个指标。这部分也可以算作工具,如:
GA,Heap,Trak,Mouseflow,AppSee,PadiTrack等
数据可视化:
这部分我也是刚刚接触,最近报名了某大数据竞赛·可视化比赛,所以逼着自己学了一些可视化方面的内容,简单说说感受吧:数据可视化方面的工具很多,有人用基于js的D3,有人用python包,有人用r…都是不同的语言,我不是说语言 有多难,只是大多数用研恐怕写代码的经验真的不多,总之,不要这个学一点那个学一点,入坑谨慎吧…。D3画出来的图很酷炫,但是学习曲线陡峭;我个人还是用r比较习惯,因为数据清洗,数据分析,数据可视化可以一篮子搞定。
数据分析工具:
1, excel/ SPSS
2, R/python(数据清洗、分析、可视化)
3, SQL(获取原始数据)
4,js(网站分析、数据可视化)
5,D3.js(D3可以看作是js的一个函数库,数据可视化)
这些都是应该掌握的,具体内容网上一大堆,自行知乎。
说一些我个人的感受,我喜欢的方法是在网上看文章,遇到不懂的概念再扩展、发散。这样一个概念就可以发散出n多概念,比如:用户行为路径分析→漏斗分析→用户细分→聚类分析→用户分层。但是要注意这个过程中保持头脑清醒==。不然容易迷失。
刚开始学用户研究,欢迎拍砖。
题主既然问到系统学习数据分析,那么你需要学习的知识应当让你了解数据分析工作的基本流程,常用工具和基本常识。下面这些是最基本的了,不能再少了…
这些知识包括但不限于:
1.数据分析工作的基本流程
1.1 数据采集:亲自参与数据采集的意义在于可以让你真正了解到第一手原始数据,包括数据产 生的时间,取样方式,数据格式/内容,约束条件等等。熟悉这一步可以帮助你 更有针对性的完成数据采集过程,也有助于培养初学者对于数据的敏感度;
1.2 数据存储:这一步的重点在于数据存储的时候经过了怎样的加工处理,最后放进数据仓库的 数据是什么样子的。因为数据在存储阶段是不断迭代更新的,,如果你不清楚数 据加工和存储的基本流程,这在后期数据使用的过程中很容易出错。
1.3 数据提取: 数据提取一定要着眼业务需求,你要做用户分析,就要提取跟用户特征相关的数 据。而且提取维度也要跟你分析的用户特征保持一致。刚才我们也提到数据是不 断迭代更新的,所以不同的提取时间和提取规则,得到的数据是不一样的
1.4 数据分析:这一步就是面向业务解读数据,所以关键在于把分析结果沟通到用户分析的业务 操作中便于业务部门理解和执行
1.5 数据呈现:也叫数据可视化,向老板交作业的过程
1.6 数据应用: 把你的结论和业务部门沟通以后,推动你的分析结论落地实施
2.常用工具如下:
数据分析类:Excel,SPSS,SAS,R,PYTHON。
用户分析类:Google Analytics,百度统计,PIWIK,
数据展示类:Office 三大件
3.常识建议如下:
3.1 概念类:主要是用户数据的基本定义及其规则,包括UV,PV,Visitor,IP等等
3.2 技术类:基本的编程语言规则(HTML,JS,R)和工作对象(Cookie,缓存,HTTP等)
3.3 流程类:了解用户研究工作对接的业务流程/部门,如营销,运营,会员等等,搞清楚数据在 这些部门是如何起作用的,数据和业务联系起来才有价值
4.学习路径建议如下:
4.1 择良师:向你能够得着的水平最高的老师学习,可以直接请教或者学习其文章、书籍
4.2 拓视野:无论学习任何东西,关起门来一心只读圣贤书都是有局限的。多和这个圈子的人 (尤其是高人)交流,知识的碰撞往往让你进步更快
4.3:多练习:你大脑当中的东西,如果没有经过实操,最多只能算是“你知道了”,而不能算 作“你学会了”。学习本身并不能解决问题,实操可以。包括Google Analytics在内 的诸多工具都提供在线指导,通过工具学习本身也比读书要快的多了。
如果是想从事消费者或是市场营销学术方面的研究,推荐可以看下下面的文章,来获得一些启示。
市场营销的学术研究根本不需要学历 :
本人初中毕业后去了职校,早早就去了工厂与企业工作,现在最终学历还是一个夜大学的工商管理大专。但是这些都不影响我成为一个市场营销的学者,我在做销售的时候偶尔看了科特勒的营销管理,觉得营销这个东西有趣。然后就自己慢慢自学,走上了业余的营销学术道路。自己感觉要做市场营销的学术(是学术,不是实务哦)打基础还是比较轻松与容易的。介绍下我的个人经历,高起点的朋友可以直接无视,而跟我一样起点很低,但是有志于从事营销学术的朋友可以参考(如果你的目标是成为机场候机室小卖部电视中反复放的那些营销大师,也可以直接无视,因为我们前往的世界不一样)。首先是靠书籍来打基础,第一阶段:科特勒的营销管理就不说了,必看,当然也可以辅助看看消费者行为学、品牌管理、市场调研的专属,营销管理是一本入门系统书,是让你具有营销常识的同时,然后找寻自己感兴趣的领域。同时,数理统计,微积分与线性代数这个很有必要自学一下,找本好书不难学,中考落榜的我都觉得只要认真做课后题就肯定可以掌握。然后自己也要开始摸摸SPSS软件,这个东西很好入门。至于数据么可以用SPSS自带的教程数据来再现书里的结果,考考自己是否真会了,当然如果有企业工作的实际数据用来跑那是更好了。好了,到这里你还没有趴下与放弃那我们进入第二阶段:接下来我们需要学习计量经济学与微观经济学啦,计量经济学基础看看古扎拉帝上下册就行了,看懂了后再切换到伍德里奇噢,不然你吃不消的。微观么随便看看高鸿业与范里安就行了,不难。与此同时,你还要开始学习STATA与AMOS了。前者做做回归,后者做结构方程模型,结构方程模型是营销必备工具,不学要被人家笑话的。当然,有条件的再学一下HLM,在做组织战略的时候,数据可能是分层的,比如几份问卷都是一个经理,一个团队或一个公司的,所以这时候需要用HLM。如果上述这些你都熟练掌握了,那估计你已经可以硕士毕业了。最后就是第三阶段了,也就是真正开始做些营销学术了。你先选择几个自己感兴趣的题材,然后开始学习看论文。我们民科没有账号,只能想办法找免费的论文看,不过运气比较好,很多论文都可以免费下载。比如:美国营销协会网站、JMS营销科学学报网站、百度学术、google学术等。一般先看中文论文,比如营销科学学报啥。期间学习下英语然后中文论文看多看熟了就可以开始看英文的了。我们最终的目标是看懂4本国际顶级期刊中的三本,即JM、JMR与JCR。MS放弃吧,这个对于民科,官科都太难,不是专门研究这个的就是天书,我们不装B,不懂就不懂。好了,今天就写到这里,以后有空再细写怎么看懂论文与做研究了。
—————————————————————
附上一个本人对于“好的学术研究”的看法,供大家一起讨论。
journal of marketing这类顶级营销期刊上每100篇论文中估计也就只有那么1-2篇是水晶艺术品(绝世佳作)。为什么说顶级的营销学术论文或者研究就像是一件水晶艺术品呢。首先,你需要提出一个好的、有趣的、反常识idea,基于这个idea你需要寻找到最恰当的理论与逻辑分析来推导出你的假设,这个假设提出与逻辑推导的过程可以让别人看了拍案叫绝,这就好比是精湛的雕刻工艺。随后,你还需要对你提出的假设进行完美证明。你需要考虑所有可能发生的、会影响到你结果可信性的因素。比如(1)你需要努力并且认真地对待与解决内生性问题,你可能需要找到一个非常好的工具变量,或者是寻找一次自然实验,或者是直接通过实验的方法,很多方法可以帮助你解决与减轻内生性问题,但是往往各个方法都有其弊端,你可能需要通过几种方法的结合来相互补偿(比如你在实验室实验以外,可能还需要做一个现场实验,或者是利用一次自然实验配合二手数据来弥补实验室实验外部效度不足的问题),从而得到一个最优,最强有力的结果,确保你的研究结果是对于因果关系的揭示;(2)在数据采集方面你也需要充分考虑到样本选择性偏误、同源性方差等因素所带来的问题。你需要通过利用一些统计计量方法(比如heckman二步回归),以及独特的数据采集手段(自变量用问卷因变量用二手数据,或是自变量是一个人填写因变量换另一个人填写等)来避免这些问题的影响;(3)你还要充分考虑数据自身的特质,是否存在异质性的因素、是否存在异方差、因变量是何种分布等,从而选择最适合的参数估计方法;(4)你需要对研究结果进行稳健性的检验,需要利用不同样本、不同模型、不同测量方式来反复再现你的结果;(5)你需要直观、简洁、可视化地呈现你最终的研究结果,使其具有极强的可读性。因此,好的实证研究就像是一块无瑕透明的水晶原石,你在其中找不到一点杂质(上述讲到的这些问题点)。实证的过程如水晶般地透明,然后在水晶原石的基础上加上精湛的雕琢工艺,那最终就成了一件绝世佳作。水晶般地透明(完美的实证过程)与精湛的雕琢工艺(idea、假设提出与理论推导)两者缺一不可。没有精湛的雕琢工艺的水晶原石只是一块透明的石头,而缺少完美的实证过程那顶多也就是一块用烂木头做的小工艺品而已。
—————————————————————
营销民科在掌握了大专程度的知识后(不一定要大专文凭,只需要知识足矣),就可以看大部分的营销顶级期刊了,最初可能因为不熟悉会看不懂,但是看多了知道了套路后自然就懂了。一般“起点”最低的期刊是JCR(journal of consumer research),为什么说她起点最低呢。第一:JCR里面的数理统计最简单,大部分都是基于实验结果数据的简单统计,比如做个方差分析,只要大概看过点数理统计的书,搞清楚一些基本分布、p值、显著性、方差分析、回归分析就足够了,所以说只要大专生的数理统计水平就可以看懂JCR的实验结果部分;第二:而其理论部分一般名称虽然比较晦涩,但是只要认真百度,再加一点心理学的参考书籍都可以理解与明白,大多数都是属于常识与利用自省法就能够理解的范围;第三:实证模型与实验设计的结构与过程十分单调与老套。JCR的理论创新主要在其心理机制与环境条件的发现,心理机制是中介变量,环境条件是调节变量。所以你在看JCR前先去百度一下搞清什么是自变量、因变量、中介变量与调节变量,以及他们间的关系就行了。然后看JCR的实证与实验过程就一目了然。比如,一般JCR上来先讲个“故事”,从中提出一些现象间的关联。比如A影响C,或者A与C是有相关性的。然后就是渐渐通过利用一个心理学的成熟理论(JCR用的理论都是心理学成熟理论)来解释A为什么会影响C,即中间的心理机制是什么。A一般是一个刺激、或者是一种可操控的东西。JCR实验的自变量都是可以被操控或是外生的东西,不然实验就无法揭示因果关系了(这个参考计量经济学中的内生性问题,是一个道理)。而C一般是一种消费者的行为或是意向。B就是消费者的心理机制,也是JCR论文的创新之处了。JCR一般的第一个实验就是先检验一下A可以影响C,然后接下来做A可以通过B来影响C,最后可能会再进一步加入调节变量。一般一篇文章都是由4-5个实验构成的,每个实验间相关重叠与递进,你需要通过不同的样本、操控方式、测量方法来再现前一个实验结果的基础上进一步地检验中介与调节变量的参与。这里举个例子:比如有人发现个人主义/集体主义可以影响消费者对于产品购买的偏好,个人主义更倾向于购买趋利型产品(驾驭性好、舒服的汽车),而集体主义的人倾向于购买避害型产品(带有安全系统的汽车)。这个现象可以先通过一个实验来验证,个人主义/集体主义既可以通过一些手法来操控(让被试读个故事),也可以直接利用长期稳定的外生变量(不同国家文化的样本)。在验证后,就要开始找中介机制了,有的人就通过调节定向理论(即个人买产品前会设定一个目标,不同的人对于产品所带来的期望利益需求是不同的)来做。从而发现并且进一步验证了个人主义/集体主义->调节定向目标(促进调节目标/预防调节目标)->产品偏好,这样就是一个比较完整的研究了。如果你是第一个提出用机制B来解释A与C间的因果关系,并且用实验进行证实,那你的文章就可以发表了。从这个例子可以看到,民科看懂JCR是难度最低的,但是想做JCR上的研究缺比较难。除了该刊对于idea创新要求高外,你需要做大量的实验。你如果不是在学校,一般是很难召集样本做这样的实验的,当然如果你有一定的财力那肯定是没有问题的。有的人认为如果是在企业中从事营销工作,是不是就有优势。我可以告诉你,企业从事营销工作的人对于做JCR这类研究是毫无优势可言的,因为企业一般很少做lab实验,就算做也不可能完全满足JCR学术论文的要求,企业做研究都需要考虑成本与经济性,JCR上的研究都有极大的创新性,创新性就意味着极高的失败风险,这些是商业研究无法承受的。但是,好在JCR上的实验一般被试都不需要很多人数,大多可以用学生来做。所以自己掏钱一般也是可以承受的。一个实验加一起的花费1-2万,对于有财力的民科朋友还是可以承受的。一个研究一般需要4-5个实验,包括预测试以及失败的实验,顺利的情况下花费在10-15万左右。但是在实验前一定要保证将相关领域的文献全部看过,而且保证自己的研究内容是创新的,实验过程设计也需要尽可能地参考现有文献,在没把握的情况下多做几个预测试。至于数据分析与处理就太容易了,一般就是SPSS点击下的事情了。当然国内别说民科了,先官科都没几个发得了JCR,所以可以作为一种生活乐趣与人生追求,成事在天。好了,有空再写写其他几本顶级期刊的论文与研究情况。
—————————————————————
journal of marketing是营销学术界的NO.1期刊,AMA一手拉扯大的大儿子,至于小儿子搞学术的朋友应该也知道是journal of marketing research。JM这本期刊相比JCR,可以说是营销学术领域的另一个世界。无论是理论、题材还是研究方法与JCR完全不一样。由于我本人在企业工作,同时也长期经营企业,相比消费者行为我个人更加喜欢看营销战略方面的论文,所以JM是我每期必看的,JCR则是选择性看。要看懂JM要比看JCR难多了,不是光有点营销常识与好奇心就能够看懂的。首先,民科要看懂JM必要好好学习计量经济学与统计学。回归分析与结构方程模型是JM最常用的两种方法。我们需要从OLS开始,从初级往中高级学。极大似然估计、面板回归、heckman二步法这种一个不能少。同时结构方程模型、HLM模型也是必须要的,我花了2年时间来学习相关理论与软件的使用,因为我平时还忙于工作,业余自学所以用了2年,有点长。在方法基础打好了后,就可以开始根据自己的兴趣看论文了。一般消费者相关理论比较好理解,因为你自身也是一个消费者,可以从消费者视角利用自省法来理解。而B2B的研究除非你在企业中是从事这类工作的,不然你很难理解。有些行家看了拍案叫绝的东西,你不是这行的可能看了会觉得没啥了不起。因此,建议没有丰富营销实务经验的朋友还是专注于消费者相关的题材比较好,B2B可能不适合你。接下来就是要说JM上的论文题材了,我个人觉得顾客资产、关系营销、创新理论、渠道治理绝对是JM的“发表大户”,现任的JM主编kumar本人就是顾客资产(数据库营销)方面的权威。这类研究的理论体系十分庞大与成熟,而且就那几个权威在搞,几个人发表了大部分的文章。所以一般的人想切入进去弄点东西是十分难的。除非你能弄到一些十分独特的数据,或是有一些别人都没想到的idea(这个跟中彩票一样的概率,一般不用指望),否则大部分人就看看的份儿了。当然最近这几年在这些大题材领域,也有些学者通过做meta分析来发表文章的,但是这个需要很好的总结与归纳能力,特别是选题角度一定要独到,meta分析的看点在收敛现有的文献争议与研究调节变量,这个搞meta分析的朋友估计一说就能理会,不搞的朋友我说了也不知为何物,所以就不细讲了。由于顾客资产、关系营销、创新理论、渠道治这些领域发文太难,因此近几年就有一年年轻学者从网络营销这一新兴题材切入,从而成功发表其论文,当然其中也有一些中国人。网络营销的特点就是需要运用一些IT技术,IT技术好的朋友可以试试,国内我觉得武汉大学的黄敏学就是一个代表人物,最近看到JMR上有他一篇挂名的文章。JM总的来说,讲的故事不如JCR有趣,但是JM由于是营销战略,从而讲的东西都很大气,研究结论更加容易被企业所实践与运用。JM上面实验法的文章不多,大部分还是用二手数据与问卷法来做的。当然现在也逐渐出现了同时使用几种数据源(问卷、实验数据、二手数据等)与研究方法的文章,并且对待变量内生性的态度也越来越严格了。这就需要我们在研究前就要对数据来源、数据处理方法、实证模型都做好慎重规划与设计了,特别是无名学者更要重视方法的规范性,因为你的思想质量别人无法马上观察与品位(大牛应该都很忙),只能先从实证研究的规范性来判断你的水平了。这也是我们在看JM前要先苦学计量经济学的最主要原因了。
—————————————————————
最后再谈一下journal of marketing research(JMR)吧,感觉这本期刊比较适合那些技术方法控,以及一些理论功底不是那么扎实但是有一些好idea的文章。或是JCR上发不了的文章(这个看看JCR再看看JMR就马上明白了)。如果说JM是个十分稳重与成熟的中年人的话,那JMR这本期刊就有点像一个稚气未脱的少年精英。上面发的文章idea都十分新颖,同时也会用一些比JM、JCR更复杂与亮炫的技术,比如今年上半年有一期是脑神经营销的专题论文,有兴趣的朋友可以去找来看看,几乎都是用亮炫的技术与工具来实证一些我们已经知道的东西,不过我个人认为这类研究对于营销的科学性提升还是很有帮助的。AMA成员可以免费选择两本学术期刊,所以JM之外另一本一般都是选择JMR了(除非你对国际营销感兴趣,那你可以选择JIM)。JMR是中国很多学者起步的国际顶级期刊,上面的文章对于理论深度与创新的要求低于JM、JCR,这点你看JMR的写作格式就可以知道,其理论回顾与假设提出一般都在2-3页(这部分JM一般在5页及其以上),而对于数据与模型的描述则要花费3-4页。JMR所用的研究方法的复杂度与创新度则比MS(marketing science)低很多。很多民科朋友都在企业从事营销实务,你手上可能有很多独特的数据,而且你也可能掌握了一些复杂新颖的技术,那你就可以试试JMR。你可以从数据驱动来看看是否能够挖掘出一些有趣、反常识的现象。然后倒过去寻找可以解释这些奇特现象的理论来自圆其说。但是请记住,你的数据一定要足够的奇特、发现要够劲爆。
市场营销的学术研究根本不需要学历
概率是基础,宏观的分析靠统计,微观的靠挖掘。从结果上来看,业务是最重要的
看题主的问题,感觉题主和我一样是数据小白。我开始SPSS零基础学。大数据总归要了解,因涉及零售行业,都是零基础,大学老师推荐了《数据化管理-洞悉零售及电子商务运营》。感觉浅显易懂点,适合零基础。题主有更好的别忘吱我一声。
别人专业学这个科班出身的,是吃饭的手艺。想要靠自己学习最后做出可靠的分析难度很大。专业的事情要交给专业的人做,要么请个统计师要么去读个统计学位。所谓捷径只能给你些似是而非的概念最终做一些不靠谱的模型得出不靠谱的结论罢了。
这个问题就好比,我想要出个唱片,如何自学钢琴?自己兴趣爱好玩玩就罢了,用来商用的话。。。