第1章 数据分析那些事儿
数据分析是“神马”
数据分析六步曲
数据分析的三大误区
数据分析师的职业发展
几个常用指标或术语
出场人物:
牛董,关键词:私企董事长、要求严格、为人苛刻; 小白,关键词:应届毕业生,刚入职场的伪白骨精(白领+骨干+精英)、牛董助手、爱臆想; Mr.林,关键词:小白同事、数据分析达人、成熟男士、乐于助人、做事严谨。
小白过五关斩六将,通过严格的面试,*终从众多**毕业生中脱颖而出,成为公司的一员。在报到的**天,公司HR向小白介绍了她的职位——公司牛董的助理,负责文���工作,可能需要做一些数据分析之类的活儿。小白一听到数据分析这个词,就感觉头皮发麻,这时,她的脑子里幻想出一些穿白大褂的科研人员在实验室的计算机前不断忙碌的场景。虽然在上大学时也使用过Excel,但是如果要做数据分析工作,她还真的有些不知如何下手。无数个问号涌到她的脑海中:数据分析到底要做什么呢?我要怎么做数据分析?老板想要看什么样的结果呢?……唉,只好边走边干了。
HR看出小白的心事,说道:“关于数据分析你不用太担心,如果遇到难题,你可以请教我们公司的Mr.林,他在这方面可是专家喔!”
小白一听有救星,立马兴奋起来,好像抓到救命稻草一样,想赶紧找到这位大师级人物,然后一股脑把疑问全倒出来。
HR:小白,你跟我来吧,我给你引荐下Mr.林。
小白:好的。
小白说着跟HR来到了Mr.林的办公桌旁,HR说道:“Mr.林,这是我们公司新来的同事,叫小白,现担任牛董助理,其中部分工作涉及数据分析,到时候她有问题还要麻烦您多多指点了”。
小白紧跟着说道:Mr.林,您好,请多多指教。
Mr.林:别客气,有问题直接来找我就可以了。
小白趁机说道:我现在就有问题,您现在是否有时间帮我解答下?数据分析是干什么的,具体要怎么做?
Mr.林听完后,笑了起来:你还真是不客气呀,好吧,你刚进公司,我就先给你做个简单的培训,带你入个门吧,以后的修行可就靠你自己努力了。
小白用力点着头……
1.1 数据分析是“神马”
Mr.林接着说道:小白,既然要学习数据分析,借用现在网络流行语,你能说说数据分析是“神马”?
小白:呵呵,数据分析肯定不是“浮云”。从字面上理解,数据分析就是对数据进行分析。Mr.林,我只能理解到这一层面了,专业的解释就需要您来指教了。
1.1.1 何谓数据分析
Mr.林:简单来说,数据分析就是你刚才讲的——对数据进行分析。较为专业的说法,数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求*大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据也称观测值,是通过实验、测量、观察、调查等方式获取的结果,常常以数量的形式展现出来。
数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律。在实际工作当中,数据分析能够帮助管理者进行判断和决策,以便采取适当策略与行动。例如,企业的高层希望通过市场分析和研究,把握当前产品的市场动向,从而制订合理的产品研发和销售计划,这就必须依赖数据分析才能完成。
在统计学领域,有些学者将数据分析划分为描述性数据分析、探索性数据分析以及验证性数据分析。其中,探索性数据分析侧重于在数据之中发现新的特征,而验证性数据分析则侧重于对已有假设的真伪证明。
从另外一个角度看,描述性数据分析属于初级数据分析,常见的分析方法有对比分析法、平均分析法、交叉分析法等。而探索性数据分析以及验证性数据分析属于**数据分析,常见的分析方法有相关分析、因子分析、回归分析等。我们日常学习工作中涉及的数据分析方法主要是描述性数据分析,也就是大家常用的初级数据分析。
1.1.2 数据分析的作用
Mr.林:了解了数据分析是神马后,那么数据分析在我们日常经营分析工作中具体有哪些作用呢?体现在哪几方面呢?
小白:Mr.林,您刚才不是说数据分析就是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律,帮助管理者进行有效的判断和决策,就好比是从矿山中挖掘出金子。
Mr.林:没错,但刚才说的是数据分析的*终目的,要达到这些目的,我们在日常工作中该做些什么呢?比如日常通报、专题分析等,这些就是数据分析具体工作的体现。而什么时候做通报工作,什么时候该开展专题分析,这都需要我们根据实际情况做出选择的。很多人经常做这些工作,但不知为何而做,只是为做而做,也没有想清楚为何要做,当你对数据分析目的及工作有了足够清晰的认识,那么数据分析开展也将如鱼得水,游刃有余。
数据分析在我们日常经营分析工作中主要有三大作用:
1、现状分析
简单来说就是告诉你过去发生了什么。具体体现在:
**、告诉你企业现阶段的整体运营情况,通过各个经营指标完成情况来衡量,以说明企业整体运营是好了还是坏了,好的程度如何,坏的程度又到哪里。
第二、告诉你企业各个业务发展及构成情况,让你了解企业各业务发展及变动情况,对企业运营情况有更深入的了解。
现状分析一般通过日常通报来完成,如日报、周报、月报等日常通报形式。
2、原因分析
简单来说就是告诉你为什么发生了。
经过**阶段的现状分析,对企业的运营情况有了基本了解,但不知道运营情况具体好在哪里,差在哪里,是什么原因引起的。这时就需要开展原因分析,以进一步确定业务变动的具体原因。如2012年2月运营收入环比2012年1月运营收入下降5%,是什么原因导致的呢?是各个业务收入都出现下降,还是个别业务收入下降引起的?是各个地区业务收入都出现下降,还是个别地区业务收入下降引起的?这就需要我们开展原因分析,进一步确定收入下降的具体原因,以便运营策略做出调整与优化。
原因分析一般通过专题分析开展来完成此项工作,根据企业运营情况选择开展。
3、预测分析
简单来说就是告诉你将来发生什么。
在了解企业运营现状后,有时还需要对企业未来发展趋势作出预测,为制定企业运营目标及策略提供有效的参考决策依据,以保证企业的可持续健康发展。
预测分析一般通过专题分析开展来完成此项工作,预测分析一般在制定企业季度、年度等计划时开展,开展频率没有现状分析及原因分析频率高。
Mr.林:小白,现在对数据分析有了进一步认识了吧,什么时候开展什么样的数据分析,需要根据你的需求及目的确定。
小白:是的,Mr.林,那请问数据分析具体如何开展呢?有哪些准备工作要做呢?
1.2 数据分析六步曲
Mr.林:小白,你的问题问得好,现在我们就来看看如何开展数据分析工作。
数据分析过程主要包括了六个既相对独立又互有联系的阶段。它们是:明确分析目的和思路、数据收集、数据处理、数据分析、数据展现、报告撰写等六步。
1.2.1 明确分析目的和思路
1. 明确分析目的
Mr.林:做任何事都要有个目标,数据分析也不例外。小白,我们先来看看菜鸟与数据分析师之间的差别,刚好我这有张菜鸟与数据分析师想法对比图,你可以对比一下,看看自己在哪些方面想法还属于菜鸟级别,在哪些方面的想法已经达到了数据分析师的水平。从他们思考问题的不同方式,就能发现为什么一个是菜鸟,而另外一个是数据分析师了。
小白:好的,我来看一看菜鸟与数据分析师各是什么样的。
Mr.林:小白,从菜鸟与数据分析师想法对比图中,你发现菜鸟与数据分析师的区别了吗?
小白:我发现,菜鸟很迷茫,目的不明确,而且一味追求**的分析方法。而数据分析师的目的就很明确,一切都是以解决问题为**。
Mr.林:说得好!其实他们*主要的区别就在于目的是否明确,如果目的明确,那所有问题就自然迎刃而解了。例如,分析师是不会考虑“需要多少张图表”这样的问题的,而是思考这个图表是否有效表达了观点?如果没有,需要怎样调整?如果目的不明确,菜鸟自然会在用什么样的分析方法、作多少张图表、需要多少文字说明、报告要写多少页等这些问题上纠结。
小白:我明白了,我不要做菜鸟,我要朝着数据分析师的方向努力。
Mr.林:菜鸟与数据分析师的区别就在于菜鸟做分析时目的不明确,从而导致分析过程非常盲目。所以在开展数据分析之前,需要想想为什么要开展数据分析?通过这次数据分析我要解决什么问题?只有明确数据分析的目标,数据分析才不会偏离方向,否则得出的数据分析结果不仅没有指导意义,甚至可能将决策者引入歧途,后果严重。
2. 确定分析思路
Mr.林:当分析目的明确后,我们就要进行梳理分析思路,并搭建分析框架,需要把分析目的分解成若干个不同的分析要点,也就是说要达到这个目的,即如何具体开展数据分析?需要从哪几个角度进行分析?采用哪些分析指标?
只有明确了分析目的,分析框架才能跟着确定下来,*后还要确保分析框架的体系化,以便分析结果具有说服力。
小白:Mr.林,前面说的角度与指标我都理解,但分析体系化如何理解?
Mr.林:体系化也就是逻辑化,简单来说就是先分析什么,后分析什么,使得各个分析点之间具有逻辑关系。这也是很多朋友常常感到困扰的问题,比如经常不知从哪方面入手,分析的内容和指标常常被质疑是否合理、完整,而自己也说不出个所以然来,所以体系化就是为了让你的分析框架具有说服力。
小白:那如何使分析框架体系化呢?
Mr.林:问的好,根据我的经验就是以营销、管理等理论为指导,结合实际业务情况,搭建分析框架,这样才能确保数据分析维度的完整性,分析结果的有效性及正确性。
营销方面的理论模型有4P、用户使用行为、STP理论、SWOT等,而管理方面的理论模型有PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等。这些都是经典的营销、管理方面的理论,需要在工作中不断实践应用,你才能体会其强大的作用。如图1-6所示,就是以PEST分析理论为指导,搭建的互联网行业PEST分析框架,故而使数据分析变得有血有肉有脉络,真正做到理论指导实践。其他具体应用后续会做进一步介绍。
明确数据分析目的以及确定分析思路,是确保数据分析过程有效进行的先决条件,它可以为数据收集、处理以及分析提供清晰的指引方向。
小白:嗯,在做数据分析前,先想想到底是为什么要做数据分析,以便明确数据分析方向,保证我不迷失方向。
1.2.2 数据收集
Mr.林:数据收集是按照确定的数据分析框架,收集相关数据的过程,它为数据分析提供了素材和依据。这里所说的数据包括**手数据与第二手数据,**手数据主要指可直接获取的数据,第二手数据主要指经过加工整理后得到的数据。一般数据来源主要有以下几种方式,如图1-7所示。
3. 数据库
每个公司都有自己的业务数据库,包含从公司成立以来产生的相关业务数据。数据库就是一个庞大的数据资源,需要有效地利用起来。
4. 公开出版物
公开出版物包括《中国统计年鉴》、《中国社会统计年鉴》、《中国人口统计年鉴》、《世界经济年鉴》、《世界发展报告》等统计年鉴或报告。
5. 互联网
随着互联网的发展,网络上发布的数据越来越多,特别是搜索引擎可以帮助我们快速找到所需要的数据,例如**及地方统计局网站、行业组织网站、政府机构网站、传播媒体网站、大型综合门户网站等上面都可能有我们需要的数据。
6. 市场调查
进行数据分析时,需要了解用户的想法与需求,但是通过以上三种方式获得此类数据会比较困难,因此可以尝试使用市场调查的方法收集用户的想法和需求数据。市场调查就是指运用科学的方法,有目的、有系统地收集、记录、整理有关市场营销的信息和资料,分析市场情况,了解市场现状及其发展趋势,为市场预测和营销决策提供客观、正确的数据资料。市场调查可以弥补其他数据收集方式的不足,但进行市场调查所需的费用较高,而且会存在一定的误差,故仅作参考之用。
小白:看来我以后做数据分析时,不用担心没有数据来源啦。
1.2.3 数据处理
Mr.林:数据处理是指对采集到的数据进行加工整理,形成适合数据分析的样式,它是数据分析前必不可少的阶段。数据处理的基本目的是从大量的、可能杂乱无章、难以理解的数据中抽取并推导出对解决问题有价值、有意义的数据。
数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。一般拿到手的数据都需要进行一定的处理才能用于后续的数据分析工作,即使再“干净”的原始数据也需要先进行一定的处理才能使用。
小白:数据处理是数据分析的前提,对有效数据的分析才是有意义的,明白啦!
1.2.4 数据分析
Mr.林:数据分析是指用适当的分析方法及工具,对收集来的数据进行分析,提取有价值的信息,形成有效结论的过程。
在确定数据分析思路阶段,数据分析师就应当为需要分析的内容确定适合的数据分析方法,到了这个阶段,就能够驾驭数据,从容地进行分析和研究了。
由于数据分析多是通过软件来完成的,这就要求数据分析师不仅要掌握各种数据分析方法,还要熟悉主流数据分析软件的操作。一般的数据分析我们可以通过Excel完成,后续也将**为你介绍,而**的数据分析就要采用专业的分析软件进行,如数据分析工具SPSS Statistics等。
小白:好的,期待您后续精彩的数据分析讲解。
1. 数据分析与数据处理的区别
小白:Mr.林,我有个问题。我经常听到数据处理跟数据分析这两个词,它们之间有何关系呢?
Mr.林:从前面介绍数据处理和分析的过程不难看出,数据处理是数据分析的基础。通过数据处理,将采集到的原始数据转换为可以分析的形式,并且保证数据的一致性和有效性。如果数据本身存在错误,那么即使采用*先进的数据分析方法,得到的结果也是错误的,不具任何参考价值,甚至还会误导决策。
2. 数据分析与数据挖掘的关系
小白:还有个问题,刚才提到数据挖掘,那么数据挖掘是什么呢?它与数据分析有什么关系呢?
Mr.林:这个问题问得好!数据挖掘其实是一种**的数据分析方法。
数据挖掘就是从大量的数据中挖掘出有用的信息,它是根据用户的特定要求,从浩如烟海的数据中找出所需的信息,以满足用户的特定需求。数据挖掘技术是人们长期对数据库技术进行研究和开发的结果。一般来说,数据挖掘主要侧重解决四类数据分析问题:分类、聚类、关联和预测,**在寻找模式与规律。
数据分析与数据挖掘的本质都是一样的,都是从数据里面发现关于业务的知识。
数据挖掘现在还不是你学习的**,如果你有兴趣,可在掌握一定的数据分析知识后,再进一步查阅相关资料学习。
1.2.5 数据展现
小白:您刚才讲通过分析,隐藏在数据内部的关系和规律就会逐渐浮现出来,那么通过什么方式展现出这些关系和规律,才���让别人一目了然呢?
Mr.林:不错,孺子可教也!这就是我接下来要说的数据展现了。众所周知,每个人看待事物都有自己的理解方式,所以数据分析师在展现结果的时候一定要保证绝大部分人的理解是一致的。
一般情况下,数据是通过表格和图形的方式来呈现的,我们常说用图表说话就是这个意思。常用的数据图表包括饼图、柱形图、条形图、折线图、散点图、雷达图等,当然可以对这些图表进一步整理加工,使之变为我们所需要的图形,例如金字塔图、矩阵图、漏斗图、帕雷托图等。
大多数情况下,人们更愿意接受图形这种数据展现方式,因为它能更加有效、直观地传递出分析师所要表达的观点。记住在一般情况下,能用图说明问题的,就不用表格,能用表格说明问题的,就不用文字。
小白:原来图表的运用还这么有讲究的呀,我一定好好学习如何用图表说话!
1.2.6 报告撰写
Mr.林:数据分析报告其实是对整个数据分析过程的一个总结与呈现。通过报告,把数据分析的起因、过程、结果及建议完整地呈现出来,以供决策者参考。所以数据分析报告是通过对数据全方位的科学分析来评估企业运营质量,为决策者提供科学、严谨的决策依据,以降低企业运营风险,提高企业核心竞争力。
一份好的分析报告,首先需要有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然。结构清晰、主次分明可以使阅读者正确理解报告内容;图文并茂,可以令数据更加生动活泼,提高视觉冲击力,有助于阅读者更形象、直观地看清楚问题和结论,从而产生思考。
另外,分析报告需要有明确的结论,没有明确结论的分析称不上分析,同时也失去了报告的意义,因为*初就是为寻找或者求证一个结论才进行分析的,所以千万不要舍本求末。
*后,好的分析报告一定要有建议或解决方案,作为决策者,需要的不仅仅是找出问题,更重要的是建议或解决方案,以便他们在决策时作参考。所以,数据分析师不光需要掌握数据分析方法,而且还要了解和熟悉业务,这样才能根据发现的业务问题,提出具有可行性的建议或解决方案。
Mr.林:以上是数据分析的6个关键步骤,今天只是简要介绍,以后将逐一为你讲解。说了这么多,给你讲个段子轻松下,顺便帮我们回顾下刚讲的内容。
小白一听有段子听,立马精神起来:好啊!好啊!
Mr.林:如何判断数据分析师正处于分析流程哪个阶段:1、手托腮帮,深思痛苦状,在思考分析思路;2、手放键盘上,不动,表情呆滞,在数据处理;3、鼠标在飞快移动,在用数据透视表做分析;4、鼠标不断左右键交替点击,在画图表;5、断断续续敲击键盘,时而移动鼠标,在写PPT分析报告。
小白:还真形象啊!Mr.林,您该不会说的就是您自己吧?呵呵!
Mr.林:哈哈,数据分析师差不多都这样的状态。
1.3 数据分析的三大误区
Mr.林:小白,刚才进行了数据分析简要介绍,而在实际的学习、工作中,常常有数据分析人员陷入一些误区,在这里我要告诉你,提醒你注意。
小白:好的,请Mr.林指教。
1. 分析目的不明确,为分析而分析
Mr.林:经常有人问要用多少图,除了摆数据,还需要说些什么。这就是刚才所说的菜鸟常见问题。在此我想说的是,数据分析不应为了分析而分析,而是应该围绕你的分析目的(了解现状、业务变动原因、发展预测等)而进行分析。
只有对自己的目的有清晰的认识,你才知道要怎样去实现这个目的,需要通过哪些图表展现,才会知道这些图表是否能反映问题,自然而然地进行相应的问题分析,而不是连该说些什么都不知道。
2. 缺乏业务知识,分析结果偏离实际
Mr.林:目前现有的数据分析师大多是统计学、计算机、数学等专业出身,他们大多缺乏从事营销、管理方面的工作经验,对业务的理解相对较浅,对数据的分析偏重于数据分析方法的使用,如回归分析、相关分析等。
有公司老板抱怨手下的数据分析师每天给他看几十个零散数据,虽然做出的报告很专业,图表也很漂亮,但所作的分析忽视了缺乏业务逻辑上的关联性,得不到全面、综合性的结论。
在企业中所作的数据分析不是纯数据分析,而是需要多从业务方面进行分析,不应停留在数据表面,要思考数据背后的事实与真相,使得分析结果更加切合实际,对老板的决策提供有力的支撑,否则就是纸上谈兵。
所以说,数据分析师的任务不是单纯做数学题,数据分析师还必须懂营销,懂管理,更要懂策略。
3. 一味追求使用**分析方法,热衷研究模型
Mr.林:在进行数据分析时,相当一部分人都喜欢用回归分析、因子分析等**分析方法,总认为有分析模型就是专业的,只有这样才能体现专业性,结果才是可信的。
其实不然,**的数据分析方法不一定是*好的,能够简单有效解决问题的方法才是*好的。
我们坚信,仅有分析模型是远远不够的,围绕业务发现问题并解决问题才是数据分析的*终目的!只要能够解决业务问题,不论是**的分析方法还是简单的分析方法,就是好方法,正如我们常说的“不论是黑猫还是白猫,只要能抓老鼠就是好猫”。
小白:好的,这些我在以后的工作中会注意的,做好一个数据分析师并不是一件容易的事,我要努力向Mr.林靠齐。
1.4 数据分析师职业发展
1.4.1 数据分析的广阔前景
Mr.林:数据分析作为一个新的行业领域正在全球迅速发展着,它开辟了人类获取知识的新途径。
目前,在数据库技术、软件工具、各硬件设备的快速发展下,信息技术应用已在各行各业等领域全面展开,尤其是对通信、互联网、金融等行业的发展做出了巨大贡献。并且经过长期的应用积累了大量丰富的数据,但大部分单位、企业对其存储信息利用率极低。巨大的历史数据是否有价值?有何价值?是否可以综合利用分析?是否能够为领导决策提供参考依据?
回答是肯定的,数据分析这一项工作越来越受到领导层的重视,借助数据分析的各种工具,从海量的历史数据中提取挖掘业务发展的有价值的、潜在的知识、找出趋势,为决策层的决策提供有力的依据,对产品或服务的发展方向起到积极作用,有力推动单位、企业的科学化、综合化管理。
从二十世纪九十年代起,欧美**开始大量培养数据分析师,直到现在,对数据分析师的需求仍然长盛不衰,而且还有扩展之势。根据美国劳工部预测,到2018年,数据分析师的需求量将增长20%。就算你不是数据分析师,但数据分析技能也是未来必不可少的工作技能之一。
小白:数据分析师如此抢手的原因何在呢?
Mr.林:一个简单的原因就是社会越发达,人们对数据的依赖就越多。无论政府决策还是公司运营,科学研究还是媒体宣传,都需要数据支持。那么,对数据有如此大的依赖,就必然导致对数据分析的大量需求。因此,将数据转化为知识、结论和规律,就是数据分析的作用和价值。
小白:那数据究竟会庞大到什么地步呢?
Mr.林:据国际知名咨询公司估计,到2020年,全球每年产生的数据量将达到3500万亿GB,打个比方,就是用普通的DVD一张一张地摞起来,可以从地球摞到月球两次。
面对这样庞大的数据,对数据分析师的要求就不仅仅是单纯的分析了,更重要的是与相关业务部门进行合作,将数据真正应用到业务中,根据实际的业务发展情况识别哪些数据可用,哪些不适用,而不是孤立地在“真空环境”下进行分析。这就要求数据分析师不仅具备洞察数据的能力,还要对相关业务的背景有深入的了解,明白客户或业务部门的需求,从而将数据信息化、可视化,*后转化为生产力,帮助企业获得利润,这就是整个数据“供应链”。当然数据分析师也需要理解这个“供应链”。
1.4.2 数据分析师职业要求
小白:那怎样才能成为一名**的数据分析师呢?数据分析师的职业要求又有哪些?
Mr.林:你的问题可以用五懂来回答,即懂业务、懂管理、懂分析、懂工具、还要懂设计。
1. 懂业务
从事数据分析工作的前提就是需要懂业务,即熟悉行业、公司业务及流程,甚至有自己独到见解,若脱离行业认知和公司业务背景,分析的结果只会是脱了线的风筝,没有太大的实用价值。
例如公司2011年的运营收入是1000万元,那么不熟业务的数据分析师看到的只是1000万这个数字,而熟悉业务的数据分析师,则看到的不仅是1000万这个数字,他还看到数字背后隐藏的信息,如1000万元是有哪几个业务收入构成,哪个业务收入占主要部分,哪个业务收入是*小占比,*高业务收入的地区又是哪个地区等信息。
这就是懂业务与不懂业务的数据分析师之间的区别。
从另外一个角度来说,懂业务也是数据敏感的体现,不懂业务的数据分析师,看到的只是一个数字。反之,懂业务的数据分析师,则看到的不仅仅一个数字,他明白这个数字代表什么意义,知道数字是大了还是小了,懂业务的数据分析师心中有数,这才是真正意义的数据敏感性。
2. 懂管理
懂管理一方面是为了指导数据分析框架的搭建,如刚才介绍的数据分析六步曲的**步确定分析思路就是需要用到营销、管理等理论知识来指导,如果不熟管理理论,那你如何指导数据分析框架的搭建,以及后续的数据分析开展呢?
另一方面的作用是针对数据分析结论提出有指导意义的分析建议,如果没有管理理论的支撑,如何确保分析建议的有效性呢?
所以这就要求数据分析师需要掌握一定的管理理论知识。
3. 懂分析
懂分析是指掌握数据分析基本原理与一些有效的数据分析方法,并能灵活运用到实践工作中,以便有效的开展数据分析。
基本的分析方法有:对比分析法、分组分析法、交叉分析法、结构分析法、漏斗图分析法、综合评价分析法、因素分析法、矩阵关联分析法等。
**的分析方法有:相关分析法、回归分析法、聚类分析法、判别分析法、主成分分析法、因子分析法、对应分析法、时间序列等。
不论简单还是复杂的分析方法,只要能解决问题的方法就是好方法。
4. 懂工具
懂工具是指掌握数据分析相关的常用工具。数据分析方法是理论,而数据分析工具就是实现数据分析方法理论的工具,面对越来越庞大的数据,我们不能依靠计算器进行分析,必须依靠强大的数据分析工具帮我们完成数据分析工作。
常用的数据分析工具如EXCEL、ACCESS、SPSS、SAS,建议先用好EXCEL分析工具,EXCEL就是一款非常实用的数据处理、分析工具,它能解决、满足你工作中80%,甚至****。有兴趣、时间、需要的话,再学习SPSS、SAS等统计分析工具。
同样,工具的选择应用以研究问题选择工具,只要能解决问题的工具就是好工具。
5. 懂设计
懂设计是指运用图表有效表达数据分析师的分析观点,使分析结果一目了然。
图表的设计是门大学问,如图形的选择、版式的设计、颜色的搭配等等,都需要掌握一定的设计原则。
小白:颜色搭配都有要求?我不能根据我自己的喜好选择么?
Mr.林:当然有要求,根据喜好选择也要在符合设计原则的基础上选择,例如公司的VI设计是以蓝色为主色调,属冷色系,那么你选的图表颜色就要与公司的VI设计相吻合,尽量避免使用红色、黄色等暖色系的颜色,这方面知识我会在数据展现部分做具体介绍。
小白:好的,看来要成为一个合格的数据分析师还有很长的路要走。
1.4.3 数据分析师的基本素质
Mr.林接着说道:要成为一名**的数据分析师并非一件容易的事。虽然大学的专业与数据分析不相关,但你可以通过工作中的实践来学习数据分析,这需要付出大量的时间和精力,不经一番寒彻骨,怎得梅花扑鼻香?
刚才介绍的是数据分析师的职业要求,现在继续介绍数据分析师的五大基本能力和素质。
1. 态度严谨负责
严谨负责是数据分析师**素质之一,只有严谨负责的态度,才能保证数据的客观、准确。
在企业里,数据分析师可以说是企业的医生,他们通过对企业运营数据的分析,为企业寻找症结及问题。一名合格的数据分析师,应具有严谨、负责的态度,保持中立立场,客观评价企业在发展过程中存在的问题,为决策层提供有效的参考依据。不应受其他因素影响而更改数据,隐瞒企业存在的问题,那对企业发展是非常不利的,甚至会造成严重的后果。如果这样,对数据分析师自身来说,从此以后所做的数据分析结果都将受到质疑,因为你已经不再可信,在同事、领导、客户面前已经失去了信任。
所以,作为一名数据分析师就必须持有严谨负责的态度,这也是*基本的职业道德。
2. 好奇心强烈
好奇心人皆有之,但是作为数据分析师来讲,这份好奇心就应该更强烈,应该把自己当成数据福尔摩斯,要积极主动地发现和挖掘隐藏在数据内部的真相。
在数据分析师的脑子里,应该充满着无数个“为什么”,为什么是这样的结果,为什么不是那样的结果,导致这个结果的原因是什么,为什么结果不是预期的那样等等,只有这样才有突破点。
这一系列问题都要在进行数据分析时提出来,并且通过数据分析,给自己一个满意的答案。越是**的数据分析师,好奇心也越不容易满足,回答了一个问题,又会抛出一个新的问题,继续研究下去。
只有拥有了这样一种刨根问底的精神,才会对数据和结论保持敏感,继而顺藤摸瓜,找出数据背后的真相。当然,你也会从中获取成就感。
3. 逻辑思维清晰
除了一颗探索真相的好奇心,数据分析师还需要具备缜密的思维和清晰的逻辑推理能力。我记得有位大师说过:结构为王。何谓结构,结构就是我们常说的逻辑,不论说话还是写文章的时候都要有条理,有目的的去做,不可眉毛胡子一把抓,不分主次。
通常从事数据分析时所面对的商业问题都是较为复杂的,我们要思考错综复杂的成因,分析所面对的各种复杂的环境因素,并在问题发展可能性中选择一个*优的方向。这就需要我们对事实有足够的了解,同时也需要我们能真正理清问题的整体以及局部的结构,在深度思考后,理清结构中相互的逻辑关系,只有这样才能真正客观地、科学地找到商业问题的答案。
4. 擅长模仿学习
在做数据分析时,有自己的想法固然重要,但是“前车之鉴”也是非常有必要学习的,这能帮助数据分析师迅速地成长。
因此,模仿学习是快速提高学习成果的有效方法。这里说的模仿主要是参考、借鉴他人**的分析思路和方法,而并不是说直接“照搬”。
成功的模仿需要领会他人方法精髓,理解其分析原理,透过表面达到实质。万变不离其宗,要善于将这些精华转化为自己的知识,否则,只能是“一直在模仿,从未超越过”。
5. 勇于创新
通过模仿可以借鉴他人的成功经验,但模仿的时间不宜太长,并且建议每次模仿后都要进行总结,提出可以改进的地方,甚至要有所创新,不断总结分析方法、分析思路、分析流程,在总结中前行。
创新是一个**数据分析师应具备的精神,只有不断的创新,才能提高自己的分析水平,使自己站在更高的角度来分析问题,为整个研究领域乃至社会带来更多的价值。现在的分析方法和研究课题千变万化,墨守成规是无法很好地解决所面临的新问题。
听到这,小白就掰着手指头算自己符合几条**数据分析师的素质和能力。
Mr.林继续说道:学习数据分析需要时间和经验的积累,这些素质能力不是说有就有的,需要慢慢培养形成,不能一蹴而就。在工作中运用不同的分析方法对数据进行分析,并与业务部门同事积极沟通,加深自己对整个行业或研究内容的理解,相信在两到三年内,一个合格的数据分析师就会诞生。
小白:好的,我会努力学习的。
1.5 几个常用指标或术语
Mr.林:一个**的数据分析师要有扎实的数据解读功底,因为在进行数据分析时,经常会遇到一些分析指标或术语,那么,对这些指标或术语的理解不够充分就没法开展工作了。还有点时间,我先给你简单介绍一些基础的分析指标或术语。
小白:好的。
1. 平均数
Mr.林:我们在日常生活中提到的平均数,一般是指算数平均数,就是一组数据的算数平均值,即全部数据累加后除以数据个数。算术平均数是非常重要的基础性指标,平均数是综合指标,它的特点是将总体内各单位的数量差异抽象化,代表总体的一般水平,掩盖了总体内各单位的差异。
例如现有某学期学生的数学考试成绩,通过计算成绩平均数,可得如图1-18所示的结果。将每位同学的数学成绩与平均数相比较,就能发现哪些同学的数学成绩高于平均数,需要保持,哪些同学的成绩低于平均数,需要继续努力。
当然,在平均数这个指标中,除算术平均数以外,还有其他平均数,如调和平均数和几何平均数。
小白:一个小小的平均数都有这么多学问呀。
2. **数VS相对数
Mr.林:**数是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标,也是数据分析中常用的指标,如GDP、总人口等。此外,**数也可以表现为在一定时间、地点条件下数量增减变化的**数,比如A国人口比B国人口多1000万人。
相对数是指由两个有联系的指标对比计算而得到的数值,用以反映客观现象之间数量联系程度的综合指标。计算相对数的基本公式是:
相对数=比较数值(比数)÷基础数值(基数)
分母是用做对比标准的指标数值,简称基数;分子是用做与基数对比的指标数值,简称比数。相对数一般以倍数、成数、百分数等表示,它反映了客观现象之间数量联系的程度。
使用相对数时需要注意指标的**性,同时要与总量指标(**数)结合使用。
3. 百分比VS百分点
Mr.林:百分比是相对数中的一种,它表示一个数是另一个数的百分之几,也称百分率或百分数。百分比通常采用百分号(%)来表示,如8%,50%,168%等。由于百分比的分母都是100,也就是都以1%作为度量单位(如图1-20所示),因此便于比较,在数据分析中的应用非常广泛。
百分点是指不同时期以百分数的形式表示的相对指标的变动幅度,1个百分点=1%。例如,图1-21中某公司发言人就混淆了百分比与百分点的概念。表示构成的变动幅度不宜用百分数,而应用百分点。因此,这位公司发言人正确的说法应该是“公司今年的利润是45%,比去年的28%提高了17个百分点”。
4. 频数VS频率
Mr.林:频数是指一组数据中个别数据重复出现的次数。如图1-22所示,某校A班学生共50名同学,按性别进行分组,分为男与女两个组别,男同学的频数为30,女同学的频数为20。
频率是每组类别次数与总次数的比值,它代表某类别在总体中出现的频繁程度,一般采用百分数表示,所有组的频率加总等于****。还是用某校A班的例子,30个男同学在50个同学中出现的频率为60%,即(30÷50)X****;而20个女同学在50个同学中出现的频率为40%,即(20÷50)X****,如图1-22所示。
所以频数是**数,频率是相对数。
5. 比例VS比率
Mr.林:比例与比率都属于相对数。
比例是指在总体中,各部分的数值占全部数值的比重,通常反映总体的构成和结构。比如A班共有学生50人,男生30人,女生20人,则男生的比例是30/50,女生的比例是20/50。由此可以看出,比例的基数(也就是分母)都是全体学生人数,即为同一个基数。
比率是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。比如刚才的例子,男生30人,女生20人,则男生与女生的比率是30/20,如图1-23所示。这一指标经常会用在社会经济领域,比如我国的人口性别比就是用每100名女性数量相对的男性数量来表示的。
6. 倍数VS番数
Mr.林:倍数与番数同样属于相对数,但使用时容易混淆。倍数是一个数除以另一个数所得的商。如A÷B=C,就是说A是B的C倍。需要注意的是,倍数一般是表示数量的增长或上升幅度,而不适用于表示数量的减少或下降。
番数是指原来数量的2的N次方倍。比如翻一番为原来数量的2倍(21),翻两番为4倍(22)。如图1-24所示,这位公司发言人在讲话中就混淆了倍数与番数的概念。因此,这位领导正确的说法应该是“公司产品**翻一番(6.4=3.2X21),从去年的3.2万件提高到今年的6.4万件。此外,我们成本控制也很好,由20万元下降了50%,今年成本为10万元”。
7. 同比VS环比
Mr.林:同比为与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况。例如2010年12月与2009年12月相比,如图1-25所示。
环比为与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。例如2010年12月与2010年11月相比,如图1-25所示。
Mr.林:讲了这么多,我估计你都听晕了。没关系,这些内容现在听起来虽然枯燥,但能够为你以后做数据分析打下坚实的基础,其中一些内容也只有通过实际的操作才能有更深刻的体会。
小白:是啊。您讲的这些我明白都是基本功,我回去努力复习理解,绝不辜负您的教导。
1.6 本章小结
Mr.林:小白,“磨刀不误砍柴工”,在实际进行数据分析之前,我们再来回顾下这些基本内容:
? 何为数据分析是,数据分析未来的前景,数据分析师的基本素质,以及数据分析的三大作用。
? 数据分析的六步曲,首先是明确分析目的和思路,然后是数据收集,第三步是将收集回来的数据进行处理,第四步是根据研究目标和内容进行分析,第五步是将分析出的结果通过图表的方式展现出来,*后一步是撰写数据分析报告;
? 认识常见的数据分析误区;明白数据分析师的要求与基本素质,了解如何成为一个合格的数据分析师;
? 数据分析中经常用到的指标或术语,除掌握*基本的平均数、百分比等概念以外,还需要将容易混淆的指标进行明确区分,避免在以后阐述分析结果时出现错误。
*后送你数据分析心法给你,那就是数据分析三字经:
①学习:先了解,后深入;先记录,后记忆;先理论,后实践;先模仿,后创新;
②方法:先思路,后方法;先框架,后细化;先方法,后工具;先思考,后动手;
③分析:先业务,后数据;先假设,后验证;先总体,后局部;先总结,后建议。
如果现在看这个还不会有太深刻的理解,没关系,正如三字经里所说:“先了解,后深入;先记录,后记忆”,等到积累一定经验,再回头看看你就会深有感触。
小白:谢谢Mr.林的指点,您说的我都记下了,我会加倍努力,早日出师。