第1章 市场研究中的数据
1.1 数据的测度和分类
一、数据的测量尺度
市场研究过程中有各种各样的数据,我们发现这些数据有不同的测量尺度。数据的测量尺度是指测量某一物体的准则或者依据。比如测量门的高度时,我们可以用米尺,也可以用掌距来测量。测量尺度是为了更好地反映事物的特征,更好地表述、记录它以使我们的研究变得方便。一般来说,市场研究中一般有下列四种数据的测量尺度。
1.名义尺度
名义尺度是按照事物的特征或者属性的不同,赋予不同的名称,作为该事物的一种标记,从而可以区别于其他事物,而且具有相同属性或者特征的数据可以归为同一类,因此名义尺度也可以成为“类别尺度”。例如,人的性别可以区分为男性和女性;婚姻状况可以区分为已婚和未婚;这些都是应用名义尺度来命名的数据。所以在用名义尺度测量或者描述事物的特征时,先将该事物按照其特征,进行归类,并表示类别的名称,然后用代码进行表示。
2.顺序尺度
顺序尺度是将事物按照其特征和属性的大小,排成顺序或者等级。比如将中**电企业销售量*高的5家公司排名为1~5。顺序尺度的主要功能是用来进行等级排列,比较先后的顺序。在等级或者顺序的排列中,可以比较个体之间的地位,说明“大于”或“小于”的关系和差异,但是个体之间的差异并无相同的单位。例如一次考试中,全班**名和第二名的成绩差异,未必等于第二名与第三名之间的差异。
3.等距尺度
等距尺度是一组具有连续性、单位相等的数值。这些数值不仅显示大小的顺序,而且数值之间具有相同的距离。例如,以等距尺度测量一个班的英语考试成绩,范围在0~100分之间,根据各个学生回答问题的情况给予一定的分数,从学生的分数当中可以看出他们成绩的高低,而且可以了解到学生之间成绩的差距。因此等距尺度的主要特征在于采用连续且等距的数据说明变量特征或属性的差异性。
4.比率尺度
比率尺度具有等距尺度的全部特征,而且具有“真正零点”。比率尺度的数值之间有相等的比率,不仅可以加减,也可以作乘除的运算。例如,人的身高,可以采用比率尺度来测量,以0代表没有高度,0以上的不同数值代表实际高度,身高200厘米是身高100厘米的两��。年龄也可以采用比率尺度来测量,零岁是真正的零点。因此,比率尺度提供事物的信息量*多,作用也*大,但是在实际研究中却并不多见。一般来说,物理特征的测量(重量、长度等)比较可能采用比率尺度,但心理特征的测量多以等距尺度为主,因为人类的心理特征很难找到真正的零点。
二、数据的类型
测量某种特性的尺度通常都包含一组项目(items),每一项目都陈述了某种可以引发个人反应的特殊情境或社会对象,同时附有可供个人选择的一组反应类别。按照某种指派规则,对于个人对某一特定项目的反应所评定的分数,称为项目分数(items score)。项目必须经过一道选择的程序,去掉过分冗长、语义含糊不清或可能引起混淆的叙述句,项目经过适当量化后称为变数。
针对问题中各种特性在不同对象间差异的描述,我们必须发展一种客观的测量方法以提供个别性质的描述及进一步的信息。性质可能是形状、大小或态度等的特性,变数用来描述某种性质的个别差异。性质在某些情况下相当具体,但在其他情形,特别是心理变数就不具体了。对于不同对象其性质只有一种,此性质称为常数。如对全人类而言,性别是变数,但只对男性而言,性别则是常数;又如在数学测试上不同学生得到不同的分数,反映在分数上的数学能力是变数,但是所有得42分的学生的数学能力是常数。
市场研究中数据可以分为这样几种类型:按照所采用的测量尺度不同,可以将数据分为分类数据、顺序数据和数值型数据;按照数据的收集方法可以分为观测数据和实验数据;按照被描述对象与时间的关系,可以将数据分为时间序列数据和截面数据;按照数据的连续性不同,可以将数据分为连续数据和间断数据。
1.分类数据、顺序数据、数值型数据
以前面的数据的测量尺度,而将市场研究中的数据分为分类数据、顺序数据和数值型数据三种类型。分类数据是按照事物的特征进行分类的结果。数据表现为类别,可以用文字来描述,也可以用数字代码来代替。市场研究中进行数据分析时,会对分类数据进行数据编码。顺序数据是根据顺序尺度来进行分类的,它不仅能够表示事物的类别,还能表示类别之间的顺序。例如考试中的优、良、中等;产品的一等品、二等品、三等品等。数值型数据即是依据等距尺度和比率尺度等测量尺度对事物进行计量的结果,其结果可以表现为具体的数值,表明事物的数量特征。
2.观测数据和实验数据
观测数据是由访问员的现场观察而获取的数据,观测数据的内容丰富多样,可以用文字来表示,也可以用声音、图片等来表示。实验数据是由研究人员根据实验的结果而得到的数据,市场研究中通常是由研究人员控制一种变量,而观察另一种变量的反应变化。例如,在北京家乐福商场中,研究人员提高飘柔洗发水的价格,看该洗发水**的变化。
3.时间序列数据和截面数据
时间序列数据指的是在不同的时间上收集的数据,它所描述的是某种现象随时间而变化的特征。例如,三元牌牛奶在北京市场2000--2006年的市场占有率变化,就是一个典型的时间序列数据。截面数据指的是在相同或者相似的时间点上收集的数据,例如2006年各品牌牛奶在北京市场的销售量。
4.连续数据和间断数据
在对一些变量进行测量时,变量之间可以再划分成无限多个细小单位。例如身高,单位可以用米,也可以用厘米、毫米,变量的值是连续的。这类变量称为连续变量,其相应的数据称为连续数据。但是对另外一些变量测量的时候,变量的单位之间不能再划分成无限多个细小的单位,变量值是间断的。如测量学生的心跳次数,只能是1次、2次,而不可能是1.5次、2.5次。这类变量称为间断变量,其相应的数据称为间断数据。间断数据的数字形式只能为整数。
1.2 市场研究数据的来源
统计数据分为原始数据和二手数据,原始数据系指研究者直接由调查或实验而搜集得来的数据,亦称一手数据。例如,民意调查机构要预测选举结果,得直接向选民询问调查,所得的数据就是原始数据。原始数据收集不易,有赖于完善的搜集技术与筹划,其所花费的人力、时间、**很多,搜集来的数据比较全面且合用。而二手数据系指其他私人、机关、团体所搜集整理后的数据。二手数据是由专家搜集的,因此有相当高的正确性,而且这种数据的查询既省时、省力又省钱,但是却经常不能完全适合所要研究的问题。
此外,数据的性质包含静态数据与动态数据,静态数据系指在某一特定时间所搜集的数据。静态数据通常都由调查而来,其调查方法依照调查的对象是否为整个全体,可分为普查与抽查两类。动态数据系指在某一期间内连续不断地搜集得来的数据。例如,户籍机关每天必须登记人口的出生、死亡、婚姻、迁移等动态统计数据。动态数据多由登记或观测而得。研究某现象的瞬息状态,多采用调查方式来搜集原始数据,如普查某年12月31日某城市的总人口;分析某现象在某期间内连续发生的状态,则宜采用登记方式或观测来搜集统计数据,如统计某地某年人口的出生与死亡数目。统计某商店某月每天营业额,或观测某地商店消费顾客的特征等,必须经常记录其变动情形。
一、原始数据搜集的方法
1.观察法
观察是一种对已经发生的事件或现象作记录的活动,从对日常生活的观察中,可以得到很多信息。例如,学生对老师上课的反应,老师说话的声调,同学之间对话的声音,闻到的香水味、饭菜的香味等,都可形成信息的基础。观察对象不只是看到的,也可以是听到的、读到的、碰到的、闻到的。观察内容包括历史数据或目前记录的数据,如财务记录、历年的指标、手抄的或录影带式的记录等。
……