第5章 SAS*基本的统计概念
学习后面各章SAS统计分析技术必须具备本章的社会统计知识。本章介绍统计学中*基本的知识和概念。
5.1总体与样本的区别
总体(Population)是样本测量值的集合。对于感兴趣的整个组中,每个成员都对应一个这样的值。比如某省的人口(总体)或工业产值(总体)中的某个指针测量值的集合,而不是那些人或物的集合。
样本(Sample)虽然也是一些值的集合,但不代表整个感兴趣的组。比如,一个样本可以是某省中某县的人口的集合或某县工业产值的集合。
总体与样本的重要区别在于:二者虽然都是某些值的集合,但总体代表着一个省组成的整个测量值的集合,样本只代表这个组群中的一个子组(如县)的测量值的集合。
比如对民意测验(调查),报纸杂志上经常刊登一些品牌方面的民意测验结果,但是事先往往没有邀请所有的人参加这些满意度方面的测验,而仅有一小部分的人参加了,因此这个民意测验的结果只是代表感兴趣组中一个样本值而已。一般情况下,要获得总体值,只能从一些随机样本中推论之。
随机样本(Random Sample)是指他们既能够保证任何一个样本被选取的可能性都相同,又能够代表所在总体的特征趋势。
一个样本充其量只是一个极其简单的随机样本。真正的随机样本的收集过程是一个科学性很强的复杂过程,要在统计学家的指导下,经过爱岗敬业者们耐心细致地、逐级分层地随机抽样。比如,某系评定“奖教金”时,对于某位教师的评价,应该尽可能地客观、全面。起初可能只从本系同学中进行“民意测验”。但是,本系同学有4个年级的学生,各个年级的学生对于**教师的概念不尽相同。四年级学生已经形成了关于**教师的模式或印象,选举**教师时有一种尺度。但是,对于三年级、二年级,特别是一年级的学生,就会出现另外的评价。因为,他们在学校的时间不同。经历不同,对于某位教师的接触时间也不同,因而对某位教师的看法和要求也不同。因此,*终对教师的打分、评价都会有很大的差异。所以,应该将4个年级分成4组,从每个年级(组)中再随机地抽取一个以上的样本,这种逐级分层的随机抽样的结果,可以获得同学们对每一位教师较为客观、公正的评价,而且还可以获得不同年级的同学,对于某位教师的不同评价的程度。
……