第1章 相关与一元回归分析
1.1 拟合与*小二乘法
考察变量之问的数量关系是现代科学方法的基本手段。它起源于伽利略,由牛顿加以完善,随后在物理学和工程实践中得到了广泛应用并取得巨大成功。从18世纪开始,这种方法逐渐影响到几乎所有学科。定量研究方法的基本程序包括:
(1)确认需要研究的变量。
(2)获得变量的一系列观测值。
(3)研究这些观测值之间的关系。
(4)建立变量之间的关系模型(一般表现为几个变量之间的函数关系)。
1.1.1拟合的基本步骤
下面以工厂中产量对总成本的影响研究为例说明这种方法的基本步骤。
【例1-1】 产量和成本的关系研究。为了研究产量和成本之间的关系,首先我们要收集一系列数据,而且必须是在一系列产量水平下的成本。这么做的理由是,按照普遍接受的理论,产量的增长会带来成本的增加。由此得到一系列产量和成本的观测数据的数对,如表1—1所示。
在处理数据之前,用更直观的方式来展示这些数据往往可以帮助我们获得更清晰的整体印象。在两个变量的关系研究中,散点图是常用的工具,因为它可以把两个变量的数量关系表现在二维平面坐标系上。绘制两个变量的散点图用Ex—ce1就可以了,见图1—1。
凭肉眼就可以判断出这10个点分布在一条直线的两侧,图1—1上的方程y=3·442z+1.487 6是用Exce1的“添加趋势线”功能得到的。之所以用添加趋势线而不是回归分析模块来得到拟合直线,是因为在提出基于概率统计理论的回归模型之前,科学家和工程师已经习惯于对散点图拟合合适的曲线方程。所使用的算法是*小二乘法,*小二乘法和数理统计理论结合之后才产生出回归分析。一般认为这项工作主要归功于高斯和马尔可夫。
……