第1章 回归分析
1.2 分析过程
1.2.5 检验模型前提
上文评价了用*小二乘法得出的回归参数估计以及检验准则的可用性,这些都取决于我们到目前为止都默认的有关分布的假设,在此,上文引入的随机误差项起到重要作用。
引入随机误差项,是为了考察现实情况建模中存在的不确定性。实际变量y的波动绝不可能完全由一定个数的可观察变量解释,所以我们给出(14)式作为随机模型,它是回归分析的基础。
随机误差项存在的原因特别有如下两条:
(1)由于未考虑到的影响量;
(2)数据误差:测量误差和选择误差。
若考虑y所有可能的影响量,则运算工作量极大,从而使模型不便于使用,所以,模型的值应比实际更简单,仅需反映重要的结构。
数据误差主要是指受测量**度限制的测量误差,和从抽样中获取数据时产生的选择误差。在抽样调查中,不可避免有随机的选择误差。
对需解释变量y,我们想到销售数据(**、市场占有率、客户覆盖范围和市场知名度等),它们大多是抽样数据,也肯定含有测量误差。作为影响量,除了供应商的措施,还包括竞争对手的措施和交易商的措施,此外,还可能存在多种多样的国民经济影响、社会影响或其他环境影响。*后,买卖成交与否都由个人决定,而人类的行为总包含一定的随机性。
因此,有充分的理由认为随机误差项是一个随机量,而随机模型是回归分析的基础。观察值可理解为由此随机模型产生过程的表现,观察数量构成可能的现实抽样。
进行回归分析时,会做一系列的假设,它们同作为研究基础的随机模型有关。下面,我们将研究这些假设的意义以及违背假设的后果。这里,我们仅研究线性回归分析(亦可用其处理非线性问题),即回归分析的典型或线性模型。
……