在总体回归函数中引入随机干扰项,主要有以下几方面的原因。
(1)代表未知的影响因素。由于对所考察总体认识上的非完备性,许多未知的影响因素还无法引入模型,因此,只能用随机干扰项代表这些未知的影响因素。
(2)代表残缺数据。即使所有的影响变量都能被包括在模型中,也会有某些变量的数据无法取得。例如,经济理论指出,居民消费支出除受可支配收入的影响外,还受财富拥有量的影响,但后者在实践中往往是无法收集到的。这时,模型中不得不省略这一变量,而将其归入随机干扰项。
(3)代表众多细小影响因素。有一些影响因素已经被认识,而且其数据也可以收集到,但它们对被解释变量的影响却是细小的。考虑到模型的简洁性,以及取得诸多变量数据可能带来的较大成本,建模时往往省掉这些细小变量,而将它们的影响综合到随机干扰项中。
(4)代表数据观测误差。由于某些主客观的原因,在取得观测数据时,往往存在测量误差,这些观测误差也被归入随机干扰项。
(5)代表模型设定误差。由于经济现象的复杂性,模型的真实函数形式往往是未知的,因此,实际设定的模型可能与真实的模型有偏差。随机干扰项包含了这种模型设定误差。
(6)变量的内在随机性。即使模型没有设定误差,也不存在数据观测误差,由于某些变量所固有的内在随机性,也会对被解释变量产生随机性影响。这种影响只能被归入到随机干扰项中。
总之,随机干扰项具有非常丰富的内容,在计量经济学模型的建立中起着重要的作用。如果进一步分析,可以发现,当随机干扰项仅包含上述(3)和(6)时,称之为“原生”的随机干扰,是模型所固有的;当随机干扰项包含上述(11、(2)、(4)、(5)时,称之为“衍生”的随机误差,是在模型设定过程中产生的,���可以避免的。尽管本书对此不加区别,但认识这一点是重要的。