第1章 随机事件和概率
在自然界、生产实践、科学实验和日常生活中发生的现象,按其结果能否准确预测来划分,可以分为两大类:一类是必然现象;另一类是随机现象.
在一定条件下必然发生的现象称为必然现象.例如,在标准大气压下,纯水加热到100℃必然沸腾;向上抛一石头必然会落下.所有这些现象的特点就是,在一定条件下必定出现某一结果,并且是可以事先预测的,即在准确地重复某些条件的情况下,它的结果总是可以肯定的.
另一类现象是在一定条件下,可能会出现多种不同的结果,但在观测之前无法预知其确切结果的现象,这一类现象称为随机现象.例如,抛一枚硬币,*终落在地上是一种必然现象,而落地后正面朝上还是反面朝上却是一种随机现象;某种电器使用寿命的长短是一种随机现象.这类现象的共同特点是:在相同条件下可重复进行试验,但每次试验不止出现一个结果,即试验结果呈现出不确定性.
事实上,在个别试验中,随机现象的结果虽然呈现出不确定性,但是经多次重复试验,却可发现它仍然呈现出某种规律性,这种规律性称为随机事件的统计规律性.
一、随机试验
满足下列三个条件的试验称为随机试验:
(1)试验在相同条件下可重复进行;
(2)每次试验的可能结果不止一个,但能事先明确试验的所有可能结果;
(3)每次试验前不能确定哪一个结果发生.随机试验是一种含义较广的术语,它包括对随机现象进行观察、测量、记录或做
科学实验等,以后简称试验,常用字母E1,E2,.表示.
例1.1.1 下面的四个实验都是随机试验.
E1:抛一枚硬币,观察正面H、反面T出现的情况.显然,结果是集合{H,T}的一
个元素;E2:将一枚硬币连续抛两次,观察试验的结果.这时,所有可能的结果为{HH,HT,TH,TT}; E3:对某目标进行射击,观察直到目标击中为止的总射击次数;E4:测量一个工人生产的电灯泡的寿命,试验的结果是t小时.如果假定灯泡的寿命不超过5000小时,则t是区间[0,5000]中的某个数值.这四个实验均满足随机试验的三个条件,而实验“记录100年后地球上的人口数量”却不是随机试验,因为实验无法在相同的条件下重复进行.
二、样本空间
对于任一个随机试验,每次实验的所有可能结果都是事先知道的,而且结果不止一个.把随机试验的一切可能结果的集合称为样本空间.在概率论中常用大写的希腊字母Ω来表示.试验的每个结果称之为样本点或基本事件,通常用小写的希腊字母ω或ω1,ω2,.来表示.例1.1.1中4个随机试验的样本空间分别为
Ω1={H,T},其中H表示正面,T表示反面;Ω2={HH,HT,TH,TT};Ω3={0,1,2,.};Ω4={t|0≤t≤5000}.由上述可知,样本空间可以是有限点集,可以是可列点集(即它可以与自然数集
是一一对应的集合),也可以是某区间或平面上的一个区域.其中,随机试验E1的样本空间是一维的,E2的样本空间是二维的,它们的样本点为有限个.
1.1 随机事件
三、随机事件
在实际问题中,我们往往关心某种满足一定条件样本点的集合,这种满足一定条件样本的集合称为随机事件,简称事件.所以随机事件就是某些样本点的集合,也就是样本空间Ω的某些子集合.在试验时,如果出现了事件A中的样本点,我们就说事件A发生了或者说A出现了.例如,
(1)在E1中事件A表示“出现正面”,即A={H};
(2)在E4中事件B表示“电灯泡的寿命在3000至4000小时之间”,即B=[3000,4000].
Ω作为自身的子集合,在每次试验中总是发生的,称为必然事件;空集?不包含任何样本点,在每次试验中总是不发生,称为不可能事件.事件通常用大写的英文字母A,B,C,.来表示,其具体内容可写为A={.},其中大括号中或者是A所包含样本点的列举,如上面的A,或者是对A中样本点所具有的性质的描述,比如在例1.1.1的E3中,设C为射击次数不超过5次的事件,那么可写C={ω∈Ω:ω≤5}.事件B也属于这种情况,不过我们用一个闭区间[3000,4000]表示“3000≤ω≤4000”.
四、事件间的关系与运算
事件既然是Ω的子集合,它们之间的关系与运算就是集合间的关系与运算.下面设A,B,A1,A2,.均为事件.
(1)若A炒B,则称B包含事件A或A含于B.这表示事件A发生必导致B发生,若A炒B,且B炒A,即A=B,则称事件A与B相等.
(2)事件A∪B={ω∈Ω:ω∈A或ω∈B},称为事件A与B的并事件.也就是把两事件的样本点放在一起所组成的新事件.因此,A∪B发生当且仅当A,B中至少
n 有一个发生,类似地,称i ∪= 1 Ai={ω∈Ω:ω至少属于A1,A2,.,An中一个事件}为n个∞ 事件的并事件,称i∪= 1 Ai={ω∈Ω:ω至少属于A1,A2,.中一个事件}为可列个事件的并事件.
(3)事件A∩B={ω∈Ω:ω∈A并且ω∈B}称为事件A与B的交事件,简记为AB,也就是两事件中公共的样本点所组成的事件,因此AB发生当且仅当A与B同时发生.n 类似地,称i ∩= 1 Ai={ω∈Ω:ω属于一切Ai,i=1,2,.,n}为n个事件的交事件,称i ∩=∞1 Ai={ω∈Ω:ω属于一切A1,A2,.}为可列个事件的交事件.
(4)事件A-B={ω∈Ω:ω∈A但ω臭B}称为事件A与B的差事件,事件A-B发生当且仅当A发生,而B不发生.
(5)若A∩B=?,则称事件A与B互不相容或互斥,即两事件不能同时发生.
(6)若A∪B=Ω,且A∩B=?,则称两事件互为逆事件,并记B=A?或A = B?.事件的关系与运算可用图1.1来表示.
图1.1 事件的运算满足下列定律:
(1)交换律:A∪B=B∪A, A∩B=B∩A;
(2)结合律:A∪(B∪C)=(A∪B)∪C,A∩(B∩C)=(A∩B)∩C;
(3)分配律:A∩(B∪C)=(A∩B)∪(A∩C),A∪(B∩C)=(A∪B)∩(A∪C);
(4)对偶律:A ∪ B = A?∩ B?, A ∩ B = A?∪ B?.
这些定律均可用严格的数学方法证明,即证明等式两边的事件相互包含.但是用图示的方法验证这些定理会显得更加直观.例如,图1.2中的A ∪ B即为方框中阴影部分,而如果你把A的外面涂上红色,把B的外面涂上蓝色,那么既有红色又有蓝色的部分恰是方框中的阴影部分.
根据事件的关系与运算规则可用一些简单的事件来表示较复杂的事件.
1.2 概率的定义
例1.1.2 某灯泡厂取样检查灯泡的寿命,设A表示“灯泡寿命大于1500h”,B表示“灯泡寿命为1000~2000h”,请用集合的形式写出下列事件:Ω,A,B,A∪B,AB,A-B,B-A.
解 Ω={x|x≥0}=[0,+∞), A={x|x>1500}=(1500,+∞),B={x|1000≤x≤2000}=[1000,2000], A∪B=[1000,+∞),AB=(1500,2000], A-B=(2000,+∞), B-A=[1000,1500].
例1.1.3 一个货箱中装有12只同类型的产品,其中3只是一等品,9只是二等品,从中随机地抽取两次,每次任取1只,Ai(i=1,2)表示第i次抽取的是一等品,**字母及事件间的关系表示下列事件:
(1)两只都是一等品;
(2)两只都是二等品;
(3)一只是一等品,另一只是二等品;
(4)第二次抽取的是一等品.解 由题意,用A?i表示第i次抽取的是二等品(i=1,2),则
(1)两只都是一等品:A1∩A2;
(2)两只都是二等品:A?1 ∩ A?2;??
(3)一只是一等品,另一只是二等品:A1A2∪A1A2;
(4)第二次抽取的是一等品:A?1A2∪A1A2=A2.例1.1.4 甲、乙、丙三人各向目标射击一发子弹,以A,B,C分别表示甲、乙、丙
命中目标,**A,B,C的运算关系表示下列事件.
A0:“甲命中,乙和丙都没有命中” AB?C?;
A1:“至少有一人命中” A∪B∪C;
AB ?A ?
A2:“恰有一个命中目标” AB?C?∪?C ∪?BC ;
A BC ∪ A ?
A3:“恰有两个命中目标” ABC?∪?BC ;
A4:“*多有一个命中目标” B?C?∪ A?C?∪ A?B?;
A5:“三人都命中目标” ABC;
A6:“三人均未命中目标” A?B?C?.
注 事件的表示不是**的,例如,利用对偶律或事件的差,例1.1.4中事件A0
也可表示为如下几种形式:A0=A(B ∪ C) , A0=A-B-C.
1.2 概率的定义
1.1节介绍了随机现象,通过大量试验可以观察到会有哪些结果出现.实际上,我们更希望能对这些结果出现的可能性作出定量的描述.事件发生可能性的定量描述的实质就是事件发生的概率.有些事件发生的概率直觉就可以确定,但是,对于一
第1章 随机事件和概率
般事件而言,单凭直觉来确定其发生的概率显然是行不通的.一、概率的统计定义
人们经过长期的实践发现,虽然一个随机事件在某次试验或观察中可能发生也可能不发生,但在大量重复试验中,它发生的可能性的大小却能呈现出某种规律性.
我们感兴趣的正是对这种规律性的探讨.
1.频率的稳定性
若事件A在n次试验中发生了nA次,则称nA为事件A在这n次试验中发生的
频数,而比值fn(A)=nnA 称为事件A在这n次试验中发生的频率.很早人们就注意到,在多次抛掷一枚质地均匀的硬币时,出现正面这一随机事件发生的频率会接近1/2.请看下面“抛掷硬币”试验的实例,见表1.1.表1.1
实验人 抛掷次数 出现正面次数 频率(出现正面次数/抛掷次数)
德摩根(DeMorgan)蒲丰(Buffon) 20484040 10612048 0.51810.5069
皮尔逊(Pearson) 24000 12012 0 .5005
表1.1说明:当试验的次数n增加时,正面向上的频率,即正面出现的次数k与
总的试验次数n之比kn 将随n的增大而逐渐逼近12 .
频率偏离这个常数很大的可能性虽然存在,但是试验的次数n越大,则频率偏离这个常数的可能性越小,也就是说,随机事件的每一次观察结果都是偶然的,但是多次观察某个随机现象可以知道,在大量的偶然事件中存在着必然的规律.
通过大量的试验可知,在重复试验的次数n充分大时,事件的频率总是在一个固定数值p附近摆动,我们将这种特性称为频率的稳定性.频率的稳定性是一个客观存在,它不断地为人们所证实.例如,多年医学研究表明,出生婴儿性别的数量比约为男∶女=1.06∶1;英语字母E,T,A出现的频率要明显高于其他字母.因此人们常用统计频率作为概率的近似值.
2.频率的性质
频率具有下列性质:
性质1.2.1 对于任一个事件A,有0≤fn(A)≤1.
证 设nA表示n次试验中A发生的次数,则有0≤nA≤n,从而0≤nnA ≤1, 即
0≤ fn (A )≤1 .