基本定义
用数轴上的一段历经或一个报告区间,表明总的参数的机会规模.这一段距离或报告区间称为区间预期的置信区间。出发点
区间预期(interval estimation)是从点预期值和抽样标准误出发,按给定的几率值建立包含待预期参数的区域.其中这个给定的几率值称为置信度或置信水平(confidence level),这个建立起来的包含待预期函数的区域称为置信区间(confidence interval),指总的参数值落在样本统计值某一区内的几率;而置信区间是指在某一置信水平下,样本统计值与总的参数值间误差规模。置信区间越大,置信水平越高。划定置信区间的两个数值分别称为置信下限(lower confidence limit,lcl)和置信上限(upper confidence limit,ucl)常常形式
区间预期,区间预期的区域上、下界一般形式为:“点预期±误差”
“总的均值”的区域预期
符号如果
总的均值:μ
总的方差:σ
样本均值:x* =(1/n)×Σ(Xi)
样本方差:s* =(1/(n-1))×Σ(Xi-x*)^2
置信水平:1-α
明显水平:α
困难
已知n个样本报告Xi (i=1,2,...,n),如何预期总的的均值?
首先,引入记号:
σ'=σ/sqrt(n)
s'=s*/sqrt(n)
然后,分情形讨论:
情形1小样本(n<30),σ已知,此时区间位于 x* ± z(α/2)×σ'
情形2小样本(n<30),σ未知,此时区间位于 x* ± z(α/2)×s'
情形3大样本(n≥30),σ已知,此时区间位于 x* ± z(α/2)×σ'
情形4大样本(n≥30),σ未知,此时区间位于 x* ± t(α/2)×s'
其中,
z(α/2)表明:正态分布的水准α的分位数
t(α/2)表明:T分布的水准α的分位数正文
形式
参数预期的一种形式。通过从总的中抽取的样本,依据适当的正确度与精确度的要求,构造出适当的区域,以作为总的的分布参数(或参数的函数)的真值所在规模的估计。比如,预期一种药品所含杂质的比率在1~2%之间;预期一种合金的断裂力度在1000~1200千克之间,等等。在有的困难中,只需要对未知量取值的上限或下限做出预期。如前例中,一般只对上限感兴趣,而在第二例中,则只对下限感兴趣。
构造
在数理统计学中,待预期的未知量是总的分布的参数θ或θ的某个函数g(θ)。区间预期困难可一般地表述为:要求构造一个仅依靠于样本X=(x1,x2,…,xn)的适当的区域【A(X),B(X)】,一旦得到了样本X的观测值尣,就把区间【A(尣),B(尣)】作为θ或g(θ)的预期。至于怎样的区域才算是“适当”,如何去构造它,则与所根据的原理和准则相关。这些原理、准则及构造区间预期的方法,便是区间预期理论的研究对象。作为参数预期的形式,区间预期与点预期是并列而又互相补充的,它与如果检验也有紧密的联系。置信区间理论
这是1934年,由统计学家J.奈曼所创立的一种严格的区域预期理论。置信系数是这个理论中最为基本的概念。
置信系数 奈曼以几率的频率解释为出发点,觉得被预期的θ是一未知但确定的量,而样本X是随机的。区间【A(X),B(X)】能否真包含待预期的θ,取决于所抽得的样本X。所以,区间 【A(X),B(X)】只能以适当的几率包含未知的θ。对于不同的θ,π(θ)之值可以不同,π(θ)对不同的θ取的最小值1-α(0<α<1)称为区间【A(X),B(X)】的置信系数。与此相应,区间【A(X),B(X)】称为θ的一个置信区间。这个名词在直观上可以理解为:对于“区间【A(X),B(X)】包含θ”这个推断,可以予以一定程度的相信,其程度则由置信系数表明。
对θ的上、下限预期有相似的概念,下方限为例,称A(X)为θ的一个置信下限,若一旦有了样本X,就觉得θ不差于A(X),或者说,把θ预期在无穷区间【A(X),∞)内。"θ不差于A(X)"这论断正确的几率为θ)。π1(θ)对不同的θ取的最小值1-α(0<α<1)称为置信下限A(X)的置信系数。
在数理统计中,常称不胜过置信系数的任何非负值为置信水平。优良性准则
置信系数1-α 反应了置信区间【A(X),B(X)】的牢靠程度,1-α愈大,【A(X),B(X)】用以预期θ时,犯错误(即θ并没有在【A(X),B(X)】之内)的机会性愈小。但这导致困难的一个方面。为了使置信区间【A(X),B(X)】 在事实困难中有用,它除了充足牢靠外,还应该充足精确。比如说,预期某个人的年纪在 5到95岁之间,虽十分牢靠,但太不精确,因此无用。一般指定一个很小的正值α(一般,α 取0.10,0.05,0.01等值),要求置信区间【A(X),B(X)】的置信系数不差于1-α,在这个前提下使它尽或许地精确。对于“精确”的不同的解释,可以致使种种优良性标准。比较重要的有两个:一是考虑区间的长度B(X)-A(X)愈小愈好。这个值与X相关,一般用其数学期望Eθ(B(X)-A(X))作为衡量置信区间【A(X),B(X)】 精确程度的指标。这个指标愈小, 置信区间的精确程度就愈大。其他是考虑置信区间 【A(X), B(X)】包含假值(指任何不等于被预期的 θ 的值)θ┡ 的几率,它愈小,【A(X),B(X)】作为θ的预期的精度就愈高。
假使A(X)是θ的置信下限,则在保证A(X)的置信系数不差于1-α的前提下,A(X)愈大,精确程度愈高。这也可以用【A(X) ,∞)包含假值θ┡(θ┡<θ)的几率来衡量,此几率愈小,置信下限A(X)的精确程度愈高。对置信上限有相似的结果,若在某个准则下,一个置信区间(或上、下限)比其余置信区间都好,则称它为在这个准则下是统一最优的。比如,在上述准则下,置信系数1-α的统一最优置信下限A(X)定义为:A(X)有置信系数1-α ,且对任何有置信系数1-α的置信下限A1(X),当θ┡<θ时,成立置信区间
有时,对所考虑的置信区间(或上、下限)加之某种一般性制约,在这个前提下寻求最优者。无偏性是经常用的制约之一,假使一个置信区间(上、下限)包含真值θ的几率,总不差于包含任何假值θ┡的几率,则称该置信区间(上、下限)是无偏的。同变性(见统计决策理论)也是一个常用的制约。
求置信区间的方法 最常用的求置信区间及置信上、下限的方法有下方几种。
一种是利用已知的抽样分布(见统计量)。比如,设x1,x2,…,xn为正态总的N(μ,σ2)(见正态分布)中抽出的样本,要作μ 的区域预期,记,· 则服从自由度为n-1的t分布。指定α>0,找这个分布的上α/2分位数tα/2(n-1),则有
即
自此得到 μ 的一个置信系数为 1-α 的置信区间 。相似地可以定出μ的置信系数为1-α的置信上、下限分别为。如果检验
其他是利用区间预期与如果检验的联系,设要作θ的置信系数为1-α 的区域预期,对于任意的θ0,考虑原如果为 H:θ=θ0,备择如果为 K:θ≠θ0。设有一水平为α 的检验,它当样本X属于集合A( θ0)时接受H。若集合{θ0∶X∈A(θ0)}是一个区间,则它就是θ的一个置信区间,其置信系数为1-α。就上例来说,对如果H:μ=μ0的检验常用t检验:当时接受μ=μ0,集合 即为区间 这正是前面定出的μ的置信区间。若要求θ的置信下限(或上限),则取原如果为θ≤θ0(或θ≥θ0),备择如果为θ>θ0(或θ<θ0),依照同样的方法可得到所要求的置信下(上)限。
仍有一种方法是利用大样本理论(见大样本统计)。比如,设x1,x2,…,xn为抽自参数为p的二点分布(见几率分布)的样本,当n→∞时,依分布收敛(见几率论中的收敛)于标准正态分布N(0,1),以 uα/2记N (0,1)的上 α/2 分位数,则有。所以,可作为p的一个区间预期,上面的极限值1-α就定义为它的渐近置信系数。费希尔的信任推断法
20世纪30年代初期,统计学家R.A.费希尔提出了一种构造区间预期的方法,他称之为信任推断法。其基本看法是:设要作θ的区域预期,在抽样得到样本X以前,对θ一无所知,样本X表露了θ的一部分信息,据此可以对θ取各种值予以各种不同的“信任程度”,而这可用于对θ作区间预期。比如,设X是从正态总的N(θ,1)中抽出的样本,则服从标准正态分布N(0,1),自此可知,对任何α
即
费希尔把这个等式解释为:在抽样以前,对于θ落在区间内的机会性本来一无所知,通过抽样,得到了上述数值,它表达了统计工作者对这个区间的"信任程度",若取b)=-α=uα/2,则得到区间,其信任程度为 1-α。即当用上述区间作为θ的区域预期时,对于“它能包含被预期的θ”这一点可予以信任的程度为1-α。
在本例以及其余某些简单困难中,用费希尔的方法与用奈曼的方法得出统一的结果。但是,这两个方法不仅在基本看法上不统一,而且在较复杂的困难中,所得出的结果也不同。一个著名的例子是所谓的费希尔-贝伦斯困难:设两个正态分布μ1,μ2,σ娝,σ娤都未知,要求μ1-μ2的区域预期。费希尔用他的方法给予了一个与奈曼理论不统一的解法,奈曼在1941年曾对此执行了详尽的讨论。
此外。贝叶斯方法
(见贝叶斯统计)也是一个重要的构造区间预期的方法。统计决策理论中引进的一部分概念和优良性准则,也可用于区间预期。另外序贯方法(见序贯分析)在区间预期中也有了相当的成长。
区域预期 有时要对两个或许多的参数θ=(θ1,θ2,…,θk)(k>1),比如正态分布N(μ,σ2)中的μ与σ2,同期执行预期;这时,每当有样本X,就由X在θ的取值的k维空间Rk内定出一个区域Q(X),而把θ预期在Q(X)内。该种预期叫做区域预期。所用区域一般为比较简单的几何形状,如长方体、球或椭球等。有关区域预期的置信系数、优良性准则及其求法等,与区间预期情形类似。
容忍限与容忍区间 这是一个与区间预期有紧密联系的概念,但处理的困难不同。给定β,у,0<β<1,0<у<1,以F记总的分布。若T(X)为一统计量,满足条件,则称 T(X)为总的分布F 的上(β,у)容忍限。相似地可定义下(β,у)容忍限。若T1(X)和T2(X)为两个统计量,T1(X)≤T2(X),且,则称 【T1(X),T2(X)】 为总的分布的一个(β,у)容忍区间。比如,X是某产品的质量指标,而F为其分布,则(β,у)容忍区间【T1(X),T2(X)】的意义是:起码有1-β的把握笃定“起码有100(1-у)%的产品,其质量指标落在区间【T1(X),T2(X)】之内”。可以说,容忍区间预期的是总的分布的几率汇聚在何处,而非总的分布参数。