什么是统计推断
统计在研究现象的总的数量关系时,需要了解的总的对象的规模往往是很大的,有时甚至是无限的,而受于经费、时间和精力等各种原因,以致有时在客观上只能从中观察部分单位或有限单位执行计算和分析,依据局部观察结果来推断总的。比如,要表明一批灯泡的平均运用寿命,只能从该批灯泡中抽取一小部分执行检验,推断这一批灯泡的平均运用寿命,并给出该种推断的置信程度。该种在一定置信程度下,依据样本资料的特质,对总的的特质作出预期和猜测的方法称为统计推断法。统计推断是现代统计学的基本方法,在统计研究中得到了极为大量的应用,它既可以用于对总的参数的预期,也可以用作对总的某些分布特质的如果检验。
统计推断是在几率论的基础上根据样本的相关报告和信息,对未知总的的质量特性参数,作出合理的判定和预期。它的一般过程如图l所示。

统计推断有着大量的用途,差不多遍及所有科学技术领域,在质量治理活动中应用尤其广泛。所以,讨论统计推断是一个十分故意义的课题。
统计推断的必要性
为何我们不能直接研究对象的全部情形,而只能获得研究对象的部分信息来推断和预期整体的某些规律呢?
1、在产品牢靠性T程领域,研究某种产品在规定条件下和规定时期内完成规定功能的几率时,一般要解决损坏性检验和试验,如灯泡的寿命试探、焊缝的力度检验、电视机无故障工作时间的确定等。我们只能通过抽取样本,对样本执行损坏性试验后,推断总的的牢靠性指标。假如对所有产品执行损坏性检测,就没有产品可供销售了,这违背了我们研究的本来目的。
2、仍有一部分研究对象,构成其整体的个体是无限多的,客观上对全部个体执行观察和检验是根本不或许的。如研究海水中微生物的情形时,不或许将全部海水都装入试管中;分析鱼池中全部活鱼的重量与长度时,不能将池水抽干、逐条过秤等。所以,只能用随机取样统计推断的方法。
3、有些情形对全部个体逐一研究、检测是值得的,但需要付出非常多的财力、物力和时间。如自动化流水作业的生产过程,对每个产品执行检测需要停机等。所以,我们也只能依靠于抽样检验和调查,分析样本后对整体作出判定。
4、受于整体的不均匀性和样本的随机性,利用分析样本得到的报告来推断总的的情形必然会造成偏差。但是,在大部分情形下该种预期误差的存在是合理的,也是值得容忍的。由于不同的困难有不同的精度要求,并没有是所有困难都需要一个绝对精准的估量,也不是一切困难都能得到一个非常精确的结果,所以统计推断是不可缺少的研究手段。
统计推断的基本方法
在质量活动和治理实践中,民众关心的是特定产品的质量水平,如产品质量特性的平均值、不合格品率等。这些都需要从总的中抽取样本,通过对样本观察值分析来预期和推断,即依据样本来推断总的分布的未知参数,称为参数预期。参数预期有两种基本形式:点预期和区间预期。
1、点预期
用样本的统计量去预期总的相应未知参数称为点预期。当我们任意抽取一个样本:
x1、

,该样本的均值E(x)和方差D(X)便已知:
假如已知该样本所属总的的分布犁式,则可利用总的分布型式均值和方差的计算公式推断其分布的未知参数。如表l所示。
二项分布B(N,P) |
泊松分布P(%26lambda;) |
均匀分布U(a,b) |
正态分布N(%26mu;,%26sigma;2)
|
 |
 |
 |
|
对于同一总的,伴随抽取样本的不同,就可得到不同的样本均值和方差,通过计算.同一总的分布未知参数就可造成多个预期值。如此,就存在对大量点预期优良性的评价困难。一般用无偏性和有效性作为评价点预期优良性的标准。即假如所有预期量的均值

,称这些预期量

为参数%26theta;的无偏预期,在多个无偏预期量中方差小的预期量则更为有效。
2、区间预期
用样本确定两个统计量,构筑一个置信水平为1 %26minus; %26alpha;的区域,对总的未知参数给出预期,称为区间预期。假如从正态总的中抽取一个样本:
x1、

,其样本的均值为:

方差为:

则该正态总的均值、方差和标准差的1 %26minus; %26alpha;置信预期区间如表2所示。

点预期仅仅给出未知参数的一个具体预期值,没有给出预期的精度,而区间预期却体现了预期的精度。所谓置信水平1 %26minus; %26alpha;,是指所构造的置信区间覆盖未知参数的几率为1 %26minus; %26alpha;。受于置信区间是由选用样本的统计量构筑的,它是会伴随样本的改变而改变的,它有时覆盖未知参数,有时却没有覆盖未知参数。但是,用此法构筑的置信区间,在100次中大概有100(1 %26minus; %26alpha;)个区间覆盖未知参数。
统计推断的两类错误
民众总是期望不犯错误,但是在统计推断过程中不犯错误是不或许的。受于总的的不均匀性和样本的随机性,统计推断必然存在风险(错误)。如果有一批未知质量情况的产品,当下随机抽取其中的一个样本,通过检验、分析样本的质量情况,来推断整批产品的质量好坏,则或许显现如表3所示的四种情形。

A、假定这批产品质量是好的,通过检验样本发现样本质量也是好的,则推断该批产品质量好而决定接收。显然,这个统计推断是完全正确的。B、假定这批产品质量不好,通过检验发现样本质量不好,则推断该批产品质量不好而拒收。该统计推断结论也是合理的。C、假如该批产品质量是好的,而通过检验样本发现样本质量是坏的,则推断该批产品质量不好而拒收,就犯了“弃真”的错误,习惯上把它称做第Ⅰ类错误。D、假如该批产品质量不好,通过检验样本发现样本质量是好的,则推断该批产品质量好而给予接收,则犯了“取伪”的错误,一般将其称做第Ⅱ类错误。
犯错误就会产生损失,就会发生猜测失误、判定失误,就会致使不期望结果的发生。在统计推断过程中上述两类错误总是此涨彼消不可避免的,我们的原则是控制两类错误导致的损失最小且已知。
在不同的统计推断过程中,对上述两类错误有着不同的描述。在用控制图执行统计过程控制中,第Ⅰ类错误叫“虚发警报”,即生产正常而点子偶然多出控制界限,依此就判异而犯“弃真”错误;第Ⅱ类错误叫“漏发警报”,即过程已经异常,有部分点子仍位于控制界限内。依此判过程正常而犯“取伪”错误。在抽样检验过程中,第Ⅰ类错误为生产方风险,即对于给定的抽样方案,当质量水平为某一指定的可接收质量时被拒收的几率,此时生产方遭受损失;第Ⅱ类错误为运用方风险,即对于给定的抽样方案,当质量水平为某一指定的不满足质量时被接收的几率,此时运用方承受损失。在如果检验过程中,犯两类错误的情形如表4。

当原如果
H0成立时,受于样本观察值落人婉拒域W中而误觉得
H0不成立,犯“弃真”错误;当原如果
H0事实上不成立,受于样本观察值未落人婉拒域W而误觉得
H0成立,犯“取伪”错误。
统计推断提升精准性的渠道
个体是总的的一部分,局部的特性能反应全局的特点,但是,受于总的的不均匀性和样本的随机性,又致使样本不能精确地反应总的。所以,抽取部分个体经分析得出相关总的的结论存在着差错和不牢靠。从理论上讲有两种渠道可以清除和降低该种差错。其一,使总的最大限度地均匀。总的是我们要研究的未知事物,我们往往不或许更改他的均匀性,当能够使其高达理想的均匀时,已经完全把握了它,没有研究的必要了。其二,采取适当的抽样方法保证抽样的“代表性”,可有效地控制和提升统计推断的牢靠性和正确性。
随机抽样的方法很多,常用的有:
1、简单随机抽样
简单随机抽样,是指抽样过程应独立执行而且总的中每个个体被抽到的可能均等。随机抽样不是随便抽取,随便抽取轻易承受个人好恶的影响。为达到随机化,可采取抽签、掷随机数骰子或查随机数值表等办法。如从100件产品中随机抽取l0件构成样本,可以把这100件产品从l开始编号直到100号,然后用抓阄的办法任意抽出l0个编号,由这l0个编号代表的产品构成样本。此种抽样方法的优点是抽样误差小,缺点是手续繁杂。在实践中真正做到每个个体被抽到的可能相等是不轻易的。
2、周期系统抽样
周期系统抽样,又叫等距抽样或机械抽样,马上总的按顺序编号,用抽签或查随机数值表的方法确定首件,从而按等距原则依次抽取样本。如从120个零件中取五个做样本,先按生产顺序给产品编号,用简单随机抽样法确定首件,然后按每隔24(由120÷5=24得)个号码抽取一个,共抽取五个构成样本。该种方法非凡适用于流水线上取样,操作简便,实行起来不易显现差错。但抽样起点一经确定,整个样本就完全固定。对总的质量特性含有某种周期性改变,而当抽样间隔正好与质量特性改变周期相符时,就或许得到一个偏差很大的样本。
3、分层抽样法
分层抽样法,即从一个可以分成不同子总的的总的中,按规定比例从不同层中随机抽取个体的方法。当不同设备、不同环境生产同一种产品时,受于条件差别产品质量或许有较大差异,为了使所抽取的样本具有代表性,可以将不同条件下生产的产品构成组,使同一组内产品质量均匀,然后在各组内按比例随机抽取样品合成一个样本。该种抽样方法得到的样本代表性比较好,抽样误差较小,缺点是抽样手续较繁,常用于产品质量检验。
4、整群抽样法
该种方法是先将总的按一定方式分成多个群,然后随机地抽取若干群并由这些群中的所有个体构成样本。如依照生产过程将1000个零件分别装入2O个箱中,每箱5O个,然后随机抽取一箱,此箱中5O个零件构成样本。该种抽样方法实行方便,但样本来自个别群体而不能均匀分布在总的中,因此代表性差,抽样误差较大。