1.2 实验误差及数据处理

1.2.1 误差的概念与种类

(1)误差的概念

测量的目的是为了得到被测值物理量的客观真实数(简称真值)。但由于受测量方法、测量仪器、测量条件以及试验者水平等多种因素的限制,只能获得该物理量的近似值,也就是说,一个被测量的测量值N与真值N0之间一般都会存在一个差值。这种差值称为测量误差,又称绝对误差,用δ表示。

δ=N-N0   (1-1)

绝对误差不同于误差的绝对值,它可正、可负。当δ为正时,称为正误差,反之则为负误差。因此,公式(1-1)定义的误差,不仅反映了测量值偏离真值的大小,也反映了偏离的方向。绝对误差与真值之比称为相对误差,相对误差一般用百分数表示。

  (1-2)

显然,相对误差是没有单位的,而绝对误差与测量值有相同的单位。被测量的真值N0是一个理想的值,一般来说是无法知道的,因此,一般也不能准确得到。对可以多次测量的物理量,常用已修正过的算术平均值来代替被测量的真值。

(2)误差的种类

为了便于对误差作出估算并研究减小误差的方法,有必要对误差进行分类。根据误差的性质,测量误差分为系统误差和随机误差。

①系统误差 在相同条件下对同一物理量进行多次测量,误差的大小和符号始终保持恒定或按可预知的方式变化,这种误差称为系统误差。

②随机误差 在相同条件下对同一物理量进行多次测量,误差或大或小,或正或负,完全是随机的、不可预知的,这种误差称为随机误差。

1.2.2 系统误差

(1)系统误差的来源

①理论或方法的原因 系统误差指由试验方法本身的原因所造成的误差。例如测水泥的细度有三种方法(干筛法、水筛法、负压筛法)因试验方法不同,试验结果也不同。

②仪器原因 由于仪器本身的局限和缺陷而引起的误差或没有按规定条件使用仪器而引起的误差。如仪表失修,直尺的刻度不均匀,天平刀口磨损,天平的两臂长度不等或仪器零点没调好,仪器未按规定放水平等。应注意的是,建筑材料试验中的重要仪器必须定期进行校正和鉴定。

③环境原因 是指外界环境发生变化引起的误差,如温度、湿度等因素引起的误差。例如同样的混凝土配合比,在夏天测得的坍落度与冬天测得的坍落度便不一样。

④个人原因 是指试验操作人员本身的生理或心理特点而造成的误差。如有人习惯早按秒表,有人习惯晚按秒表;又如有人习惯偏向左边观测仪表刻度,有人习惯偏向右边观测仪表刻度等。

(2)发现系统误差的方法

要发现系统误差,就要对实验依据的原理、实验方法、实验步骤、所用仪器等可能引起误差的因素逐一进行分析。因此,它要求试验者既要有坚实的理论基础,又要有丰富的实践经验,下面简要介绍几种发现系统误差的方法。

①对比的方法

a.试验方法的对比:用不同的试验方法测同一个量,看结果是否一致。

b.仪器的对比:用不同的仪器测同一个量,看结果是否一致。

c.改变测量方法:如用天平称物体的质量时,分别将物体放在天平的左盘和右盘,对比测量结果,可以发现天平是否存在两臂长度不等而带来的误差。

d.改变观察者:两个人对比观察可以发现个人误差。

②数据分析的方法 当测量数据明显不服从统计分布规律时,说明存在系统误差。即将测量数据依次排列,如偏差的大小有规律地向一个方向变化,则测量中存在线性系统误差;如偏差的符号有规律地交替变化,则测量中存在周期性系统误差。

(3)系统误差的消除与修正

必须指出,任何“标准”仪器都不能尽善尽美,任何理论都只是实际情况的近似。因此,在实际测量中,要完全消除系统误差是不可能的。这里所说的“消除系统误差”,是将它的影响减小到随机误差以下。

①消除仪器的零点误差 对游标卡尺、千分尺以及指针式仪表等,在使用前,应先记录零点误差(如果不能对零的话),以便对测量结果进行修正。

②校准仪器 用更准确的仪器校准一般仪器,得到修正值或校准曲线。

③保证仪器的安装满足规定的要求。

④按操作规程进行试验。

1.2.3 随机误差

随机误差是不可避免的,也不能消除,但可以根据随机误差理论估计出它的大小,并可通过增加测量次数减小随机误差。

(1)测量值的随机分布

①直方图 如果各测量值为连续随机变量,它们相互独立,则它们有其特有的概率分布。为了弄清它的概率分布规律,先从直方图入手。

例如一批高强混凝土立方体试件抗压强度测量值见表1-1。

表1-1 混凝土的抗压强度测量值

a.找出最大值和最小值,求出极差。

本例中最大值和最小值分别为61.83和59.88,则极差R为:

R=max{xi}-min{xi}  (1-3)

本次样本中R=max{xi}-min{xi}=61.83-59.88=1.95

b.根据样本大小分组。

通常大样本(n>50)分为10~20组,小样本(n≤50)分为5~6组,组距Dx为:

  (1-4)

式中 R——样本极差;

k——样本组数。

本例样本较大,可分为10组,分组情况见表1-2。根据组数k=10及极差R=1.95可得组距Dx=R/k=1.95/10≈0.20。

表1-2 分组情况

c.确定分点,数出各组的频数ni

d.计算各组的频率ni/n

e.计算各组的相对频率ni/n·Dx)。

f.以分点为横坐标,相对频率为纵坐标,画出直方图,如图1-1所示。

图1-1 混凝土抗压强度直方图

直方图由一系列以组距为底、相对频率为高的矩形绘制而成,它们参差有序。所有矩形面积之和等于1,如式(1-5)。

  (1-5)

直方图在横坐标上的跨越范围就是测量值的范围,这个范围很大,说明测量值是分散的;另外,直方图中间高、两边低,说明趋于样本平均值的测量值出现的频率大,较大或较小的测量值出现的频率小。

②正态分布 上述的抗压强度测量值,其概率密度函数符合正态函数分布。不仅混凝土抗压强度测量值如此,而且炮弹落点、产品质量、人的身高、体重等都符合正态分布。正态分布密度函数又称高斯分布。

  (1-6)

式中 x——测量值;

μ——总体平均值;

σ——总体标准偏差。

总体标准偏差公式如下:

  (1-7)

样本的标准偏差公式如下:

  (1-8)

S为有限多次测量值的标准偏差,即样本的标准偏差,σ为无限多次测量值的标准偏差,即总体的标准偏差。通常用样本的标准偏差S来代替总体标准偏差σ

正态分布曲线以直线x=μ为对称轴,如图1-2所示。当x=μ时,fx)值最大,说明测量值落在μ的邻域内的概率最大;测量值落在区间μ±σ内的概率为68.3%;测量值落在区间μ±2σ内的概率为95.5%;测量值落在区间μ±3σσ的概率为99.7%。

图1-2 正态分布曲线

(2)异常数据的舍弃准则

在对建筑材料试验的数据中,有时有少数的测量数据与其他的测量数据相差很大。这些相差很大的数据,如果是操作过失引起的,就应该舍弃。那么舍弃异常数据的准则是什么呢?下面介绍两个判别异常数据的准则。

①拉依达准则 凡是偏差(残差)大于3σ的数据应作为异常数据予以舍弃。对于服从正态分布的随机误差来说,误差在±3σ区间以外的数据,其概率仅为0.3%,也就是说,在1000次测量中,超过3σ的可能性只有3次。而建筑材料试验通常只进行数次或几十次,所以这种可能性基本为零。这里强调指出,该准则只有在n大于13才有效。

②肖维涅准则 设重复测量的次数为n,在一组测量数据中,凡是未在区间N±CnS内的测量值可以认为是异常数据。其中N为平均值,Cn为该准则的因数,S为标准偏差,其值见表1-3。

表1-3 因数Cn取值表

1.2.4 有效数字及运算规则

(1)有效数字

建筑材料试验中的测量值都是由数字表示的,例如:

水泥试样的质量m=38.00g;

混凝土立方体边长a=153.0mm,b=150.2mm,c=147.8mm;

实验室的温度T=22.0℃。

这些数字不仅说明测量值数量的大小,同时也反映了测量的精确度,水泥试样的质量m精确到0.01g;混凝土立方体边长abc精确到0.1mm;实验室的温度精确到0.1℃。

与测量的精确度相符的数字称为有效数字,上述的有效数字中,温度T为三位,其余为四位。除了有效数字的最后一位为可疑数字外,其余的数字是可靠的。所以,根据用有效数字表示的试验记录,便可推知试验时所用的仪器的精度。用不同精度的测量仪器所得的试验记录,其有效数字的位数应该不同。在今后的建筑材料试验中,必须根据试验中所用仪器的精度来确定有效数字的位数,而不能笼统地要求有效数字一定要多少位。

在书写有效数字时,应注意以下几点。

①数字“0”有时是有效数字,有时只起定位作用。

例如20.50为四位有效数字,末位数字“0”为有效数字;0.105为三位有效数字,首位数字“0”不是有效数字。

②在数值的科学表示法中,10的幂次不是有效数字。

例如7.6×103为二位有效数字;12.40×10-7为四位有效数字。

③在作单位变换时,有效数字的位数不能变更。

例如1.1t→1.1×103kg→1.1×106g是正确的;而1.1t→1100kg→1100000g是错误的。

④有效数字运算时,如e、π、等,可认为其有效数字为无限多位,待进行运算后再定位。

(2)数值的修约(四舍六入五成双)

以往采用“四舍五入”法对数值进行修约,往往造成在大量数据运算中正误差无法抵消的后果,使试验的结果偏离真值。

在大量数据运算中,如果第n+1位需要修约,因出现1、2、3、4、5、6、7、8、9这些数字的概率相等,1、2、3、4和6、7、8、9进位的机会相等,可以抵消,唯独出现5时需要进位,故无法使正误差抵消。

为此,现提出“四舍六入五成双”的修约方法。对于位数很多的近似数,当有效位数确定后,其后面多余的数字应该舍去,只保留有效数字最末一位,这种修约(舍入)规则是“四舍六入五成双”,也即“4舍6入5凑偶”这里“四”是指≤4时舍去,“六”是指≥6时进上,“五”指的是根据5后面的数字来定,当5后有数时,舍5入1;当5后无有效数字时,需要分两种情况来对待:

①5前为奇数,舍5入1;

②5前为偶数,舍5不进(0是偶数)。

例如

9.8249→9.82,9.82671→9.83

9.8350→9.84,9.8351→9.84

9.8250→9.82,9.82501→9.83

从统计学的角度,“四舍六入五成双”比“四舍五入”要科学,在大量运算时,它使舍入后的结果误差的均值趋于零,而不是像四舍五入那样逢五就入,导致结果偏向大数,使得误差积累进而产生系统误差,“四舍六入五成双”使测量结果受到舍入误差的影响降到最低。

例如

1.15+1.25+1.35+1.45=5.2,若按四舍五入取一位小数计算:

1.2+1.3+1.4+1.5=5.4

按“四舍六入五成双”计算:

1.2+1.2+1.4+1.4=5.2,舍入后的结果更能反映实际结果。

尤其是在化学领域应用广泛,在计算“分析化学”“化学平衡”时经常需要使用“四舍六入五成双”这种较精确的修约方法。这样得到的结果较精确,而且运算量相对来说也不大,十分有用。

(3)数字运算规则

①加减法 由于有效数字的位数取决于测量仪器的精度,数据的最后一位是可疑数字,所以有效数字加减运算的结果应与仪器精度最低的相同。例如:0.0254+20.12-3.25546=?

其中第二个数字的精度最低为十分之一,所以它们的结果也是十分之一,与每一数字的有效数字位数多少没有关系。它们修约后为0.0254→0.02;3.25546→3.26。所以,0.0254+20.12-3.25546=0.02+20.12-3.26=16.88。

②乘除法 乘除法运算后的有效数字位数,与参加运算的数据中有效数字位数最少的相同。例如39.5×4.08×0.0013÷868=0.00024=2.4×10-4

在参加运算的数据中,它们的相对误差如下所示,由以下相对误差计算结果可见,相对误差最大者,对运算的结果起决定性作用。

0.1÷39.5=0.25%;

0.01÷4.08=0.24%;

0.0001÷0.0013=7.7%(最大);

1÷868=0.12%。