您的当前位置:首页正文

第一章实验误差及数据处理

2024-01-15 来源:好走旅游网
第一章 实验误差及数据处理

第一节 测量与误差

物理学是以实验为本的科学,从经典的伽利略自由落体实验、库仑定律的验证、法拉第电磁感应现象的发现到现代的X射线的发现、广义相对论的建立及实验检验等,都建立在实验基础上。在实验中需要对各种物理量进行测量,如长度、质量、杨氏模量、电流、电阻、居里温度等等,测量分为两种:直接测量和间接测量。直接从仪器上读出测量结果的叫直接测量,如用米尺测量长度,用天平测量物体的质量,电流表测量电流的大小。由直接测量结果经过函数关系式计算才能得出待测量的叫间接测量,如单摆实验中重力加速度的测量,伏安法中电阻的测量。物理实验中的测量多数是间接测量。

物理量本身存在着一个客观真值,严格来说真值是测不到的(真值不能以有限位数表示),我们只能测得其近真值,这是因为人的认识能力的局限,测量工作受技术水平的限制以及受测量者主观视听与环境条件偶然起伏的影响,这就使测量不可避免地伴随有误差产生。因此分析测量中产生的各种误差,设法消除其影响,并对测量结果中未能消除的误差作出估计,是科学实验不可缺少的工作。为此我们必须了解误差的概念、特性、产生的原因、消除及减少的办法,学习误差的估计方法等有关知识。

一、误差

测量中,由于各种原因测量值与真值总是存在差异,

xxx0 (1-1)

x0为真值,x为测量值,其差x就称为误差,也叫绝对误差。测量误差存在于一切测量之中,

贯穿实验过程的始终,随着科学技术水平的不断进步,测量误差越来越小,但却永远不能降低到零。

但是这里有一个问题需要注意,真值x0是客观存在且又不可测知的,因此在实际测量中,误差并不能由(1-1)式简单地计算出来。建立在统计学基础上的误差理论,是我们在实际测量中处理误差问题的理论基础。

绝对误差可以评价某一测量的可靠程度,但若要比较两个或两个以上的不同测量结果时,它就无能为力了,这就需要用相对误差来评价测量的优劣。相对误差定义为

相对误差绝对误差100%

测量最佳值

二、误差与分类

从误差的性质上可分为两大类:系统误差和随机误差。 (一)系统误差

在同样的条件下,对同一物理量进行多次测量时,误差的大小和正负总保持不变,或按一定规律变化,或是有规律的变化,或是有规律的重复,这种误差称为系统误差。

系统误差主要来自三个方面:

1.仪器误差,这是由于仪器本身的缺陷或没有按规定条件使用而引起的。如仪器零点不准,尺子长了或短了一点,天平不等臂或使用的砝码有误等等。

2.理论(方法)误差。只是由测量所依据的理论公式本身的近似性引起的,如单摆周期公式

T02l成立的条件是摆角趋于零、摆绳质量为零等,这样的实验条件是不能完全满足的,势必g要带来误差。

3.个人误差。这是由于观测人员生理或心理特点所造成的,这通常与观测人员的固有习惯和反应速度等有关,其结果是使测量数据总往一个方向偏。如用秒表测量固定时间间隔时,有人就总是偏大,而有人却总是偏小。

4.环境误差。是由于仪器的使用环境(温度、湿度、电磁场)不符合仪器的原设计要求而产生的。例如要求在20℃±2℃条件下使用的仪器,放在-20℃的环境下使用;磁电式仪表附近有强磁场等均会引进环境误差。

系统误差有些是定值的,如某些仪器的零点不准;有些是积累性的,如用受热膨胀的钢尺进行长度测量,随着测量时温度升高指示值就偏小,且误差值随待测长度成比例增加;有些是周期性或一定规律化。

要减小系统误差,一般要在实验前对测量仪器进行校正,在实验时找出系统误差产生原因,采取一定的方法去消除或部分消除,或对测量结果进行修正。对于定值系统误差,一般采用的技巧和方法有:交换法、替代法、异号法等。系统误差是有规律的,因此多次测量取平均值并不能减小系统误差。

(二) 随机误差

如果实验中已理想地消除了系统误差,在相同条件下多次测量同一物理量时,还会发现各次测量值之间有差异,这种误差是由于人的感官灵敏程度和仪器精密程度有限,周围环境的干扰以及随测量而带来的其他不可预测的偶然因素造成的。这些由于偶然的或不确定的因素所造成的每一次测量值的无规则的涨落,称为偶然误差,也叫随机误差。

尽管这种误差是随机的,每次测量值时而偏大,时而偏小,但它服从一定的统计规律,常见的统计规律是比真值大和比真值小的测量值出现的几率相等;误差小的数据比误差大的数据出现的几率大;误差越大出现的几率越小,出现很大误差的几率趋于零。因此增加测量次数,可以减小随机误差,但是随机误差是不能完全消除的。当测量次数足够多时随机误差服从正态分布。随机误差主要来自下列三个方面:

1.主观因素 由于观测人员的感官灵敏程度和操作熟练程度的限制,使得主观判断出现不确定性。 2.测量仪器的影响 测量仪器精度不够高或工作状态不正常,使得示数不重复和不固定。 3.环境的影响 气流扰动、温度起伏、电磁场的不规则干扰等均会影响测量结果。

除了上述两类误差以外,还可能发生由于读数、记录上的错误,由于突发的不正常的条件变化,仪器工作不正常等因素造成的错误,而使数据序列中出现“坏值”。错误不同于误差,必须剔除。这种剔除要遵守一定的规则,而不能不恰当地、人为地把一组数据中离散较大的数据都去掉,那样就会使测量结果的可靠性失去标准。

总之,系统误差与随机误差性质不同,来源不同,处理方法也不同.

第二节 误差

一. 系统误差

在许多情况下,系统误差常常不明显表示出来,却是影响测量结果精确度的主要因素,有些系统误差给实验结果带来严重影响,因此对系统误差的处理是误差分析的一个很重要的内容。由于系统误差的处理涉及较深的知识,这里只作简单的介绍。

由于随机误差与系统误差是性质不同的两类误差,下面我们考虑系统误差时就暂不考虑随机误差。 (一)系统误差的发现

定值系统误差不能用多次重复测量发现,因为含有定值系统误差的量的多次测量结果仍服从正态分布,因此要想发现定值的系统误差,必须从研究系统误差的来源着手,仔细研究实验方法和测量所依据的理论公式的完善性,校准仪器,分析实验条件和每一步测量是否符合要求等等。具体做法通常采用“理论分析”与“对比测量”两种方法。

1.理论分析方法

(1)分析测量所依据的理论公式要求的条件在实际测量中是否已满足。例如用伏安法所依据的公式

RV,该公式是在电流表内阻为零、电压表内阻为无限大时才成立。而测量时这两个条件均不能I实现,因此产生方法误差。

(2)分析仪器所要求的使用条件是否满足,例如要求水平放置使用的电子天平、电表等没有水平放置,测高仪不垂直地面使用时,则测得的结果一定含有系统误差。

2.对比测量方法

(1)实验方法与测量方法对比:用不同的实验方法测量同一个物理量,看测量结果是否一致.例如用三种不同方法测同一电阻,伏安法测得R1001(),电桥法测得R100.10.1(),电位差计法测得R100.050.02(),这说明用伏安法测量时存在较大误差。

同一种实验方法,有时改变测量方法也可以发现系统误差。例如用伏安法测电阻,安培表内接同安培表外接测得的R值不同可发现线路误差,再如霍耳效应实验中改变通过霍耳片的电流方向进行测量,可以发现不等位电位的系统误差。

(2)仪器的对比:一个量用不同的仪器进行测量可以发现仪器的系统误差,若其中一个为标准仪器,则可以得出另一个仪器的修正值。例如把一块0.5级电流表同一块2.5级的电流表串联在一个电路中,结果读数不同,说明至少有一块不准,若将0.5级电流表作为标准表,则2.5级电流表的修正值便可得出。

(3)改变实验参数进行对比:在实验中改变某个参量的数值,如测量结果有单调的或规律性的变化,则表明存在某种系统误差。

(4)人的对比:换人测量进行比较可发现人员误差。

变值的系统误差可以由多次重复测量发现。因为含有变值系统误差的量的多次测量结果不服从正态分布,这样便可以通过分析数据的方法来发现变值系统误差。例如数据呈单向性或周期性变化,说明测量中存在线性或周期性系统误差。

(二)系统误差的消除

系统误差的特点是它的确定性。因此不能用重复多次测量的办法来消除或减弱它,处理系统误差是个测量技术问题,它不能像随机误差那样有一个统一的处理方法,只能针对不同情形采用不同的措施。处理是否得当主要取决于观测者的实验经验、学识和技巧,下面介绍几种消除系统误差的常用方法。

(1)消除产生系统误差的根源,如采用符合实际的理论公式,改进测量方法,重新测量仪器保证仪器装置良好以及在规定条件下进行测量等等。

(2)找出修正值对测量结果进行修正,如用标准仪器校正实验中所使用仪器或修正曲线进行修正。 (3)选择适当的测量方法修正误差,使其不带入到测量结果中,常用方法如下:

(a)交换法(又称对置法):交换测量中的某些条件(如被测物位置),使产生系统误差的因素从相反的方向影响测量结果,从而抵消系统误差。如用天平称量物体质量,为了消除两臂不等引进的系统误差,将被测物与砝码互换位置进行两次测量,两次测量砝码质量数为m1,m2,则被测物质量为

m1m2,这样便消除了不等臂引入的误差。

(b)替代法:其做法是在测量条件不变的情况下,用某一已知标准量取代被测量而不引起测量指示

值的改变,于是被测量就等于这个已知标准量。如用惠斯通电桥测电阻,当电桥平衡后,用一可变标准电阻取代被测电阻,其它条件不变,调节标准电阻的阻值,使电桥重新达到平衡,则被测电阻就等于标准电阻的示值,这种办法可以消除桥臂阻值不准引进的系统误差。

(c)异号法:其做法是改变测量中的某些条件做两次测量,使两次测量中产生的系统误差符号相反,取两次测量结果的平均值作为测量值,便可以消除系统误差.如在霍耳效应实验中,改变通过霍耳片的电流方向,测两次霍耳电动势,取其平均值作为霍耳电动势的测量值变可消除不等位电位差引入的系统误差。

以上只是几种常用的消除系统误差的方法,对某些变值的系统误差则有专门的方法予以消除。实际上任何方法都不能做到将系统误差消除干净。所谓消除只是把系统误差减弱到与随机误差相比小到可以忽略不计,否则应估算出系统误差的数值。

(三)系统误差的传递和合成

直接测量结果的系统误差也会影响间接测量结果,但不同的是几项系统误差的合成可能加大结果的误差,也可能相互抵消一部分,是代数公式。传递公式如下:

NfffxyzxyzNlnflnflnfxyzxyz N

(四)系统误差的修正

任何实验仪器,任何理论模型、任何实验条件,都不可能理想到不产生系统误差的程度。对于系统误差,一是进行修正,二是消除其影响,这里的消除是指让其影响减小到随机误差以下。消除系统误差一般采用以下方法: 1.消除产生系统误差的根源

找到产生系统误差的根源,无论是理论模型、实验仪器还是实验条件,我们都可以使其更完善,从而减少系统误差的影响。

2.找出修正值,对测量结果进行修正

可采用标准仪器或测量标准量,找出修正值或校准曲线,对结果进行修正;或通过理论分析,对理论公式的近似造成的误差进行修正。

3.从测量方法上或仪器设计上消除。

二.随机误差

实验中总会有随机误差出现,即使系统误差减少到最小,在相同条件下对同一量重复测量,每次测量的结果可能还会不一样,这就是所谓的随机性。但当测量次数很多时,实验误差的随机性便会显示出一定的统计规律,我们据此可以根据统计理论对实验结果的随机误差作出估算。

(一)标准误差和标准偏差

在相同条件下,对某物理量x进行n次测量,如每次测量值分别为x1,x2,x3,xk, x表示算术平均值

xx1x2x3xn1nnxi (1-2)

ni1算术平均值只是真值的估计值,不能反映各次测量值的分散程度。标准误差则可以评价测量值的分散程度。对物理量x进行n次测量,其某一次测量结果的标准误差(标准差)定义为

xlimnxi1nix2n (1-3)

实际物理测量中,测量次数总是有限的,因此标准误差只是理论上的定义。对标准误差要进行估算,常用的是贝塞尔法,即用实验标准偏差sx近似替代标准误差x。若x1,x2,...xn是独立的随机变量,x为样本算术平均值,则某一次测量结果标准偏差

sx(xi1nix)2 (1-4)

n1我们都用此公式计算直接测量量的实验标准误差。

当进行了有限次测量后,得到的算术平均值x也是一个随机变量。在完全相同条件下,多次进行重复测量,每次得到的x也不尽相同,这说明x本身也具有离散性。理论证明算术平均值x的标准偏差为

sxsxn(xi1nix)2 (1-5)

n(n1)由(1-5)式可以看出,平均值的标准偏差比任一次的标准偏差要小,随着测量次数增多,平均值的标准偏差也在减小。

(二) 随机误差的正态分布

对一个物理量进行一次测量,随机误差(偶然误差)的出现没有规律性,但在相同条件下,对同一物理量进行多次测量时,当测量次数足够多时随机误差的分布就表现出统计规律性。在多数情况下,随机误差服从正态分布(亦称高斯分布),其概率密度函数(x)由下式给出:

(x)1(xx)22e22 (1-6)

式中x为随机变量,x是正态分布曲线峰值的横坐标,这里,为有限次(n次)测量中单次测量的标准误差。如果已知x和,由(1-4)式可计算出实验值落在某特定区间的几率。实验值落在[a,b]范围内的几率

p[a,b]xdx (1-7)

ab等于xa,xb两直线与横坐标轴及曲线所包围的面积(图1-1),这里将p[a,b]称为置信概率,将

[a,b]称为置信概率p所对应的置信区间。按照概率理论,x出现在区间,内是必然的,也就是

其概率为100%,即满足归一性

xdx1

利用(1-7)式可计算出x出现在[x,x]区间的几率是68.3%,出现在[x2,x2]内的几率为95.5%,出现在[x3,x3]内的几率为99.7%。由此可以看出x落在[x3,x3]区间外的可能性非常小,这就是所谓的“3”准则。 (x) 1.21.2

11

0.80.8

大 0.60.6 0.40.4

0.20.2

00

x x 0 xb a -6-4-20246-4-2024

图1-1 正态分布曲线 图1-2 的物理意义

正态分布函数中有两个参数x 和,x决定了曲线中心的位置,决定了曲线的形状,越大,曲线越平坦,曲线峰值低:越小,曲线越陡峭,峰值越高。如图1-2所示。

对于随机误差的分布,有以下几条重要性质:

1.单峰性 绝对值小的误差出现的概率比绝对值大的误差出现的概率大,与平均值之差越大,出现的概率越小。

2.对称性 大小相等、符号相反的正负误差出现的概率基本相等。

3.有界性 极大正误差与负误差出现的概率很小,误差的绝对值不会超过某一范围。 (三)有限数据随机误差的t 分布

小 O 根据误差理论,当测量次数很少时,测量列的误差分布将偏离正态分布,这时测量值的随机误差将遵从t分布。这个分布是1908年由英国统计学家威廉•西利•戈塞特首先提出的,由于发表时用了笔名“student”,所以也称“学生分布”。

在讲解t分布之前,先引入两个数学概念:数学期望和方差D(x)。设(x)是随机变量x的概率密度函数,则

x(x)dx (1-8)

称为变量x的数学期望。其物理意义就是待测物理量的真值(当不存在系统误差时)。 D(x)2(x)2(x)dxx (1-9)

称为x的方差,这也是x的数学定义。

令tx,则随机变量t满足概率密度为 sx1)1222t (1-10) (t)12的t分布,其中n1称为自由度,而

1x20为函数。

12exdx (1-11)

从(t)的表达式可以知道,(t)只与测量次数有关,当测量次数n时,t分布趋于正态分布。t出现在任意区间a,b的概率为

p[a,b]tdt。

abt分布有如下特征:

1.以0为中心,左右对称的单峰分布;

2.t分布是一簇曲线,其形态变化与n(确切地说与自由度ν)大小有关。自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布曲线。

对应于每一个自由度ν,就有一条t分布曲线,每条曲线都有其曲线下统计量t的分布规律,计算较复杂。因此,统计学家上根据自由度ν的大小与t分布曲线下面积的关系,编制了附表6,t分布表,以便于应用。

(t)

图1-3 t分布

三.精密度、准确度和精确度

在实验中,常用到准确度、精密度和精确度三个不同的概念来评价测量结果。准确度高,是指测量结果与真值的符合程度高,反映了测量结果的系统误差小。精密度高,是指重复测量所得结果相互

接近程度高(即离散程度小),反映了随机误差小。精确度高,是指测量数据比较集中,且逼近于真值,反映了测量的随机误差和系统误差都比较小。我们希望获得精确度高的测量结果,精准度是精密度和准确度、偶然误差与系统误差的综合反映。

图1-4用打靶的例子来说明精密度,准确度和精确度 准确度低 精密度高 准确度高 精确度高 精确度低 准确度低 精密度低

1-4 打靶示意图

四.仪器误差

测量结果的精密度和准确度是与测量仪器的精确度等级密切相关的,通常用仪器的精度和等级来描述仪器的这种性质。仪器的精度是指它能分辨物理量的最小值。仪器的精度越高,它的分度越细,允许的偏差越小。仪器的级别和最大允差有关。

(一)仪器的误差来源 1.原理误差

原理误差由于理论不完善或采取近似理论而产生。它与制造精度无关,而是由设计决定。仪器采取何种方案,进行何种近似处理,便会产生何种原理误差。

2.制造误差

由于材料、加工尺寸和相互位置的误差而产生的仪器误差,统称为制造误差。制造误差是不可避免的,但并不是所有的零件误差都造成仪器误差,起主要作用的是构成测量链的零部件。所以设计时要注意结构的合理性,要注意基面统一等。

3.运行误差

运行误差产生于仪器的使用过程中,主要分为以下几类:

①变形误差。由于载荷、接触变形、自重等原因而产生弹性变形引起的误差 ②磨损引起的误差

③温度变化引起的误差。温度变化不仅会引起机身热变形,还会引起周围介质的折射率发生变化,后者对于干涉长度测量仪器会引入误差

④振动引起的误差。 (二)仪器误差的表示

在物理实验中一般将国家技术标准或检定规程规定的计量器具最大允许误差称为仪器示值误差(限)仪,它表示在仪器正常使用条件下,仪器示值与被测量量真值之间可能产生的最大误差的绝对值。它是由制造工厂或计量部门使用更精确的仪器、量具,经过比对后给出的,可在产品说明书上、仪器标牌上或仪器手册中查到。

仪器的示值误差与仪器的准确度等级有关,一般由仪器的量程和准确度等级可以求出仪器的示值误差。不同的仪器量具,其示值误差有不同的规定,如对于模拟式(即指针式)电表级别分别为5.0、2.0、1.5、1.0、0.5、0.2、0.1等,其示值误差为:

仪量程准确度等级% (1-12)

而数字式的电表则较为复杂。常用仪器量具的主要技术要求和仪器最大允差见表1-1。

如果测量仪器用具是数字式仪表,一般取其末位数最小分度单位为示值误差。而在我们不能知道仪器示值误差或仪器准确度等级情况时,可以取其分度值的一半作为示值误差。

仪器示值误差提供的是误差绝对值的极限值,而不是测量的真实误差,其正负也无法确定。一般而言,测量值与真值的误差在仪,仪内的置信概率为1。和随机误差是用标准误差来估算一样,

表1-1 常用实验仪器的主要技术要求和最大允差 仪器名称 木尺(竹尺) 量 程 30~50cm 60~100cm 150mm 500mm 1000mm 1m 2m 125mm 0~25mm 500g 最小分度值 1mm 1mm 1mm 1mm 1mm 1mm 1mm 0.02mm 0.05mm 0.01mm 0.05g 最大允差 ±1.0mm ±1.5mm ±0.10mm ±0.15mm ±0.20mm ±0.8mm ±1.2mm ±0.02mm ±0.05mm ±0.004mm 0.08g(满量程) 0.06g(1/2量程) 0.04g(1/3量程) 1.3mg(满量程) 三级天平 200g 0.1mg 1.0mg(12量程) 0.7mg(13量程) 普通温度计 精密温度计 电表(0.5级) 电表(1.0级) 数字万用表

也需要知道仪器的标准差。实际上仪器的误差在仪,仪区间内是按一定概率分布的,不同仪器用具概率密度函数不同,有的满足正态分布,有的满足均匀分布。对于概率密度函数满足正态分布的,

0~100℃ 0~100℃ 1℃ 0.1℃ ±1℃ ±0.2℃ 0.5%量程 1.0%量程 α%·Ux+β%·Um(其中Ux表示测量值即读数, Um 示满度值即量程, α,β对不同的测量功能有不同的数值。通常将β%·Um用“字数”表示,如“2个字”等) 钢板尺 钢卷尺 游标卡尺 螺旋测微器 七级天平 其仪器用具的标准差与仪器示值误差关系为:仪仪3。而均匀分布的概率密度函数为

1f2仪0仪仪 (1-12)

其分布曲线如图1-5。根据概率统计理论,对于均匀分布函数仪器用具的标准差为仪通常将仪器用具的误差当成均匀分布。

-Δ仪 O Δ仪 Δ 图1-5均匀分布曲线 f(Δ) 仪3。我们

五.坏值的剔除

前面已经讲过,对于坏值应当剔除,才能使实验结果符合实际情况.但另一方面,由于偶然误差的存在,测量数据具有一定的离散程度是符合统计规律的,可以存在个别或少量偏离平值较大的数据,因此也不能把一组数据中离散较大的数据都归于坏值而剔除。剔除坏值要规定一个判别规则,规定一个限度。超出这个限度,就认为是坏值而予以剔除。

下面介绍几个常用的判断规则,

1.3准则(Pauta准则) 如果测量数据与平均值之差大于标准偏差的3倍,即3,就剔除这个数据,这是一个很粗略的方法,当n,数据为正态分布时,数据落在x±3中的几率为99.7096%,但当n较小时,这个标准就不可靠了。

2.肖维勒准则 前面讲过的3标准不适用于测量次数较少的情况。用肖维勒准则时,要考虑测量次数的影响。对某一测量数据,如果有

xixn

则xi就予以剔除.n为与测量次数有关的系数,由表1-2给出,从表中可以看出,当n为200时,此准则与3准则相当。

表1-2 肖维勒系数表

n 5 6 7 8 9 10 11 12 13 14 15 16 17

第三节 不确定度

对物理量测量结果可靠程度的描述,是个非常重要的问题。对此过去各国有不同的看法和规定,因而影响了国际间的交流。各国为了使所进行的测量和所测得的结果具有统一的评定标准,以便能够互相对比,互相承认,由多个国际组织联合制定了“测量不确定度的表示指南(GUM)”,供各国使用。

用不确定度取代误差是国际上推行的表示测量结果的形式,误差概念和误差分析在用于评定测量结果时有时显得既不完备,也不易操作,而不确定度是一个合理表征测量结果分散性的参数,它是一个容易定量、便于操作的质量指标。测量结果是否有用,在很大程度上取决于不确定度的大小,所以测量结果必须有不确定度说明时才是完整和有意义的。完整的测量结果应包括数值、不确定度和单位。

一.测量不确定度简介

(一)定义

测量不确定度是指“表征合理地赋予被测量之值的分散性,与测量结果相联系的参数”。 下面对不确定度的定义给予说明:

(1)此参数可以是标准偏差或其倍数,或说明了置信概率的区间的半宽度;

(2)此参数一般由多个分量组成,其中一些分量可用于测量结果的统计分布评定,以实验标准偏差表示,另一些分量由基于经验或其它信息假定的概率分布评定,也可用标准偏差表征。

(3)仪器的测量不确定度是与给定测量条件下所得的测量结果密切相关,因此应指明测量条件,也可以泛指需用测量条件下所得的测量结果的不确定度。

n 1.65 1.73 1.70 1.86 1.92 1.96 2.00 2.04 2.07 2.10 2.13 2.16 2.18 n 18 19 20 21 22 23 24 25 26 27 28 29 30 n 2.20 2.22 2.24 2.26 2.28 2.30 2.33 2.34 2.53 2.37 2.38 2.38 2.39 n 35 40 50 60 80 100 150 200 500 1000 2000 5000 n 2.45 2.50 2.53 2.64 2.74 2.81 2.93 3.02 3.29 3.48 3.66 3.89 (4)完整的测量结果应包含被测量值的估计及其分散性参数两部分。 (二)来源

测量过程中不确定度的来源如下 1.被测量量的定义不完整

例如测量一根标称值为1米长的铜棒长度,若要求测准到微米级,则该被测量的定义就不完整,因为铜棒受温度和压力的影响已比较明显,完整的定义为:标称值为1米的铜棒在25.00℃和一个标准大气压下的长度。

2.被测量的定义值很难实现,即方法不理想。

如上例中测量的温度和压力若达不到要求,就会引入不确定度。 3.被测量的物体不能完全代表定义的被测量。 4.环境条件的影响。

5.人员对模拟式仪器的读数偏差。 6.测量仪器的分辨力限制。

7.测量标准和标准物质的给定值或标定值不准确。 8.数据处理时所引用的常数和其它参数不准确。

9.测量方法、测量系统和测量程序引起的不确定度。 10.同一条件下被测量的各种随机因素影响。 11.修正系统误差的不完善。 12.不明显的粗大误差。 (三)测量不确定度分类

测量结果的不确定度一般包含若干个分量,它不像误差那样按性质分为随机和系统两类,而是按照数值评定办法分为“A类”和“B类”两类。A类:由样本观测值统计分析评定的不确定度,也称统计不确定度,用实验标准偏差表征。B类:指用不同于统计分析的其它方法评定的不确定度,也称非统计不确定度,用根据经验或资料及假设的概率分布估计的标准偏差来表征。

测量不确定度在使用中根据表示的方式有三种术语:标准不确定度、合成不确定度和扩展不确定度。

标准不确定度:测量结果的不确定度用标准偏差表示。

合成不确定度:在各不确定度分量相互独立的情况下,将各类不确定度分量按“方和根”的方法合成。

伸展不确定度:为了提高置信概率,用包含因子k乘以合成标准不确定度得到的一个区间来表示的测量不确定度。

除此之外为了比较测量结果准确程度的高低,常常使用相对不确定度,相对不确定度的定义是

E不确定度 测量值

二. 测量不确定度的评定方法

(一)A类不确定度的评定

用对一系列测量值进行统计分析的方法,得到的实验标准偏差就是A类标准不确定度值。 相同条件下,对同一被测量x独立重复测量n次(n足够大),测量值为x1,x2,......xn,其最佳值

1n算术平均值xxi 作为测量结果时,测量结果的A类标准不确定度为:

ni1uAS(x)S(x)n, (1-13)

式中,

S(x)(xi1nix)2

n1uA的统计意义为待测量出现在xuA,xuA区间的概率为平均值x的标准不确定度 uAS(x),

68.3%。

[例1]对某量测量10次,测得数据为:12.25,12.58,12.53,12.58,12.52,12.56,11.89,12.40,12.63,11.34,求A类不确定度。

1101nxi12.428 解:xxi=i110i1n S(x)(xi1nix)2n10.22410(xi1nix)2 0.224

101 uAS(x)=

0.071

测量结果为12.438,uA0.07

(二)B类不确定度的评定

用其它非统计方法进行评定,用估算的标准偏差表征。一般根据经验或有关信息和资料,分析判断被测量值的分布区间x,x,假设被测量值落在该区间的概率分布,由要求的置信概率和选取的k因子,估计标准偏差。

1.获得B类不确定度的信息来源一般有:

(1)以前的测量数据;

(2)相关部门提供的技术说明文件;

(3)校准证书、检验证书或其他文件提供的数据、准确度的级别及目前使用的极限误差; (4)手册或某些资料给出的参考数据及其不确定度; (5)对有关技术资料和测量仪器的了解和经验;

(6)规定实验方法的国家标准或类似技术文件中给出的重复性限。 [例2]膨胀系数为1.65210℃,由手册查到此值的误差不超过0.04010℃,求膨胀系数

-1

-1

55的标准不确定度。

解:根据经验值在区间内设为均匀分布,取k13

uB0.0410530.023105℃-1

uB为膨胀系数值不准引入的标准不确定度.

下面我们说明在不确定度的B类评定方法中,如何假设其概率分布。 (1)只要测量次数足够多,其算术平均值的概率分布为近似正态分布.。

(2)若被测量既受随机影响又受系统影响,而对影响量缺乏任何其他信息的情况下,一般假设为均匀分布。

(3)有些情况下,可采用同行的共识,如微波测量中的失配误差为反正弦分布等.

2.B类评定的方法

(1)若由先验信息给出测量结果的概率分布,及其\"置信区间\"和\"置信水平\" 标准不确定度u(x)为: u(x)a kpa---置信区间的半宽度 ,kp---置信水平p的包含因子

(2)若由先验信息给出的测量不确定度U为标准差的k倍时,标准不确定度u(x)为:

u(x)U kU k(3)若由先验信息给出测量结果的\"置信区间\"及其概率分布

u(x)U---置信区间的半宽度 ,k---置信水平接近1的包含因子 3.几种常见误差的分布情形及其标准不确定度估计 (1)舍入误差

舍入误差的最大误差界限为0.5(末),按均匀分布考虑,故标准不确定度为 : u(x)(2)引用误差

测量上限为xm的S级电表,其最大引用误差限(即最大允许不确定度)为: U(x)xms%,按均匀分布考虑,故标准不确定度为 : u(x)0.530.3

xms%3

(3)示值误差

某些测量仪器是按符合“最大允许误差”要求而制造的,经检验合格,其最大允许误差为,按均匀分布考虑,故标准不确定度为: u(x)3

(4)仪器基本误差

设某仪器在指定条件下对某一被测量进行测量时,可能达到的最大误差限为,按均匀分布考虑,故标准不确定度为: u(x)3

(5)仪器分辨力

设仪器的分辨力为,则其区间半宽度为(6)仪器的滞后

滞后引起的标准不确定度为:u(x)2 ,按均匀分布考虑,故标准不确定度为:u(x)23

23

下面以标准水银温度计检定规程编制来说明不确定度的来源

[例3] 以50℃为例:用二等标准铂电阻温度计检定二等标准水银温度计。采用比较法检测,即将标准器(二等标准铂电阻温度计)与被检测对象(二等标准水银温度计)同时插入恒温槽水中,此时要求被检测温度计垂直插入恒温槽。恒温槽稳定后,用测温电桥测量铂电阻温度计的示值,同时调整读数装置的水平位置,测量水银温度计的偏差。选用的被检测温度计测量范围0℃~50℃,分度值为0.1℃,测量点为50℃。 1.数学模型:

xtstx x—— 样品修正值 ts—— 标准器示值 tx—— 样品示值

2.不确定度计算

(1) 标准器溯源的不确定度u1 50℃时标准铂电阻温度计的标准不确定度为:u1=0.0024℃

(2) 电测设备引起的不确定度u2 -5

用1590测温电桥测量二等标准铂电阻温度计,电桥最大允许误差为5×10,50℃时标准器的标称值为30Ω,均匀分布,标准不确定度为u2=5105301030.009℃

(3) 二等标准铂电阻温度计水三相点变化引起的不确定度u3 按标准铂电阻温度计检定规程要求,温度计水三相点变化8mK时应提前送检,但规程要求经常测定标准器的水三相点电阻值,并使用新测得值计算,取使用前后变化为2mK,均匀分布,标准不确定度为u30.00230.001℃

(4) 二等标准铂电阻温度计水三相点自热引起的不确定度u4 按二等标准铂电阻温度计检定规程要求,温度计自热不得超过4mK,但由于标准器溯源时已经分析了这项变化,在此可忽略。

(5) 恒温槽温度场不均匀引起的不确定度u5 恒温水槽使用范围为5℃~95℃。在50℃时,均匀度为20mK,均匀分布,标准不确定度为

u50.020/30.012℃

(6) 时间常数(恒温槽波动)引起的不确定度u6 恒温水槽在50℃时,稳定度为15mK ,但实际测量低于10分钟,取一半变化即8.5mK,均匀分布,标准不确定度为u60.0085/30.004℃ (7) 视线与温度计不垂直带来的不确定度u7 温度计读数时,应保证读数装置水平,且应保证水银温度计垂直插入恒温槽中。读数不能水平可引起

0.01℃的偏差,均匀分布,标准不确定度为u70.01/30.006℃ (8) 露出液柱引起的不确定度u8 温度计应全部插入恒温槽中测量,但允许露出不高于15个分度值,约1cm,实验测得,在50℃时由于温度计露出液柱1cm带来的不确定度可以忽略。 (9) 读数视差引起的不确定度u9 两人读数时不一致,对分度值为0.1℃的水银温度计可产生0.01℃的视差,取均匀分布,标准不确定度为u90.01/30.006℃ (10) 计算修约引起的不确定度u10 计算时末位取舍产生的误差为分度值的1/20,即0.005℃,按两点分布计算,标准不确定度为

u100.005/30.0025℃

(11) 温度计刻线引入的不确定度u11 实验发现温度计刻线影响读数很大,参看一些文献对不确定度的评定,几乎对这项误差没有估计,实验中发现当标准温度变化0.02℃时,被检温度计才能看到从刻线处上升或降低。但此项误差与第9项关联,按0.01℃计算,由此引入的标准不确定度为u110.01/30.006℃ (12) 温度计重复性引起的不确定度u12 2(XX)i16温度计在50℃重复测量6次,实验测得s126(61)0.008,u12s12=0.008℃

3. 合成不确定度计算

用二等标准铂电阻温度计检定二等标准水银温度计(50℃)合成不确定度: 1 2 3 4 5 6 7 8 9 10 11 12 13 不确定度来源 标准器溯源的不确定度u1 电测设备引起的不确定度u2 标准器Rtp变化引起的不确定度u3 标准温度计自热引起的不确定度u4 恒温槽不均匀引起的不确定度u5 时间常数(恒温槽波动)引起的不确定度u6 视线与温度计不垂直带来的不确定度u7 露出液柱带来的不确定度u8 读数视差引起的不确定度u9 计算修约引起的不确定度u10 被检温度计刻线引起的不确定度u11 温度计重复性引起的不确定度u12 合成不确定度u 分布 均匀 均匀 均匀 均匀 均匀 均匀 均匀 均匀 均匀 均匀 统计 标准不确定度(℃) 0.0024 0.009 0.001 0 0.012 0.004 0.006 0 0.006 0.003 0.006 0.008 0.020

4 扩展不确定度

U=kp×u 取k=2 U=0.04℃ (k=2)

关于合成不确定度和扩展不确定度的计算参看下文的(三)和(四)。

(三)合成标准不确定度的确定

1.合成标准不确定度:当测量结果受多个因素影响而形成若干个不确定度分量时,测量结果的标准不确定度通过多个标准不确定度分量合成得到

ucui1m2i (1-14)

ui--第i个标准不确定度分量,m—不确定度分量的个数,uc合成标准不确定度

2.标准不确定度传递公式

已知yfx1,x2,xn,其中xi为相互独立的可测量,则y的合成不确定度

fucyi1xin2uxi (1-15) 22其相对不确定度为:

u(y)Eycy

lnf2xuxi (1-16) i11n表1-3 常用函数不确定度传递公式 测量关系式Nfx,y, 传递公式 Nxy Nxy unuxuy unuxuy 2222Nkx uNkux,uNux NxNkx uN1ux NkxNxy xN yxkymNn zuyuNu xNxy2uyuNux Nxy222uuN2ux2ykmNxy 2un2zz22Nsinx uNcosxux Nlnx uNux x 如果结果只有A类不确定度和B类不确定度,对A类评定和B类评定的合成,可按方差合成方法: uc22 (1-17) uAuB

[例3]一个标准电阻20℃时的校准值为100.05,手册上给出校准不确定度为0.01(k=2),电阻的温度系数为1510℃,其误差极限为110℃。现在25℃时使用,测温用的温度计

-1

-1

35的允许误差极限为0.02℃。问该电阻在25℃时的电阻值及其合成标准不确定度。 解:RtR0[1(t20)]

这里Rt为温度为25℃时的电阻值,R0=100.05,1510℃,t=25℃

-1

3Rt100.05[115103(2520)]100.125

u(R0)0.01/20.005

u()110530.57105℃-1(设为均匀分布)

u(t)0.0230.0112℃(设为均匀分布)

222Rt2Rt2Rt2uc(Rt)u(R)u()u(t)0.018 0Rt0该电阻在25℃时的电阻值为Rt100.125,合成标准不确定度为uc(Rt)0.018 (四)扩展不确定度的确定

在传统场合多用合成标准不确定度uc来表示测量结果的分散性,但在工业商业活动中,常将合成不确定度uc,乘以包含因子k,得到扩展不确定度:

Ukpuc (1-18)

kp是与置信概率相关的量。

扩展不确定度的表示方法中关键是包含因子kp的确定,一般在物理实验中:

kptp(n) (1-19)

这里n为测量次数,p为置信概率,常取95% 或99%,当n足够大而且满足正态分布时,k0.952,

k0.993,扩展不确定度近似按以下两式表示:U0.952uc,U0.993uc

表3正态分布置信概率kp与p的关系

p kp 0.500 0.675 0.683 1 0.900 1.65 0.950 1.96 0.955 2 0.990 2.58 0.997 3

三.测量结果的表示

一个完整的测量结果应该包括两部分内容:一是被测量量的最佳估计值,一般由算术平均值给出;二是有关测量不确定度的信息。

(一)多次直接测量结果的不确定度表示

多次直接测量量x的不确定度除了由统计方法得到的A类不确定度外,还有其它不确定度分量,如还有仪器的允差带来的不确定度分量。当这两类不确定度相互独立时,测量结果的标准不确定度为

ucui122i22 (1-20) uAu仪其扩展不确定度为Ukuc,kp的取值根据有效自由度和所要求的置信概率P,从t分布表中查出。

合成标准不确定度的自由度称为有效自由度,一般用来表示。当测量量多次测量近似服从正态分布时

uc4u4AA4u仪 (1-21)

仪A为测量量x的A类不确定度的自由度,其值为n-1,n是测量次数。仪通常为1。最终测量结果

表示为

xxkpuc (P=p) (1-22)

p为置信概率。

例4 用螺旋测微器测量一钢丝直径d(mm)分别为0.694,0.698,0.700,0.695,0.705,0.705,求其置信概率为95%时的不确定度。

解:d0.6990mm

uA(0.6940.699)2(0.6980.699)2(0.7000.699)2(0.6950.699)22(0.7050.699)26(61)0.0020mmd的自由度为d615。

仪器的最大允差为0.004mm,采用均匀分布模型,u仪0.00430.0023mm,u仪的自由度取1

uc22uAu仪0.0030mm

uc44uAA4u仪仪(0.0030)42.63 (0.002)4(0.0023)451查t分布表,3时,t0.953.18,所以

d0.6993.180.00200.6990.006mm(p=0.95)

(二)间接测量结果的不确定度表示

已知yfx1,x2,xn,其中xi为相互独立的可测量,则y的合成不确定度

fucyi1xin2uxi (1-23) 2这里y一般服从正态分布,则其有效自由度为

uc4(y)fi1xinuxi44xi

根据有效自由度和所要求的置信概率P,从t分布表中查出kp的取值,测量结果表示为

yykpuc (P=p) (1-24)

[例5]一个圆柱体,用0.02mm精度的卡尺测其直径和高度,用合成不确定为0.04g,包含因子k为3的天平称其质量为m152.10g。求柱体密度。对直径d和高度h,测10次,得到

d2.042cm, Sddi110id1.8103cm d1019

2910 h4.120cm, Shhi110ih9102.2103cm h1019

4m11.273gcm3 2dh3用天平测质量一次:m152.10g,则 (1)d的标准不确定度

uAdSd1.810cm uBd0.0023cm0.0012 (取均匀分布)

ucd2du仪d2.2103cm uAuc4(d)(0.0022)4(c)42.683 444u(d)(0.0018)(0.0012)uA(d)仪91d仪3cm (2)同理 u(ch)2.510uc4(h)(0.0025)4(h)42.893 444u(h)(0.0022)(0.0012)uA(h)仪91h仪 (3)m的标准不确定度

uc0.0430.013g(取高斯分布) (4)柱体密度的合成不确定度

uc4()(0.021)42.63 (h)4uc(h)uc4(d)uc4(m)(0.0022)4(0.0025)4(0.013)4331(h)(d)(m)查t分布表3时t0.953.18

2ucd2uch2ucm2uc3.18dhm3120.07gcm3

(5)结论 11.270.07gcm( p=0.95)

第三节 实验数据处理方法

一、有效数字及其运算规则

(一)有效数字

在物理实验中,测量结果数据的位数不能太多,也不能太少。太多容易使人误认为测量精密度很高,太少会损失测量精确度。其数据位数的多少应以反映出测量精确度为宜,按照这样的原则记录的数据才是有效的.

我们把测量结果中确定的(可靠的)几位数字加上不确定(不可靠)的一位数字统称为测量结果的有效数字。有效数字最后一位虽然是不确定的,即有误差,但在一定程度上反映了一定客观实际,因此即为有效的。由以上有效数字定义可以看出,有效数字是由绝对误差决定的。

对于数值很大或数值很小的数据,直接表示出来是很不方便的,有时甚至很难表示出来或表示出来容易引起理解上的错误。为此我们介绍数值的科学表达方式,即把一数据表示为一个大于1小于10的数乘上10的若干次幂。例如

1250000400001.250.040106

0.0001250.0000041.250.04104

根据有效数字的定义,有效数字的最后一位是有误差的,因此,有效数字位数与相对误差是密切相关的,有效数字位数越多,相对误差越小;有效数字位数越少,相对误差越大。一般来说,两位有效数字相对误差为十分之几至百分之几,三位有效数字相对误差为百分之几至干分之几,余此类推。

(二)有效数字的确定

有效数字与误差有很大的关系,是由与误差相关的不确定度决定有效数字的位数。确定有效数字的位数有如下几个步骤:

(1)计算出该数的不确定度,且只取一位。 (2)将该数取到不确定度所在的那一位。

(3)将后边的那些位的数按数据修约规则修约。

在有效数字中,凡是“0”在数字之间或在数字之末,均属有效数字,如1.01,1.10,1.00都是三位有效数字,在数据前的“0”不算有效数字,如0.101,0.00101,0.0100也都是三位有效数字。有效数字与十进制单位的变换无关,即与小数点的位置和乘10的几次幂无关,如

2.01mm,2.01103m,0.00201m都是三位有效数字

在计算公式中出现的常数,可认为是没有误差的,所以其有效数字可取无穷多位。

在记录实验数据时应根据测量仪器的最小分度读数,读到最小分度值一半所在的那一位。 (三)有效数据修约规则

在数据处理中,我们采用如下的数据修约规则.

(1)若舍去部分的数值小于所保留的末位的0.5,则末位不变。大于0.5,则末位加1. (2)若舍去部分的数值等于所保留的末位的0.5,则末位凑成偶数。 我们将上述修约规则称为“四舍六入五凑偶”。

例如将2.1025,2.10155,3.012457,4.2215,4.32175,5.023011修约成四位有效数字为 2.102,2.102,3.012,4.222,4.322,5.023。

(四)有效数字运算法则

根据有效数字的意义和修约规则,有效数字的运算应遵循以下两条准则: (1)一个确定数字与不确定(不可靠)数字作加减乘除运算后仍是不确定数字。 (2)运算的最后结果中,只保留一位不确定(不可靠)数字,按照修约规则去掉第二位以后的不确定(不可靠)数字。

以上两条准则在具体运算形式中又可具体化为:

(1)当几个数作加减运算时,在各数中,以小数位数最少者为准,最后将运算结果修约到与小数位数最少者相同,称为“尾数取齐”。

例如 20.3十1.01+0.324+0.0468= 21.7 (2)当几个数作乘除运算时,以有效数字最少者为准,结果的有效数字修约到与有效数字最少者相同,注意此时与小数点位置无关,称为“位数取齐”。

例如 12780.345.7276 (3)一个数进行开方、乘方运算,其结果的有效数字位数与被开方、乘方数的有效数字位数相同。例如,15812.6。

(4)对于一般函数运算的有效数字,将函数的自变量末位变化1个单位,运算结果产生差异的最高位就是应保留的有效位数的最后一位。 例 sin30°2′=0.500503748 sin30°3′=0.500755559

两者差异出现在第4位上,故sin30°2′=0.5005。这是一种有效而直观的方法,严格地说,应

按间接测量量不确定度传递公式计算后确定有效数字取位。

以上只是在不计算误差或很难计算出误差时决定有效数字位数的近似方法,且只应用于基本运算形式。在实际问题中,常常采用在中间运算时多取一至两位的办法,最后在表达结果时,有效数字的取位由前面讲到的不确定度来确定,这是处理有效数字的基本原则。

二、实验数据的列表表示法

数据的表示有许多种方法,其中最常用的是列表法。在记录和处理数据时常常将数据排列成表。列表表示的实验数据至少包括两个变数,一个是独立变数或自变量,另一个叫做从变数或因变量。列表法就是将一组实验数据中的自变量、因变量按一定形式顺序一一对应地列出来。

列表法的优点是简单易做,数据易于比较;形式紧凑又能反映出变数间的变化关系。列表的要求: (1)在设计表格时,应简单明了,便于进行数据处理,也可以把数据处理的一些结果列在表内。 (2)一般在不加说明即可了解情况下,应尽量用符号代表。

(3)单位写在标题栏里,一般不要重复地记在各个数字上。当数值过大或过小时,应以10的正负幂表示为宜,如果每一行或一列内的数字数量级一样,在标题栏内写上(10),不要重复地记在各个数字上。

(4)列表时应注意有效数字,记录数据时要整齐,便于比较。 (5)必要时对实验条件、数据来源等加以说明。 例如弦的振动实验波长与张力关系列表如下。

砝码质量(g) 波腹数 L’(cm) L=L’/n(cm) T(N) 20 8 93.0 11.6 0.196 -0.708 -0.936 40 5 85.3 17.1 0.392 -0.407 -0.767 60 4 85.2 21.3 0.588 -0.231 -0.672 80 4 97.0 24.3 0.784 -0.101 -0.614 100 3 83.4 27.8 0.980 -0.009 -0.556 nlogT logL

三、非线性实验数据的处理

在数据处理过程中,常常要求对非线性实验数据进行处理,即曲线拟合,求经验公式。曲线拟合包含直线拟合,但直线拟合作为重点,我们将在下面一节重点讨论。由于曲线的形式很多,在此对曲线拟合也只作简单的介绍。

(一)变数置换法处理非线性关系

在实验中遇到的变量之间的函数关系,有许多是非线性的,但其中有许多函数关系经过适当的变换可成为线性关系,即把“曲线改直”。例如

(1)yax,a,b 为常量,有lgyblgxlga,设Ylgy,Xlgx,则YbXlga为线性关系。

(2)

b1ab,a,b 为常量,设Y1/y X1x,则YaXb也是线性关系。 yx这样的例子很多,如单摆实验、弦的振动实验都会用到“曲线改直”的数据处理方法,这里不一一列举,这要求我们在实验中具体问题具体分析。通过这样的变换,就可以把数据处理的重点放在线性关系即直线的处理上。

在下面要讲的作图法、逐差法、最小二乘法和平均法中,处理线性关系要比处理非线性关系简单得多。尤其是作图法中,由于直线是能够最精确绘制的图线,所以曲线改直不仅简化数据处理,而且能得到更为准确的参数。对于逐差法,一般也局限于对线性关系的处理。

(二)最小二乘法

最小二乘法是数据处理中最常用的拟合方法,其原理是:若能找到一条最佳的拟合曲线那么这条曲线与各测量值方差之和在所有拟合曲线中应是最小的。用最小二乘法,必须首先知道曲线的函数关系式。

设已知单个独立变数的函数

yfx,, (1-25)

其中,是常数参量,并且是我们的测量目标。用最小二乘法拟合曲线,实际上就是求参量的最佳值问题。

若在实验中的一组等精度观测值为

x1,x2,xn y1,y2,yn 将观测值代人(1-25)式,就得到N个方程, y1fx1,, y2fx2,, ............ ynfxn,,

如果测量无误差,把这些方程联立求解,不难得出,,…等参数值。由于有误差的存在,对于

,…若能找到最佳值,则:

1y1fx1,, ............

iyifxi,, ............

nynfxn,, (1-26) 即

yi1nifxi,,min

2有

n2 i0

ai1

i1n2i0

............

nfyfx,,xi0iii1f即 nyifxi,,xi0 (1-27)

i1这里fxi表示fxi,,对的偏导数在xxi点上的取值,式(1-27)称为正规方程,

从正规方程解出的,值,就是待定参量的最佳值,这样得到的曲线fxi,,总可以用一个有(M+1)个参数的M阶多项式来逼近它(M+12m yfxi,a0,a1,a2a0a1xa2xamx (1-28)

正规方程为:

0a01a12a2mamy01a02a13a2m1amy1 2a03a14a2m2amy (1-29)

2a0m1a1m2a22mamymm其中

ixn,yin1Niynxn (1-30)

in1N

方程式(1-30)是一个线性方程组。可以证明,诸系数

i组成的行列式不为零,因此诸ai恒有

惟一的解。这些解a0,a1,a2,,am就是诸参量在最小二乘法意义下的最佳估值。

四、线性实验数据的处理

在实验数据处理过程中,遇到最多的还是线性实验数据的处理,即线性拟合,求线性关系

的经验公式。一些曲线拟合也可通过变数变换按线性处理,线性拟合通常采用作图法、最小二乘法、逐差法。

(一)作图法

1.计算斜率和截距

若被测量x与y的线性方程为

ykxb

其拟合步骤和方法与曲线完全一致。拟合出的直线的截距和斜率可直接从图上求得

ky2y1x2x1

by2kx2 (1-31)

x1,y1,x2,y2是从拟合线上取得的点。假定自变量x的测量无误差,则测量值y的标准偏差为:

ydn1N2nN2 (1-32)

其中dnynkxnb。拟合直线斜率和截距的误差为 k2y

x2x1x1x2x2x122 by (1-33)

以上误差计算部分只给出计算公式。

2.作图规则

(1)作图一定要用坐标纸,坐标纸的大小、坐标轴的比例及X轴、Y轴的起点,应由测得的有效数字和结果的需要决定,一般情况下坐标轴的起点不取为零。

(2)原则上数据的可靠数字在图中应为可靠的:数据中不可靠的一位在图中应是估计的,但常常适当放大些,使图上实际可能读出的有效数字位数与测量的读数相当。

(3)标明图名,坐标轴,画出坐标轴的方向,标明所代表的物理量(或符号)及单位。 (4)测量的数据点,要用“+”“☉”或“x”等标记标出,不同的曲线要用不同的标记,以示区别。 (5)用直尺作直线,直线并不—定通过所有的点,而是要求线两旁的点比较均匀地分布。 (6)在直线上选取两点计算斜率时要注意,两点的距离在测点范围内要尽可能大一些,否则会使在计算 k、b中引入不应有的取值误差。在标定两点坐标时,要与原始数据的有效数字相一致,或按有效数字定义,读取几位可靠数字和一位不可靠数字。

(7)对变化规律容易判断的曲线以平滑线连接,曲线不必通过每个实验点,各实验点应均匀分布在曲线两边;难以确定规律的曲线可以用折线连接。

3.斜率和截矩的不确定度评定

由直线上任意两点坐标x1,y1,x2,y2可得斜率为

ky2y1x2x1 (1-34)

对(1-28)取对数,

lnkln(y2y1)ln(x2x1) 利用相对不确定度公式,可得

lnk2lnk2lnk2lnk2uku(y)u(y)u(x)212yyxxu(x1)212112121212u(y)u(y)u(x)212yyyyxxxxu(x1)11112222 (1-35)

22222222

作图法处理数据时u(x1)u(x2),u(y1)u(y2),其值均由坐标的最小分度反映出来,若x、y轴最小分度值分别为x、y,则测量量x、y的仪器示值误差分别为x、y,误差概率密度满足均匀分布

u(x1)u(x2)x3

u(y1)u(y2)y3

将x1,x2,y1,y2,u(x1),u(x2),u(y1),u(y2)分别代入(1-35)式即可求出斜率k的标准不确定度。

对于截矩b,由by2kx2根据不确定度传递公式可得

22ubk2u2(x2)u2(y2)x2u(k) (1-36)

k,u(k),u2(x2),u2(y2)已知,即可求出u(b)。 ub,uk扩展不确定度分别为

Ub2u(b)(p0.95) Uk2uk(p0.95)

(二)最小二乘法

前面已经讲过了用最小二乘法进行曲线拟合。直线拟合是曲线拟合的具体化和最简单的应用,所以这里我们只给出具体计算公式。

设已知函数形式是

ykxb

测得实验数据x1,x2,...xn和y1,y2,...yn 1.利用最小二乘法拟合出参数最佳值

kxyxyxx22

bykx (1-37)

2.各测量值的标准偏差 这里测量值y的标准偏差

yi1n2inm (1-38)

其中iyikxib,n为测量次数,m为回归方程要确定的未知量个数,在这里m=2。y的意义是:如果i服从正态分布(其期望值为零),则任一出现在[(kxb)y,(kxb)y]的概率为68.3%。

将k改写成如下形式

ki1n(xix)(xi1nyi

ix)2这里已经假定各xi的误差忽略不计,只有各yi有误差,其标准偏差为y,则根据标准偏差的方和根合成方法可得

kyn(xx)22

bx2k

3.检验

在计算出测量最佳值后,计算相关系数可以检验直线拟合情况。定义为:

xxyxy2x2y2y2

总是在0和1之间,值越接近于1,表明实验数据密集在求得的直线近旁,即x与y的线性程度越好。如果值远小于1而接近于0,说明实验数据对求得的直线很分散,即x与y的线性关系

不好或不存在线性关系,如图1-5所示.

y108yx8765431234566420xxxxxxxx0123 456x

值接近1 值接近0 图1-5  的意义

(三)逐差法

逐差法是普通物理实验中数琚处理常用的一种方法,主要是处理线性关系问题 1用逐差法处理数据的条件

(1)首先函数可以写成x的多项式形式,即 一次逐差

ya0a1x

(2)自变量x是等间距变化的。但当y是x的线性函数的情况下,在x不是等间距时也可有类似逐差的处理方法,一般也笼统的称为逐差法。

2.逐差法原理

设ya0a1x,测得xi,yi i0,1,2,...n,有 y1a0a1x1 y2a0a1x2 ............ yna0a1xn 其中:xix0ix,x恒定。

若用逐差法验证线性关系,则对不同的i验证yi1yia1x,即各相邻测量值y的差恒定。 当用逐差法求直线斜率a1时,若还用前后项相减的方法,将其差值求平均就会造成逐项相消,只剩yny1n1a1x,因此要做如下处理,

取偶数个数据n2m,

ymiyima1x 求平均,

1m a12ymiyi (1-39)

mxi1当x不等间距变化时

x1,x2,,x2m y1,y2,,y2m

1mymiyi a1 (1-40) mi1xmixi由以上讨论可以看出,用逐差法处理数据可以充分利用测量数据,具有对数据取平均效果;可以

绕过一些具有定值的未知量而求出所需要的结果.但用逐差法处理的函数形式只限于多项式,而且自变量要求是等间距的,否则计算将很繁琐。

思考题

1.举例说明什么是直接测量?什么是间接测量? 2.误差主要分哪几大类?举例说明。 3.简述有效数字的修约规则。 4.服从正态分布的误差有什么特点? 6.误差与不确定度有什么区别和联系?

7.简述直接测量和间接测量数据处理的主要步骤。 8.用逐差法处理数据有什么优点?其应用条件有哪些?

计算题

1.指出下列各量有效数字的位数。

(1)U1.200kV (2)L0.00148mm (3)m10.0108kg (4)自然数8 2.判断下列写法是否正确,并加以改正

(1)I0.0470A47mA (2)m57.5600.05kg (3)h29.35101000km (4)x4.6750.003A

43.试按有效数字修约规则,将下列各数据保留三位有效数字。

3.8544,3.7429,1.545,5.9750,8.4649,7.6750,3.6912,6.7838 4.按有效数字的确定规则,计算下列各式。

(1)242.3777.60.6889? (2)89.678.5679.123? (3)0.05251.8? (4)8.400.0720.674.001? 5.分别写出下列各式的不确定度传递公式。 (1)P1111JX2Y2 (2)EBC2D2F2 2A2d2hA3B3(3)c (4)V

4A46.用千分尺(仪器极限误差为0.004mm)测量一钢球直径6次,测量数据为:14.256、14.278、14.262、14.263、14.258、14.272(mm);用天平(仪器极限误差为0.06g)测量它的质量1次,测量值为:11.84g,试求钢球密度的最佳值与不确定度。

7. 用精度为0.02 mm 的游标卡尺测量一圆柱体的直径D ,其测得量如下:

23.32 、23.36 、23.34 、23.30 、23.36 (单位为毫米),试求其算术平均值、标准偏差、不确定

度并写出最后结果的表达式。

8.用米尺测得正方形一边长a为:2.01cm,2.04cm,2.00cm,1.98cm,1.97cm,2.03cm,1.99cm,2.02cm,1.98cm,2.01cm。试分别求出正方形周长和面积的算术平均值、不确定度和测量结果表达式。

【附录1 Origin 数据处理软件应用】

物理实验中经常要进行大量的数据处理,如算术平均值的计算、不确定度计算、画图、曲线拟合等等,数据处理工作繁杂而且枯燥,而这些工作都可用Origin软件来完成。下面针对物理实验中经常用到的功能来进行介绍。

一.误差计算

打开Origin软件,屏幕上将出现如下窗口

图1

Data1是数据表,供输入数据。默认形式的数据表中有两列,分别为A(X)和B(Y),如果需要添加列可点击最右上角的图标

,实验中有几组数据就需几列。现以“长度、质量和密度的测量”实验为

例来说明Origin的使用。

在“长度、质量和密度的测量”中,要求对柱体的高度、直径和质量进行测量,最终计算出圆柱体的密度,并要求求出密度的不确定度。用Origin进行数据处理时,将圆柱体的高度、直径和质量分别输入到A(X)、B(Y)和C(Y)列(图2)。用鼠标点击A(X),该列变黑,表明已被选中(图3)。点击“Analysis”菜单,在下拉选项中选“Statistics on Columns”,则会完成高度平均值(Mean)、

图2

单次测量值的标准偏差sx(图4中的sd)、平均值的标准偏差sx(图4中的se)等计算。其结果如下

图3

图,由此可得到圆柱体的高度平均值为29.573mm,平均值标准偏差为0.0067mm;同理可用此项功能计算出圆柱体直径和质量的平均值及其平均值标准偏差,如图4所示。

图4

将高度的平均值、直径的平均值和质量的平均值代入公式圆柱它们的标准偏差就可在计算不确定度时用到。

2.绘图

在弦的振动实验中测得半波长L(m)和张力T(N)的数据如下表:

4m1就可求得圆柱体密度,而2D1hL=L’/n(m) 0.0946 T(N) 0.196 0.133 0.392 0.1613 0.588 0.1871 0.784 0.21 0.980 0.23 1.176 现将L(m)输入到A(X)列,将T(N) 输入到B(Y)列,点击最底端的Columns for Plotting”对话框,鼠标点A(X),然后再点右边的y轴变量,鼠标点B(Y),然后再点右边的则完成了数据在图6上的分布。

图标,出现图5中的“Select ,则表示将A(X)列的数据设为

,则表示将B(Y)列的数据设为x轴变量然后点“OK”,

图5

图6

在图上双击任一坐标轴,则会出现图7的对话框,你可以根据需要对坐标轴进行修改,包括坐标轴的起始点、坐标示值增量、数字的大小等。然后在最上面“Analysis”菜单下选择“Fit Linear”则可对数据进行线性拟合,拟合结果如下,由此可得到相关系数为0.99277,线性并不很好。

图7

图8

3.函数图形的绘制

Origin软件还可以对数据进行函数计算,如取对数值、正弦、余弦等。首先点击图标

,增加列数,

如图9。然后点击C(Y)列,使其涂黑,表示被选上。再用鼠标选“Column”菜单下的“Set Column Values”项,出现如下对话框,在此对话框中选择要进行的函数运算和对哪一列进行此运算,如这里进行的是将A(x)列取对数,则在途中出现“Col(C)=log(clo(A))”后点“OK”,则运算完成,如图10同样也对B(Y)列进行了对数运算。结果列在图-11,然后和前面一样以C(Y)为X轴,D(Y)为Y轴画图,然后进行线性拟合,拟合的结果是斜率B=0.49553,截矩A=-0.67471相关系数R=0.99991。斜率B的值与理论上的0.5非常接近,而相关系数表明logT与logL满足线性关系。

Origin软件功能很多,需要同学自己通过使用研究来熟悉,这里就不详细介绍了。

图9

图10

图11

图12

【附录2:实验课的基本程序】

物理实验是学生在教师指导下独立进行的一项实践活动,无论实验内容的要求或研究的对象以及采用的方法如何不同,基本程序大致相同,一般都有三个环节:如何预习实验、如何做实验、如何写实验报告。

1.实验前的预习

由于实验课的时间有限,测量工作量大,实验中还可能遇到各种各样的问题,应在课前认真阅读讲义,了解本次实验的目的,依据什么原理及相关公式,采用什么实验方法,对要使用的仪器作全面了解,以及要注意什么问题。在准备好的实验记录本上写好预习报告,包括:列出实验所用仪器,画好电路图、光路图等实验线路;写好测量公式及测量步骤;列好数据表格。

2.进行实验

到实验室后应遵守实验室的规章制度,爱护实验仪器,注意安全。做实验之前要仔细阅读有关仪器使用的注意事项和仪器说明书,了解仪器的性能、规格、使用方法以及操作规则,并记录仪器的规格、型号等。实验过程中应合理操作,认真思考,仔细观察,在测量数据之前,根据理论预想一下可能出现的结果,然后再看看是否和预期的结果相符。如果不符,仔细分析原因,找出改进措施,绝不能拼凑数据。每次测量后要立即把数据记录在数据表格中,注意有效数字和单位。对实验过程中出现的一切自己认为有意义的正常或不正常的现象,都要仔细观察,记录下来并在写实验报告时进行讨论、分析产生的原因一以及是否合乎物理规律等。原始记录应由指导教师签字。

3.实验报告

实验报告是对实验的全面总结,其内容一般包括:实验名称、实验者姓名、实验日期;实验目的、仪器用具(包括型号、规格等)、实验原理(要用自己的语言简要阐述,不要照抄书本);实验内容、实验数据(将原始数据用简单明了的方式从预习报告上传记下来)及数据处理(计算、作图等);实验结果讨论及思考题的解答。实验报告要求书写工整、条理清晰、图表正确,应该是一篇完整的小论文,对于没有做过这个实验的人,通过阅读实验报告便能够了解实验的全部内容。要按时交实验报告,同时原始记录要附在实验报告上

因篇幅问题不能全部显示,请点此查看更多更全内容