第四节 常模

一、常模团体与常模

(一)常模

常模是根据标准化样本的测验分数经过统计处理而建立起来的,具有参照点和单位的测验量表。

制定常模需要三步:确定适当的比较团体;获得该团体成员的测验分数;把原始分数转化为量表分数。把量表分数进行统计分析,再把个人分数表示成这个团体内的相对位置。其中选择和确定常模团体是最为重要的步骤。

(二)常模团体

常模团体是由具有某种共同特征的人所组成的一个群体或群体的一个样本。如果群体较大,常模团体应是该群体的代表性取样,又称为标准化样本。在确定常模团体时,要注意以下几个问题。

1.群体的构成必须明确界定

在制定常模时,必须清楚地说明所要测量的群体的性质与特征。可以用来区分和限定群体的变量是很多的,如年龄、性别、年级、职业、地区、民族、文化程度、社会地位等。依据不同的变量确定群体,如中国大学生、中国未成年罪犯等。常模团体不同,便可得到不同的常模。譬如同样是修订EPQ,陈仲庚教授获得的是北方常模,龚耀先教授获得的是全国常模。

2.标准化样本必须是所要测量群体的一个代表性取样

当所要测量的群体很小时,将群体所有成员逐个测量,其分数分布便是该群体最可靠的常模。但当群体数量较大时,如果将每个成员进行测量就会耗费大量的时间和人力物力,而且周期很长。从现实操作层面来看,只能测量一部分人作为总体的代表,获得这部分人的分数分布规律,继而将这个规律推广到整个群体,得到整个群体的常模。这就存在取样是否适当的问题,只有当样本群体的特征与总体特征一致时,分数分布规律由小群体推广到大群体才依然有效,常模的误差才会在可接受的范围。

常模团体缺乏代表性,会使常模资料产生偏差而影响对测验分数的解释。由于从某些团体搜集资料比较容易,所以有取样偏差的可能性。取样即从目标人群中选择有代表性的样本,为了克服取样偏差,在搜集常模资料时,要遵循随机化原则,采用统计学的方法抽取样本。常用的几种抽样方法包括简单随机抽样、系统抽样、分组抽样和分层抽样等。

3.取样的过程必须明确且有详尽的描述

在一般的测验手册中,要详细介绍取样的大小、取样策略、取样时间等,越明确、越详尽越好。譬如,只说“常模资料来自1500名男犯”是不够的,还要说明这些罪犯选自哪些地区、哪些监狱、哪些监区,以及年龄分布、刑期长短等情况。对常模的描述越详尽,越便于使用者判断自己的受测者与常模团体是否具有可比性。

4.样本的大小要适当

所谓大小适当并没有严格的规定。一般说来,样本大小取决于两个因素,即取样误差和施测成本。样本越小,施测成本越低,取样误差可能越大;样本越大,施测成本越高,取样误差可能越小。从统计学原理上说,取样误差与样本大小成反比,所以,在其他条件相同的情况下,样本越大越好。但样本施测时所要花费的人力、物力、时间又与样本大小成正比,在其他条件相同的情况下,样本越小越好。因而样本大小要适当,在有代表性的前提下,样本应该大到足以提供稳定的常模值。保证既能将取样误差控制在较小的范围之内,又能具有较好的可操作性。取样误差大小与样本大小不是简单的反比关系,有时从一个具有代表性的较小样本中得到的数据比来自较大但定义模糊的团体中得到的数据还要可靠。因而关键是样本要有代表性。

样本大小可以根据以下几个方面来确定:第一,常模总体的数目。总体数目小,则所需样本数目也小;总体数目大,样本数目也应大,一般来说,样本范围最好为30-100人;如果是全国性常模,一般2000-3000人为宜。第二,总体性质。总体性质越复杂,样本容量就越大。第三,测验结果的精确度。精确度要求越高,样本容量越大。

5.要注意常模的时效性

由于社会的发展、文化的变迁、职业要求的改变等,以前的“代表性样本”与当下的被测者之间的差异性逐渐增大,常模资料的偏差越来越大,几年前所编制的常模可能不再适合,因此常模必须定期修订,并尽可能采用新近的常模。

6.要将一般常模与特殊常模结合起来

测验手册上所列的常模通常是为典型团体建立的,不一定适合每一个具体的被试。对此问题的一个解决办法是为每个特定目的建立特殊常模。特殊常模是为非典型团体建立的,其优点是,将个人与背景相近的人比较,针对性较强。但这同时也是它的缺点,因为它很难在较广的范围内对分数作解释。有时可将特殊常模与一般常模结合起来,从而获得最大量的信息。

二、常见的常模类型

常模可以分为两类,即组内常模和发展常模。组内常模主要有百分等级、标准分数和T分数等;发展常模是用来描述受测者已经达到的发展水平,主要有智龄、年级当量、发展顺序量表和发展商数等。

(一)发展常模

1.智力年龄

比内-西蒙量表中首先使用智力年龄的概念。一个儿童在年龄量表上所得的分数,就是最能代表他的智力水平的年龄。这种分数叫作智力年龄,简称智龄。其操作性定义为,智龄是基础年龄与在较高年龄水平的题目上获得的附加月份之和。

因为每个年龄段包括6个题目,每个题目代表2个月的智龄。具体计算如下,假如某儿童6岁组的题目全部通过,7岁组通过2题,8岁组通过3题,9岁组通过1题,其智龄为:6(岁)+2×2(月)+3×2(月)+1×2(月)=6岁+12月=7岁。

如果为每个年龄水平编制一些适当的题目,便可得到一个评价儿童智力发展水平的年龄量表。年龄常模的基本要素有:一套能区分不同年龄组的题目;一个由各个年龄的被试组成的代表性常模团体;一个表明答对哪些题或得多少分归入哪个年龄的对照表。

2.年级当量

教育成就测验常用年级当量来解释,相比于年龄常模,年级当量用年级水平来代替了年龄水平。年级常模可以从计算各年级学生在某份测验上的平均原始分数而得。各年级之间的年级当量可以采用内插法,或通过在一学年中的各时期直接测量而得。年级当量的使用非常普遍,但相比其他常模分数,更容易产生误解,应用年级当量时要注意:第一,教学内容随年级变化,故年级常模只适用于在各年级间有系统改变的一般科目。第二,年级当量的解释比较困难,例如,一个成绩优异的四年级学生在标准化测验中获得相当于六年级的分数,并不意味着他掌握了六年级的教学内容。第三,常模与标准是不同的,标准是期望达到的分数,而常模代表的是群里的次数分布。

3.发展顺序量表

最具代表性的发展顺序量表主要是格塞尔发展顺序量表和皮亚杰量表。格塞尔发展顺序量表按月份显示儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平。4周能控制眼球运动;16周能使头部保持平衡;28周能用手抓握东西并玩弄;40周能控制躯干、坐立或爬行;52周能控制腿脚运动、站立和行走等。他将婴幼儿的行为系统的建立看作一个有秩序的过程,反映了神经系统的不断成长和功能的分化,因而可以把每个成熟阶段的行为模式作为智能诊断的依据。

皮亚杰量表则用特定的任务来揭示儿童发展处于哪个阶段。他发现儿童不同时期出现不同的守恒概念:5岁时理解质量守恒;6岁时掌握重量守恒;7岁时有容量守恒概念。皮亚杰的研究着重于从婴儿到十多岁儿童认知过程的发展,尤其注重某些特殊概念的形成,其中最著名的工作就是对守恒概念的研究。

4.发展商数

比较典型的发展商数是智商,包括比率智商和离差智商。比率智商,即

其中IQ为智力商数,MA为智力年龄,CA为实际年龄。

比率智商可以表示一个儿童发展速率或聪明的程度。在斯坦福大学推孟教授于1916年修订而成的斯坦福-比内量表中,首次使用比率智商的概念。由于智力是由快到慢再到停止的一个过程,所以比率智商不适合年龄较大的被试。

(二)百分位常模

1.百分等级

指在常模样本中低于这个分数的人数的百分比。

2.百分点

也称百分位数。计算处于某一百分比例的人对应的测验分数是多少。

3.四分位数和十分位数

四分位数和十分位数只是百分位数的两个变式,其含义相似。

(三)标准分数常模

标准分数是将原始分数与平均数的距离以标准差为单位表示出来的量表。因为它的基本单位是标准差,所以叫标准分数。常见的有z分数、Z分数、T分数、标准九分、标准十分、标准二十分和离差智商等。

1.z分数

其中X为任一原始分数,为样本平均数,SD为样本标准差。

表示任一得分离平均数有几倍的标准差的距离。z分数得分越高(绝对值)表示离平均数越远,特征越明显。

2.Z分数

加上一个常数(A)是为了去掉负值,乘以一个常数(B)是为了使单位变小从而去掉小数点。计算公式为Z=A+BZ。

3.T分数

当以50为平均数(即加上一个常数50),以10为标准差(乘以一个常数10)来表示时,通常叫作T分数。量表MMPI、EPQ采用的是T分。计算公式为:

4.标准九分

以5为平均数,2为标准差。

5.标准十分

平均数为5.5,标准差为1.5。16-PF的量表分采用的是标准十分。

6.标准二十分

平均数为10,标准差为3。WAIS-RC原始分转换为量表分时,每一个分测验采用的是标准二十分。

7.离差智商

是一种以年龄组为样本计算而得的标准分数,表示的是个体智力在年龄组中所处的位置,因而是表示智力高低的一种理想的指标。韦克斯勒将离差智商平均数为100,标准差为15。计算公式为: