四、简答题1. 试比较各种导出分数的优缺点。
导出分数就是在原始分数转换的基础上,按照一定的规则,经过统计处理后获得的具有一定参照点和单位,且可以相互比较的分数。这种按某种规则将原始分数转化为导出分数的过程称作分数的转换。常用的导出分数有百分等级、标准分数、T分数等。
(1)百分等级的优缺点
百分等级是应用最广的导出分数。一个原始分数的百分等级是指在一个群体的测验分数中,得分低于这个分数的人数的百分比。其优缺点为:
①优点
a.百分等级是一种相对位置量数,具有可比性,且具有易于计算、解释方便等优点,对一般教师、学生和家长而言,均能了解百分等级的意义,所以它较适用于不同的对象和性质不同的测验。
b.百分等级不受原始分数分布状态的影响,即使分数分配不是正态的,也不会改变百分等级常模的解释能力。
②缺点
a.单位不等,尤其在分配的两个极端。
b.百分等级只具有顺序性,而无法用它来说明不同被试之间分数差异的数量。
(2)标准分数的优缺点
标准分数是一种具有相等单位的量数,又称作Z分数,以Z表示。它是将原始分数与团体的平均数之差除以标准差所得的商数,是以标准差为单位度量原始分数离开其平均数的距离。其优缺点为:
①优点
a.Z分数不仅具有可比性,而且还具有可加性。
b.运用公式所求得的Z分数,实际上只是对原始分数X所作的一个线性变换,所以Z分数与原始分数X的分布形态相同。若原始分数不服从正态分布,转换成Z分数后,其分布仍然非正态。
c.任何一组原始分数经转换为Z分数以后均有

、S
Z=1,因此,可以利用Z分数对不同测验分数进行比较。
②缺点
Z分数由于计算中经常出现负数和小数,且单位过大(一个标准差单位),所以,使用起来不够方便。
(3)T分数的优缺点
一种将Z分数作线性变换,使负号与小数消失,全部变为正数的转换方法。这种转换后的分数命名为T分数。所以T分数实际上是由标准分数直接转换而来。其优缺点为:
①优点
a.具有等单位特点,便于进一步进行统计分析。
b.正态分布下,可以利用正态分布表将各种导出分数与百分等级分数作换算。
c.正态分布下,运用某种变式分数可以将几个测验上的分数作直接的比较。即使是非正态分布,也可运用由正态化的Z分数转换而得的变式分数进行直接比较分析。
②缺点
a.分数过于抽象,不易理解。
b.在非正态分布下,分布形态不同的变式分数,仍然不可以作相互比较,也不能相加求和。
2. 列举你所了解的各种测验的分数合成方法,并评价它们的合理性。
分数合成的方法有:
(1)临床诊断——直觉合成
根据直觉的经验,主观地将各种因素加权,而获得结论或预测的方法称作临床诊断。临床诊断是实际工作中最常用的组合测验分数的方法。
①临床诊断法的优点
a.具有高度的综合性。
b.具有灵活的针对性,能就特定的个人作具体的结论。
②临床诊断法的缺点
a.主观加权易受决策者的偏见影响,不够客观。
b.缺乏精确的数量分析,没有精确的数量指标。
(2)加权求和合成
如果各个测验所测特质间有相互代偿作用,这些测验上的分数又是连续性资料,并能大体同时获得,那么可以采用加权求和的方法对分数进行合成。加权系数的确定比较复杂,通常采用的方法有:
①抽象推理,从某些理论要求出发加以推定。
②使用统计学方法,常用主成分分析的第一主成分作权数。
(3)多重回归
多重回归就是研究一种事物或现象与其他多种事物或现象在数量上相互联系和相互制约的统计方法,基本方程式为:

在具体应用时,应注意到多重回归方法所采用的是统计线性模型,所以只有当预测源与效标间存在线性关系时才是适合的。同时还要求预测源分数跟效标分数能够同时取得,并且都是连续性资料,若这些条件不能满足,就不宜于采用多重回归分析而应用其他方法。
(4)多重划分
多重划分就是在各个特质上都确定一个标准,从而把成绩划分为合格与不合格两类。在整个测验实施时,是把所有组成这一测验的分测验按一定顺序排列起来逐一实施,只有通过了前一次测验,才能继续实施后一个测验。当有一个测验的成绩被断定为不合格时,测验即停止,被试被视为不合格而予以淘汰。由于成功的被试必须越过一连串测验的栅栏,所以这种方法也称作“连续栅栏”。
①优点:采用多重划分的方法组合分数时,应该将最有效的预测源或测验放在前面,紧接着为第二个有效的测验,如此类推。这样就保证了整个逐步淘汰过程具有最优良的选择效率。
②缺点:采用多重划分方法,只决定接受或拒绝,每个被试只可放在其中一个类别:达到最低标准与没有达到最低标准。因此,在通过连续栅栏选择的被试之中,相互之间没有优劣之分,他们之间的差异被忽视了,若想区分他们之间水平的差异,必须用其他方法。
3. 选择常模团体与制定常模有什么关系?如何选择好常模团体?
(1)选择常模团体与制定常模的关系
常模是根据标准化样本的测验分数经过统计处理而建立起来的具有参照点和单位的测验量表。常模团体是由具有某种共同特征的人所组成的一个群体,或是该群体的一个样本。选定合适的常模群体是制定常模的关键,常模是否合适直接关系到该测验的推广度以及有效性:
①从测验的编制者来讲,确定常模团体的问题,变成确定所编制的测验将来用于什么总体,所选定的常模团体必须能够代表该总体。大部分测验都有不止一个常模团体。
②对测验的使用者,要从不同角度来选定常模,选定一个与施测样本最适合的一个常模团体。因为标准化测验通常提供许多原始分数与各种常模团体的比较转换表,被试的分数必须与最合适的常模比较。
③无论是测验编制者还是测验使用者,所关心的主要问题仍然是常模团体的成员。
a.对于成就测验和能力倾向测验,适当的常模团体通常包括目前与潜在的竞争者;
b.比较广泛的能力与性格测验,常模团体通常包括具有同样年龄或教育水平的人。
c.在一些特殊情况下,还有许多方面也可用来定义常模团体,如性别、年龄、年级或教育水平、职业、社会经济地位、民族等。
(2)选择好常模团体的途径
①群体构成的界限必须明确。在确定常模团体时,必须清楚地说明所要测量的群体的性质与特征。
②常模团体必须是所测群体的一个代表性样本。为了克服取样偏差,保证具有代表性,一般在抽样时应遵循随机化原则,采用统计学的方法抽取样本。
③取样的过程必须明确且有详尽的描述。这主要是为了使测验的使用者不至于误用测验和错误地解释测验结果,说明和描述越明确、越详尽越好。
④样本大小要适当。“大小适当”并没有明确的指标。根据统计学原理,取样误差与样本大小成反比。所以,在其他条件相同时,样本越大越好。但是还应考虑到人力、物力等方面的因素。
⑤常模团体必须是近时的。过时的常模是不能作为参照标准的,一个常模不能一劳永逸地使用。
⑥注意一般常模与特殊常模的结合。可使被试与最接近的群体进行比较,将两者结合使用,解释分数便会更加准确。但特殊常模只提供有关特殊信息,适用范围较窄,所得结论不能在广泛的背景下作解释。
4. 离差智商与比率智商的本质差异是什么?
(1)离差智商
离差智商,是指一个人的智力偏离本年龄组平均水平的方向和程度。测验规定,100为平均水平,如果一个人智商分数高于100,则表示高于平均水平;若小于100,则表示低于平均水平。离差智商反映的是一个人与其同年龄组人的智力分布相比较下,所处的水平位置。
离差智商的公式是:

,其中

反映了所有人的分数相对于平均数偏离的程度,说明了整体中各个分数的分布状况,离差智商也就因此而得名。100分为定义的平均智商;15是为了取消除法中的小数,并使所得的商与100有可比性而人为规定的。
(2)比率智商
比率智商:1916年美国斯坦福大学推孟修订的比纳—西蒙量表使用智商(IQ)这个概念来作为智力的测量指标,更加有利于不同年龄儿童智力的比较。
斯坦福—比纳智力测验中的智商是智力年龄与实际年龄之比,也称比率智商,计算公式为:

。其中,智力年龄是受测者通过测验项目所属的年龄。IQ作为智力年龄与实足年龄的比值,当其值为100的时候,就表示一个人的智力处于中等水平。在一般人口中,智商呈正态分布,即中等水平的居多数,两极端的为少数。
(3)两者的本质差异
两者的本质差异在于,通过比率智商,只能够了解到个体自己的智力发展情况,了解其心理年龄与实足年龄的关系,并且比率智商存在一个很明显的问题即是随着个体实足年龄的增长,心理年龄的变化越来越慢,会出现智商倒退的现象,并且不同个体之间不能够相互比较。而离差智商就解决了这个问题,采用Z分数,来衡量所有人的分数相对于平均数的偏离程度,提供了不同个体间相互比较的可能。
五、论述题1. 参照常模的分数解释有几种?请分析各自的优缺点。
心理测量分数通常用参照常模的办法解释。按照统计学的原理,把某一标准化样组的原始分数或测验分数转化为具有一定单位、参照点和连续体的导出分数,这就是测验量表。导出分数能以相同单位来表示测验成绩,能参照相同的或近似的常模团体在不同的测验中的作业情况,于是个体在多种测验中的有关作业情况就可比较了。常见的参照常模的解释有以下几种:
(1)组内常模和量表
一般来说,所有的标准化测验都提供某种形式的组内常模。利用这种常模,个体的作业情况可以通过与和其最可比较的标准化团体的作业比较而得以评价。常用的组内量表包括:
①百分等级分数
a.百分等级分数的定义
百分等级是应用最广的导出分数。一个原始分数的百分等级是指在一个群体的测验分数中,得分低于这个分数的人数的百分比。
b.百分等级分数的优缺点
优点:具有可比性,易于计算、解释方便。适用于不同的对象和性质不同的测验。另外,百分等级不受原始分数分布状态的影响,即使分数分配不是正态的,也不会改变百分等级常模的解释能力。
缺点:单位不等,尤其在分配的两个极端。百分等级只具有顺序性,而无法用它来说明不同被试之间分数差异的数量。另外,百分等级是相对于特定的被试团体而言的,所以,解释时不能离开特定的参照团体。
②标准分数
a.标准分数的定义
标准分数是一种具有相等单位的量数,又称作Z分数。它是将原始分数与团体的平均数之差除以标准差所得的商数,是以标准差为单位度量原始分数离开其平均数的分数之上多少个标准差,或是在平均数之下多少个标准差。标准分数还包括一些变式如T分数等。
b.标准分数的优缺点
优点:具有等单位特点,便于工作进一步的统计分析;正态分布下,可以利用正态分布表将各种导出分数与百分等级分数作换算:正态分布下,运用某种变式分数可以将几个测验上的分数作直接的比较。即使是非正态分布,也可运用由正态化的Z分数转换而得的变式分数进行直接比较分析。
缺点:分数过于抽象,不易理解,正如在介绍T分数时所提到的那样不为一般人所熟悉;在非正态分布下,分布形态不同的变式分数,仍然不可以作相互比较,也不能相加求和。
(2)发展性常模和量表
测验分数的一个可能意义是通过对原始分数的变换使其明示:个体达到了怎样的程度,他的行为属于哪一个水平。人的许多心理特质如智力、技能等,是随时间以有系统的方式发展的,所以可将个人的成绩与各种发展水平的人的成绩比较而制成发展量表。主要的发展量表包括:
①智龄,即心理年龄
测量儿童心理成长,可以将一个儿童的行为与各年龄水平的儿童比较,以获得该儿童的心理发展水平。这需要得到一个可评价儿童智力发展水平的年龄量表。一个儿童在年龄量表上所得的分数,就是最能代表他的智力水平的年龄,这样的分数就称作智力年龄,简称智龄。
②年级当量
在教育成就测验中,分数的解释通常也采用年级当量。即将被试的测验成绩与某一年级的学生的平均分数作比较,而说成相当于某一年级水平。
③商数
在教育测验中,有时也采用商数来表明教育发展或成就的速率,常见到的有教育商数与成就商数。教育商数与智商类似,它是教育年龄与实际年龄之比。成就商数是将一个学生的教育成就与他的智力作比较,即教育年龄与智力年龄之比。
发展性量表总的优点主要有:以年龄或年级当量作为单位来报告分数易于被人理解;可以与同等团体做直接比较;为个人内比较与纵向比较提供了基础。但其也存在一定的缺陷,主要包括:只适用于所测的特质随年龄或年级发生系统变化的情况,因此仅适用于年纪小的儿童,对成人不适用;由于人的行为发展受教育与经验的影响,因此发展量表只适用于典型环境下成长的儿童;发展量表的单位不相等;获得同样的年龄或年级当量分数,并不一定具有相同的智力或学业水平。
2. 什么是常模参照测验和标准参照测验?比较其异同,并举例说明。
(1)常模参照测验和标准参照测验的含义
①常模参照性测验就是以常模为评价测验分数优劣标准的测验,常模被视为测验分数的参照,它关心的不是一个人能力或知识的绝对水平,而是他在所属群体的能力或知识连续体上的相对位置。这种测验是将一个人的分数与其他人比较,看其在某一团体中所处的位置。
②标准参照性测验就是在对测验结果进行评价时不是以常模为标准,而是根据特定的操作标准和行为领域,对个体做出是否达标或达到什么程度的判断,而不考虑他人分数的测验。这种测验是将被试的分数与某种标准进行比较来解释。这种测验常常用来检验学习效果,看对指定的内容范围掌握得如何或达到某一标准,衡量测验优劣的主要指标是内容效度。
(2)二者的异同
①两种测验的相同点:两种测验都是对测验分数的解释。两种测验都可以给被试提供相应的信息。
②两种测验的不同点:两种测验是根据对测验分数的解释参照不同划分的。标准参照性测验是将测验结果同事先规定的标准进行比较,对被试个体的分数做出解释;而常模参照性测验是将测验分数参照常模加以解释,也就是将每一个人的分数同团体中的其他人进行比较,这是一种相对的比较。
(3)举例
①高中生升大学的考试属于常模参照性测验。在这种考试中,一方面需要测试学生对书本知识的掌握水平,但同时也是属于选拔性考试,必然有一些学生被筛选下去,而只保留优秀的考生。这种考试的结果是获得该考生在一起参加考试学生中的相对位置,通过相比较来衡量其实际能力,考虑是否通过,并以这个信息考虑录取与否。
②会计师职业资格考试属于标准参照测验。这种考试并不要求该考生与同时参加考试的其他考生进行比较,通过比较获得考生在团体中的相对位置,而是以知识概述为依据,确定试题范围,测试考生是否达到某一级别的要求,从而划定一定的分数作为标准(比如60分),达到这个标准的考生即认为是合格的,可以颁发相应的资格证书。因此这种考试关键取决于试题的内容效度,即内容是否能衡量考生的真实水平。