测量信度 Flashcards
信度概述
信度的定义(概念、三种等价的信度定义)
信度的作用(随机误差的反映、解释个体分数、不同测验分数比较)
1.定义
信度是指测量结果的稳定性程度,即用同一测量工具反复测量某人的同一种心理特质,则其多次测量结果间的一致性程度就叫做信度,也叫测量的可靠性。
三种等价的信度定义
(1)信度(信度系数)是一个被测团体真分数的变异数与实得分数的变异数之比。即:
rxx= ST2/Sx2
(2)信度是一个被试团体的真分数与实得分数的相关系数的平方。即:
rxx=ρxT2
(3)信度是一个测验x(A卷)与它的任意一个“平行测验”x’(B卷)的相关系数。即
rxx=ρxx’
2.信度的作用
- (1)信度是测量过程中所存在的随机误差大小的反映
如果信度很低,测量的随机误差就很大,测量的结果就会与真分数发生较大偏差。
- (2)信度可以用来解释个人测验分数的意义(21J)
用一个团体两次施测的结果来代替同一个人反复施测,以估计测量误差的变异数。此时,每个人两次测量的分数之差可以构成一个新的分布,这个分布的标准差就是测量的标准误,可用下式计算:SE=Sx√(1-rxx’)。它是测量误差大小的客观指标,有这指标,就可以对团体中任何一个人的测验成绩做出恰当解释,即能通过区间估计指出测量的精度。
- (3)信度有助于不同测验分数的比较
通常,不同测验的原始分数不能直接进行比较,必须转换为标准分数。具体方法是采用“差异的标准误”来进行差异的显著性检验,其公式为:SEd=S√(2-rxx-ryy)
信度的估计方法
(一)重测信度
1.含义
重测信度是指用同一个量表对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。
2.使用的前提条件
(1) 所测量的心理特性必须是稳定的
(2) 遗忘和练习的效果基本上相互抵消;
(3) 在两次施测的间隔期内,被试在所要测查的心理特质方面没有获得更多的学习和训练
信度的估计办法
(二)复本信度
1.含义
复本信度是指两个平行的测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。如果两个复本测验是同时连续施测的,则称这种复本信度为等值性系数。如果两个复本测验是相距一段时间分两次施测的,则称这种复本信度为稳定性与等值性系数。稳定性与等值性系数是对信度最严格的检验,其值最低。
2.使用前提条件
(1) 要构造出两份或两份以上真正平行的测验;
(2) 被试要有条件接受两个测验。这种条件主要取决于时间、经费等几个方面。
信度的估计办法
(三)分半信度
1.含义
分半信度有时也称内部一致性系数,它是指将一个测验分成对等的两半后,所有被试在这上所得分数的一致性程度。分半信度的计算方法和等值复本信度的计算方法类似,但还必须用斯皮尔曼一布朗公式加以校正。
- 使用的前提条件及范围
(1) 分半信度通常在只能施测一次或没有复本的情况下使用。
(2) 在使用斯皮尔曼一布朗公式时要求全体被试在两半测验上得分的变异数要相等,否则就要用弗朗那根或卢仑公式校正。
(3) 当一个测验无法分成对等的两半时,分半信度不宜使用。
信度的估计办法
(四)同质性信度
1.含义
同质性信度也叫做内部一致性系数,是指测验内部所有题目间的一致性程度。题目间一致性程度有两层意思(1)是指所有的题目测的都是同一种心理特质;(2)是指题目得分之间都具有较高的正相关
2计算方法
一种粗略的估计方法是求测验的分半信度;十分方便的方法有库一理信度系数和克龙巴赫a系数;还有荷伊特信度,是荷伊特提出用方差分量比描写测验内部一致性的方法。
信度的估计办法
(五)评分者信度
1.含义
评分者信度是指多个评分者给同一批人的答卷进行评分的一致性程度。
2.计算方法
当评分者人数为两个时,评分者信度等于两个评分者给同一一批被试的答卷所给分数的相关系数(积差相关或等级相关)。
当评分者人数多于两个时,评分者信度可用肯德尔和谐系数进行估计。
提高测量信度的方法
(一)影响测量信度的主要因素
被试(个体、团体)主试(施测者、评分者)环境(测试环境、机考环境)测量工具(测验是否标准)两次测验的间隔时间
1.被试方面(个体、团体)
(1) 就单个被试而言,被试的身心健康状况、应试动机、注意力、耐心等都会造成测量误差;
(2) 就被试团体而言,整个团体内部水平的离散程度以及团体的平均水平都会影响测量信度。同质性越大,得分分布越窄,信度值越小,可能低估信度,反之则会高估信度。另外团体得分总体过高或过低都会使得分变窄,从而低估测量的真正信度。
2.主试方面(施测者、评分者)
(1) 施测者故意制造紧张气氛、操作不规范给被试一定的暗示或协助等会降低测量信度;
(2) 评分者评分标准不一也会降低测量信度。
3.施测情境方面
在实施测验时,考场是否安静、光线和通风情况是否良好、所需设备是否齐备、桌面是否合乎要求、空间宽窄是否恰当等因素都可能影响测量的信度。
此外基于计算机或其他IT技术的考试,考试平台的质量、稳定性,以及考生使用机器的熟练程度等,也是常见的影响测量信度的重要因素。
4.测量工具方面(试题)
试题的取样、试题之间的同质性程度、试题的难度等是影响测验稳定性的主要因素
5.两次施测的间隔时间
在计算重测信度和稳定性与等值性系数时,两次测验相隔的时间越短,其信度值越大;间隔时间越长,其信度值就可能越小。
提高测量信度的方法
(二)提高测量信度的常用方法
- 适当增加测验的长度。
* 注意:①新增项目必须与试卷中原有的项目同质;②新增项目的量必须适度。若已知测验现有信度及所要求的信度标准可以用斯皮尔曼一布朗预测公式得到恰当的增加数目。 - 使测验中所有试题的难度接近正态分布,并控制在中等水平。
3努力提高测验试题的区分度。
- 选取适当的被试团体,提高测量在各同质性较强的亚团体上的信度。
- 主试者严格执行施测规程,评分者按照严格标准给分,施测场地按测验手册的要求进行布置,减少无关因素的干扰。