经典测验理论 Flashcards
测量误差
测量中那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。
系统误差
由与测验目的无关的因素引起的一种恒定而有规律的误差,这种误差稳定地存在于每一次测量当中,只影响准确性。
测量误差的来源
1⃣️测量工具
▫️项目取样的代表性、猜测、题目表述不清
▫️i.e, 信效度低
2⃣️被试
① 应试动机
② 测验焦虑(适度有益)
③ 测验经验
④ 练习效应
⑤ 反应倾向(e.g, 求快/求准;选择“是”或“否”的偏好)
⑥ 生理变化(生病、疲劳;智力、情绪、体力等方面的生理节律)
3⃣️施测过程
① 测验环境(温度、光线、声音、空间宽窄)
② 主试与评分记分
③ 意外干扰(停电、作弊、设备故障)
真分数
测量没有误差时测到的真值,反映被试某种心理特质的真正水平。操作性定义为无数次测量结果的平均值,这只是一个理论上的抽象概念。
经典测验理论(CTT)的假设
观察分数(X)与真分数(T)之间是一种线性关系,并只相差一个随机误差(E),即CTT的数学模型:X=T+E。
根据该模型引申出三个假设公理:
① 若一个人的某种心理特质可以用平行的测验反复测量足够多次,其观察分数的平均值会接近真分数,即ε(X)=T。
② 真分数和误差分数之间的相关为0,即ρ(ET)=0。
③ 各平行测验上的误差分数之间的相关为0,即ρ(E1E2)=0。
平行测验
对于测验总体中的任何一个被试而言,若他在两个测验上的观察分数同时满足CTT的数学模型和三大假设,并且具有相等的真分数和相等的误差标准差,则这两个测验被称为严格平行的测验。通俗地说,如果两个题目不同的测验测得的都是同一特质,并且题目的形式、数量、难度、区分度及测验得分的分布都是一致的,则这两个测验被称作彼此平行的测验。
CTT经典测验理论的推论
① 在一次测量中,被试观察分数的方差等于其真分数方差与误差分数方差之和。
② 真分数的变异还可以分为两部分:
⑴ 与测量目的有关的变异
⑵ 与测量目的无关的变异(系统误差)
③ 一个团体的实测分数的变异是由以下三项变异决定的:
⑴ 与测验目的有关的变异(V)
⑵ 稳定的但出自无关来源的变异(系统误差I)
⑶ 测量误差的变异(随机误差E)
信度的定义
信度是指测量结果的稳定性程度,即用同一测量工具反复测量某人的同一种心理特质,多次测量结果间的一致性程度,也叫测量的可靠性。
三种等价的定义:
① 信度(信度系数)是一个被测团体真分数的变异数与实得分数的变异数之比。
② 信度是一个被试团体的真分数与实得分数的相关系数的平方。
③ 信度是一个测验x(A卷)与它的任一个平行测验x’(B卷)的相关系数。
信度的作用
1⃣️信度是测量过程中所存在的随机误差大小的反映
2⃣️信度可以用来解释个人测验分数的意义
▫️用一个团体两次施测的结果来代替同一个人反复施测,以估计测量误差的变异数。此时,每个人两次测量的分数之差可以构成一个新的分布,这个分布的标准差就是测量的标准误(自行回忆公式,SE=?)。它是测量误差大小的客观指标,有这一指标,就可以对团体中任何一个人的测验成绩做出恰当解释,即能通过区间估计指出测量的精度。
3⃣️信度有助于不同测验分数的比较
▫️通常,不同测验的原始分数不能直接进行比较,必须转化为标准分数。具体方法是采用“差异的标准误”来进行差异的显著性检验,其公式为(自行回忆)。
重测信度
重测信度是指用同一个量表对同一组被试施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。
使用重测信度的前提条件
① 所测的心理特质稳定;
② 遗忘和练习的效果基本相抵;
③ 在两次施测的间隔期内,被试在所要测查的心理特质方面没有获得更多的学习和训练。
重测信度的误差来源
被试状态、时间间隔
复本信度
复本信度是指两个平行测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。如果两个复本测验是同时连续施测的,则称这种复本信度为等值性系数。如果两个复本测验是相距一段时间分两次施测的,则称这种复本信度为稳定性与等值性系数。稳定性与等值性系数是对信度最严格的检验,其值最低。
使用复本信度的前提条件
① 构造出两份或两份以上真正平行的测验;
② 有条件让被试接受两个测验,这种条件主要取决于时间、经费等几个方面。
复本信度的误差来源
- 等值性系数:题目内容、被试状态;
- 稳定性与等值性系数:题目内容、时间间隔。
分半信度
分半信度有时也称内部一致性系数,它是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。分半信度的计算方法和等值复本信度的计算方法相似,但还必须用斯皮尔曼-布朗公式加以校正。
使用分半信度的前提条件
① 分半信度通常在只能施测一次或没有复本的情况下适应;
② 在使用斯皮尔曼-布朗公式时要求全体被试在两半测验上得分的变异数要相等,否则就要用弗朗那根公式或卢仑公式校正;
③ 当一个测验无法分成对等的两半时,分半信度不宜适用。
分半信度的误差来源
题目内容
随机误差
由与测量目的无关的、偶然因素引起的、不易控制的误差。它使多次测量产生不一致的结果,其方向和大小的变化完全是随机的,只符合某种统计规律,影响准确性和一致性。
同质性信度
同质性信度也叫内部一致性系数,是指测验内部所有题目间的一致性程度。题目间一致性程度有两层意思:⑴是指所有题目测的都是同一种心理特质;⑵ 是指题目得分之间都具有较高的正相关。
同质性信度的计算方法
一种粗略的估计方法是求测验的分半信度;十分方便的方法有库-理信度系数和克隆巴赫α系数;此外还有荷伊特信度,是荷伊特提出的用方差分量比描写测验内部一致性的方法。
同质性信度的误差来源
内容取样、所研究行为的异质性
评分者信度
评分者信度是指多个评分者给同一批人的答卷进行评分的一致性程度。
评分者信度的计算方法
当评分者人数为两个时,评分者信度等于两个评分者给同一批被试答卷所给分数的相关系数(积差相关或等级相关);当评分者人数多于两个时,评分者信度可用肯德尔和谐系数进行估计。