5 测量 Flashcards
测量的定义
测量是根据一定的法则,使用量具,对事物的特征进行定量描述的过程。
测量的要素
1)参照点 绝对参照点:绝对零点 相对参照点:人为确定的零点 2)单位 确定的意义 相等的价值
测量的量表
1)称名量表:分类 2)顺序量表:排序 3)等距量表:相等单位、相对零点,能加减 如:分数、温度、海拔 4)比率量表:相等单位、绝对零点,能加减乘除
心理测量的定义、性质(特征)和水平
1、定义: 依据一定的心理学理论,使用一定的操作程序,对人的心理特征进行定量描述的过程。 2、性质(特征) 1)间接性 2)相对性:相对零点 3)客观性:信效度、标准化 3、水平:等距量表(本质:顺序量表)
心理测验的分类和功能
1、分类
2、功能
误差
(1个定义、2种分类、3种来源、4种控制)
1、定义
是在测量过程中,那些与测量目的无关的因素所导致的测量结果不准确或不一致的测量效应。
2、分类 1)随机误差 与测量目的无关的、偶然因素引起的、不易控制的误差 影响测验的准确性与稳定性(一致性) 如:评分标准宽严不一、题目难 2)系统误差 与测量目的无关的因素引起的一种恒定而有规律的效应 影响测验的准确性,但不影响测验的稳定性(一致性) 如:标准答案给错了
3、来源 1)测量工具 测验题目取样不当、格式不妥、难度过高或过低、指导语用词不当、时限过短 2)测量对象 应试焦虑和动机(适度);应试经验;反应倾向;练习效应;生理因素 3)测量过程 测试环境;测试时间;主试;意外干扰;计分
4、控制:测量的标准化 1)编制 测验题目是所测指标的代表性取样、对所有被试施测相同或等值的题目 2)实施 相同测验环境、指导语和时限 3)计分 4)分数解释
真分数与观察分数的定义
1、真分数 定义:是反映被试某种心理特质真正水平的数值 操作定义:无数次测量结果的平均值 2、观察分数 实测的分数
经典测量理论(CTT)的数学模型
1)CTT假设,观察分数X与真分数T之间是一种线性关系,并且只相差一个随机误差E,即X=T+E
2)根据CTT模型,可引申出三个假设公理
若一个人的某种心理品质可以用平行测验反复测量足够多次,则其观察分数的平均值为真分数。即:
真分数与测量误差之间相互独立,即误差分数与真分数的相关为零。即:
各平行测验上的误差分数之间相关为零,即:
3)CTT模型的方差关系
一次测验中,一个团体的实测分数之间的变异性是由与测量目的有关的变异数、稳定但出自无关来源的变异数和随机误差的变异数决定的。即
信度的定义
1、操作性定义 信度指测量结果的一致性和稳定性程度 2、理论定义 1)信度是一组测量分数的真变异数与总变异数(实得变异数)之比 2)是一个被试团体的真分数与实得分数的相关系数的平方 3)是一个测验与其任意一个平行测验的相关系数
信度的作用
1、信度是测量过程中随机误差大小的反映 信度低,测量的随机误差大 系统误差与信度无关 2、信度可以用来解释个体测量分数的意义 测量的标准误: 真值区间估计: 3、信度可以帮助不同测验分数之间进行比较
信度的估计方法
1、重测信度:(稳定信系数) 1)定义:指用同一个量表对同一组被试施测两次所得结果的一致性程度 2)计算:皮尔逊积差相关 3)误差来源:时间 4)使用前提:3
2、复本信度 1)定义:用两个平行测验测量同一批被试所得结果的一致性程度 2)分类: 连续施测:等值性系数 (误差来源:内容) 间隔施测:稳定性和等值性系数(误差来源:时间、内容)是对信度最严格的检验,其值最低 3)计算:皮尔逊积差相关 4)使用前提:3
3、分半信度:(内部一致性系数) 1)定义:指一个测验被分成对等的两半后,所有被试在这两半上所得分数的一致性程度。 2)误差来源:内容 3)计算:斯皮尔曼-布朗校正公式 4)使用前提:3 分半方法很多,同一测验通常会有多个分半信度
4、同质性信度:(内部一致性系数) 1)定义:指测验内部所有题目的一致性程度。这里的一致性是指分数的一致性,而不是题目内容或形式的一致性。 2.计算: 1)0,1计分:KR20、KR21 2)克隆巴赫α系数:可处理任何测验内部一致性系数的计算问题 α系数是所有可能的分半信度 平均值 α值大必有较高的信度,但α值小,却不能断定信度不高 3)荷伊特信度 用方差分量比描写内部一致性 4)使用前提:2
5、评分者信度 1)定义:指多个评分者给同一批人的答卷进行评分的一致性程度。 2)计算 评分者=2时,积差相关或斯皮尔曼等级相关 评分者>2时,肯德尔和谐系数(W)
影响信度的因素
1、被试 单个被试:身心健康、动机、态度等 被试团体:团体的异质性、平均水平 团体异质,信度会被高估,团体同质会被低估 团体的平均水平过高或过低,会低估
2、主试
施测者未按规定施测,给被试暗示、协助等,会降低信度
评分者评分标准不一,也会降低信度
3、施测情境 4、施测工具 1)试题取样不当(题目太少,考察不全面),信度低 2)题目间同质性程度:越高,信度越高 3)题目难度:过高或过低,会降低信度 4)题目的长度:题目越多,信度越高
5、两次施测的间隔时间
间隔时间越长,受其它因素影响的机会越多,信度就越低
提高信度的方法
1、适当增加测验的长度 新增项目必须与原题目同质,数量必须适度 公式: 2、使测验中试题的难度接近正态分布,并控制在中等水平 3、提高测验试题的区分度 4、选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度 5、主试严格执行施测程序,评分者严格按标准给分,施测场地按测验手册要求进行布置,减少无关因素的干扰。
效度的定义
1、操作性定义
指测量的有效性和准确性,即一个测验实际能测出其所要测的心理特质的程度。
2、理论定义
指在一系列测量中,与测量目的有关的真实变异(有效变异)与总变异的比率,即由所测的特性造成的变异所占的比例。
V=
效度和信度的关系
1、信度是效度的必要非充分条件
信度低、效度一定低,信度高、效度不一定高。
2、测验的效度受它的信度制约
信度大于或等于效度
效度的分类与估计方法
1、内容效度 1)含义:一个测验实际能测到的内容与所要测量的内容之间的吻合程度 2)估计方法 专家评定法(逻辑分析法)、复本法、再测法、经验法 3)区分内容效度与表面效度 4)应用:主要用于成就测验,也适合某些选拔和分类的职业测验,不适合能力和人格测验
2、效标关联效度 1)含义:指一个测验对处于特定情境中的个体行为进行估计的有效性。 被估计的行为是检验测验效度的标准,简称效标;测验本身称为预测源。 2)种类:同时效度、预测效度 3)估计方法:相关法、区分法(t检验)、命中率(总命中率、正命中率) 4)常用效标:学业成就、等级评定、临床诊断
3、结构效度(构想效度、构念效度、雨伞效度) 1)定义:一个测验实际测到所要测量的理论结构和特质的程度。 2)方法 测验内方法: 测验间方法:相容效度、汇聚效度、区分效度、多质多法 效标关联法 发展水平的变化
效度的影响因素
1、测验本身 1)试题样本代表性:代表性差,内容效度或结构效度就不会高 2)项目质量:题目语意不清、指导语不明、题目太难或太易、太少等都会降低效度。 3)项目长度:一般增加测验长度可以提高信度,从而为提高效度提供了可能。 2、测验实施和计分 施测过程中,若不遵从指导语、出现意外干扰、评分出现差错等,都会降低效度。 3、被试 身心特点 样本特点:样本代表性、规模、异质性 4、所选效标的性质 效标和测量分数是否符合线性关系 采用不同效标所导致的效度差异也应重视 5、测验的信度 信度高是效度高的必要条件,信度不高的测验不可能有很高的效度。
提高效度的方法
1、精心编制量表,避免出现较大的系统误差
2、妥善组织测验,控制随机误差
3、创设标准的应试情境,让每个被试都能发挥正常的水平
4、选择正确的效标,定好恰当的效标测量,正确地使用有关公式
效度的定义
1、操作性定义
指测量的有效性和准确性,即一个测验实际能测出其所要测的心理特质的程度。
2、理论定义
指在一系列测量中,与测量目的有关的真实变异(有效变异)与总变异的比率,即由所测的特性造成的变异所占的比例。
V=
效度和信度的关系
1、信度是效度的必要非充分条件
信度低、效度一定低,信度高、效度不一定高。
2、测验的效度受它的信度制约
信度大于或等于效度
效度的分类与估计方法
1、内容效度 1)含义:一个测验实际能测到的内容与所要测量的内容之间的吻合程度 2)估计方法 专家评定法(逻辑分析法)、复本法、再测法、经验法 3)区分内容效度与表面效度 4)应用:主要用于成就测验,也适合某些选拔和分类的职业测验,不适合能力和人格测验
2、效标关联效度 1)含义:指一个测验对处于特定情境中的个体行为进行估计的有效性。 被估计的行为是检验测验效度的标准,简称效标;测验本身称为预测源。 2)种类:同时效度、预测效度 3)估计方法:相关法、区分法(t检验)、命中率(总命中率、正命中率) 4)常用效标:学业成就、等级评定、临床诊断
3、结构效度(构想效度、构念效度、雨伞效度) 1)定义:一个测验实际测到所要测量的理论结构和特质的程度。 2)方法 测验内方法: 测验间方法:相容效度、汇聚效度、区分效度、多质多法 效标关联法 发展水平的变化
效度的影响因素
1、测验本身 1)试题样本代表性:代表性差,内容效度或结构效度就不会高 2)项目质量:题目语意不清、指导语不明、题目太难或太易、太少等都会降低效度。 3)项目长度:一般增加测验长度可以提高信度,从而为提高效度提供了可能。 2、测验实施和计分 施测过程中,若不遵从指导语、出现意外干扰、评分出现差错等,都会降低效度。 3、被试 身心特点 样本特点:样本代表性、规模、异质性 4、所选效标的性质 效标和测量分数是否符合线性关系 采用不同效标所导致的效度差异也应重视 5、测验的信度 信度高是效度高的必要条件,信度不高的测验不可能有很高的效度。
提高效度的方法
1、精心编制量表,避免出现较大的系统误差
2、妥善组织测验,控制随机误差
3、创设标准的应试情境,让每个被试都能发挥正常的水平
4、选择正确的效标,定好恰当的效标测量,正确地使用有关公式
效度的定义
1、操作性定义
指测量的有效性和准确性,即一个测验实际能测出其所要测的心理特质的程度。
2、理论定义
指在一系列测量中,与测量目的有关的真实变异(有效变异)与总变异的比率,即由所测的特性造成的变异所占的比例。
V=
效度和信度的关系
1、信度是效度的必要非充分条件
信度低、效度一定低,信度高、效度不一定高。
2、测验的效度受它的信度制约
信度大于或等于效度
效度的分类与估计方法
1、内容效度 1)含义:一个测验实际能测到的内容与所要测量的内容之间的吻合程度 2)估计方法 专家评定法(逻辑分析法)、复本法、再测法、经验法 3)区分内容效度与表面效度 4)应用:主要用于成就测验,也适合某些选拔和分类的职业测验,不适合能力和人格测验
2、效标关联效度 1)含义:指一个测验对处于特定情境中的个体行为进行估计的有效性。 被估计的行为是检验测验效度的标准,简称效标;测验本身称为预测源。 2)种类:同时效度、预测效度 3)估计方法:相关法、区分法(t检验)、命中率(总命中率、正命中率) 4)常用效标:学业成就、等级评定、临床诊断
3、结构效度(构想效度、构念效度、雨伞效度) 1)定义:一个测验实际测到所要测量的理论结构和特质的程度。 2)方法 测验内方法: 测验间方法:相容效度、汇聚效度、区分效度、多质多法 效标关联法 发展水平的变化
效度的影响因素
1、测验本身 1)试题样本代表性:代表性差,内容效度或结构效度就不会高 2)项目质量:题目语意不清、指导语不明、题目太难或太易、太少等都会降低效度。 3)项目长度:一般增加测验长度可以提高信度,从而为提高效度提供了可能。 2、测验实施和计分 施测过程中,若不遵从指导语、出现意外干扰、评分出现差错等,都会降低效度。 3、被试 身心特点 样本特点:样本代表性、规模、异质性 4、所选效标的性质 效标和测量分数是否符合线性关系 采用不同效标所导致的效度差异也应重视 5、测验的信度 信度高是效度高的必要条件,信度不高的测验不可能有很高的效度。
提高效度的方法
1、精心编制量表,避免出现较大的系统误差
2、妥善组织测验,控制随机误差
3、创设标准的应试情境,让每个被试都能发挥正常的水平
4、选择正确的效标,定好恰当的效标测量,正确地使用有关公式
效度的定义
1、操作性定义
指测量的有效性和准确性,即一个测验实际能测出其所要测的心理特质的程度。
2、理论定义
指在一系列测量中,与测量目的有关的真实变异(有效变异)与总变异的比率,即由所测的特性造成的变异所占的比例。
V=
效度和信度的关系
1、信度是效度的必要非充分条件
信度低、效度一定低,信度高、效度不一定高。
2、测验的效度受它的信度制约
信度大于或等于效度
效度的分类与估计方法
1、内容效度 1)含义:一个测验实际能测到的内容与所要测量的内容之间的吻合程度 2)估计方法 专家评定法(逻辑分析法)、复本法、再测法、经验法 3)区分内容效度与表面效度 4)应用:主要用于成就测验,也适合某些选拔和分类的职业测验,不适合能力和人格测验
2、效标关联效度 1)含义:指一个测验对处于特定情境中的个体行为进行估计的有效性。 被估计的行为是检验测验效度的标准,简称效标;测验本身称为预测源。 2)种类:同时效度、预测效度 3)估计方法:相关法、区分法(t检验)、命中率(总命中率、正命中率) 4)常用效标:学业成就、等级评定、临床诊断
3、结构效度(构想效度、构念效度、雨伞效度) 1)定义:一个测验实际测到所要测量的理论结构和特质的程度。 2)方法 测验内方法: 测验间方法:相容效度、汇聚效度、区分效度、多质多法 效标关联法 发展水平的变化
效度的影响因素
1、测验本身 1)试题样本代表性:代表性差,内容效度或结构效度就不会高 2)项目质量:题目语意不清、指导语不明、题目太难或太易、太少等都会降低效度。 3)项目长度:一般增加测验长度可以提高信度,从而为提高效度提供了可能。 2、测验实施和计分 施测过程中,若不遵从指导语、出现意外干扰、评分出现差错等,都会降低效度。 3、被试 身心特点 样本特点:样本代表性、规模、异质性 4、所选效标的性质 效标和测量分数是否符合线性关系 采用不同效标所导致的效度差异也应重视 5、测验的信度 信度高是效度高的必要条件,信度不高的测验不可能有很高的效度。