7心理测试理论与测量方法 Flashcards
经典测试理论
经典测验理论及其方法,起源于斯皮尔满在本世纪初有关智力和智力测验的著名研究。
1、斯皮尔满的分数模型
斯皮尔满的分数模型
斯皮尔满的分数模型提出,任何心理测验所得到的分数(X),都是由反映对象稳定的心理特征的真分数(T)和由随机因素造成的误差分数(e)这两种成分所构成。 这个分数模型依据三个基本假设: (1)模型中真分数是稳定的,对相同对象多次重复测量的误差分数呈正态分布; (2)真分数和误差分数是相互独立、互补相关的,两者之间没有显著相关。 (3)真分数和误差分数是以简单可加的方式结合在一起的。
经典心理测验理论的主要局限和问题
(1)测量结果特定于具体测验
(2)测量参数特定于具体样本
(3)忽视项目反应的模式
现代测验理论
1、潜特征测验理论
2、项目反应理论
潜特征测验理论
这类理论起源于上世纪20年代中期的瑟斯顿有关“心理年龄量表”的研究。
潜特征理论认为,测验成绩在不同程度上反映出人们的心理特征。这些特征是不能直接观察和测定的,所以称为潜特征。
这一理论的主要目的是,确定测量结果与那些不可观察的特征之间的关系。
潜特征测量理论有三个重要的概念。
(1)潜特征空间的维度
如果单一能力或特征可以说明测量结果,则称为单维,否则为多维。
(2)局部独立性
局部独立性是假定被测者对某一测验项目的正确回答的概率不受其他项目成绩的影响,可以用X2检验法检验项目反应的局部独立性。
(3)项目特征曲线
项目特征曲线是项目分数对于能力的回归线,它说明了从具有特定潜特征的总体随机选取的受测者作出特定反应的条件概率。
项目反应理论
项目反应理论是潜特征测验理论的新发展,也是目前应用最多的。这个理论指出了个体某种反应类型的概率与个体某些特征之间的关系,它的基本思想与潜特征理论其他许多模型是一致的。
项目反应理论主要有以下几个基本特征:
(1)测量指标与反应者的潜特征联系在一起
(2)用数学函数确定项目特征参数
(3)通过项目信息函数来推算测量的信度和标准误
现代测验理论在心理学研究中的应用
现代测验理论在心理学研究中正在得到日益广泛的应用,其中应用比较多的课题有测验项目的分析、成绩测量表和态度问卷的设计、测量项目库的设计,以及社会心理气氛和管理作风的研究,等等。
测量的信度
测量信度是指测量结果反映出系统变异的程度。
测量的效度
测量效度是指心理测量的有效性,即测量到的是不是需要测定的心理特征。
常用的有内容效度、同时效度、预测效度和构思效度。信度是良好效度的必要前提,却不是充分条件。
测量信度的评定
在评定测量信度时,需要区分两种测量误差:(1)测验内误差变异;(2)测验间误差变异。 评定测量信度的方法比较多,常用的有重测信度、等同信度、折半信度和内部一致信度等。
重测信度
重测信度是在一定时间间隔中运用同一测验作出重复测量所得到的信度系数。
等同信度
等同信度是以两组等效测验分别作出测量来评定信度系数。
折半信度
折半信度是在测试以后对测验项目按奇项、偶项或其他标准分成两半,分别记分,以两半分数之间的相关系数作为信度系数。
内部一致信度
内部一致信度是目前比较流行且效果较好的信度评定方法。
它不需要把测验项目分成两个部分,而是从测量构思层次化入手,使测量项目形成一定的内部结构,并以内部结构的一致性程度,对侧量信度作出评定。
内部异质性信度主要有两种:库德—理查森的公式20和克劳伯克的α系数。
测量效度的评定
1、内容效度 2、预测效度 3、同时效度 4、构思效度 5、聚合效度与辨别效度
内容效度
内容效度是指测验项目在多大程度上表示了所要测定的特征范畴。
预测效度
预测效度是指测验结果能够预测人们将来行为的程度。
同时效度
人们用测验分数与当时行为表现或工作实绩之间的相关作为效度指标,称为同时效度。
构思效度
构思效度就是要检验测验是不是真正测量了我们所提出的理论构思。
聚合效度与辨别效度
坎贝尔和菲斯克于1959年提出两种新的效度:聚合效度和辨别效度。
聚合效度是指运用不同测量方法测定同一特征或构思时测量结果相似的程度,即不同测量方式应在相同特征的测定中聚合在一起。
辨别效度是指在运用相同测量方法测定不同特征或构思时,辨别不同特征的程度,即不同特征的测量结果之间不应有高相关。
聚合效度和辨别效度的概念主要基于以下的考虑:
(1)测验总是一个“特征—方法”的单元,特征的测量总离不开一定的方法。
(2)只有通过相似性和差异性的联合测定方法,才能准确的描述和解释测量结果。 侧量效度的评定是一个理解、掌握、完善和实践心理测量的工作过程。
影响测量信度的因素
(1)测量项目的数目
(2)测量的程序
(3)测量项目的质量
(4)测量人和受试者
影响测量效度的因素
(1)测验的组成
(2)测量的程序
(3)效标的特征
(4)样本与受试者特点
心理测量的水平
心理测量是以不同量表方式进行的,常用的有四种量表方式,也叫做心理测量的水平:称名量表、顺序量表、等距量表和等比量表。
(1)称名量表
又称类别类别,即以测量对象的类别方式记分。
(2)顺序量表
顺序量表既们有相等单维,又没有绝对零,只是要求评定人在若干个备择项目中按照一定标准排出等级次序。
(3)等距量表
等距量表有相等的单位,但没有绝对零,因而其测量水平比顺序量表提高了一步。
(4)等比量表
等比量表更进了一步,它既有相等单位又有绝对零,因而属于最高测量水平。
心理测验的种类
心理测验是主要借助量表对心理特征和行为进行观察和描述的系统心理测量。常用的心理测验分成两大类:
(1)最大成绩测验
(2)典型反应测验
(1)最大成绩测验
这类测验用以测量人们的最大作业成绩,从而对他们所具备的能力作出评定。这种测验包括各种智力测验和技能测量,还包括成就测验。
(2)典型反应测验
这类测验不是测量人们能够干些什么,而是测定人们在特定情景中的典型行为或感受,主要包括个性、习惯、兴趣、焦虑、情绪等。
影响心理测验的因素
(1)测验的形式和练习因素
(2)焦虑和动机
(3)主观倾向和反应定式
(4)测验实施中的因素
心理测验的应用及其效果
1、一般智力测验和能力倾向测验 2、标准成就测验 3、兴趣测验 4、个性测验 5、情感和态度的测量
1、一般智力测验和能力倾向测验
一般智力测验对于实际学习和工作成效的预测效度并不高,能力倾向测验的效度略高一些;某些婴儿智力测验几乎没有预测效度。
2、标准成就测验
标准成就测验主要用于教育领域。实际应用情况表明,阅读测验和数学测验比语言测验和社会研究测验效度高得多,因为前者更少受到内容和课程设置方面因素的影响。
成就测验主要用于三中目的:
(1)检查和控制教育质量;
(2)评价课程设置和培养计划;
(3)对学生进行个别诊断和评估。
兴趣测验
兴趣测验在单独使用时实际价值并不大,但是,如果把兴趣测验与能力倾向测验结合在一起,能够在职业选择、人员挑选和技术培训等方面提供比较有效的依据。
个性测验
传统个性测验主要采用自我报告和投射技术。
自我报告的的个性测验对于在学校、职业或生活方面的成功并没有多大的预测价值,主要用于诊断某些症状。
投射测验主要用于心理治疗,但是,这种测验的信度比较低,其效度一般都比较低,不易用于学校、企业等作为心理测量工具。
情感和态度的测量
这方面的测量多半用于问卷量表或访谈法,这方面测量的主要局限和问题,是受试者根据需要而虚构情况的倾向、设法作出符合社会要求的反应的定势、项目用词的语义问题等。
心理测验的项目分析
1、项目的准备
2、项目分析的基本步骤
项目的准备
项目的特征:内容效度、难度和辨别力。 在项目和测验的试测过程中,应注意以下问题。 (1)试测的对象,应从正式测验所要应用的总体中取样,注意其代表性。 (2)试测力求正规化,使得实施过程与将来的正式测验时的情况尽可能相似。 (3)试测时,应使受试者有足够的答题时间,使结果更为可靠。 (4)在试测过程中,随时记录受试者的反应,包括答题的一般进度、题意不清之处等情况。
项目分析的基本步骤
1 把测验分数高低排成顺序,清点测验份数N。
2 把N乘以.27并去掉小数,取整数n。
3 从测验的高分部分从最高向低取n份最好的卷子,作为高分组,以同样方式从最低向高取得低分组。
4 分别求出高、低分组中答对项目的比例P(H)、P(L),每一个项目都求出这一比例。 5 求出项目难度P,P={P(H)+P(L)}/2.P值越高,难度越低;P值越低,难度越高。 6 求出项目的辨别力D,D=P(H)-P(L)。辨别力指数越大,表示个别项目的反应与测验总分的一致性越高。.35以上,辨别力较高; .20以下,较低。
心理物理方法和信号检测法
心理物理方法是由费希纳创立的。费希纳在有关感觉阈限的研究中,设计并采用了三中方法:
(1)最小变化法;(2)恒定刺激法;(3)平均误差法。我们把这三种方法称为经典心理物理法。
一些新的更好的方法中,最有意义的是坦纳和斯韦兹于1954年提出的信号检测理论和方法。
经典心理物理方法
1、最小变化法
2、恒定刺激法
3、平均差误法
最小变化法
最小变化法又称为极限法,这是让被试通过一系列尝试,对强度渐增或渐减的刺激作出反应,检验有关这一刺激的感觉阈限。
恒定刺激法
恒定刺激法又叫正误法,其主要特点是以被试在判断中正确与错误或者肯定与否定的频次与比例来决定感觉阈限。
平均差误法
平均差误法又叫调整法,它的特点是让被试调节比较刺激,使之与标准刺激相等或匹配,并以匹配的差误来计算感觉阈限。
心理物理方法的新发展
在心理物理方法的新发展中,有四个富有意义的里程碑。这就是福勒顿-卡特尔原则、瑟斯顿比较判断定律、赫尔森适应水平理论、斯蒂文斯幂函数定律。
信号检测法
信号检测论以统计决策论作为基础,由坦纳和斯韦兹首先应用于人的知觉研究。 根据信号检测理论,控制信号检测有两种基本心理过程:
(1)建立感觉印象
(2)决策判断
信号检测论最初应用于人的听觉检测和辨别,后来被用来研究工业检验、医疗诊断、警觉行为和信息检索系统等方面的课题。