心理测量
第一章 总论
第一节 心理测验的历史回顾
1、我国取于汉代、兴于隋唐的科举取士制度,被中外学者公认为世界上最早的心理测验的实践。
2、孔子:把人分为中人、中人以上、中人以下三个类别,“中人以上可以语上也;中人以下不可以语上也”。相当于现代测量学中的命名量表和次序量表。
3、孟子:“权,然后知轻重;度,然后知长短。物皆然,心为甚”。明确指出了心理能力和心理特征与物理现象一样,具有可测量的特征。
4、南朝人刘勰在《新论?专学篇》,他不仅观察到左手画方右手画圆不易实现这种现象,而且认为其原因是一心不能二用,这恐怕应该算是世界上最早的“分心测验”了。
5、南北朝的颜之推,周岁试儿,是1925年格塞尔婴儿发展量表的前导。
6、中国民间广泛流行的“七巧板”,在某些方面可以作为创造力测验的一种方法。
7、科举考试中的帖经和对偶,类似于现代西方言语测验中常见的填字和类比。
8、中国古代心理测验的思想,包含着典型的东方文化特点:
首先,他们都是描述性的,没有定量的标准;
其次,心理测验往往将心理特点(能力、人格、智力等)与道德观念联系起来。
9.科学心理测验产生的原因:
⑴对智力落后者分类和训练的早期关注。
①心理测验产生的最初原因是对智力落后和精神病人治疗的需要。
②1838年法国医生埃斯克罗出版了两卷本著作,第一次明确地对智力落后与精神病人作出了区分。他认为精神病是以 情绪障碍为标志。
③另一位法国医生塞国恩的贡献也特别重要,他是训练智力落后者的先驱。
⑵冯特的实验心理学。实验心理学的诞生是心理测验产生的另一个重要原因。
① 1879年冯特在德国莱比锡大学建立了心理学史上第一个实验室,许多早期试验心理学家都在这里接受训练,引发了个别差异的研究。
②实验心理学的诞生和发展,还给心理测验带来了另一个副产品:严格的标准化程序。
10.高尔顿:
①英国生物学家和心理学家,是倡导测验运动的主要人物。
②他设计了测量差异的方法,虽然不是正式的心理测验,但可视为心理测验的开端。
③1884年,在伦敦国际博览会上,高尔顿专门设立了一个“人类测量实验室”,这是心理学史上第一次大规模系统地测量个体差异的尝试。
④他还是评定量表和问卷法应用的先驱,他也经常使用自由联想技术。
⑤另一个重要贡献是他还为心理测验奠定了统计学基础,并第一个提出了相关的概念。
11.卡特尔:
①美国心理学家,从师冯特。
②1890年在《心理》杂志上发表了“心理测验与测量”一文,这是心理测验第一次出现于心理学文献中。
12、斯皮尔曼:
英国心理学家,1904年发表了他的著名论文“普通能力”,此文奠定了他的治理结构二因素论的理论基础,为日后比内智力测验的编制提供了基础。
13.比内-西蒙量表在1905年发表,它是世界上第一个正式的心理测验。
比内:①于1857年出生于法国尼斯,起初学习法律,继而改学医学,以后致力于心理测验的研究。1904年法国教育部委派许多教育家、医学家和其他科学家组成一个委员会,专门研究公立学校中智力落后儿童的教育方法。
②于1905年与助手西蒙在《心理学年报》上发表了一篇名为“诊断异常儿童智力的新方法”,文章中他中介绍了一个包括30个项目的量表。这个量表很粗糙,尚不能准确地测量智商,但它在心理测验史上极其重要,是世界上第一个正式的心理测验。
③自1905年文章发表后,比内和西蒙亲自主持过两次修订,一次在1908年,量表题目达到59个,所有测题按年龄分组,从3-13岁,测验结果用“智力水平”表示,但通常翻译为“智力年龄”。后又在1911年修订过一次。
14.心理测验的蓬勃发展 :
纵观心理测验的发展,人们常说19世纪80年代时高尔顿的10年,90年代是卡特尔的10年,20世纪头10年则是比内的智力测验的10年。
⑴操作测验的发展:由于理论上的缺陷和实际上的需要,所以就有操作测验的问世和发展。
⑵团体智力测验的发展:运用团体测验可以在同一时间内测量许多被试,这是心理测验方式的极大进步,扩大了测验的应用范围。
⑶能力倾向测验的发展:这些测验为了分析个人心理品质的内部结构提供了适用的工具,逐渐受到人们的重视。此外,普通能力倾向(智力)测验也向多元化发展。韦克斯勒所编的学前儿童、学龄儿童、成人智力量表。
⑷人格测验的发展: 心理测验的另一领域是涉及情感或行为等非智力方面的人格评估,通常包括对性格、气质、情绪状态、人际关系、动机、兴趣和态度的测量。
⑷现代西方心理学的发展:受到计算机的发生和发展,以及统计方法的改进的极大影响。而
“因素分析”的理论从1904年斯皮尔曼提出智力二音素论开始,经心理学家近一个世纪的
争论和研究,已日趋成熟和完善,给现代心理学测验奠定了坚实的基础。
15.中华人民共和国成立前心理测验的发展:
①1916年樊炳清先生首先介绍了比内-西蒙智力量表。
②1920年,廖世承和陈鹤琴在南京高等师范学校开设心理测验课,并用心理测验试测投考该校的学生,这便是中国正式开始的科学心理测验;北京高等师范学校和南京高等师范学校建立了我国最早的两所心理实验室。
③1921年,他俩正式出版《心理测验法》一书,成为中国最早的心理测验专著。
④1922年,中华教育改进社聘请美国教育心理测验专家麦考尔来华讲学,并主持编制心理测验事宜。
⑤1924年,陆志韦发表了《订正比内西蒙智力测验说明书》,30年代又与吴天敏再次做了修订;
⑥1931年,由艾伟、陆志韦、陈鹤琴、萧孝嵘等倡议,组织并成立了中国测验学会;
⑦1932年,《测验》杂志创刊。
16. 中华人民共和国成立后心理测验的发展:
①1979年,林传鼎、张厚粲等以国外资料为参考,编制了少年儿童学习能力测验;
②1989年,成立中国心理学会心理测验专业委员会,标志着中国心理测验已进入了一个新的高速发展时期。
第二节 心理测验的性质、种类和功能
1. 测量:就是根据一定的法则,用数字对事物加以确定。所谓“一定的法则”是指测量行为发生时采用的规则或方法。所谓“事物”是指我们要测量的感兴趣的事物的属性或特征。一般来说,用数字对事物加以确定,就是确定一个事物的属性的量的多少。通常人们所说的测量,指的是给事物确定出一种数量化的价值。
2. 测量有两个要素:
①一是参照点,二是单位。对任何事物确定出一个量都要有一个计算的起始点,这个点就是参照点。
②参照点可以分为两种,一种是绝对的零点,另一种是相对参照点。
③心理测验中所用的参照点都是相对的,因而测量的结果常常不能以“倍数”的方式解释。
④理想的单位的条件:有明确的意义和有相等的价值。
3. 量表就是有参照点和单位的连续体。
①命名量表:是水平最低的一种测量量表,用数字来代替事物或对事物进行分类;不能进行加减乘除。
②顺序量表:不仅表明类别,还能表明不通类别的大小等级,或具有某种属性的程度;不能进行乘除运算。
③等距量表:不仅有大小关系,而且又有相等的单位,因此可以加减运算,但没有绝对零点,所以不能做乘除运算;
④比例量表:是最精确的测量,既有相等的单位,又有绝对零点。
4. 心理量表的性质:
①一般来说,心理测量是在顺序量表上进行的。因为对于人的智力、性格、气质、兴趣、态度等来说,绝对零点时难以确定的。
②虽然心理现象适合在顺序量表上进行测量,但大多数心理学家喜欢把测验成绩转换为等距量表,最常用的转换方法是转换为标准分数,即把顺序量表转变成以标准差为单位的等距量表。
5.心理测验:即是依据一定的心理学理论,使用一定的操作程序,给人的行为确定出一种数量化的价值。
6、心理测验的要素:
①行为样本:心理测验在测量个别差异的时候,往往也只是对少数经过慎重选择的样本进行观察,来间接推知被试的心理特征。
②标准化:是指测验编制、实施、记分以及测验分数解释程序的一致性,标准化的量一个重要步骤是建立有代表性的常模。
③客观性:心理测验的客观性的某些方面,总是与标准化的讨论联系在一起的,即对心理测验的客观性要求牵涉到标准化的问题,因此,在不受被试主观判断支配的范围内,测验的实施、评分、解释应是客观的,要尽量减少主试和被试的随意程度。客观性另一个主要方面是测题或整个测验的难度水平的确定必须客观。
7. 心理测验的性质
(1)心理测验的间接性:迄今为止,我们还无法直接测量人的心理,只能通过测量人的外显行为,即测量人们对测验题目的反应来推断出他的心理特质。
(2)心理测验的相对性:我们在比较不同人之间的行为或心理特征时,没有绝对的标准,也没有绝对的标准,也没有绝对的零点,我们有的只是一个连续的行为序列。所以每一个被测得的结果,都是与他所在团体或人群的大多数人的行为,或某种人为确定的标准相比较而言的。
(3)心理测验的客观性:首先,测验用的项目或作业、施测说明、施测者的言语态度及施测时的物理环境等,均经过标准化,测验的刺激是客观的。其次,评分计分原则和手续经过了标准化,对反应的量化是客观的。再次,分数转换和解释经过了标准化,对结果的推论是客观的。
8. 心理测验的种类:
(1)按测验的功能分类:
智力测验:测量人的一般智力水平。
例如比内-西蒙智力测验,韦克斯勒儿童和成人智力量表;
特殊能力测验:偏重测量个人特殊的潜在能力,多用于升学、职业指导以及一些特殊工种人
员的筛选。
例如音乐、绘画、机械技巧、文书才能测验,这类测验在临床上应用较少;人格测验:主要用于测量性格、信念、气质等方面的个性心理因素,即个性中除能力以外的 的部分,主要包括问卷和投射测验。
问卷:明尼苏达多项人格调查表(MMPI)、16种人格因素问卷(16PF)、艾森克人格问卷(EPQ);
投射测验:罗夏墨迹测验、主题统觉测验(TAT)。
(2)按测验材料的性质分类:
文字测验:所用的是文字材料,以言语作为刺激,被试用言语做出反应;
例如:MMPI、EPQ、16PF以及韦克斯勒儿童和成人智力量表中的言语量表部分;
优点:实施方便,多用于团体测验,有肢体残疾而无言语障碍的人只能用此测验;
缺点:受被试文化程度的影响。
操作测验:也称非文字测验,无需言语,不受文化因素的影响,可用于儿童和文盲;
例如:罗夏墨迹测验、主题统觉测验、瑞文测验以及韦克斯勒儿童和成人智力量表中的操作量表部分;
优点:不受文化因素的限制;
缺点:不宜团体实施,耗时。
⑶按测验材料的严谨程度分类:
客观测验:测验中所呈现的刺激词句、图形等意义明确,只需被试直接理解,无需发挥想象力来遐想和猜测,绝大多数测验都属于此种。
投射测验:测验中所呈现的刺激没有明确的意义,问题模糊,对被试的反应也没有明确的规定,被试做出反应时要凭自己的想象力加以填补,使之成为有意义的。在这个过程中,恰好投射出被试的思想、感情和经验。此种测验种类较少,具有代表性的有:罗夏墨迹测验、主题统觉测验、自由联想测验、句子完成测验。
⑷按测验的方式分类:
个别测验:一对一,临床上常用;例如比内-西蒙智力量表、韦克斯勒智力量表;
优点:主试可以仔细观察被试的言语情绪,并有充分的机会与被试合作,所以其结果正确可靠;
缺点:耗时,不能再短时间内搜集大量的资料。
团体测验: 一个主试对多个被试,例如陆军甲种和乙种测验、教育上的成就测验;
优点:时间短,主试不必接受严格的专业训练即可担任;
缺点:主试对被试的行为不能做切实的控制,所得结果不及个别测验正确可靠。
9. 论述心理测验的功能:
⑴从实际应用角度看:人才选拔、岗位安置、临床诊断、教育评价、心理咨询和治疗
⑵从理论研究角度看:搜集资料、提出和验证假设、实验分组
第三节 正确对待和使用测验
1. 错误的测验观:
⑴测验万能论;
⑵测验无用论①某些人格测验侵犯了个人隐私;②测验为宿命论和种族歧视提供了心理学依据。
⑶心理测验即智力测验。
2. 正确的测验观:
(1)重要的心理学研究方法和决策的辅助工具:除实验法以外,心理测验法的出现是心理科学发展史上的一大进步,是心理学研究中不可缺少的研究方法之一。这是若有相应的心理测验,就可以帮助有关部门作出科学的决策。
(2)作为研究方法和测量工具尚不完善:尽管心理测验是心理学研究的必要手段,而且实际生活中也在广泛应用,但是心理测验从理论到方法都还存在许多问题,尤其过分夸大心理测验的科学性和准确性是不对的。
(3)科学地看待心理测验,防止乱用测验: ①测验使用者必须具备一定的资格; ②慎重选择测验量表; ③与被试建立良好的协调关系;④正确解释测验结果;⑤注意测验的保密。对测验的保密主要有两个方面:一是对测验内容的保密;
二是对测验结果几个人隐私保密。
第二章 心理测验的编制
第一节 心理测验的对象、目的及目标
1. 在编制测验前首先要明确测量的对象:也就是该测验编成后要用于哪些团体。其包括三个重要的维度,即①年龄:测验的年龄范围有明确的规定;
②教育水平:儿童测验要同时考虑教育水平和年龄,成人测验只需考虑教育水平;
③文化背景。
2. 测验的目的:
一般来说;显示和预测。由此我们可以分为两类测验:显示性测验和预测性测验。
(1)显示性测验:是指测验题目和所要测量的心理特征相似的测验。有些观察法、行为评估法也都是显示性测验。古德纳夫在显示性测验内部又将其区分为样本测验和标记测验:题目取自一个很明确的总体的测验即是样本测验,如四则混合运算;题目取自一个全开发的总体的测验即是标记测验,如智力测验。
(2)预测性测验:指预测一些没被测量的行为的测验。
(3)显示性测验和预测性测验的区分并不是绝对的,如高考、题目源自高中,是显示性测验;成绩预测大学,属于预测测验。
3、心理测验的目标:是指编制的测验是测什么的,即用来测量什么样的心理变量或行为特征。
目标分析以测验不同而异,一般分为以下三种:
(1)工作分析:对于选拔和预测功用的预测性测验,主要任务是对所预测的行为活动作具体分析,我们称之为任务分析或工作分析。一般分为两个步骤:①确定哪些心理特征或行为可以使要预测的活动达到成功;②建立被试是否成功的衡量标准。
(2)对特定概念下定义:如果测验是为了测量某种特殊的心理品质或特点,那么测验编制者就必须给所要测量的心理或行为特质下定义,然后必须发现该特质所包含的维量将通过什么行为表现出来或怎样进行测量。
(3)确定测验的具体内容:如果测验是描述性的显示测验,它的目标分析的主要任务则是确定显示的内容和技能,从中取样。
①成就测验是典型的描述性测验,它的内容分析过程主要体现在双向细目标的制作过程中。
②双向细目标:由测量的内容材料维度和行为目标维度所构成的表格,它能帮助成就测验的编制者决定应该选择哪些方面的题目以及各题目所占的比例。
③双向细目标在编制其他非成就测验时也适用,如精神心理测验等,其中一个维度涉及有关的机能和特质,另一个维度则是这些品质的行为描述。
④布鲁姆把学习的心理活动分为:认知、精神活动、情感三个领域。
第二节 测题的编写技术
1. 编制测验题目涉及到从编写、编辑到预试、修改这样一个循环过程。
2、搜集有关资料:题目的有关来源 (1)已出版的标准测验 (2)理论和专家的经验
(3)临床观察和记录
3、考虑测题的来源要主义两个问题:①资料来源要尽可能丰富;②材料要具有普遍性。
4、. 命题的原则及编写要领:
⑴命题的原则(理解): ①内容方面:首先,要求题目的内容符合测验的目的;其次,内容取样要有代表性;第三,题目间内容相互独立,互不牵连。
②文字方面:使用语言要准确,语句要简明扼要,最好一句话说明一个概念,尽量少使用双重否定句。
③理解方面:题目应有确切的答案,题目的内容不要超出受测团体的知识水平和理解能力,题目格式要容易理解。
④社会敏感性方面:应尽量避开社会敏感性问题,如涉及社会禁忌或个人隐私的题目不应使用。
菲利普对于涉及社会敏感性问题,怎样鼓励被试作出真实回答的策略:
◇1命题时假定被试具有某种行为,、使他不得不在确实没有该行为时才否定,可避免否定过多的倾向。
◇2命题时假定规范不一致。
◇3指出该行为是常见的,虽然是违规的。
⑵测题的编制要求:对心理测验的题目进行分类的标准很多,常见的分类是根据对被试的要求不同来分,可以分为两大类:提供型选择型题目。
①提供型题目要求被试给出正确答案,如论文题、简答题、填充题等;
②选择型题目要求被试在有限的几个答案中选择正确的答案,如选择题、是否题、匹配题等。选择题由两部分构成:提干和选项。题干就是呈现一个问题的情景,一般由直接问句或不完全的陈述问或不完全的陈述句构成。选项就是问题的多种可能答案,,常常是包括一个正确答案,若干(一般是1—5个)错误答案,其中错误的答案叫“诱答”。
5、对于选择题我们既要编好题干,也要编好选项,需注意以下几点:
①题干所提的问题必须明确,尽量使用简单而明晰的词语;
②选项要简明扼要;
③每题只给一个正确答案,其他属于诱答;
④各选项长度尽量相等,不要有长有短;
⑤避免词干用词与选项用词一致,否则成了选择答案的线索;
⑥选项最好用同一个形式。
第三节 测验的编排和组织
1、测验编排的一般原则:
⑴测题的难度排列易逐步上升;
⑵尽可能将同类型的测题组合在一起;
⑶各种类型测题本身的特点。
2.两种常见的试题排列方式:
(1)并列直进式:整个测验按试题材料的性质归为若干分测验,在同一分测验的试题依其难度由容易到难排列。
(2) 混合螺旋式:先将各类试题依难度分成若干不同层次,再将不同性质的试题加以组合,作交叉式排列,难度则渐次升进。
第三章 测验的信度
第一节 信度的概念
1.信度:是指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。信度只受随机误差的影响,随机误差越大,信度越低。
2、信度理论定义:传统的信度理论认为,每一个测验的实得分数(X)总是由真实分数(T)和误差(E),两个部份构成的,公式为: X=T+E
3、讨论一组测验分数的特性时,可用方差导标具体分数,公式:
(测验实得分数的方差)= (测验真分数的方差)+ (测验误差的方差)
4、信度的操作定义:一组测量分数的真分数方差与总方差(实得分数的方差)的比率,或者是真实分数方差占总方差的的百分比。计算公式:
由于真实分数的方差是无法统计的,因此公式可转化为:
5、信度的指标
(1)信度系数:大部分情况下,信度是信度系数为指标,它是一种相关系数。理论上说就是真分数方差与实得分数的方差的比值,公式是:
信度指数:是真分数标准差与实得分数的标准差的比值,公式是:
信度指数的平方:是信度系数。
(2) 测量标准误:信度系数表示一组测量的实得分数与真分数的符合程度,但并没有直接支出个人测量分数的变异量。
用一组被试两次测量结果来代替同一个人反复实测,就有了信度的另一个指标:
SE(测量的标准误)=所得分数的标准差
测量的标准误与信度之间呈反比关系:标准误越小,信度越;标准误越大,信度越低。
6、信度与测验分数的解释:
(1)解释真实分数与实得分数的相关:信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。
(2)比较信度可以接受的水平:一个测验究竟信度多高才适合,才让人满意呢?当然,最理想的情况是 =1.00,但实际上办不到。一般原则是:当 <0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较;当0.70≤ <0.85时,可用于团体比较;当 ≥0.85时,才能用来鉴别或预测个人成绩或作为。
(3)解释个人分数的意义:从信度可以解释个人分数的意义,这是测量标准误的应用。
它有两个作用:一是估计真实分数的范围;二是了解实得分数再测时可能的变化情形。例题:假设在一个智力测验中,某个被试的IQ为100,这是否反映了他的真实水平?如果 再测一次,他的分数将改变多少?已知该智力测验的标准差是15,信度系数为0.89,则其IQ的测量标准误和可能范围分别为:
SE=15=5
IQ=100±1.96×5≈90-110
我们可以说这个被试的真实IQ有95%的可能性落在90与110之间。即若再测一次,他的智商低于90、高于110的可能性不超过5%。
(4)比较不同测验分数的差异:测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。 SED=S
例题:某被试在韦氏成人智力测验中言语智商为102,操作智商为108,已知两个分数都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.97和0.93.问其操作智商知否显著高于言语智商?
首先计算出差异分数的标准误:
SED=15=4.74
在统计上经常要求两个分数的差异程度达到0.05的显著水平,才能承认不是误差的影响。因此将差异标准误4.74×1.96=9.29,这表明个体在韦氏测验两半得分的差异高于大约10分,才能达到0.05的显著水平。上述被试的分数差异是:108-102=6,是不显著的。
第二节 信度的类型及估计方法
1、信度的类型:重测信度、 复本信度、内部一致性信度、评分者信度。
2、 重测信度:又称稳定性系数。他的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系数。
3、用重测法估计信度的优缺点:
①优点:能提供有关测验是否随时间而变异的资料,可作为被试将来行为表现的依据;
②缺点:易受练习和记忆的影响。
4、最适宜的时距随测验的目的、性质和被试的特点而异,一般是两周到四周较宜,间隔时间最好不超过六个月。
5、重测信度的前提假设是:⑴所测量的特性必须是稳定的;⑵每个人对前一次反应的遗忘程度相同;⑶在时间间隔中没有学习另外的与测验有关的东西。
6、 复本信度:是以两个等值但题目不同的测验(复本)来测量同
一群体,然后求得被试在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。 复本信度反映的是测验在内容上的等值性,故又称等值性系数。
①复本信度的高低关键取决于复本测验的选择,因而是题目取样问题。
②同重测信度一样,复本信度也要考虑两个复本实施时间间隔。如果两个复本几乎是在同一时间内施测的,相关系数反映的才是不同复本的关系,而不掺有时间的影响。如果两个复本的施测相隔一段时间,则称稳定与等值系数。稳定与等值系数既考虑了测验在时间上的稳定性,也考虑了不同题目样本反应的一致性,因而是更为严格的信度考察方法,也是应用较为广泛的方法。 在实际应用时,为了抵消施测顺序的效应,应该有半数的被试先做A本再做B本,另一半被试先做B本再做A本。
7、内部一致性信度包括:分半信度和同质性信度。(1)分半信度:指采用分办法估计所得的信度系数。这种方法估计信度系数只需一种测验形式,实施一次测验。通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。○1常见的是将测题按其序列号的奇偶分半,这种分法的前提是:测题并非随机排列,而是按某种顺序(如难度)排列;如果随机排列的题目,则必须是所有题目平等的(要么难度相等,要么性质一样);如果测验有多个分量表,应该在分量表内部排好顺序,再把各分量表分两半组合起来求相关。○2常用的修正公式是:斯皮尔曼-布朗公式:
(测验在原长度时的信度估计值)=
例题:某测验分为两半后求得的相关系数为0.524,则测验在原长度时的度估计值为:
==0.7
斯皮尔曼-布朗公式为经验公式,他的假设条件是两半测验分数的变异数相等,但实际资料有时未必完全符合这一条件。当假设不成立时,可采用:弗朗那根公式或卢伦公式中的任一一个。
8、同质性信度:指测验内部所有题目间的一致性。当各个测题的得分有较高的正相关时,不论题目的内容和形式如何,测验即为同质的;若所有题目看起来好像测量的是同一特质,但相关很低或为负相关时,测验即为异质的。此外,对于一些复杂的、异质的心理学变量,采用单一的同质性测验是不行的,因而常常采用若干相对异质的分测验,并使每个分测验内容具有同质性,这样每个分测验就能用来预测异质效标的某一方面。
同质性信度的公式主要有:库德-理查逊公式:常用的是K-R20公式,在个各测题难度相同或近似的情况 下,还可采用计算更为简便的K-R21公式。
克伦巴赫α系数:不适用于多重几分的测题。
9、 评分者信度:用于测量不同评分者之间所产生的误差。为了衡量评分者之间的信度高低,可随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据美分测验卷的两个分数计算相关,即得评分者信度。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。 当多个评分者评定多个对象,并以等级法记分时,可采用肯德尔和谐系数作为评分者系数的估计。
10、 信度估计方法及与测量复本和施测次数的关系:
各种信度系数相应误差方差的来源
影响信度的因素 :
1、 样本的特征:(1)样本团体分数分布的影响:任何相关关系都是受到团体中分数分布的影响,当分布范围增大时,其信度估计就较高;当分布范围减小时,相关系数随之下降,信度值则较低。(2)样本团体异质性的影响:若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。(3)样本团体平均能力水平的影响:对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。
2、 测验的长度:在一个测验中增加同质的题目,可以使信度提高。①测验越长,测验的测题取样或内容取样越有代表性;②测验越长,被试的猜测因素影响越小。
3、 测验的难度:难度对信度的影响只存在于某些测验中,如智力测验、成就测验、能力倾向测验等。如果一个测验对某团体而言太容易,会使所得分数都集中在高分端;当题目太困难时,得分就会集中在低分端。两种情况均会使信度样本的分数范围变窄,从而使测验变得不够可靠。 从理论上说,只有难度水平位50%时,才能使测验分数分布范围最大,求得的信度也最高。
4、 测验的时间间隔:以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;间隔时间越久,其它变因介入的可能性越大,受外界的影响越大,信度系数便越低。
第四章 测验的效度
第一节 效度的概念
1、 效度:是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。
效度是科学测量工具最重要的必备条件。
由于有效方差是一个理论值,无法测量,所以效度和信度一样,是个理论上的概念。1)一组测验分数的总方差等于真实方差与误差方差之和,而真实方差又可分为两部分,即有关的方差和无关的但稳定的方差,后者也就是所谓系统误差带来的方差 (公式4-2)。
2、 信度和效度的关系:
(1)信度是效度的必要而非充分条件:从方差分配公式: 可以看出, 增大,即效度高,信度的真方差( )必然大,故信度必然高。当信度高时,即 降低时, 是否增加还要看 是否增减,因此效度不一定就高。效度高必然信度高,而信度高并不一定保证效度高,说明信度高只是效度高的必然条件,并不是效度高的充分条件。
(2)效度是受信度制约的。信度系数的平方根是效度系数的最高限度。
3、 效度的性质:
(1)a效度具有相对性:在评鉴测验的效度时,必须考虑其目的与功能。只有所测的结果符合该测验的目,才能认为它是个有效的测量工具。
(2)效度具有连续性。测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。因此,我们评价一个测验时,不应该说“有效”或“无效”,而应该用效度较高或效度较低来评价。
第二节 效度的类型与估计方法
1、效度的类型:内容效度、构想效度、效标效度。
2、内容效度:指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。(名词解释)
(1)想编制有较高内容效度的心理测验:○1要对所测量的心理特性有个明确的概念,并划定出哪些行为与这心理特性有关,又比较密切。○2测验题目应是所界定的内容范围的代表性取样。
(2)需要说明的是,要求内容效度的测验,并不一定要求测验为同质的。
3、内容效度的评估方法:
(1)专家判断法:为了确定一个测验是否有内容效度,最常用的方法是请有关专家对测验题目与原定内容的符合性作出判断,看测验的题目是否代表规定的内容。如果专家认为测验题目代表了所测内容,测验就是有内容效度。由于这种估计效 度的方法,是一个逻辑分析的过程,所以内容效度有时也可称为“逻辑效度”。
(2)统计分析法:计算两个评分者之间评定的一致性,虽然考察的是评分者的判断信度,但由于来自两个独立的评判者,因此符合程度越高越能反映测验的内容效度。克伦巴赫提出,内容效度可由一组被试在独立取得自同样内容范围的两个测验复本上得分之相关来作数量的估计。再测法也可用于内容效度的评估。
(3)经验推测法:通过实践来检验效度。如果通过率是随着年龄的增加而增加,就可以推测该测验有内容效度。
4、内容效度与表面效度的关系:经常混淆。
①表面效度是由外行对测验作表面上的检查确定的,它不反映测验实际测量的东西,只是指测验表面上看来好像是所要测的东西;
②内容效度是由够资格的判断者(专家)详尽地、系统地对测验作评价建立的;
③虽然二者都是根据测验内容作出的主观判断,但判断的标准不同。前者只考虑题目与测量目的之间的明显的、直接的关系,后者则考虑到题目与测量目的和内容总体之间逻辑的微妙关系。
④在编制测验时,表面效度是一个必须考虑的特性,最高作为的测验通常要求有较高的表面的效度,典型行为测验要求有较低的表面效度。如果被试很容易从测验题目看出测验的目的,就可能产生反应偏差(如掩饰等)。
5、构想效度:1954年提出,有人翻译为构思效度,也有叫结构效度。它是指测验能够测量到理论上的构想和特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。
6、构想效度的估计方法:
(1)对测验本身的分析:对测验本身的分析:测验的内容效度可以作为构思效度的证据;测验的同质性指标可以推断测验是测量单一特质还是测量多种特质,从而为评估测验构思效度提供证据;分析被试对题目的反应特点也可以作为构思效度的证据。
(2)测验间的相互比较:通过分析几个测验间的相互关系,找出其共同之处,进而推断这些测验要测量的特质是什么,也可以确定这些测验的构思效度。最简单的是计算两个测验之间得分的相关,其中一个测验时待研究效度的,另一个测验是已有效度证据的成熟的测验,但两个测验测量的是同一种心理特质。
相容效度:两测验的相关系数的平方即是两组测验分数所共同解释的变异大小,是构思效度的一个证据。
区分效度:是构思效度的又一个证据,一个有效的测验不仅应与其他测量同一构思的测验有关,而且还必须与测量不同构思的测验无相关;
因素分析法:也是建立构思效度的常用方法,通过对一组测验进行因素分析,可以找到影响测验分数的共同因素,这种因素可能就是我们要测量的心理特质(构思)。
(3)效标效度的研究证明:一个测验若效标度理想,那么该测验所预测的效标的性质和种类就可以作为分析测验构思效度的指标,另一种证实构思效度的方法是心理特质的发展变化。7、实验法和观察法证实:观察实验前和实验后分数的差异是验证构思效度的方法。
三、效标效度
1、效标效度:又称实证效度,反映的是测验预测个体在某种情境下行为表现的有效性程度。被预测的行为是检验效度的标准,简称效标。由于这种效度是看测验对效标预测如何,所以叫效标效度。这种效度需在实践中检验,所以又称为实证效标。
分类:根据效标资料是否与测验分数同时获得,又可分为同时效度和预测效度两类。
①同时效度即测验所得分数可与效标同时验证,通常与心理特征的评估及诊断有关。
②预测效度的效标资料需要一段时间才可搜集到,通常用于选拔、分组。
③因为效标资料在考试以后相隔一段时间才能获得,所以高考的效标是一种预测效标。同时效标和预测效标意义上的差异,不是来源于时间,而是来自测验的目的。前者与用来诊断现状的测验有关,后者与预测将来结果的测验有关。
2、一个好的效标必须具备以下条件:
○1必须能最有效地反映测验的目标,即效标测量本身必须有效;
○2效标必须具有较高的信度,稳定可靠,不随时间等因素变化;
○3效标可以客观地加以测量,可用数据或等级来表示;
○4效标的测量的方法很简单,省时省力,经济实用。
3、效标和效标测量:
效标,即衡量测验有效性的参照标准,指的是可以直接而且独立测量的我们感兴趣的行为。我们感兴趣的行为,就是要预测的行为,这是一个总的观念,故必须以可操作的测量来确定才有实际意义。因此有必要把效标细分为两个层次,其一是理论水平的“观念效标”, 其二是操作定义水平的“效标测量”。
一个好的效标测量必须具有:有效性、可靠性、客观性、实用性。
4、常用的效标包括:
○1学业成就:如在校成绩、学历、有关的奖励和荣誉、教师对学生智力的评定等,常作为智力测验的效标,也可作为某些多重能力倾向测验和人格测验的效标。
○2实际工作表现:是最满意的效标测量,为一般智力测验、人格测验和一些能力倾向测验的效标;
○3特殊训练成绩
○4精神病诊断;
○5等级评定:是观察者根据测验欲测量的心理特质在被试身上的表现而作出的一种个人判断;
○6效标团体的比较:即找出两个在效标表现上有差别的团体,比较他们在测验分数上的差别;
○7先前有效的测验:一个新测验与先前有效的测验的相关也经常作为效度检验的证据。(简答)
第三节 效度的表示方法及应用
一、 效度的表示方法
1、 相关法:效度系数是最常用的效度指标,尤其是效标效度。它是以皮尔逊积差相关系数来表示的,主要反映测验分数与效标测量的相关。当测验成绩是连续变量,而效标资料是二分变量时,计算效度系数可用点二列相关公式或二列相关公式;当测验分数为连续变量,效标资料为等级评定时,可用贾斯朋多系列相关公式计算。
2、 区分法:是检验测验分数能否有效地区分由效标所定义的团体的一种方法。算出t值后,便可知道分数的差异是否显著。若差异显著,说明该测验能够有效地区分由效标定义的团体,否则,测验是无效的。重叠百分比可以通过计算每一组内得分超过(或低于)另一组平均数的人数百分比得出;另外,还可以计算两组分布的共同区的百分比。重叠量越大,说明两组分数差异越小,即测验的效度越差。
3、 命中率法:是当测验用来做取舍的依据时,用其正确决定的比例作为效度指标的一种方法。命中率的计算有两种方法,一是计算总命中率,另一种是计算正命中率。
4、 预期表法:是一种双向表格,预测分数排在表的左边,效标排在表的顶端。从左下至右上对角线上各百分数字越大,而其它的百分数字越小,表示测验的效标效度越高 ;反之,数字越分散,则效度越低。
二、 效度的应用
1、 预测误差:效度系数的平方,统计学上称这种指标为决定系数,表示测验正确预测或解释的效标的方差占总方差的比例。另一种表达方式是估计的标准误,简写为Sest,它是指所有具有某一测验分数的被试其效标分数(Y)分布的标准差,也即预测误差大小的估计值, (公式4-9)估计的标注误可如同其他标准误一样解释。真正效标分数落在预测效标分数±1Sest的范围内,有68%的可能性;落在预测效标分数±1.96Sest的范围内,有95%的可能性;落在预测效标分数±2.58Sest的范围内,有99%的可能性。
2、 预测效标分数:如果X与Y两变量呈直线相关,只要确定出二者间的回归方程,就可以从一个变量推估出来另一个变量。在测验工作中,人们感兴趣的是从测验分数预测效标成绩。
3、 预测效标指数:公式4-9中的 又称作无关系数,以K表示之,K值大小表明预测源分数与效标分数无关的程度。(1-K)可作为预测效率的指数,用E表示:E=100(1-K) (公式4-15)E值大小表明使用测验比盲目猜测能减少多少误差。
第四节 影响效度的因素
一、 测验本身的因素
1、 测验题目的质量
2、 测验的长度。(一般而言,增加测验的长度通常可以提高测验的信度,而信度又制约着效度,因此增加测验的长度也能提高测验的效度。)
二、测验实施中的干扰因素
1、主试的影响因素:测验实施过程中主试的因素会影响效度。对于效标效度,测验与效标二者实施时间间隔时间越长,测验与效标越容易受到很多机遇因素的影响,因此所求的相关必然很低。测验情镜,如场地的布置、材料的准备、测验场所有无噪音和其他干扰因素等也会影响到测验的效度。
2、被试的影响因素:被试在测验时的兴趣、动机、情绪、态度和身心状况、健康状态等都会影响测验的效度。(被试的反应定势也会降低测验的效度。)
三、样本团体的性质
1、样本团体的异质性:与信度系数一样,如果其它条件相同,样本团体越同质,分数分布范围越小,测验效度就越低;样本团体越异质,分数分布范围越大测验效度就越高。(1)只以选拔上的被试为样本团体参加效度研究,降低了测验的效度。(2)选拔标准太高,样本团体的同质性增高,降低了测验的效度。
2、干涉变量:样本团体的性质对效度的影响还表现在:对于同性质的团体,同一测验的效度会有很大的不同。这些样本团体的特质包括:年龄、性别、教育水平、智力、动机、职业和任何有关的特征。由于这写特征的影响,使得测验对于不同的团体具有不同的预测能力,故测量学上称这些特征为干涉变量。
3、吉赛利提出的如何找出干涉变量的一套方法:
①用回归方程求得每个人的预测效标分数,将该分数与实际效标分数想比较,获得差异分数D。如果D的绝对值很大,说明测验中可能存在干涉变量。
②根据样本团体的组成分析,找出对照组,分别计算效度,从而象上述关于出租汽车司机的例子一样,找出干涉变量。
③对于欲测团体,根据某些易见的干涉变量将其区分为预测性高和预测性低的两个亚团体。对于预测性高的团体,获得的测验效度会有所提高。
三、 效标的性质
(1) 效标与测验分数之间的关系是否线性关系是一个很重要的因素。皮尔逊剂差相关系数的前题是假设两个变量的关系是线性的分布。
(2) 效标测量本身的可靠性如何亦是值得考虑的一个问题。
第五章 项目分析
一般来说,测验的项目分析包括定性分析和定量分析两个方面。
定性分析:主要依靠测验编制者丰富的经验和所受的训练,对项目的内容和形式是否进行恰当的分析;
定量分析:指对题目的难度和区分度进行分析。
通过项目分析我们可以选择和修改测验题目,以提高测验的信度和效度。
第一节 难度分析
1、难度:是指项目的难易程度。在能力测验中通常需要一个反映难度水平的指标,在非能力测验(人格测验)中,类似的指标是“通俗性”,即取自相同总体的样本中,能在答案方向上回答该题的人数。(名词解释)
2、 难度的指标: 难度的指标通常以通过率表示,即以答对或通过该题的人数百分比来表示。
(公式5-1)
二、难度的计算
1、二分法记分的项目:心理测验的项目大多为选择题,通过记1分,不通过记0分。当被试人数较多时,可根据测验总成绩将被试分为三组:分数最高的27%被试为高分组( ),分数最低的27%被试为低分组( )中间46%的被试为中间组。分别计算高分组和低分组的通过率,以两组通过率的平均值作为每一题的难度。
由于选择题允许猜测,所以通过率可能因机遇作用而变大。备选答案的数目越少,机遇的作用越大,越不能真正反映测验的难度。为此,吉尔福特提出了一个P值校正公式。
例题:假定某题有75%的被试通过,若该题有5个备选答案,则校正后的通过率为: (当有4个备选答案时,CP=0.67;有3个,CP=0.63;有2个,CP=0.54)
2、非二分记分的项目:如果人为地明确通过每一题的分数线,也可以用公式5-2计算难度。但此种方法的缺点在于,采用不同的分数线会得到不同的难度值,因此不常用。
三、难度水平的确定
1、项目难度的确定:进行难度分析的主要目的是为了筛选项目,项目的难度多高合适,取决于测验的目的、性质以及项目的形式。为了使测验具有更大的区别力,应选择难度在0.50左右的试题比较合适。但是在实际各种中并得非如此简单。在选择题目时,最好使试题的平均难度接近0.50,而各题难度在0.50 0.20之间。当测验用于选拔或诊断时,应该比较多地选择难度值接近录取率的项目。对于选择题来说,P值一般应大于概率水平。
2、测验难度的确定:测验的难度直接依赖于组成测验的项目的难度。通过考察测验分数的分布,可以对测验的难度做出直观检验。
第二节 项目的区分度
一、 项目区分度的概念:也叫鉴别力,是指测验项目对被试的心理特性的区分能力。(名词解释)
二、项目区分度的估计方法
1、鉴别指数:首先分别计算高分组与低分组在该项目上的通过率,然后用高分组在该项目上的通过率减去低分组在该项目上的通过率。 (公式 5-7) 项目鉴别指数与评价标准
鉴别指数 项目评价 0.40以上 很好
0.30-0.39 良好,修改后会更佳 0.20-0.29 尚可,但需修改 0.19以下 差,必须淘汰
2、相关系数:①点二列相关:适用于一类变量为二分称名变量,另一类变量为连续变量的成对变量的相关计算。
②二列相关:适用于两个连续变量,但其中一个变量被人为分成两类。 ③ 相关:适用于两个变量均为二分称名变量。 3、 区分度与难度的关系
(1) 假如样本中通过某一项目的人数比率为1.00或0,说明高分组与低分组在通过率上不存在差异,因此D为0;假如项目的通过率为0.50,则可能是高分组的所有人都通过了,而低分组却无人通过,这样D的最大值可能达到1.00。
(2) 为了使整个测验项目的潜在区分度最大,似乎应该使每个项目的难度处于0.50水平,但事实并非如此简单。如果每一个项目的难度均处于0.50,由于项目难度相同,有可能大多趋向于有关的内容或技能,结果造成项目同质性提高。在极端情况下,有可能50%的被试全部通过各项目得满分,另外50%的被试全部为0分,形成U形分布,这样反而降低总分的区分能力。如果测验的所有项目都是中等难度,只有项目的内在相关为0时,整个测验才能产生常态分布。考虑到一般测验项目之间具有某种程度的相关难度的分布要广一些,梯度多一些,是合乎需要的。
第三节 项目分析的特殊问题
1、 项目特征曲线:是项目特征函数或项目反应函数的图解形式,它反映了被试对某一测验项目的正确反应概率与该项目所对应的能力或特质的水平之间的一种函数关系。
(1)项目特征曲线可图解测验的鉴别力,项目鉴别力的高低主要在于其曲线的倾斜度,曲线坡度越陡,鉴别能力越好,预测的误差越小。
(2)项目特征曲线可以图解项目难度。
(3)项目特征曲线还可以图解选择题的诱答反应。(简答、名词解释)
第六章 测验的实施、记分及其误差
一、 测验的实施及其误差的控制 的程序及其要素(简答)
1、 标准化指导语:测验标准化的第一步是指导语标准化,即在测验实施过程中应使用统一的指导语。指导语通常包括两部分:一部分对被试的指导语,另一部分对主试的指导语。
2、 标准时限:时限也是测验标准化的一项内容。大多数典型行为测验是不受时间限制的,例如人格测验中被试的反应速度就不很重要。但在最高作为测验中,速度是需要考虑的重要因素之一。在速度测验中,尤其要注意时间限制,不得随意延长或缩短。测验的时间安排,也是影响测验结果的一个重要因素。
3、 测验的环境条件:有许多研究表明,测验环境会对测验的结果造成影响。尤其需要强调的是,心理测验进行之时,务必不能有外界干扰。为此,测验室的房门上应挂一个牌子,示意测验正在进行,旁人不许进入。因此,对于测验的环境条件:(1)遵从测验手册的要求;(2)下任何以外的测验环境因素;(3)测验结果时也必须考虑这一因素。
二、主试误差及控制方法
1、测验前的准备工作
(1)预告测验:应当事先通知被试(2)准备测验材料(3)熟悉测验指导语(4)熟悉测验的具体程序:于个别测验来说,测验的实施必须由受过专业训练的人来完成。
2、测验中主试的职责
(1)应按照指导语的要求实施测验,不带任何暗示,当被试询问指导语意义时,尽量按照中性方式作进一步的澄清。(2)测验前不讲太多无关的话(3)对于被试的反应,主试不应作出点头、皱眉、摇头等暗示性反应;(4)对特殊问题要有心理准备
3、建立协调关系:在心理测验实施中,协调关系是指主试和被试之间一种友好的、合作的、能促使被试最大限度地做好测验的一种关系。例如再智力测验中,这种关系会促使被试尽最大努力发挥自己的能力;在人格测验中,它会促使被试真实坦白地回答有关个人一般行为特点的问题。
三、被试误差及控制方法(大答题)
即使一个测验经过精心编制,题目取样具有代表性,又有标准化的实施和积分程序,这种误差是最难控制的。
1、 被试技巧与练习效应:被试对测验的经验或应试技巧会影响测验成绩,对测验的程序和技能熟悉程度不同,所得分数便不能直接比较。任何一个涉及认知功能的成绩,在第二次应用或重复测量时,都会有练习效应而使测验成绩提高。要控制应试技巧和练习效应的影响,可尽量设法使每个被试对测验材料的步骤和所需技巧有相同的熟悉程度。
2、 被试的动机与焦虑因素
(1) 被试参加测验的动机不同,会影响其回答问题的态度、注意力、持久性以及反应速度等,从而影响测验的成绩;在成就、智力和能力倾向等变量时,只有被试动机强力才可能尽力回答,取得好成绩。动机效应在测量态度、兴趣及人格等典型行为表现时也有影响。某些被试若欲给人以好印象,就会考虑主试的期望或社会赞许行为,而不按自己的真实情况回答,从而使测验分数降低。相反,为了某重动机若欲给人以坏影响,则会使测验分数升高。
(2) ○b测验焦虑是指被试在应试前和测试中出现的一种不愉快的、表现为焦虑、担心、恐惧和紧张的情绪体验。适度的焦虑会使人兴奋型提高,注意力增强,提高反应速度,提高智力测验、成就测验和能力倾向测验的成绩。测验焦虑会受到下列因素影响:
○1能力高的人,测验焦虑一般较低,而对自己能力没有把握的人,测验焦虑较高;
○2抱负水平过高,求胜心切,测验焦虑较高; ○3具有某种人格特点,如缺乏自信、患得患失、情绪不稳定的人易产生测验焦虑; ○4测验成绩与被试的关系重大,或被试受到的压力过大,容易使其产生测验焦虑; ○5经常接受测验的人焦虑较低,而对测验程序不熟悉,尤其是测验中采取了新的题目形式或实施程式会增加测验焦虑。
通过教学或辅导可以降低测验焦虑,而熟悉测验程序也是降低焦虑的有效方法。
3、反应定势:亦称反应风格,是指独立于测验内容的反应倾向,即由于每个人回答问题的习惯不同,而使能力相同的被试得到不同的测验分数。几种常见的反应定势是:
(1)求快与求精确的反应定势:如果测验有时间限制,或测验本身属于速度测验,则求精确地反应定势必然降低测验成绩;如果纯粹是难度测验,则求快的反应定势必然降低测验成绩。
(2)喜好正面叙述的反应定势:大量研究发现,被试在无法确定“是非题”的正确答案时,选择“是”的人往往多于选“否”的人,或者说选“是”的人多于实际上应该选“是”的人。
(3)喜好特殊位置的反应定势:如果被试在测试中完全不知道答案,并不会按照随机的方法来选择答案,而是偏好某一个位置进行选取。
(4)喜好较长选项的反应定势:有些被试认为选项较长,内容就多的为正确答案,在无法确定答案时,有偏好长选项的反应定势。
(5)猜测的反应定势:如果不对猜测进行修正,那么敢于猜的被试比谨慎的被试更易得高分。
4、测验中的社会心理学问题:
(1)被试对主试的需要:现实需要、受人尊重与自尊的需要、自我表现的需要、对主试权威性的需要、特殊需要;
⑵主试本身的特点:主试的特点、动机、期望(罗森塔尔效应、实验者所获得的资料受其本身期望的影响)。
第二节 测验的记分及其误差的校正
1、对于测验编制者而言:记分标准化应该包括选择和设计合式的标准化记分程序,考虑分数的分配、权数的分配、猜测的处理以及分数是由原始分数表示还是转化成其他形式。
2、对测验使用者而言:记分标准化则是要求完全按照测验手册的规定和标准答案给予被试分数,有时还可以完全依据套板或计算机记分。
3、、 记分的基本步骤和要求:
(1)首先是要获得原始分数,其要求是:
①记录被试反应。
②参考标准答案:主试应当熟悉掌握记分键,特别是非客观题的记分要求,不得随意记分。③计算最后得分并转换原始分数:把所有分数汇总,计算出原始分数的总分。
⑵转换原始分数,其意义和方法是:
在心理测量中,一般原始分数本身很少有意义,只有将原始分数进行适当的转换处理或与参照标准加以对照,即把原始分数转换为导出分数,测验分数才有意义。测验编制者提供的常模表就是原始分数的转换表,它为测验使用者提供了一种方便易行的由原始分数向导出分数转化的方法。
第七章 测验分数的解释
1、对测验分数的解释主要包括两个方面的问题:
一是如何使分数具有意义,即我们必须合理的制度测验量表以实现测验结果的数量化。又能为不同的测验导出可比较的量表;
二是如果将有意义的信息传达给当事人,即把测验分数与常规比较,依照出个人在测验量表上的相对等级,从而对个人测验作业进行解释。
第一节 参照常模的分数解释
一、 常模的团体和常模样本
1、 常模团体的性质
由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。
对编制者而言:常模的选择主要是基于对测验将要施测的总体的认识,常模团体必须能够代表该总体。这种工作包括:确定一般总体、确定目标总体、确定样本。
对测验使用者而言:要考虑的问题是,现有的常模团体哪一个最合适。 2、 常模团体的条件
(1) 群体的构成必须明确界定:在制定常模时,必须清楚地说明所要测量的群体的性质与特征。依据不同的变量确定群体,便可得到不同的常规。
(2) 常模团体必须是所测群体的代表性样本。
(3) 样本的大小要适当。总体数目小,只有几十个人,需要100%的样本;如果总体数目达,相应的样本也大,一般最低不小于30或100个;全国性常模,一般应有20##-3000人为宜。
(4) 标准化样组是一定时空的产物:我们在一定时间和空间中抽取的标准化样组,它只能反映当时当地的情况。在选择合适常模时,注意选择较为新近的常模。
3、 取样的方法:
(1)简单随机抽样:按照随即表顺序选择被试构成样本,或者将抽样范围内的每个人或者每个抽样单位编号,再随即选择,可以避免由于标记、姓名、性别或其它社会赞许性偏见而造成抽样误差。
(2)系统抽样:有时在总体数目为N的情况下,若要选择K分之一的被试作为样本,则可以在抽样范围内选择每个第K个人来构成样本。
(3)分组抽样:有时总体数目较大,无法进行编号,而且群体又有多样性,这时可以先将群体进行分组,再在组内进行随机取样。
(4)分层抽样:在确定常模时,最常用的是分层抽样方法。①分层比例抽样②分层非比例抽样
4、 常模分数和常模
(1)常模分数:就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。
(2)常模分数构成的分布,就是通常所说的常模,它是解释心理测验分数的基础。
测验手册上所列的常模通常为一般常模,不一定适合使用者的具体情况;特殊常模是为非典型团体建立的,一般比为小团体建立的常模范围更窄。
特殊常模优点:可使被试的结果与最接近的人进行比较;缺点:不允许分数在较广范围内做解释。
测验使用者可将一般常模与特殊常模结合起来使用。
二、常模的类型及解释
1、发展常模:人的许多心理特质如智力、技能等,是随着时间以有规律的方式发展的,所以可将个人的成绩与各种发展水平的人的平均表现相比较。根据这种平均表现所制成的量表就是发展常模,亦称年龄量表。
(1)发展顺序量表:因为它告诉人民多大的儿童具备什么能力或行为就表明其发育正常,相应能力或行为早于某年龄出现,说明发育超前,否则即为发育滞后。最早的一个范例是格塞尔发展程序表,其中按月份显示儿童在运动水平、适应性、语言、社会性四个方面的
大致发展水平。
(2)智力年龄:比内-西蒙量表中首先使用智力年龄的概念。 这种分数叫做智力年龄,简称智龄。
智龄是年龄量表上度量智力的单位。求智龄分方法很简单,只要将儿童在测验上的分数与各年龄组的一般儿童比较,便可给予一个年龄分数。因此在计算中先算出年龄,既全部题目都通过的那组题目所代表的年龄。再所有更高年龄水平上通过的题目,用月份计算,加在基础年龄上,儿童的智龄是基础年龄与在较高年龄水平的题目上获得的附加月份之和。
另外一种使用年龄量表的方法是不把题目分到各年龄组。首先根据被试在整个测验中正确反应的题数或反应时间而得一原始分数,而将标准化样本中每个年龄组的平均原始分数作为年龄常模。通过将原始分数与年龄常模对比,便可求得每个人的智龄。例如某个儿童的原始分数等于8岁组的平均数,则其智力年龄就是8岁。
一个人的智龄并不一定和他的实龄相符,聪明的儿童,其智龄高于实龄;愚笨的儿童,其智龄低于实龄;只有普通儿童,其智龄与实际年龄相近似。
(3) 年级当量:实际上就是年级量表,测验结果说明被试属哪一年级的水平,在教育成就测验中最常用。
2、 百分位常模及解释
百分位常模包括百分等级和百分点、四分位数和十分位数。
(1) 百分等级:是应用最广的表示测验分数的方法。一个测验分数的百分等级是指在常模样本中低于这个分数的人的百分比。其计算分为:未分组资料的百分等级计算;分组资料的百分等级求法。
(2) 百分点:也称百分位数,与百分等级的计算方法正好相反,百分等级是计算低于某测验分数的人数百分比,而百分点则是计算处于某一百分比例的人对应的测验分数是多少。百分点的计算可根据直线内插法进行。在实际应用中,我们一般既可以由原始分数计算百分等级,又可以由百分等级确定原始分数。通过这样的双向方式编制的原始分数与百分等级对照表,就是百分位常模。
3、 标准分常模及解释
标准分常模:标准分数是将原始分数与平均分数的距离以标准差为单位表示出来的量表。它的基本单位是标准差。
(1) 线性转换的标准分数:z分数为最典型的线性转换的标准分数。
(2) 非线性转化标准分数:当原始分数不是常态分布时,也可以使之常态化,这一转化过程就是非线性的。与线性导出分数一样,常态化标准分数也可以被转化成任何方便的形式。当以50为平均数(即加上一个常数50),以10为标准差(乘以一个常数10)来表示时,通常叫做T分数。
①T分数:T=50+10z` T分数这一概念最早由麦克尔于1939年提出,含有纪念推孟和桑代克二氏。
②标准九分:是另一较知名的标准分数系统,其量表是个9级的分数量表,它是以为平均数,以2为标准差的一个分数量表。
③常态化的标准分数还有标准十分(平均数5,标准差1.5)标准二十分(平均数10,标准差3)
4、 智商及其意义
(1) 比率智商:比内-西蒙量表传入美国后,斯坦福大学推孟教授于1916年对其修订而成斯坦福-比内量表。它在心理年龄的基础上,以智商表示测验结果,即以后所说的比率智商。
①比率智商的定义:心理年龄(MA)与实足年龄(CA)之比,将商数乘以100,即
IQ= ×100
②比率智商提出后,普遍被心理学界和医学界所接受。但由于个体智力增长是一个由快到慢再到停止的过程,即心理年龄与实足年龄并不同步增长,所以比率智商并不适合于年龄较大的被试;另外,由于不同年龄组儿童的比率智商分布的情况是不一样的,因而相同的比率智商分数在不同年龄就具有不同意义。基于这种考虑,心理学家韦克斯乐提出了离差智商的概念。
(2) 离差智商:是一种以年龄组为样本计算而得的标准分数,为使其与传统的比率智商基本一致,韦克斯勒将离差智商的平均数定为100,标准差定为15。所以离差智商建立在统计学的基础之上,它表示的是个体智力在年龄组中所处的位置,因而是表示智力高低的一种理想的指标。由于离差智商的提出,过去曾使用比率智商的许多测验在后来也使用了离差智商,如在1960年修订的斯一比测验中,就使用的是平均数为100,标准差为16的标准分数量表。必须指出,从不同测验获得的离差智商只有当标准差相同或接近时才可以比较,标准差不同,其分数的意义便不同。
5、 百分位与标准分数的共同之处:将被试的分数在团体内做横向比较,而发展量表却是与不同发展水平的人做纵向比较。
三、常模分数的表示方法:①转换表:有时也称常模表,是最简单也是最基本的表示常模的方法;
②剖析图。(TK或XZ)
第二节 参照效标的分数解释
在效标参照测验中,一种标准是对测验所包括的材料熟练或掌握的程度,将分数与此种标准比较可以搞清一个人知道什么和能做什么。因为涉及的主要是测验的内容,所以可以把这种分数叫做内容参照分数。另一个比较标准是外在效标,即用预期的效标成绩来解释测验分数,因为涉及的是最后来的结果,所以把这种分数叫做结果参照分数。
一、效标参照测验及其应用 参照效标测验是格拉赛提出的。
效标参照测验优点:
(1)不象常模参照测验那样,使能力强者骄傲自满,能力差者长期遭受挫折,效标参照测验巧妙地避开了对得分、名次的过分纠缠,使各人都有自己的奋斗目标和希望。
(2)常模参照测验无法反映出被试的真正能力和水平,甚至对被试到底能做什么,不能做什么也不清楚。效标参照测验既能发现个人特有的长处,也会找到问题的症结所在,而常模参照测验就做不到。
(3)从常模参照测验的得分不能得到被试在外在效标上的表现,效标参照测验则可直接作出解释,有时测验结果的本身可能就是效标。
(4)效标参照测验与教师在教学过程中的自编测验关系更为密切,因而效标参照测验的理论概念更易为教师接受和应用。
二、内容参照分数及解释
1、内容参照分数:又叫范围参照,主要是依据被试对某个确定的材料内容或技能的掌握程度和熟悉程度来表示和解释测验结果。
2、内容参照的表示方法:内容参照的表示方法:掌握分数和正确百分数。
(1)掌握分数:订出一个判别被试是否通过或掌握的最低分数,即最低掌握水平,此分数以上,表明被试已达到掌握或熟练水平;此分数以下,表明没有达到这个水平,需要进一步的学习或采取其他补救措施。
(2)正确百分数(更为常见):是报告内容参照分数的又一个指标,表明被试者在测验中答对题目的百分比,因而掌握分数的二分法记分来表示掌握或熟练程度更为合适。
正确百分数=答对题目数/总题目数х100
(3)内容参照分数的优点:用个人所掌握的内容或技能水平来描述行为,指出一个人知道什么或能做什么,这比知道一个人在团体中的相对等级更有价值,并特别适合于计算机辅助教学及利用程序教材自我掌握进度的学习。但对于大多数能力倾向及人格测验来说,由于所测的范围很难确定,因而一般不用内容参照分数法。
三、结果参照分数及解释
1、果参照分数:实际上是一个效标分数,即用效标行为的水准来表示测验的结果,而且也是对被试未来作为的预测。
2、结果参照分数表示法
(1)期望结果的概率:通过一种简单的图表,显示出获得特定测验分数的人得到每一种效标分数的百分比,即将测验成绩以产生各种不同结果的概率来描述。
(2)预期的效标分数:将具有不同测验分数的人所可能获得的预期效标分数用图表显示出来。
第三节 测验分数的解释与报告
一、测验分数的综合分析
1、根据心理测量的特点进行分析:由于测验误差的影响,被试测验分数会在一定范围内波动,故应该永远把测验分数视为一个范围而不是一个确定的点。
2、要考虑测验前的经历和测验时的情景:(1)为了能对测验分数作出有意义的解释,必须将个人在测验前的经历考虑在内。(2)测验情镜也是一个需要考虑的因素。
3、要考虑测验的信度和效度:为了对测验分数做出确切的解释,只有常摩资料是不够的,还必须有测验的信度和效度资料。
4、于来自不同测验的分数不能直接加以比较:为了使不同测验分数可以相互比较,必须将二者放在统一量表上。具体做法是将两个测验都对同一样本进行施测,并把两种测验的原始分数都换算成百分等级,然后用该百分等级作为中介,就可以作出一个等价的原始分数表,另一种是用相同的标准分数作等值的基础,此种方法叫做线性等值。
二、报告分数的具体建议
1、不应把测验分数直接告诉被试本人或家长、学校班主任等有关人员,应告诉的是测验分数的解释和建议。
2、避免使用专业术语。
3、要保证当事人知道这个测验测量或预测什么。
4、要使当事人知道他是和什么团体在进行比较。
5、要使当事人知道如何运用他的分数。
6、要考虑测验分数将给当事人带来什么心理影响。
7、要让当事人积极参与测验分数的解释。
8、测验结果应向无关人员保密。
第八章 智力测验
智力测验:是一种重要的心理测验技术,它不仅能够对人的智力水平的高低做出评估,而且在某种程度上反映出与病人有关的其他精神病理状况,因此智力测验是心理测验中应用最广、影响较大的工具和技术。
第一节 智力的概念及智力分数
一、智力和智力的构成理论
1、智力(简答题)
(1)智力是抽象思维的能力:美国心理学家推孟认为,一个人的聪明程度与抽象思维能力成正比;法国心理学家比内把智力解释为“正确的判断、透彻的理解、适当的推理”能力
(2)智力是学习的能力(伯金汉):“智力就是获得知识及保持知识的能力”(汉蒙)。
(3)智力是适应新环境的能力:“智力是个体有意识地以思维活动来适应新环境的一种潜能”(斯特恩)
(4)我国心理学家认为智力大体是学习的能力、保持知识的能力、推理的能力及应付新环境的能力。
3、 智力结构理论:
(1)斯皮尔曼的二因素理论:智力主要是一种普遍而概括的能力,他称这种因素为G因素(普通因素),另外人的智力活动中还存在着S因素(特殊因素),个人的特殊能力,只在某些方面表现。
(2)瑟斯顿的群因素理论:与二因素论相反,智力是由一群彼此无关的原始能力构成的,各种智力活动可以分成不同的组群,每一群中有一个基本因素是共同的
(3)吉尔福特的三维结构理论:智力结构应从内容、操作和产品三个维度去考虑,并用三个维度的立体模型来描述智力的结构。其设想,没一个内容都可以运用不同的操作而产生不同的产品,可以得到4*5*6=120种单独的智力因素。
(4)卡特尔的流体智力与晶体智力理论:智力由两种成分构成,一种是流体智力,一种是晶体智力。①流体智力:是人的一种潜在智力,主要和神经生理的结构和功能有关,很少受社会教育影响,它与个体通过遗传获得的学习和解决问题的能力有联系。这种智力几乎可以转换到一切要求智力的练习活动中,所以称为流体智力②晶体智力:则主要是后天获得的,受文化背景影响很大,与知识经验的积累有关,是流体智力运用在不同文化环境中的产物。这种智力表现为来自经验的结晶,故称晶体智力。
二、智力及计算方法
1、智商的提出:1904年比内与其助手西蒙编制了世界上第一个正式的心理测验,1908
年第一次修订,修订后的量表首先采用了心理年龄,或称智力年龄的概念,简称心龄或智龄。心龄不能表示聪明或愚笨的程度,如果要比较不同年龄的两个小孩子哪个更聪明或愚笨,只用心龄便无法解决,这样就需要计算智力商数了
2、智商的计算
(1)比率智商:最早由德国心理学家施太伦提出,是心理年龄除以生理年龄所得商数,即为 智力商数,或比率商数。
○a优点:比率智商可使不同年龄者的智力水平相互比较,可以表示一个人的聪明程度。
○b局限:认得生理年龄是与年俱增的,而心理年龄并不与年俱增,特别是到了一定年龄以后会产生稳定不前甚至下降的趋势,这样就会降低IQ分数,而不能正确地反映出实际的智力水平,故它不适用于20岁以上的成年人,现在很少使用。
(2)离差智商:韦克斯勒提出离差智商的概念,是采用统计学中的均数和标准差计算出来的,表示被试偏离他本人这个年龄组平均成绩的量数,是依据测验分数的常态分布来确定的。
1960年推孟在修订斯坦福-比内量表时,标准化样本得到的数值,定IQ均值为100,标准差16。
第二节 个体智力测验
一、 比内-西蒙量表
1、 比内-西蒙量表的发展:是智力测验中运用广泛、影响较大的量表。
①最早由法国心理学家比内和医生西蒙于1905年编制而成,称比内-西蒙量表。
②1908年比内发表修订后的比内-西蒙量表,将测验成绩用 “智力年龄”来表示,并建立了常模,这是心理测验史上的一个创新。
③1916年斯坦福大学的教授推孟修订的斯坦福-比内量表最负盛名,史称1916量表,并首次引入了比率智商的概念,以IQ作为比较人聪明程度的相对指标。
④20年后(1936年),推孟教授和助手梅里尔于1937年第一次对斯坦福-比内量表进行修订,修订后由L和M型两个等值量表构成。
⑤1960年推孟和梅里尔再度合作,将1937年量表L型和M型中的最佳项目组合并成单一的量表,称L-M型。其重大的改革是用韦氏量表的离差智商替代了比率智商,平均数100,标准差16。
2、 斯坦福-比内第四版:S- 的理论模型:斯坦福-比内量表第四版(S- )。这次修订本从智力模型、实施测验、记分与结果解释等方面作出了很大改变:
(1)S- 理论模型:它用一个三个层次的认知能力结构模型作为编制量表的框架,最高层是一般智力G因子;第二层次采用改良过的卡特尔的流体智力与晶体智力,在此之外又增加了短时记忆能力,其中晶体智力 之下又分为语言推理和数量推理,流体智力又称为抽象/视觉推理能力;
(2)S- 的分测验:由15个分测验组成,其中9个测验来源于第三版,另外6个是新添项目 ,这是S-B第一次使用分测验的形式。这15个分测验是对四个认知区域的评估:语言推理、数量推理、抽象/视觉推理、短时记忆。
(3)S- 的实施与记分:在实施中,词汇测验总是为第一个测验,它的功能是作为唤起测验,根据词汇分测验的分数和实际年龄,实测者就能决定被试在其余分测验上从哪一个水平进行测验。S- 和L-M型一样,也是采用离差智商记分法。首先把各分测验的原始分数转换为标准年龄分(SAS),SAS以50为均值,8为标准差。将每个认知区域所含分测验的标准分相加,分别得到语言推理、数量推理、抽象/视觉推理、短时记忆。各认知区域分相加转换为合成标准年龄分。按均值为100,标准差为16的公式计算。
3、中国比内量表:最早于1916年传入中国,1924年陆志韦在南京发表了他修订的《中国比内-西蒙智力测验》,1936年又与吴天敏进行了第二次修订。1982年吴天敏教授进行了第三次修订,称作《中国比内测验》。测验对象年龄范围扩大为2-18岁,基本上每岁3个试题,共计51个题目。在评定成绩的方式上,放弃了比率智商,而采用离差智商的计算方法来求IQ。
二、韦氏智力量表:
1、韦氏智力量表:主要是指WAIS-R、WISC-R和WPPSI这三个量表,三者均包括相同的分测验,因年龄关系,有一些在形式上作了一些变更。
2、中国修订韦氏成人智力量表(WAIS-R):包括11个分测验,其中言部分包括知识、领悟、算术、相似性、数字广度、词汇6个分测验,操作部分包括数字符号、图画填充、木块图、图片排列、物体拼凑等5个分测验。
(1)各测验的主要内容包括:
○1相似性:包括13对词,要求被试对共同性进行概括,主要测量人的抽象思维与概括能力;
○2数字广度:主要测量人的注意力和短时记忆能力;
○3图画填充:主要测量人的视觉辨认能力,以及视觉记忆与视觉理解能力; ○4图形拼凑:主要测量处理局部与整体关系能力、概括思维能力、知觉组织能力以及辨别能力。
(2)测验的实施与记分:
○1进行测验时,一般按先语言测验后操作测验的顺序进行;
○2在每个分测验中,题目都是按难度顺序排列的,算术、图片排列、木块图案、动物拼凑、数字符号有时间限制,另一些测验不限制时间,应让被试有适当时间来表明回答;
○3一个分测验中的各项目得分相加,称分测验的粗分(或称原始分)。粗分按手册上相应用表可转化成平均数为10,标准差为3的量表分。分别将六个言语测验和五个操作测验的 量表分相加,便可以得到言语量表分和操作量表分。再将二者相加,便可得到全量表分。最后根据相应用表换算成言语智商、操作智商和总智商。
(3)测验结果的基本分析方法:
○1总智商(FIQ)分析:通常可用测得的IQ值加减5的方法判断IQ值的波动范围。
○2分量表的平衡性:分别计算语言智商(VIQ)和操作智商(PIQ)是韦氏智力测验的一个特点。一般可视VIQ大于、等于或小于PIQ以及二者相差到何种程度而决定其意义,例如优势半球有损害,则VIQ明显低于PIQ;非优势半球有损害,则PIQ明显低于VIQ;若是弥漫性损害,其表现与非优势侧损害时相似。
○3比较各分测验的差异:韦氏智力量表的另一个特点是,整个测验是由多个侧重反映某一方面能力的分测验组成,分析它们的强点和弱点,具体方法主要有:
①各言语分测验的量表分与言语量表的平均分比较;
②各操作分测验的量表分与操作量表的平均分比较;
③各分测验的量表分与全量表的平均分比较。
b韦氏儿童智力量表中国修订本(WISC-CR)
○aWISC-CR有12个分测验,属言语量表的分测验一欧常识类同、算术、词汇、理解和背数,其中背数为备用分测验;属操作量表的分测验有填图、图片排列、积木图案、物体拼凑、译码和迷津,其中迷津是备用测验。
○b实施程序:先做一个言语测验,再做一个操作测验,交替进行,以维持儿童的兴趣,避免疲劳和厌倦。其记分基本上个成人智力测验类似,所不同的是每个分测验的原始分在转化为量表分时,是在儿童自己所属的年龄组内进行的。
c对韦氏智力量表的评价:
○a韦氏智力量表的优点:
○1具有复杂的结构,不但有言语分测验,还有操作分测验,可同时提供三个智商分数和多个分测验分数,能较好地反映一个人智力的全貌和测量各种智力因素。
○2用离差智商代替比率智商,既克服了计算成人智商的困难,又解决了在智商变异上长期困扰人们的问题。
○3韦氏智力量表临床应用的多,积累了大量的资料,已成为临床测验中的重要工具。
○b韦氏智力量表的缺点:
○1韦氏智力量表的三个独立本的衔接欠佳,表现在同一被试用两个相邻量表测验如WAIS和WISC时,其智商水平在WAIS的系统性高于WISC。
○2测验的起点有点偏难,有的分测验(如相似性测验)对低智力者难以说明,故不便测
○3有的分测验项目过多(如词汇测验),增加了测验时间。
第三节团体实施的智力测验
1、团体测验与个体测验的差异(JD)
a团体测验采用多项选择,而个体测验多采用开放式问题;
b团体测验的记分较个别测验的记分更为严格而客观;
c团体测验为团体施测,对主试要求不高。个别测验为个体施测,对主试要求较高;
d团体测验多用于筛选,而个体测验则多用于诊断及弥补工作;
e团体测验能较个体测验更好地建立常模。
2、团体测验的优缺点(JD)
a团体测验的优点有:节省人力、物力和主试施测时间,测验程序简便、对主试要求低、记分客观和更易建立常模。
b团体测验的缺点有: ○a无法对被试详细观察,不易发现疾病、疲劳、焦虑等可能影响测验成绩的特殊反应;
○b主试与被试之间无法建立和谐的协调关系;
○c题目类型受到限制,缺乏灵活性,不利于有独创性的被试;
○d由于动机问题或不能看懂指导语,有些测验者的成绩会大大低于实际水平。
3、瑞文渐进测验:分为两型标准型是瑞文测验的基本型,1938年问世,适用于8年级到成人被试,有5个黑白系列;彩色型适用于5.5岁到11岁的儿童及智力落后的成人,分为三个系列。还有供智力水平较高者的高级型。瑞文测验既可以团体施测,也可以作为个别测验。
第四节婴幼儿智力发展量表
一、格塞尔发展程序表
1、量表结构:它适用于4周至6岁,包括四大行为领域:运动发展、适应行为、语言发展和个人-社会行为。格赛尔指定了一些“枢纽龄”,并对每个枢纽龄的4种行为能力作了描述,确立了63个项目,以此作为检查的项目和诊断标准,从而建立了8个分量表。
2、诊断过程及方法:格赛尔反对给婴幼儿一个总的智力商数,强调发展的几个领域可以不平衡,认为应当分别对4个领域进行计算。DQ=测得的成熟年龄/实际年龄*100
3、临床应用评价:如果各领域的DQ均低于65~75分,说明发育严重落后。
4、丹弗发育筛选测验:共提出105个要求或项目,分别测量四大行为领域的能力:
①应人能(个人-社会行为):对周围人的应答能力和料理自己生活的能力;
②应物能:看、用手摆物和绘画能力;
③言语能力:听、说、写和语言能力;
④动作能(大动作):坐、走步和跳跃的能力。
5、考夫曼儿童成套评估测验:是智力和成就的综合测量。考夫曼夫妇以神经心理学和认知心理学的有关认知加工理论为K-ABC的理论基础,认为人的大脑存在两种综合性的加工活动:①同时加工过程(指人们认识事物时,在特定的时间内同时感知到事物的各个部分的特征);②继时加工过程(指人们认识事物时,可以在某一时刻只感知事物的一种特征,随着时间的 陆续感知事物的各部分特征),并以“个体解决问题和信息加工的模式”定义智力。K-ABC有16个分测验,分成三个量表:同时性加工量表、继时性加工量表和成就量表。
6、贝利婴儿发展量表:由心理量表、运动量表和婴儿行为记录表三部分组成。每个婴儿在心理量表和运动量表上的分数按年龄组转换成平均数为100,标准差为16的标准分数,从而计算出心理发展指数和心理运动发展指数。
贝利婴儿发展量表的意义:从测验编制技术上看,贝利婴儿发展量表是被公认为最好的婴儿测验,它具有科学的可靠性和有效性的材料。在心理实验上,常用它做智力前后变化的对比。然而该量表主要用来测量当时的发展状况,而不是预测将来的能力水平。
7、新生儿行为评定量表:目前年龄最小的婴儿使用的发展量表,适用于出生3-4周的新生儿。
第五节创造力测验
对于创造力还没有一个严格的科学定义,一般是指产生新的想法 ,发现和制造新事物的能力。
第六节智力测验相关的心理学问题
1、智力发展的一般趋势:智力在童年期迅速增长,在青春期增长缓慢,约在25岁达到顶峰,以后保持稳定到中年后期,在老年期逐渐下降。根据瑟斯顿和韦克斯勒等人的研究,可将智力发展与年龄的关系:
①一般常人的智力发展,约自3-4至12-13之间呈等速进行,之后随年龄增长而渐减;
②早期的研究都认为智力发展约在15岁至20随之间停止,新近的研究发现,智力的发展约在25岁达到顶峰;
③智力发展的速率与停止年龄有很大个体差异,一般智力高者发展速率快,停止的时间晚;智力低者发展速率慢,停止的时间早;
④各种能力的发展速率并不完全相同,其感知能力特别是着重反应速度的能力达到高峰和下降比较早,而较复杂的推理能力发展较慢且下降较慢。
2、智力的个别差异:在全人口中,智力分布曲线基本上呈常态,其智力极高(IQ在130以上)与极低(IQ在70以下)者均占少数,智力属于中常或接近中常(IQ在80~120)之间者约占全体人群的80%。
3、如何正确理解和解释智力测验的结果(JD)
①不能以一次测验来确定智力水平:首先,测验是有误差的;其次,人的一生中智商会产生许多变化。
②测验要为智力的开发服务:测验的目的不是为每一个人贴上智力高低的标签,而是为了更好地开发人类的智力服务。
第九章 能力倾向测验
一、能力倾向测验
1、定义:一般是指测量从事某种职业或活动的潜在能力,或预测未来作为水平的评估工具。
2、能力倾向测验产生的原因 :
①智力测验的局限:早期智力测验的编制者,希望通过广泛地测量心理功能,从而估计个体的总体智力水平。但是,他们很快发现这些测验不能包括所有重要的功能,大部分的智力测验只不过测量了言语能力和数目及抽象符号关系能力。因此所谓的智力测验只是涉及到智力的某些方面而已。
②个体能力倾向的差异:个体在某一测验的各部分上的作业,常常表现出显著的差异,这种个体内变异在智力测验上表现为分测验得分的差异,但由于分测验的项目太少,智力测验往往不足以作出这种能力倾向差异的分析。
③因素分析技术的发展:从斯皮尔曼到瑟斯顿再到吉尔福德,对智力本质的统计研究,使我们能分析特质的组成,从而为编制区分性的能力倾向测验提供了帮助。
④来自实际的需要:随着科学管理,尤其是人事选拔和测评的发展,对个体的能力倾向
进行评估的工具越来越受重视。
3、能力倾向测验的特点:
①能力倾向测验预测失败比预测成功更为正确:能力倾向测验只是测量某方面的潜在能力,只预测一个人将来在某方面的“可能”成就,并不保证他在该方面的“必然”成就,因为一个人的能力倾向能否获得充分的发展还与他的性格、兴趣、学习态度、技巧、机会等条件都有关联。
②必须审慎解释各种特殊能力分数间的差异:这是因为
○1各种能力倾向测验的标准化样本,很少有两个是完全相同的,尤其是那些从特殊职业团体进行的取样;
○2被试施测某种能力倾向测验的结果应该与实际从事这种活动的团体相比较。
③能力倾向测验在训练计划中应审慎应用 :
○1有些能力倾向要到15、16岁之后才能逐渐成熟,如果将这些测验用于未成熟的被试,可能会出现误导;
○2许多能力倾向测验的预测能力尚未得到证实,或者没有进行过预测性研究,或者没有证实这种相关。所以有时各种研究资料齐全的旧测验反而比新测验更好。
4、能力倾向测验与智力测验
①能力倾向测验可分成三类:一般能力倾向测验、特殊能力倾向测验和多因素能力倾向测验。其中一般能力倾向测验就是指智力测验。而狭义的能力倾向测验专指后两者。
②智力测验内容范围很广,使得这些测验对预测各种效标都有一定的有效性。但智力测验由于频带宽度过大,一般只有中等的预测效度。能力倾向测验主要是测量个体某方面的潜在能力,虽然预测效标的频带宽度较小,但精确度更高一些。
③智力测验一般得到的是对个体总智能的评估分数,而能力倾向测验测量的是某种特定的或多因素的组合。
5、多因素能力倾向测验:用来测量个体在不同领域内的技能和知识,从而为职业咨询、分类和安置决策提供有效信息。
①工业能力倾向成套测验:多用于商业和工业的选择和安置。
②学术能力倾向成套测验:以学生为对象进行标准化实施。
③军事能力倾向测验
二、、职业兴趣测验
1、职业兴趣测验的发展
①第一个职业兴趣量表是1927年斯特朗编制的斯特朗职业兴趣表;1934年,库德编制了库德职业兴趣调查;上世纪50年代出现了霍兰德职业爱好问卷。
②从1965年以来,职业兴趣量表出现了一些明显的发展趋势:
○1各量表之间互相吸收;
○2越来越倾向于采用大样本的实证资料库来解释测验分数;
○3越来越多的问卷同时提供较广泛的同质性兴趣量表以及特定的职业量表;
○4越来越多的量表采用霍兰德的6种职业理论;
○5扩大了所包括的职业水平。
2、职业兴趣测验的理论
①霍兰德认为:个体的人格特征和背景因素决定了他的职业选择方向;
职业选择是个体人格的一种表现形式;
理想的职业选择是使人格类型与职业类型相互协调和匹配。
他认为在美国社会中主要存在六种人格类型和六种与之相对应的环境模式:
现实型(R);研究型(O);艺术型(A);社会型(S);企业型(E)和常规型(C)。
3、安妮·罗伊根据对职业的观察和研究结果提出:职业选择的首要因素是个体是“以人取向”还是“不以人取向”。
4、第一个正式职业兴趣量表的编制者为:斯特朗-坎贝尔的兴趣问卷
第十章 成就测验
一、成就测验:也称学绩测验,是指测量一个人在接受教育或训练后所获得的成果,或者说测量某种知识、技能训练结果的测验。
1、成就测验的发展历史:标准化成就测验发源于美国,始创者是赖斯;另一个早期的奠基人是桑戴克,他被公认为教育测验运动的鼻祖。
2、成就测验的功能(JD):
①反馈功能:测验的结果可以作为教师调节教学活动的反馈信息。
②评价功能:学绩测验可作为评价学生学习效果、教师教学效果、学校或一个地区的教学质量的工具。
③研究工具:测验对教育理论的研究和发展具有重要的作用。
④人才筛选与安置:成就测验可作为量才的工具。用于筛选或安置的测验首先要注重信度。
⑤诊断功能:诊断测验常用于低成就或学习上有困难的学生,以探查其学习缺陷所在。
3、成就测验的分类:
①根据内容:单科测验和成套测验;
②根据功能:评估性测验和诊断性测验;
③根据编制方法:教师自编测验和标准化成就测验;
④根据测验原理:效标参照测验和常模参照测验;
⑤根据测验题型:定向反应型和自由反应型;
⑥根据传统用途:总结性评估测验和形成性评估测验。
4、、成就测验与能力倾向测验、智力测验的区别(LS):成就测验与能力倾向测验、智力测验都是测量人的最高作为的测验。
①就测验的对象而言:三者所测的都是认知性特质,本质上有重叠之处,无法加以截然区分。(不同之处在于,成就测验是一种直接测量法,而智力或特质只能通过间接方法测量,即通过对被试的某种表现或成绩来进行推测。)
②从功能上看:成就测验也不同于智力、能力倾向测验。
○1智力、能力倾向测验主要功能是预测一个人在未来的教育、训练或工作经验中可能的表现,它们的使用是在教育或训练程序以前,用以反映被试是否有接受某种课程或专业技能训练的能力;
○2成就测验则是评估被试在接受一些教育或训练程序后所获得的学习成果,它的实施发生在教育、训练过程后。
○3在测验的技术品质上,成就测验要注重内容效度,即测验项目是否能全面代表所学内容;而能力倾向、智力测验则必须有较高的预测效度或辨别效度,否则就失去其基本价值。)
③实际上,从某种角度看,能力倾向测验与成就测验的区分只在于编制的目的和方法。如果目的在于编制一种预测工具,那么便可以称为能力倾向测验;如果目的在于编制过去测量作业的工具,便可称为成就测验。
第十一章 人格测验
研究人格的方法大体有两类:研究人格的形成和发展;
描述性的研究:人格测验属于此类。
1、、现代西方心理学家对人格本质的理解至少4个方面是一致的或基本一致的 :
①绝大多数心理学家都强调或事实上承认人格的整体性;
②所有的心理学家都承认人格的独特性,即承认没有两个人的人格是完全相同的;
③绝大多数心理学家都承认人格对个人行为的调节功能,即认为人的行为至少部分地决定于行为者的人格特征;
④所有的心理学家都主张人格的相对稳定性,即认为人格对行为的调节功能具有跨时间和跨情境的特点。也就是“江山易改、秉性难移”。
2、人格的发展史:
①颅相学:认为人格可以通过触摸头骨来分析,某部位隆起就可以确认他具有该区域有关的性格;
②相面术:通过人的外部特征,尤其是面部特征来确定人的气质和性格;
③笔迹学:通过分析个人的书写样本来确定人格;
④以上3种均采用观察现象或外部特征的方法,强调先天作用,有宿命论的思想,现已摈弃。
3、人们公认的人格测验的先驱是:克雷丕林,他最早将自由联想测验应用于临床诊断。
4、20世纪前半叶,人格评估历史上的重要事件:
①1919年美国伍德沃斯发表了第一个标准化的人格问卷——个人资料调查表,并用于军事甄选,开人格问卷测量之先河;
②1920年罗夏墨迹测验问世,投射测验由此诞生;
③1938年默里发表《人格探索》一书,描述了TAT测验的理论基础;
④1942年哈特卫和麦金利发表了明尼苏达多项人格问卷,是人格问卷中最常用的测验。
5、相对于智力、成就和能力测验,人格测量的信度和效度最低。
影响人格测量真实性的因素:编写测验项目的技术;被试是否真实回答问题。
第二节 自陈量表
1、自陈量表:又称自陈问卷,是由被试本人对自己的人格特质,按自己的意见进行评定的一种方法。它的一个特点是高度结构化,另一个特点是建立标准化常模,又被称为客观式人格问卷。
2、自陈量表的格式:是非式、折中是非式、选择式、文字等级式、数字等级式。
3、编制自陈量表的方法:
①逻辑分析法:首先确定要测量的特质,然后编写出一些看来能测量这类特质的题目,编制成问卷。包括爱德华个人偏好量表、詹金斯活动调查表和显性焦虑量表。
②经验效标法:测验项目的选择完全是以实证资料为依据,也就是说只保留那些能够将效标组与控制组区分开的项目,而不管其内容看起来是否合理。包括明尼苏达多项个性调查表和加州心理量表。
③因素分析法:这种方法是以因素分析的统计方法为基础,首先以大量的测验题目给大量的被试施测,然后找出相关的题目构成一个因素,一种因素代表一种人格特质。包括卡特尔十六种人格因素测验和艾森克人格问卷。
④综合法:首先采用逻辑分析法经由推理获得一大批题目,然后采用因素分析法编制出若干同质量表,最后将同质量表中没有效标效度的题目删掉。包括杰克逊人格问卷。
4、自陈量表的特点(JD) :
①自陈量表的题量较大,多数用于测量人格的若干特质;
②自陈量表通常采用纸笔测验;
③自陈量表的计分规则简单而客观,施测手续比较简便,测量分数容易获得解释。
4、明尼苏达多项个性调查表:MMPI是根据经验性原则建立起来的自陈量表。其有临床量表10个,效度量表4个,均集中在1~399题。
①临床量表:国内宋维真等认为T60作为区分健康人与偏离者的个性较为恰当,T分超过60分即属异常范围:
○1疑病(Hs):33个题目,它反映被试对身体功能的不正常关心。
○2抑郁(D):60个题目,它与忧郁、淡漠、悲观、思想与行动缓慢有关,分数太高可能会自杀,得分高者常备诊断为抑郁性神经症和抑郁症。(最能反映对生活不平、不满的表现)
○3癔症(Hy):60个题目,得分高者多表现为依赖、天真、外露、幼稚及自我陶醉,并缺乏自知力。若是精神科患者,往往被诊断为癔症(转换性癔症)。
○4病态人格(Pd):50个题目,可反映被试性格的偏离,高分数的人为脱离一般的社会道德规范。
○5男子气-女子气(Mf):60个题目,反映性别色彩。高分数的男人表现敏感、爱美、
被动、女性化,缺乏对异性的追求。高得分的妇女被看作男性化、粗鲁、好攻击、自信、缺乏情感、不敏感,在极端的高分情况下,则应考虑有同性恋倾向和同性恋行为。
○6偏执(Pa):高分提示具有多疑、孤独、烦恼及过分敏感等性格特征。极端的高分者被诊断为精神分裂症偏执型和偏执性精神病。
○7精神衰弱(Pt):高分数者表现紧张、焦虑、反复思考、强迫思维、恐怖以及内疚感。
○8神经分裂症(Sc):高分者表现异乎寻常的或分裂的生活方式。
○9轻躁狂(Ma):高得分者常联想过多过快、活动过多、观念飘忽、夸大而情绪高昂、情感多变。
○10社会内向(Si):高分数者表现内向、胆小、退缩、不善交际、屈服、过分自我控制、紧张、固执及自罪;低得分者表现外向、爱交际、富于表情、好攻击、健谈、冲动、不受拘束、任性、做作在社会关系中不真诚。
②效度量表 :
○1疑问(Q):对问题毫无反应及对“是”和“否”都进行反应。高得分者表示逃避现实,若前399题中原始分超过22分,则提示临床量表不可信。
○2说谎(L):L量表原始分超过10分时,就不能信任MMPI的结果。
○3诈病(F):多为一些比较古怪或荒唐的内容。分数高表示被试不认真、理解错误,表现出一组互相无关的症状,或在伪装疾病。如果测验有效,F量表是精神病程度的良好指标,其得分越高暗示着精神病程度较重。
○4校正(K):是对测验态度的一种衡量,其目的是为了判别被试接受测验的态度是不是隐瞒,或是防卫的;根据这个量表修正临床量表的得分,即在几个临床量表上分别加上一定比例K分。
③实施:卡片式(适于个别施测)和手册式(可个别也可团体施测)。
④记分方法:一种是电脑记分,一种是模版记分。 模版记分具体步骤:
○1将回答纸上被试对同一题目划两种答案的题号用颜色笔划去,与“无法回答”的题数相加,作为Q量表的原始分数;
○2将每个量表的模版依次覆盖在回答纸上,数好模版上有多少个圆洞里划上了记号,这个数目就是次量表的原始分数。
○3在下列5个量表的原始分数上分别加上一定比例的K分;
○4由于每个量表的题目数量不同,各量表的原始分数无法比较,因此需要换算成T分数,根据公式计算结果,如果T分在70以上(按美国常模),或T分在60分以上(中国常模),便视为可能有病理性异常表现或某种心理偏离现象。
○5将各量表T分数(加K值后的T分数)登记在剖析图上,各点相连即成为被试人格特征的剖析图。
⑤对MMPI的评价 :
○1MMPI是目前国际上应用最广的人格测验,它适用于多种不同的情况,对于临床工作和离乱研究均不失为一项杰出的工具;
○2MMPI的各个分量表都是根据经验法编制的,而且对于分数的解释也是以经验为基础,较为客观,不像其它人格测验那样随意性大,故用此量表鉴别各种精神病患者,与临床诊断的符合率较高;
○3MMPI首次将效度量表纳入个性量表,并成为解释过程中的一个组成部分,提高了测验的诊断价值。
5、卡氏16种人格因素测验
①卡尔特的人格理论:他把每一个所具有的独特的特质称之为个别特质,一个社区或一集团的成员都具有的特质称之为共同特质。
②他把人的个性结构分为表面特质和根源特质,表面特质是指一个人经常发生的、从外部可以直接观察到的行为表现;根源特质是通过因素分析方法发现的,是制约着表面特质的潜在基础。
③卡尔特从许多人的行为表现中,共抽取出16种根源特质,他称之为个性因素,认为人的所作所为无一不受根源特质的影响。
③16种根源特质中,有的起源于体质因素,称为素质特质;有的起源于环境因素,称之为环境铸模性特质。体质因素和环境铸模性特质同动力特质、能力特质和气质特质有关。
6、测验的结构与施测方法:16PF英文原版共有5种版本,187个题目。16PF属于团体实施的量表,也可以个别实施。使用记分模版只能得到各个量表的原始分数,通过查常模表将其换算成标准分数(标准十分)。
7、次级人格因素:适应与焦虑性;内向与外向性;感情用事与安详机警性;怯懦与果断性。
8、艾森克人格问卷:分儿童(7-15岁)和成人(16岁以上)
①理论基础:艾森克所提出的人格三维度理论,他经过长期的实验研究和临床观察,提出精神质、神经质和内外向是人格的3个基本维度。
艾森克人格自陈量表得分的意义:
○1E(内向-外向):分数高表示人格外向,可能是好交际,渴望刺激和冒险,情感易于冲动。分数低表示人格内向,可能是好静,富于内省,除了亲密的朋友之外,对一般人缄默冷淡,不喜欢刺激,喜欢有秩序的生活方式,情绪比较稳定。
○2N(神经质):反映的是正常行为,并非指神经症。分数高者常常焦虑、担忧、郁郁不乐忧心忡忡,遇到刺激有强烈的情绪反应,以至出现不够理智的行为;分数低者情绪反应缓慢且轻缓,很容易恢复平静,稳重、性情温和、善于自我控制。
○3P(精神质):并非暗指精神病,它在所有人身上都存在,只是程度不同。高分者可能是孤独、不关心他人,难以适应外部环境,不近人情、感觉迟钝、与他人不友好、喜欢寻衅搅扰、喜欢干奇特的事情,并且不顾危险;低分者能与人相处,能较好地适应环境,态度
温和、不粗暴、善从人意。
E和N的关系图
将T分数落在±0.67个标准差之内的点作中间型解释,将T分数落在±0.67个标准差之外,±1.15个标准差之内的点作倾向型解释,将T分数落在±1.15个标准差之外的点作典型型解释。
9、爱得华个人偏好量表(EPPS):其依据是美国心理学家默里于1938年提出的需要理论。
①主要特点:是采用强迫选择法来控制社会称许性。
②局限:a强迫选择法得到的是自比分数,就是说每种需要的强度不是以绝对形式来表示,而是与个人其他需要的强度有关,即以相对形式来表示的;
b过于将注意力集中在控制社会称许性这一变量的影响上,必然会影响对测量不同特质的题目的选择;
c虽然EPPS中的社会称许性的影响比典型的人格测验小,但并没有完全消除;
d由于题目编制采用反复轮流配对的方式,因此被试极易厌倦和疲劳。
10、加州心理问卷(CPI):在美国是使用最广泛的测查正常人人格特点的量表之一。 CPI的施测与记分方法与MMPI相同,其常模分数也可以50平均数,10为标准差的T分数表示。
第三节投射测验
1、投射法:作为测验工具,主要是探讨个体内在隐蔽的行为或潜意识的、深层的态度、冲动与动机。
2、投射测验的特点:
①使用非结构任务作为刺激材料,这种任务允许被试有各种各样不受限制的反应;
②测量目标的隐蔽性:被试一般不可能知道他的反应将作何种心理学解释,从而减少了伪装的可能性;
③解释的整体性:它关注人格的总体评估而不是单个特质的测量。
3、投射技术的理论基础:精神分析技术强调人格结构的大部分是无意识成分,认为个人无法凭其意识说明自己,因而自陈法无法有效地了解人格结构,必须借助某种无确定意义(非结构化)的刺激情境为引导,才能使个体隐藏在潜意识中的欲望、需求、动机、冲动等泄露出来,或者说是被试不知不觉地投射出来。
4、投射测验假定:
①人们对外部事物的解释性反应都是有其心理原因的,同时也是可以给予说明和预测的;
②人们对外部刺激的反应虽然决定于所呈现的刺激的特征,但反应者过去形成的人格特征、他当时的心理状态以及他对未来的期望等心理因素也会渗透在他对刺激的反应过程及其结果之中;
③正因为个人的人格会无意识地渗透在他对刺激情境的解释性反应之中,所以,通过向被试提供一些意义模糊的刺激情境,让被试对这种情境做出自己的解释,然后通过分析他解释的内容,就可能获得对被试自身的人格特征的认识。
5、投射测验的分类:联想法、构造法、表露法、完成法。
6、罗夏测验:是一种投射技术,它是由瑞士精神病学家罗夏于1921年首创的一种测验。
记分方法:①反应的部位:主要有5个类别:
整体反应W:指被试的反应包括整个或几乎整个墨迹图,可能提示思维有过分概括的倾向;
明显局部反应D:被试以一般的局部作为反应部位,一定数量的D反应表示其有良好的知识水平;
细微局部反应d:指被试只利用了墨迹图中较小的但仍可明显区分的部分;
特殊局部反应Dd:对墨迹图不寻常部分作答,可能提示刻板的或不依习俗的思维;
空白部分反应S:回答包括墨迹图中的空白部分,或一个单独的空白处,或是几个空白相连。
②反应的决定因素:一般注意4个因素:
形状F:被试由于墨迹的整体或局部像某种事物而引起某种反应;
动作M:指被试在墨迹图中看到的人或动物的运动,通常是想像的或移情作用 的象征;
彩色C:被试的反应由墨迹的色彩决定,说明情绪健康;
阴影K:被试的反应决定于墨迹的阴影部分,视为焦虑的指标。
③反应的内容 :整个动物或某一部分、人的整体或某一部分、内脏器官、性器官、自然景物等。
④反应的普遍性也较常进行评分:P表示大部分人共有的回答,Q表示个人的回答。P回答多说明 对事物的看法与众相同,这种人是比较合群的;Q回答的多说明对事物有独特的见解,在病理时往往也多这一类回答,但多属离奇的。
7、主题统觉测验(TAT):是投射测验中与罗夏测验齐名的一种测验工具。测验材料由29张图片和 1张空白卡片组成,图片都是含义隐晦的情景。依被试的年龄和性别把图片组合为四套,分别用于 男人(M)、女人(F)、男孩(B)、女孩(G)。每套包括图片20张,分两个系列进行测验,故每个系列实 际上只用10张图片。施测时每个给予被试一张图片,让其编制一个300字作用的故事,说明图片 中所表现的是怎么回事,事情发生的原因是什么,将来演变下去可能产生的结果,以及个人感想等。
8、语句完成测验:是投射测验中较接近自陈问卷的测验,一般有2种形式:
①限制选择式:即在一句未完成的句子后面列数个短句,由被试从中选择一个能表达其情感的短句
作答;
②自由完成式:即用未完成的句子让被试进行补充,使之成为一个完整的句子,来表达个人的真实 感情。
9、对投射测验的评价:
①投射测验的优点:
○1可以对人格作综合的、完整的探讨,对被试的内心生活作深层次的探索,并作出动
态解释。
○2大部分的投射测验题目不显示任何测验目的,题目内容掩饰性好。
○3投射测验不受语言文字的限制,因而它的适用范围很广。
○4投射测验是心理学理论和实际相结合不可或缺的一种工具。
②投射测验的缺点:
○1评分缺乏客观的标准,难以量化。
○2大部分的投射测验缺乏充分的常模材料。
○3测验的信度和效度不易建立。
○4原理复杂深奥,不经过专门训练者不易使用。
○5与其他测验相比,被试的反应更易受实施情景的影响。
第四节人格测量的其他方法
1、知觉和认知测量中的场独立和场依存的测验
①在研究中,为了区分所谓“场独立”和“场依存”的被试 ,他们设计了3个测验:
身体调节测验:被试坐在一间倾斜着的房间中的椅子上,要求他调节椅子使其达到垂直位置;
镶嵌图形测验:要求被试在一系列复杂的图形中找出一个简单的图形,并记录反应时间;
标尺和框架测验:被试坐在暗室,面前一面斜置的发光的框架和标尺,让被试调节标尺使之水平垂直;
②典型的场独立的人是可靠的、独立的,心理成熟、自我环境,以理智思维作为防御机制,明暸自己的内部经验。
③典型的场依存的被试是不可靠的、心理不够成熟、被动的,内部经验不够协调,倾向于以压抑和否定作为防御机制。
2、Q分类技术:Q分类对研究自我概念的概念的测量及变化特别有用。经过心理治疗的个案,其现实自我与理想自我分类的结果一致性增加了。
第十二章 临床测验
1、临床测验 :
广义:所有有助于临床诊断之用的测验都可以称之为临床测验。
狭义:临床测验是指在专门为医学临床诊断和疗效评定而设计的测验,如神经心理学测验和心理健康问卷。
2、神经心理学测验的主要功能 :
①为大脑损伤病例给出定位诊断的症状学依据;
②提供药物和外科等其他治疗的疗效判定标准;
③为制定高级神经机能的神经康复治疗程序和措施提供心理学依据;
④检查操作本身也可转化为康复训练作业。
3、本顿视觉保持测验:是为评定视知觉、视觉记忆和视觉结构能力而设计的,已成为重要的临床检查和研究的工具。(记忆测验中的)
4、本德视觉运动格式塔测验(感知觉与思维测验中的):三种施测方法:
①临摹(复制):这是基本的或标准的方法,即主试逐个呈现9个样本图案,要求被试照图样临摹。
②加压法:在被试临摹时限定图画时间,使被试在自由临摹时不易显现的轻度认知困难,在催促的压力下将障碍暴露出来。
③记忆法:每张图画呈现5秒钟后移开,要求被试凭记忆默画出来,当默画完毕后,再将原图片呈现一次,让被试临摹,之后再移去样本,再一次凭记忆默画出来,统计默画出来的数目。
5、在临床工作中采用标准化、量化评定量表的检查方法,比一般检查方法的优点:
①量表同一的标准化检查程序,一般都是经过科学检验而比较严格的,因此,不同的检查者在检查中不容易遗漏症状;
②量表中的每一规定的项目或症状,都有其固定的含义,因此,可避免不同的检查者因对症状理解不一致而出现的误差;
③量表的评分,都有统一规定的评分标准,可使检查者评分的主观成分减低到最小;
④使用量表,由于临床资料的数量化,因此,便于统计学分析及处理;
⑤量表的检查,可以精确地反映症状、病情的客观动态变化,因此资料的可信性强。
6、症状资评量表 :
①90项症状清单(SCL_90) :量表有90个项目,5级评分制-没有、很轻、中度、偏重、严重。
② SCL_90的统计指标:
○1总分:90个项目单项分相加之和,能反映其病情严重程度。
○2因分子:共包括10个因子,即所有90个项目分为10大类。每一因子反映受检查者某一方面的情况,因而通过因子分可以了解受检者的症状分布特点,并可作廓图分析。量表作者并未提出分界值,按全国常模结果,总分超过160分,或阳性项目数超过43项,或任一因子分超过2分,可考虑筛选阳性,需进一步检查。
③抑郁自评量表(SDS):1965年编制。按照中国常模结果,SDS总粗分的分界值为42分,标准分为53分。
④焦虑自评量表(SAS):1971年编制。按照中国常模结果,SAS总粗分的正常上限为40分,标准分为50分。