心理测量

时间:2023.5.22

409出品 禁止盗版

心理测量复习题

第一章 单选

1.教育测验的奠基人是 (A)

A桑戴克 B赖斯 C爱德华 D比内 2.世界上第一个智力量表由 (A)

A比内—西蒙提出 B斯坦福---比内提出 C韦氏提出 D艾森克提出 3.心理测验是(C)

A无用 B万能 C尚待完善 D绝对公平 4.19xx年,在中国创刊的与心理测量有关的杂志为(A)

A《测验》 B《心理测验》 C《教育测验》 D《智力测验》

5.公元1370年笔试成为科举取士的一部分,这可视为(B)的正式开始

A 智力测验 B 能力倾向测验 C 成就测验 D 人格测验

6.19xx年修订的斯坦福--比内量表正式引入了(A)的概念

A 智力年龄 B 年级当量 C 比率智商 D 离差智商

7.将智力定义为“个体有目的的行动,理性的思考以及有效的适应环境的总体能力”的心理学家是(A)

A 韦克斯勒 B 斯皮尔曼 C 比内 D 桑代克

8.“心理测验”一词最早出现在(C)发表的《心理测验与测量》一文中。

A. 高尔登 B. 比内 C. 卡特尔 D. 推蒙

9.公元1370年笔试成为科举取士的一部分,这可视为(C)的正式开始 D 人格测验

10.在比内一西蒙19xx年的智力量表中首次使用了(A)的概念。 D离差智商

11.在心理测验的发展史上,弗兰西斯?高尔顿的主要贡献是(C)

A首次提出“心理测验”一词 B编制了世界上第一个正式的心理测验

C第一个倡导心理测验的人 D提出

“智力商数”的计算方法

12.首先倡导科学心理测验的学者是(B)。 A比奈 B高尔顿 C卡特尔 D皮尔逊 13下列陈述正确的是(B)。 A高尔顿修订了比奈-西蒙量表。

B卡特尔在《心理》杂志上发表《心理测验与心理测量》一文。

C皮尔逊第一个提出了相关的概念。 D比奈首先倡导科学心理测验。 14.人格测验的先驱是(C)。

A艾森克B罗夏 C克雷佩林 D韦克斯勒

15.测验史上,第一次对个体差异进行测量的人是(B)

A比奈 B高尔顿 C卡特尔 D铁钦纳 16.首创“心理测验”这一术语的是(A) A高尔顿 B比纳 C波林 D卡特尔 17.最早的智力测验是由(D)编制的

A卡特尔在1805年 B卡特尔在19xx年 C比奈在1805年 D比奈在19xx年 18.第一个团体智力测验是 (A) 。 A陆军甲种和乙种测 B多水平团体智力测验 C瑞文测验 D文化公平智力测验

19.韦克斯勒编制的第一个量表是(D)。 A.WAIS B.WISC C.WPPSI D.W-BI 20.瑞文标准推理测验是 (C) 测验。 A成就测验 B言语智力测验 C非言语智力测验 D投射测验

21.世界上第一个智力测验的编制者是(D) A高尔顿 B卡特尔 C波林 D比奈

22.智力是信息加工的能力,这种观点的代表人物是(D)

C推孟 D斯腾伯格

23.第一次采用智力商数表示智力发展的相对水平的是(B)

C.韦克斯勒智力量表 D.认知诊断成套测验 24.人格测验的先驱是(A) A克雷佩林 B比奈 C卡特尔 D高尔顿

25.比较常用的形容词检核表(ACL)的编制者是(B) A卡特尔 B高夫 C克瑞普林 D艾森克

A 智力测验 B 能力倾向测验 C 成就测验 A桑代克 B比奈

A智力年龄 B智力商数 C比率智商 A.比奈-西蒙量表 B.斯坦福-比奈量表

- 1 -

409出品 禁止盗版 26.首先倡导测验运动的学者是(A) A卡特尔 B克雷佩林 C高尔顿 D西蒙

27.1890年在《心理》杂志上发表"心理测验与测量"一文的作者是(B)

A高尔顿 B卡特尔 C比奈 D冯特 28.19xx年推孟修订的斯坦福-比内量表的最大改变在于采用(A)

A智力结构 B智力层次 C离差智商 D比率智商

29.卡特尔16人格因素测验(16PF)的编制方法是(C)

A理论推演法 B经验效标法 C因素分析法 D序列系统法

30.下列智力测验中,属于非言语类测验的是(D) A比纳——西蒙智力量表 B韦克斯勒智力量表

C斯坦福——比纳智力量表 D瑞文推理测验

多选在每小题列出的四个备选项中至少有两个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选、少选或未选均无分。 1.下列测验中,属于人格测验的是(ABC) A EPQ B 16PF C MMPI D TAT

2.纵观中国古代心理测量的思想,我们不难看出其中包含着典型的东方文化特点,即(AC) A. 定性描述 B. 定量评估

C. 带有道德判断的色彩 D. 具有非道德判断的色彩

3.下列测验中,属于投射测验的是(BC) A、语义区分测验 B、主题统觉测验 C、语句完整测验 D、显相焦虑表

4.英国生物学家和心理学家高尔顿(F.Galton)的主要贡献有(ABC)。

A.提出人的不同气质特点和智能是按身体特点的不同而遗传的

B.为了研究差异的遗传性,设计了测量差异的方法

C.为心理测验奠定了统计学基础,第一个提出了相关的概念

D.创立了积差相关法

5.美国心理学家卡特尔(J.M.Cattell)对促进心

理测验发展做出的巨大贡献是 (ABD)。

A.使心理测验首次出现于心理学文献中 B.认为心理学应立足于实验和测验 C.为智力测量制定了常模 D.认为心理测验应有统一的标准

6.20世纪以后,心理测验在(ABCD)等方面取得了长足发展。

A.操作测验 B.团体智力测验 C.能力倾向测验 D.人格测验

7..下列各项测验中只能作个别施测的有:(AB) A.罗夏墨迹测验 B.MMPI

C.比内—西蒙智力测验D.韦克斯勒智力量表 8.下列五种测验中属于人格测验的有:(ABCD) A. 主题统觉测验 B.罗夏墨迹测验 C..MMPI D.16PF

9.采用韦氏成人智力量表可得到以下几个智力商数:(ABD)

A.总体智商 B.言语智商 C.算术智商 D.操作智商 10.中国古代心理测量方法(ABD)

A.观察法 B.访谈法C.实验法 D.自然测验法 填空

1.默瑞和摩根19xx年编制的投射测验被称 为测验。(主题统觉)

2.19xx年, 先生发表了《订正比内西蒙智力测验说明书》,30年代又与(吴天敏)再次做了修订。(陆志韦)

3.在中国古代,中能说是圣人贤哲的言谈或著作中有 的思想体现。(因材施教) 4.中国古代最值得称道的心理与教育测量的实践活动是初萌于商周,兴盛于隋唐的 制度。(科举)

5.中国古代的医书《皇帝内经》中曾把人分成太阴、

太阳、少阴、少阳、阴阳和平五种,这实际上是 的思想。(人格分类)

6.我国古代教育家孔子曾把人分为中人、中人以下、中人以上,这实际上相当于测量学中的命名量表和 。(顺序量表)

7.卡特尔于1890年发表了《心理测验和测量》一文,首创了 这个术语。(心理测量) 8.著名美国学者波林指出:“在测验领域,19世纪80年代是高尔顿的十年,90年代是卡特尔的十年,20世纪头十年则是 的十年。(比奈)

- 2 -

409出品 禁止盗版 9.卡特尔的学生桑代克等人利用心理测验原理,编制了第一批 ,被人称为教育测验的鼻祖。(标准化的教育测验)

10.19xx年,世界上第一个智力测验发表了,人们称之为 。(比奈—西蒙量表) 11.韦氏成人智力量表修订本将原始分转化为量表分后,查相应年龄的IQ表,便可得到三个智力商数: , 和 。(言语、操作和总体)

12.公元六世纪初,南朝人刘勰的著作《新论·专学》中提到了类似现代“ ”的思想。(分心测验)

13.默瑞和摩根19xx年编制的主题统觉测验的英文缩写为 。(TAT)

14. 所著的《人物志》是一部论述能力问题的古代专著,也是第一本能力测量的书。(刘勋)

15.刘勋认为“众人之察,不能尽备”,只能“观其的测量是一致的。(行为样组)

16.高尔顿在1893年出版的《人类能力及其发展的研究》一书中,首次提出了 和测验这两个术语,堪称直接推动心理测验产生的第一人。(心理测量)

17.现代精神病学的创始人、人格测验的先驱是 。(诶米尔·克雷佩林)

18. 被称为心理测量的鼻祖,是发明智力测验常模量表第一人。(比奈)

19.19xx年,英国心理学家瑞文出版了 ,是一个著名的非文字智力测验。(瑞文标准推理测验)

20.客观的标准化教育测验的最初尝试者是英国格林威治医院的教师 。(费舍)

一书,是关于测验理论的第一部著作。(心理与社会测量导论)

22. 被认为是客观化和标准化的人格测验,在人格测验中占主导地位。(自陈量表) 23.心理测验始于__________,20年代进入狂热,40年代达到顶峰,50年代后转向稳步发展。(20世纪初)

24心理测验始于20世纪初,20年代进入狂热,___________达到顶峰,50年代后转向稳步发展。(40年代)

25.心理测验始于20世纪初,20年代进入狂热,40年代达到顶峰,_________后转向稳步发展。(50年代)

26.心理测验运动始于______________。(比奈量表的出现)

27.19xx年,美国斯坦福大学_______教授修订的斯坦福——比奈量表,使智商一词为全世界所知。(推孟)

28.19xx年,英国心理学家瑞文出版了瑞文标准推理测验,这是一个非常著名的非文字智力29.测验,既可以用于个别测验,又可以用于________。(团体测验)

30.奥斯蒂编制出的团体智力测验扩大了测验的应用范围,应用在______________和分派兵种的选择上。(官兵选拔)

31.19xx年,伍德沃斯编制了第一个现代意义上的人格问卷,即________,该量表后来一直被奉为情绪适应调查表的范本。(伍德斯沃个人资料调查表) 1.自陈量表:问卷包括100多个关于精神病症状的问题,让被试根据自己的情况回答,称为自陈问卷。 简答

1.简述西方早期心理测验产生的原因。 答案:

(一) 在西方一些国家,工业革命成功后,对劳动力的需要急剧增加,工厂大量采用童工,许多地方官与工厂主订约,每雇20个童工,必需带一个低能者。

(二) 19世纪,由于社会上对智力落后和精神失常者实行人道主义在欧洲和美洲开设了一些护理精神病人的特别医院,因而急需确定收护标准和客观化的分类方法,首先必须区分精神错乱者与智力落后者。

因而有了专才训练与职业指导的需要,这也是促使测验发展的重要因素。特别是后来各种特殊能力倾向测验更是直接应实践的需要而产生的。 2. 请简要论述心理测验在发展的过程中受到哪些因素的影响 答案:

心理测验的发展主要受两方面因素的影响,即: (一)心理学理论的发展

(1)19xx年英国心理学家斯皮尔曼提出智力的二因素论,认为人的智力可分为普通因素和特殊因素

感变,以审常度”,这与现代心理测验中对 名词解释

21.19xx年,美国心理学家桑代克出版了 (三) 另外,随着工业的发展,社会分工日益精细,

- 3 -

409出品 禁止盗版 两部分;

(2)20世纪30年代智力的多因素论兴起,瑟斯顿由因素分析求得七种基本智力因素,随之发展出一批多重能力倾向测验;

(3)60年代美国加州大学教授的智力结构理论提出发散思维为智力的因素之一,从而开拓了创造力测量的新领域。

(二)统计学方法的进步

20世纪30年代后,因素分析法盛行,推进了能力测验的发展,促进了人格理论和人格测验的发展 3.请简述中国古代心理测量方法及其优缺点 答案:(一)观察法

优点:是科学研究方法的第一步,其特点

是直接和描述性;

帮助研究者提供和限定研究范围; 缺点:观察法无法让研究者对各因素间的关系作出推论;

观察法有时提供的资料并不充分; 观察法的描述性限制常常被忽略; 观察法本身并不一定客观无偏; (二)访谈法

优点:直接,主试对被试有较多的观察与控制机会

缺点:比较费时,不易进行大规模测量; 对主试有较高的要求; (三)自然测验法

优点:更好的控制变量,经济; 能正确解释变量的因果关系; 缺点:容易受到无关变量的影响; 实验的前期准备比较复杂 4.简述心理测验的发展历史的特点 答案:

(一) 先是以解剖生理特征为根据,而后转向对心智活动的测量。

(二) 由测量简单的感知能力,发展到测量复杂的认知能力。

(三) 由笼统的单一量数以评定个别间差异的观念,转变为以多个量数兼顾个别差异与个别内差异的观念。

(四) 心理测量学是随着实验心理学的发展而产生的,二者在发展过程中由合到分,最后又走到一起来了。

5.简述韦克斯勒智力量表的特点 答案:

(一) 在19xx年出版的WISL中用离差智商代替比率智商。

(二) 由各个分测验结果可以得到言语、操作和总体三个分数,既可以区分个别间差异,又可以评定个别内差异。 第二章 单选

1.心理测量所用的参照点(B) A.只有绝对零点B.只有相对零点

C.不存在零点 D.有相对零点,也有绝对零点 2.测验的客观性实际上就是(D)问题

A.刺激的客观性 B.反应量化的客观性 C.结果推论的客观性 D.测验的标准化

3.任何测量进行多次,其结果不会完全一致是指(B)

A.绝对性B.测量误差C.相对性D.间接性 4.当被试人数较多,测验时间和经费又有限时,最好选用(B)测验

A.个别 B.团体 C.速度 D.投射

5.在测试过程中能以团体方式进行的测验是(D) A.操作测验 B.投射测验 C.韦氏智力量表 D.大学入学考试测验

6.测验的客观性不包括(C)的客观性 A.测验的刺激 B.对反应的量化 C.绝对的标准 D.对结果的推论 7.在顺序量表中,变量具有(C) A.相等单位 B.绝对零点 C.等级 D.可以做加、减、乘、除 8.一般来说,心理测量是在(B)量表上进行的 A.命名 B.顺序C.等距 D.等比

9.学校运动会排出了全校各班级的名次,未报出各班的得分,用的是(D)

A.命名量表 B.等距量表 C.等比量表 D.顺序量表 10.心理测量的参照点是(D)

A.人定零点 B.绝对零点 C.人定零点和绝对零点 D.不能确定 11.一般而言,心理测验的分数属于(C) A.类别量表 B.等级量表 C.等距量表 D.比率量表

12.狭义的心理测量是指以(B)为工具的测量 A.调查B.测验C.实验 D.口试

13.(B)测验通常用于预期个体在职业、训练课程或教育中的成功

- 4 -

409出品 禁止盗版 A.智力B.性向(能力倾向) C.成就 D.推理 14.下列对测量的描述,正确的是(B)

A.测量就是心理测量 B.就是依据一定的法则用数字对事物加以确定

C.就是用数字来描述事物的法则 D.测量就是用一些题目或数字来描述事物的属性

15.参照点就是确定事物的量时,计算的(A) A.起点B.中点 C.终点D.重点

16.用1代表男,用2代表女等等,这样的量表通常叫做(A)量表

A.命名B.顺序 C.等距D.等比

17.我们通常将学生的考试结果按名次排序,这些名次属于(B)变量

A.命名B.顺序 C.等距 D.等比

18.0℃并不意味着没有温度,这种说法(C) A.错 B.不确定C.对D.不存在

19.其数值可以进行加、减、乘、除运算的量表是(D)

A.命名量表 B.顺序量表 C.等距量表 D.等比量表

20.关于心理测验,下列说法中正确的是(D) A.将具有代表性行为构成的项目集,对代表性人群进行测试,标准化后的数量化系统。

B.用标准化测验或量表,在标准情境下,对人的外显行为进行观察,并将结果按照数量或类别加以描述的过程。

C.对心理的某方面品质,采用多种手段进行系统地观察和综合评价

D.就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点作出推论和数量化分析的一种科学手段。

21.测验的客观性不包括(C)的客观性 A.测验的刺激 B.对反应的量化 C.绝对的标准 D.对结果的推论 22.错误的测验观不包括(D)

A.测验万能论 B.测验无用论 C.心理测验即智力测验 D.以上一个也不是 23.心理测验所测验的是(C) A.智力本身 B.人格本身 C.心理现象的外显行为 D.情绪与情感 24.测验的客观性实际上就是(D)问题 A.刺激的客观性 B.反应量化的客观性 C.结果推论的客观性 D.测验的标准化

25.对命名量表描述错误的是(D)

A.用数字代表某事物或者某种属性的全体 B.是测量水平最低的一种形式

C.数字只用来作为标记和分类 D.可以进行数量化分析

26.心理测量按功能分类不含有(D)

A.智力测验 B.特殊能力测验 C.人格测验 D.团体测验

27.甲乙两地的温度分别是20℃和15℃,采用等距量表(B)

A.其绝对的零点是0℃ B.甲乙两地的温差是5℃

C.甲地的温度是乙地的D.0℃就是没有温度

28.有相等单位但没有绝对零点的量表是(C) A.等级量表B.顺序量表 C.等距量表D.比例量表 29.理想的评价量表是一种制作(C)的直接方法 A.称名量表B.顺序量表C.等距量表D.等比量表 30.心理测验按功能分类不含有(D) A.智力测验 B.特殊能力测验 C.人格测验 D.团体测验 31.心理测验的性质不包括(C) A.间接性B.相对性C.直接性D.客观题 32.下面(D)是按测验的目的分类的

A.个别测验B.团体测验C.文字测验D.描述性测验 多选

1.测量所用的数字具有自然数特点,即具有(ABCD) A、区分性 B、顺序性 C、等距性 D、可加性 2.任何测量都应具备的要素是(BD) A、量表B、参照点C、等级D、单位 3.参照点有两种即(AB) A、绝对零点 B、相对零点 C、绝对定点 D、相对定点

4.测量所用单位,好的单位应具备有(CD)条件 A、确定大小 B、相同意义 C、确定意义 D、相同价值

5.心理测量具有独特的性质即具有(ABC) A、间接性 B、相对性 C、客观性 D、外显性 6.从心理测验的观点来看,能力可分为(AB) A、实际能力 B、潜在能力 C、普通能力 D、特殊能力

7.按测验目的可把心理测验分为(ABC) A、描述性测验 B、诊断性测验 C、预测性测验 D、个人测验

1.33

- 5 -

409出品 禁止盗版 8.按测验性质 可把心理测验分为(CD) A、标准化测验 B、教育测验 C、构造性测验 D、投射性测验 9.测验在理论研究中的应用有(ABC) A、搜集资料 B、建立假说 C、实验分组 D、得出结论

10.按测量结果的评价标准可把心理测验分为(AD) A、常模参照测验 B、标准化测验 C、非标准化测验 D、标准参照测验 填空

1.狭义的心理测量是指以_______为工具的测量。(测验)

2.用1代表男,用2代表女。这样的量表通常叫_______量表。(命名)

3.其数值可进行加、减、乘、除运算的量表是_______量表。(等比)

4.一般来说,心理测量是在_______变量上进行的。(顺序)

5.当被试人数较多,测验时间与经费又有限时。最好选用_______测验。(团体)

6.我们通常将学生的考试结果按名次排列,这些名次属于_______ 变量。(顺序)

7.测量就是根据一定的法则用_______对事物加以确定。(数字)

8.计算事物的量的起点是_______。(参照点) 9.心理测量的性质是_______、_______、_______。(间接性,相对性,客观性)

10.测验的编制,实施,计分,解释等程序的一致性指的是_______。(测验的标准化)

11.测验在理论研究中的应用是_______、_______、_______。(收集资料,建立和检验假说,实验分组) 12.能力测验可分为_______、_______ 。(普通能力测验,特殊能力测验)

13.非标准化的测验是指不符合_______的测验。(标准化的程序)

14.测验分数在某一常模团体的分布形态指的是_______。(常模)

15.按测验目的可把心理测验分为_______ 、_______、_______ 。(描述性测验,诊断性测验,预测性测验)

16.单位需要具备的条件有_______、_______。(确定的意义,相等的价值)

17.心理测验在实际工作中的应用有_______、选人、安置、_______、_______、预测。(诊断,评

价,咨询)

18.按测验的难度和时限把心理测验分为_______、_______。(速度测验,难度测验)

19.要求被试按通常的习惯方式做出反应,没有正确答案的测验是_______测验。(典型作为测验) 20.个别测验的缺点是_______ 、_______。(费时,对主试要求高)

21.文字测验又称_______ 。(纸笔测验) 名词解释

1.测量:测量就是根据一定的法则用数字对事物加以确定。“一定的法则”是指在测量时所采用的规则或方法。“事物”是指我们所感兴趣的东西,即引起我们所感兴趣的事物的属性或特征。“数字”是代表某一事物或事物某一属性的量。

2.参照点:参照点是计算事物的量的起点。有两种:绝对零点和相对零点。

3.量表:要测量某个事物,必须有一个定有单位和参照点的连续体,在连续体上把事物的属性表现出来,这个连续体称为量表。即测量的量表是指在进行测量时体现了测量规则的连续体。

4.心理测量:心理测量就是根据一定的法则用数字对人的行为加以确定。即根据一定的心理学理论,使用一定的操作程序,给人的行为确定出一种数量化的价值。

5心理测验:通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。它具有间接性,相对性和客观性的特点,测量的是人的行为;不可能是全部的领域,包含的只能是人全部可能项目中的一个样本;在编制,施测,评分和解释项目的取样都依据一套系统的程序。它是心理测量的一种工具,是根据一定法则对人的行为用数字加以确定的方法。

6.特质:特质是描述一组内部相关或内在联系的行为时所使用的术语,是在遗传与环境影响下,个人对刺激作出反应的一种内在倾向。

7 实际能力和潜在能力:实际能力是指个人当前的能力,代表个人已有的知识﹑经验技能,是正式与非正式学习或训练的结果。潜在能力是指个人将来可能有的能力,是在给予一定的学习机会时,某种行为可能达到的水平。

8.成就测验:成就测验主要用于个人(团体)经过某种正式教育或训练之后对知识和技能掌握的程度,因其所测的主要是学习成绩吧,所以又叫学绩

- 6 -

409出品 禁止盗版 测验。

9.标准化测验和非标准化测验:标准化测验是指从编制到实施都严格遵循测量理论并严格控制与测验目的无关因素影响的测验。非标准化测验是指不符合标准化程序的测验。

10.常模参照测验:常模参照测验是指以常模作为评价测验分数优劣标准的测验。

11.标准参照测验和标准:标准参照测验在对测验结果进行评价时不以常模为标准,而是根据特定的操作或行为标准,对个体做出是否达标或达到什么程度的判断。标准是指在编制测验和解释测验时所依据的知识和技能领域。 简答

1.什么是标准性参照测验和常模性参照测验?比较其异同。并举例说明。 答案:

(一) 标准性参照测验的定义。这种测验是将被试的分数与某种标准进行比较来解释,这种测验常常用来检验学习效果,看对指定内容范围掌握得如何达到某一标准衡量测验优劣的主要指标是内容效度。 (二) 常模性参照测验的定义。这种测验是将一个人的分数与其它人比较,看其在某一团体中所处的位置。也就是把受测者的成绩与具有某种特征的人所组成的有关团体作比较,根据一个人在团体内的相对位置来报告他的成绩。常模就是指具有共同特征的人组成的一个群体。

(三) 两种测量相同:两种测验是根据对测验分数的解释参照不同划分的。标准参照性测验是将测验结果同事先规定的标准进行比较,对被试个体的分数做出解释,而常模参照测验是将测验分数参照常模加以解释,也就是将每一个人的分数同团体中的其他人进行比较,这是一种相对比较。

2.什么是速度测验和难度测验?两者的区别是什么。 答案:

速度测验和难度测验是按测验的难度和时限划分的。

(一) 速度测验和难度测验的分别的含义。 (二) 两者的区别 (1)

测量的目标不同

验难度相等,但严格限制时间,看规定时间内所完成的题目数量。一般题目都很容易,只要给够时间,每个人都能完成。但是它就是在题目数量多,时间短的情况下来检测被试的反应速度。测验分数的高低完全依赖反应速度。在这类测验里几乎没有人能全部做完所有题目。 b)

难度测验是不限时间,即一般每一题都有时

间去做,它包括不同难读的题目,由易到难的排列,有最难的题目,几乎所有的被试都解答不了,但给充分的时间,让被试有机会做所有的题目,并在规定时间内做完会做的题目。所以这类测验检测解答难题的最高能力。但有些题目不见得能做出来,它的时间限制的标准通常是使95%的被试都有做完测验的机会。

3.简述标准参照测验及其特点。 答案:

(一) 标准参照测验在对测验结果进行评价时不以常模为标准,而是根据特定的操作或行为标准,对个体做出是否达标或达到什么程度的判断。 (二) 特点 (1)

在编制之前必须对所有测量地内容范围

作出清晰地界定,并给予严格的操作定义,测量题目的选择限制在这样的内容范围之内,并且构成测验所有题目,必须是所依据的内容范围中去,从而可以对被试在所测内容范围中的掌握水平作出评价。 (2)

标准参照测验的目的一般在于了解被试

在某一行为领域的绝对水平,从而判定他是否达到了此项行为的最低标准,标准参照测验的分数界点的确定是建立在内容范围的明确界定基础的。标准参照测验的主要目的在于了解个体所规定的测量内容上的行为水平,其出发点是个体本身的绝对水平,而不是个体间的差异。

4.按测验的性质分类,可以分为哪两类? 答案:

可分为构造性测验和投射性测验。

(一) 构造性测验有清楚的内容结构,测验所呈现得刺激和被试的任务都是明确的测验的记分和解释都有严格的规定。所得数据比较可观,但缺点也比较明显,被试回答受主观色彩影响,受社会道德的制约。

(二) 投射性测验目的是让被试在无意中将自己内心深处的欲望,观念,情绪,动机,态度等投射在反应中,以便主试对被试的心理做深层次的分析。

速度测验测得是被试的反应速度,而难度测验测的是被试解题的最高能力。 (2) a)

测验限定不同

速度测验在于测量被试作业的快慢,它的测

- 7 -

409出品 禁止盗版 这种测验中的刺激没有明确的意义,问题模糊,对被市的反应也没有明确规定。

5.使用心理测验中的行为样本有哪几点内在要求? 答案:

(一) 首先,在测量或界定一个特定属性的行为是,心理测验并非测量所有可能出现的行为。例如假设你打算开发一个测量个体写作能力的测验,一个策略就是从个体的学期论文或系目清单中收集 个体已经写出的任何东西并对此评价。这种程序可能会很精确,但不实际。相反,心理测验会通过努力收集一个系统的行为样本,使得这个繁琐的程序达到最优化。在这种情况下,一个写作测验包括一系列短文,样本文学,备忘录等诸如此类的东西。 (二) 采用行为样本测量心理变量的第二个内涵是,一个测验的质量主要是有样本的代表性所决定。测验中的行为必须能够代表在测验情形之外出现的行为。要求不同寻常的或独特反应的测验,不适用于要求对问题或情形的反应与日常生活可观察的反应相类似的测验。 第三章 单选

1.既影响效度也影响信度的误差有(A)

A.随机误差 B.系统误差 C.抽样误差 D.评分误差 2. 经过无数次测量所得到的平均值,即为(C) A.常模分数 B.团体分数 C.真分数 D.实得分数 3. 测量的随机误差(C)

A.是恒定的 B.方向是一致的 C.是由偶然因素引起的 D.,导致整体测验分数会降低 4. 系统误差影响测量的(A)

A.准确性B.一致性C.准确性和一致性D.信度 5. 经典测验理论假定,观察分数与真分数之间是(B)的关系。

A.相关为零 B.线性

C.相差一个常数 D.相差一个系统误差 6. 以下哪些不属于测量的随机误差来源(D) A.测试环境的干扰 B.测试时间的干扰 B. C.意外干扰 D.被试引起的误差 7. 测量的系统误差来源不包括(D) A.测验自身引起的误差 B.应试动机 C练习效应 D.测试环境的干扰

8.下列哪一项是经典测验理论的不足 (A)

B.能力参数估计不变性 C.

D.能力估计的精确性

9.下列哪一项不是项目反应理论的优点(A)

A测量结果拓宽的有限性,预测力缺乏 B.能力参数估计不变性 C.

D.能力估计的精

10. 在IRT中,基本假设不包括(B)

A.潜在特质空间的单维性假设 B.整体独立性假设 C.

线

D.非速度限制假设

11.CTT与IRT的相同点是(B) A.主

B.核心部分都是数学模型 C.

D.能力参数估计的不变性 12.下列情况中(A)是系统误差

A.在测验分数公布之后,发现制定的标注出现了错误

B.考试时突然有人闯入,打扰了考生 C.阅卷老师身体不适

D.有几道数学考卷中,小数点印刷不清

13.在评定量表的误差中,对一个人总的看法影响了对具体特质的评定,这种误差是(C) A.严格误差 B.逻辑误差 C.认知误差 D.光环效应 14.重测信度考虑的误差来源是( C ) A内容取样B时间取样C随机误差D评分者误差 15.. 如果某测验的信度系数为0.08,那么该测验中真分数造成的变异占( C )

A 80% B 20% C 64% D 36% 16. 被试的反应定势可以具体分析为多种,其中包括( D )

A 求“快”定势 B 位置定势 C喜好正面叙述的定势 D 长选项定势 17.复本信度,又称等值性系数,其考虑的误差来源是( C )

A 内容取样B时间取样C 随机误差 D 评分者误差 18.下列哪一步属于记分的一般程序?( C ) A 记录被试反应 B 参考标准答案 C 建立常模标准 D 计算最后得分

A.测量结果拓宽的有限性,预测力缺乏 19.智力是信息加工的能力,这种观点的代表人物

- 8 -

409出品 禁止盗版 是(D )

A.桑代克 B.比奈C.推孟 D.斯腾伯格 20.《中国比奈测验》的测试对象的年龄范围是( C )浙江省06年4月高等教育自学考试 A.1-15岁 B.1-30岁 C.2-18岁 D.2-20岁 21.根据林德西对于投射测验的分类,罗夏墨迹测验属于( A )

A.联想法 B.构造法 C.完成法 D.选排法 22.心理测验的三个基本特点是( B )浙江07年4月高等教育自学考试心理测量试题 A.间接性、绝对性、客观性 B.间接性、相对性、客观性 C.直接性、绝对性、主观性 D.直接性、相对性、主观性

23.当目标总体很大时,我们可以按照一定规则对目标总体进行分组,再在组内随机抽样,这种抽样方式称为( D ) 20xx年北京市自考心理测量试卷

A.简单随机抽样B.系统抽样 C.分组抽样 D.分层抽样

24.19xx年推孟修订的斯坦福-比内量表的最大改变在于采用( C )

A.智力结构 B.智力层次 C.离差智商 D.比率智商

25.确定内容效度的主要方法是(B ) A.统计分析 B.专家判断 C.经验判断 D.复本信度

26.从逻辑上分析,同时效度和预测效度的主要差别是(D )

A.测验目的 B.测验内容 C.测验方法 D.效标获得的时间 27.正确对待心理测验的态度应该是(D) A.万能 B.无用 C.绝对公平 D.尚待完善 28.智力年龄、年级当量和发展顺序量表称之为(A)20xx年北京市自考心理测量试卷

A.发展常模分数 B.百分位常模分数 C.标准分数 D.参照效标分数 29.凡是平均数为5,标准差为2的标准分数,一般我们都成为( C )

A、 Z分数 B、T分数 C、标准九 D、标准十 30.在心理测验的发展史上,第一个倡导心理测验的心理学家是( A )

A、高尔顿 B、卡尔特 C、比内 D、冯特 多选

1.经典测验理论假定,观察分数与真分数之间是(BD)的关系。

A.相关为零 B.线性 C.相差一个常数 D.相差一个随机误差

2.与经典测量理论的真分数模型有关的假设是(BC)

A.真分数和观察分数之间的相关为零 B.真分数与误差分数之间的相关为零 C.各平行测验上的误差分数之间相关为零 D.多次观察分数之和接近真分数

3. 经典测验理论的基本思想是把任何一个测验成绩都看作是(BD)的和 A.真分数和系统误差 B.真分数和随机误差

C.真分数、随机误差和系统误差 D.有效变异数、系统误差和随机误差 4. 下列情况中(AB)不是系统误差

A.在测验分数公布之后,发现制定的标注出现了错误

B.读卡机选择题的程序中少编进了一道小题 C.阅卷老师身体不适

D.有几道数学考卷中,小数点印刷不清 5. 测量误差的种类有(ABC) A.随机误差 B.系统误差 B.C.变量误差 D.其他误差

6. 以下哪些属于测量的随机误差来源(ABC) A.测试环境的干扰 B.测试时间的干扰 C.意外干扰 D.被试引起的误差 7. 测量的系统误差来源主要有(AB) A.测验自身引起的误差 B.应试动机 B. C.评分计分 D.测试环境的干扰 8. 经典测验理论的不足有(ABCD) A.统计量的样本依赖性,抽样变动大 B.能力与难度量表的不一致性,测量误差大 C.信度估计的不精确性,复本施测难 D.测验结果拓宽的有限性,预测力缺乏 9. 项目反应理论的特点有(ABCD) A.能力参数估计不变性 B.B.项目参数估计的不变性

C.能力估计的不变性 D.测验编制应用的价值性

10. 在IRT中,基本假设主要有(ABCD) A.潜在特质空间的单维性假设B.局部独立性假设 C.项目特征曲线假设 D.非速度限制假设

- 9 -

409出品 禁止盗版 填空

1. 引起的误差是测量工作中最复杂和最难控制的一类误差。(测量对象或被试本身 ) 2.测量理论一般分为 、概化理论和项目反应理论三大类。( 经典测量理论)

2.测量误差:指在测量过程中,那些与测量目的无关的因数所导致的测量结果不准确或者不一致的效应。

3.抽样误差 :又叫取样误差,是由抽样变动引起的误差。抽样误差与取样方法及样本容量有关。 4.系统误差:是指由与测量目的无关的因素引起的

3.引入真分数的心理学家是 (斯皮尔曼) 一种恒定而有规律的效应。这种误差稳定地存在于4.当观察分数接近真分数时,就是说这次测量的误差较 。(小)

5.项目反应理论又称为 或潜在特质理论。(题目反映理论)

6.IRT的理论假设建立在 基础上。( 数学统计模式 )

7.IRT中,四条基本假设是潜在特质空间的单维性假设、局部独立性假设、 和非速度限制假

每一次测量当中,尽管测量的结果比较一致,但实测结果与真实水平之间存在差异。

5.随机误差:是指那些与测量目的无关的偶然因素引起的误差,使多次测量产生了不一致的结果,并且这些结果的方向和大小也是随机的。

6.实测分数:把对某一对象实际进行测量时直接获得的值称为实测分数,或实测值或观测分数(X)。 7.测量误差:实测分数与观察分数的差被称为测量

设。(项目特征曲线假设) 误差。 8.IRT是以项目特征曲线和 等概念为理论构架,依据强势假设来发展其理论模式。 (潜在

8.真分数:被试在某种程度上所具有的稳定的心理特质被称为真分数,也称真值

特质 ) 9.观察分数:把实测的分数称作该特质的观察分9.误差可以分为随机误差和 。(系统误差) 数。 10.心理测量误差的来源 、测量对象和测量过程。(测量工具)

11.心理测量工具通常是一套以 为核心的刺激反应系统。(测验 )

12.测量工具所造成的误差主要来自于测验的编制过程,其中 的影响最大。(项目取样) 13. 是指被试在应试前和应试中所出现的一种紧张的、不愉快的情绪体验。(测验焦虑) 14.经典测量理论的基本思想是把任何一个测验成绩看作是 和测量误差的和。(真分数 15.项目反应理论的特点:能力参数估计的不变性、项目参数估计的不变性、 和编制测验的应

10.应试动机:受测者接受测验的动机不同,会影响其作答态度、注意力、持久性、反应速度等,从而影响测验成绩。

11.标准化:测验的编制、施测、评分及对分数的解释都必须标准化,这样才能够有效控制导致误差的因素,以减少误差,使测验分数更可信、更有效。 12.变异:指同种生物后代与前代、同代生物不同个体之间在形体特征、生理特征等方面所表现出来的差别。

13.测验焦虑:是指被试在应试前和测试中所出现的一种紧张的、不愉快的情绪体验。焦虑的产生既有认知因素的作用,也有生理因素的作用。

用价值。 (能力估计的精确性) 14.经典测验理论:人们将以真分数为核心架设的16.IRT的核心是 。(能力估计的精确性) 测量理论及其方法体系,统称为经典测验理论,也17.随机误差影响测验的一致性和准确性,而系统误差只影响测验的 。(准确性)

18.真分数的操作定义是无数测量结果的 。(平均值) 关系。(线性)

20.测验标准化包括测验的 、施测、评分及对分数解释的标准化。(编制) 名词解释

1.误差:误差是由于各种因数造成的测量误差。

称为真分数理论。

15.项目反应理论:也称潜在特质理论或潜在特质模型,是一种现代心理测量理论,其意义在于可以指导项目筛选和测验编制。项目反应理论的特点:能力估计的精确性、测验编制应用的价值性。 16.项目参数不变论:项目参数估计与所使用的被试样本无关。

17.项目特征曲线:又称为“知道——正确假设”,及被试知道某一项目的正确答案,他必然答对,换

19.经典理论假定,观察分数与真分数之间是一种 能力参数估计的不变性、项目参数估计的不变性、

- 10 -

409出品 禁止盗版 句话说,若答错某一项目,则他必然不知道答案。 18.练习效应:练习效应,心理学实验当中的一种误差来源。指实验中,被试由于多次重复同样的程序,实验成绩提高或降低的现象。可以通过合理安排休息、随机安排刺激序列等方式避免或平衡这一效应带来的误差。

19.非速度限制假设:又叫无时间限制假设,即测验的进行是在没有时间限制的条件下完成的,被试在项目反应上不理想,是由于能力不足引起的,而不是由于时间不够所致。

20.单维性假设:指假定同一测验都在测单一向度,即测验中的每一个项目都测量到同一种共同的潜在特质。也就是说如果被试对一个测验的项目的反应是由他的K种潜在特质所决定的,那么这些潜在特质就构成了一个K维潜在空间,被试的各个潜在特质分数综合起来,就决定了该被试在这一潜在空间的位置。当且仅当这个空间的全部特质都被确定以后,这个空间才是完全的。 简答

1.试简述误差的来源。 答案:

在物理测量中,误差来源主要有3个,即测量工具、测量对象和测量过程。当被测试对象本身不稳定或测量工具不科学,或施测时的条件、操作等不合要求时,测量便必然会出现误差。同样,心理测量的误差也来自三个方面,即测量工具、被测对象和施测过程。

(一) 在测量工具方面,心理测量和物理测量有所不同。心理测量工具通常是一套以测验为核心的刺激反应系统(通常称为量表)。心理测量量表是否稳定、是否真正测到了所要测的东西是测量工具造成误差的两种主要原因。测量工具所造成的误差主要来自于测验的编制过程,其中项目取样音响最大。 (二) 测量对象即被试本身引起的误差是测量工作中最复杂和最难控制的一类误差,被试的真实水平是否得到充分发挥是造成测量误差的主要原因。包括测验焦虑、测验经验、学习和发展及教育、应试动机、练习效应、反应倾向生理变因等。 (三) 在施测过程方面产生测量误差的原因主要是一些偶然因素(恒定因素较易控制)。测量过程,包括测试环境、测试时间、主试因素、意外干扰、评分计分等。

2.试简述真分数数学模型及其假设。 答案:

(一) 把任何一个测验成绩都看作是真分数和测量误差的和,这是经典测量理论(CTT)的基本思想。即经典测量理论假定,观察分数(记为X)与真分数(记为T)之间是一种线性关系,并且只相差一个测量误差(记为E)。用公式表示如下:X=T+E,这就是CTT的数学模型。 (二) 真分数理论的假设公理: a)

若一个人的某种心理特质可以用平行的测验反复测量多次,则其平均误差为0,即其观察分数的平均值会接近于真分数。用公式表示为E(X)= T或 E(E)=0。 b) c)

真分数和测量误差之间相互独立。 个平行测验上的误差分数之间相关为0。

3.试简述经典测验理论的缺点。 答案:

(一) 统计量的样本依赖性,抽样变动大; (二) 能力与难度量表的不一致性,测量误差大; (三) 信度估计的不精确性,复本实测难; (四) 测验结果拓宽的有限性,预测力缺乏; (五) 测验分数的测验依赖性,分数难比较。 4.试简述项目反应理论的特点。 答案:

(一) 能力参数估计不变性; (二) 项目参数估计的不变性; (三) 能力估计的不变性; (四) 测验编制应用的价值性。

5.试简述在IRT中,基本假设主要有哪些。 答案:

(一) 潜在特质空间的单维性假设 (二) 局部独立性假设 (三) 项目特征曲线假设 (四) 非速度限制假设 第四章 单选

1、信度指的是测量的( C )

A正确性 B针对性 C 一致性 D有效性 2、如果某测验的信度系数为0.81,那么该测验中真分数造成的变异占( A ) A 81% B19% C9% D18%

3、复本信度,又称等值性系数,其考虑的误差来源是( B )

A 时间取样 B内容取样 C 系统误差 D评分者误差 4、信度只受( B )的影响。

A系统误差B随机误差C恒定效应D概化理论

- 11 -

409出品 禁止盗版 5、在测量理论中,信度被定义为:一组测量分数的真分数方差与总方差(实得分数的方差)的比率,即( C )

A X=T+E B S2X=S2T+S2E C rxx=S2T/S2X D K=N/n

6、 分半信度通常是在测验实施后将测验按奇,偶数分为等值的两半,并分别计算每位被试者在两半测验上的得分,求出这两半分数的相关系数。这个相关系数就代表了( D )内容取样的一致程度。 A 原测验 B 所有条目之间 C题目与分测验之间 D 两半测验

7、同质性信度主要代表测验内部( B )间的一致性。

A两半测验B所有题目C 题目与分测验D分测验 8、一般而言,若获得信度的取样团体较为异质的话,往往会( A )测验的信度。 A高估 B低估 C忽略 D不清楚 9、对于不同平均能力水平的团体,题目的( A )会影响信度系数。

A难度 B区分度 C信度 D效度

10、以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越( D ) A不 B 低 C小 D大

11、计算同一批被试在不同时间内所得到的两个相同测验的一致性程度,由此而得出的信度系数是指( A )

A重测信度B复本信度C分半信度D同质性信度 12、如果一个学生在一个月里接受两次测验,所得成绩相差很大,那么我们说这两次测验的( C )不好。

A效度 B施测时间 C信度 D常模 13、下列信度类型中受测量的时间间隔影响的有( A )

A重测信度B复本信度C分半信度D评分者信度 14、计算同质性信度常用的指标包括( B ) A因素分析 B肯德尔W系数 C克伦巴赫a系数 D荷伊特信度

15、一般要求在成对的受过训练的评分者之间平均一致性达到( C )以上,才认为评分是客观的。 A 0.70 B 0.80 C 0.90 D 1.00 16、复本信度的缺点不包括( C )

A如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响。

B由于第二个测验只改变了题目的内容,已经掌握

的解题原则可以很容易地迁移到同类问题。 C能够避免重测信度的一些问题,如记忆效果,学习效应等。

D对于许多测验来说,建立复本是十分困难的。 17、信度系数在解释个人分数的意义时的作用不包括( D )

A了解实得分数再测时可能的变化情形 B估计真实分数的范围

C计算测量的标准误 D 了解误差分数的大小

18、一般来说,在一个测验中增加同质的题目,可以使信度提高。以下选项是关于测验增长的描述,其中不正确的是( B )

A测验越长,测验的测题取样或内容取样就越有代表性。

B测验越长,越遵循报酬递增率原则。

C测验越长,被试者受猜测因素的影响就越小。 D测验太长,有时反而会引起被试者的疲劳和反感而降低可靠性。

19 、( D )不能够适用于速度测验中的信度计算。 A分半法 B重测法 C复本法 D同质法 20、测验长度,亦即测验的数量可影响信度系数,如在一个测验中增加同质题目( D ) A可使信度提高 B可使信度降低 C对信度无影响 D对信度有影响,视情况而定

21、 rxx为信度系数。下列( D )情况属于极端情况。

A rxx=0.90 B rxx=0.80 C rxx=0.70 D rxx=1.00 22、实验信度的验证,不包括( D ) A直接验证B系统验证C概念验证D内容验证 23、关于信度的指标正确的是( C )

A信度系数,即实得分数方差与真分数的方差的比值

B信度指数即是信度系数 C测量标准误与信度呈负相关 D测量标准误与信度呈正相关 24、对信度的评估方法( B ) A有统一通用的一个法则 B没有统一通用的一个法则

C可用一种信度系数就能说明信度的不同方面 D要用多种信度系数来说明信度的总的方面 25、关于同质性信度,下列说法正确的是( A )

- 12 -

409出品 禁止盗版 A是检验测验内部所有题目间的一致性 B是用同一测验重复测量的一致性程度 C是检验两个测验在内容上的等质性

D其关键是应关注测验题目的内容和形式,而不论其正,负相关性

26、测量长度与信度的关系是 ( A ) A增加同质的题目,可提高信度 B增加异质的题目,可提高信度

C测验长度越长,信度越差 D测验长度越短,信度越好

27、关于评分者的信度,下列说法正确的是( D ) A是评估不同评分者对某测验的信度的评价 B一致性要求达r=0.9以上,不认为评分是客观 C一致性要求达r=0.9以上,就认为评分是客观 D是测定不同评分者之间所产生的评估误差 28、确定可以接受的信度水平的一般原则是,当( A )时,测验不能用于对个人做出评价或预测,而且不能作团体比较。

A rx <0.70 B 0.70<=rx<0.85 C rx>=0.85 D rx=1.00

29、 a系数被称为内部一致性系数,它是( B ) A对分法信度系数的推广B项目间相关系数的指标 C该测验所测特质的度量D测试及格标准的指标 30、关于测验难度,下列表述正确的是( B ) A对信度的影响,存在于所有心理测验中 B对信度的影响,只存在于如智力,成就,能力倾向等测验中

C平均难度为50%时,信度最低 D平均难度要么高,要么低,信度较高 多选

1.关于评分者的信度,下列说法正确的是 (BD) A、是评估不同评分者对某测验的信度的评价 B、一致性要求r=0.9以上,才认为评分是客观的 C、一致性要求r=0.9以上,就认为评分是客观的 D、是测定不同评分者之间所产生的评估误差 2.样本的平均能力水平(AC) A、低者,信度值相对较低 B、低者,信度值相对较高 C、高者,信度值相对较低 D、高者,信度值相对较高

3.rxx为信度系数,下列情况属于极端情况的是(CD)

A、rxx=0.90 B、rxx=0.80 C、rxx=0 D、rxx=1.00

4、一般来说,在一个测验中增加同质的题目,可以使信度提高。下列描述中正确的有(ACD) A、测验越长,测验的测题取样或内容取样就越有代表性

B、测验越长,被试者受猜测因素的影响就越小 C、测验越长,就越遵守报酬递增率原则 D、测验太长,有时反而会引起被试者的疲劳和反感而降低可靠性

5、下列哪些方法可以用于速度测验中的信度计算(ABC)

A、分半法 B、重测法 C、复本法 D、同质法 6、信度系数在解释个人分数的意义时可以(ABC) A、了解实得分数再测时可能的变化情形 B估计真实分数的范围

C、计算测量的标准误 D 了解误差分数的大小 7、信度是指检验结果的(AD)

A、可靠性 B、有效性 C、特殊性 D、一致性 8、计算同质性信度常用的指标有(BD ) A、分半信度 B、克伦巴赫a系数 C、肯德尔W系数 D、K-R20

9.SE=SX√1-rxx,公式中SE为测量的标准误,SX是所得分数的标准差,为测验的信度系数。从公式中可以看出,测量的标准误与信度之间的关系是(BD)

A、信度越低,标准误越小 B、信度越低,标准误越大 C、信度越高,标准误越大 D、信度越高,标准误越小

10、以下哪些因素会导致测验信度被低估(ABCD ) A、测验的题目难度过高 B、被试的同质性太高 C、测验题目很多 D、测验的题目难度过低 填空

1.信度是指测量结果的稳定性与 程度。 (一致性)

2.重测信度,又称为 、稳定性系数,是指用同一个量表对同一组被试施测两次所得结果的一致性程度。该信度能表示两次测验结果有无变动,反映了测量分数的稳定程度。(再测信度) 3. 指的是两个平行测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。(复本信度)

4. 即内容取样这一概念,不仅是复本信度

- 13 -

409出品 禁止盗版 的基础,而且也是其他信度的基础。(项目取样) 5.如果两个复本测验时同时连续施测的,则称这种复本信度为 。(等值性系数)

6.如果两个复本测验是相距一段时间分两次施测的,则称这种复本信度为 。(稳定性与等值性系数)

7. 就是指用不同的题目测量同样的内容而且其测验结果的平均值和标准差都相同的两个测验。(平行测验)

8. 是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的相关。(分半信度) 9.同质性信度,也叫 ,它是指测验内部所有题目间的一致性程度。这里的一致性是指分数的一致性,而不是题目内容或形式的一致性。(内部一致性系数)

10. 最初是由心理学家斯皮尔曼在研究智力理论时提出来的,后来发展成为一种复杂的统计技术,用于确定一组变量间的相互关系最少需要几个因素来解释。(因素分析)

11. 指的是多个评分者给同一批人的答卷评分的一致性程度。(评分者信度)

12. 是项目分析的一种形式,它主要是检测每一个项目同测验总分之间的相关。(鉴别力分析) 13.标准参考测验不是把被试的成绩与其他人比较,以寻求个别差异,而是与一种既定的标准相比较,看被试对某种知识和技能的掌握是否达到了某一水平,所以又叫 。(掌握测验) 14. 是一个测验的分数减去另一个测验的分数得到的,它可以是两个时刻上表现出的差别。(差异分数)

15.传统的经典测量理论又称为 ,真分数指“在测量中不存在测量误差时的真值或观察值”,实际的观察值等于真分数加上误差。(真分数理论) 16. 要求子测验在内容、均数、变差、信效度方面完全相同。(严格平行测验)

17. 是经典真分数理论与方差分析相结合的产物,它把因素试验设计、方差分量模型等统计工具应用到教育与心理测量学,对经典的信度理论进行推广,对于测验的编制、施测过程中的误差控制、测验的评价等提出了一整套新的方法。(概化理论)

18. 是指影响测量过程和测量结果的各种内在和外在因素,一个测量侧面就是某一方面的测量条件。(测量侧面)

19. 指的是从一个测验或是测量的被测量者得分到施测者同等程度接受的所有可能条件下被测者均分的概化的精确性,即从测量对象在样例测量上的得分到全分域的概化精确性,或者说是从样例到接受的观察全域的概化程度。(可靠性) 20. 所进行的测量是观察全域中的一个样例,也就是从观察全域中随机抽取出来的,观察全域的所有测量即使有差异,也可通过随机抽样的原则来排除。(随机平行测验)

21. 是指满足以下两种条件的侧面:(1)观察样本容量(侧面水平数)远小于观察全域的容量;(2)每个观察样本(侧面水平或条件)是随机地从观察全域中挑选出来的,即观察全域中未被挑选为观察样本的观察可以同等程度地替换观察样本。(随机侧面)

22.样本团体的平均能力水平低者,信度值相对较 (低)

23.用重测法估计信度,最适宜的时距是随测验的

目的,性质和被试者的特点而异,一般是 周较宜,间隔时间最好不超过10个月。(6~8) 24.以两个等值但题目不同的测验来测量同一群体,求其两者得分的相关性,被称为 (复本信度)

25.复本信度又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。复本信度反映的是测验在 上的等值性。(内容) 26.内部一致性系数(a系数)是所测特质 的指标。(一维性)

27.解释测验结果的参照指标是 (常模).

28.速度测验的信度应以 取得。(重测法) 29.分半信度求出后通常需要进行校正,通常用 校正。(斯皮尔曼—布朗公式)

30.斯皮尔曼—布朗公式rxx=2rhh/(1+rhh)式中rhh为 的相关系数,rhh为测验在原长度时的信度估计值。(一半分数) 名词解释

1、信度:是指测量结果的稳定性与一致性程度。在测量理论中,信度被定义为:一组测量分数的真变异数与总变异数(实得变异数)的比率。对于信度的定义,还应注意:①信度是指测量工具所获得的“结果”的可靠性,而非指工具本身;②每一个信度的估计值,仅指某一特定方面的一致性,而非

- 14 -

409出品 禁止盗版 泛指一般的一致性;③信度的估计是完全采用统计方法的。

2、重测信度:重测信度,又称为再测信度、稳定性系数,是指用同一个量表对同一组被试施测两次所得结果的一致性程度。该信度能表示两次测验结果有无变动,反映了测量分数的稳定程度。 3、复本信度:复本信度指的是两个平行测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。

4、项目取样:项目取样即内容取样这一概念,不仅是复本信度的基础,而且也是其他信度的基础。 5、等值性系数:如果两个复本测验时同时连续施测的,则称这种复本信度为等值性系数。 6、稳定性与等值性系数:如果两个复本测验是相距一段时间分两次施测的,则称这种复本信度为稳定性与等值性系数。

7、平行测验:平行测验就是指用不同的题目测量同样的内容而且其测验结果的平均值和标准差都相同的两个测验。

8、分半信度:分半信度是指将一个测验分成对等的两半后,所有被试在这两半上所得分数的相关。 9、同质性信度:同质性信度,也叫内部一致性系数,它是指测验内部所有题目间的一致性程度。这里的一致性是指分数的一致性,而不是题目内容或形式的一致性。

10、因素分析:因素分析最初是由心理学家斯皮尔曼在研究智力理论时提出来的,后来发展成为一种复杂的统计技术,用于确定一组变量间的相互关系最少需要几个因素来解释。

11、评分者信度:评分者信度指的是多个评分者给同一批人的答卷评分的一致性程度。

12、鉴别力分析:鉴别力分析是项目分析的一种形式,它主要是检测每一个项目同测验总分之间的相关。

13、标准参考测验:标准参考测验不是把被试的成绩与其他人比较,以寻求个别差异,而是与一种既定的标准相比较,看被试对某种知识和技能的掌握是否达到了某一水平,所以又叫掌握测验。 14、差异分数:差异分数是一个测验的分数减去另一个测验的分数得到的,它可以是两个时刻上表现出的差别。

15、传统的经典测量理论:传统的经典测量理论又称为真分数理论,真分数指“在测量中不存在测量

误差时的真值或观察值”,实际的观察值等于真分数加上误差。

16、严格平行测验:严格平行测验要求子测验在内容、均数、变差、信效度方面完全相同。 17、概化理论:概化理论是经典真分数理论与方差分析相结合的产物,它把因素试验设计、方差分量模型等统计工具应用到教育与心理测量学,对经典的信度理论进行推广,对于测验的编制、施测过程中的误差控制、测验的评价等提出了一整套新的方法。

18、测量侧面:测量侧面是指影响测量过程和测量结果的各种内在和外在因素,一个测量侧面就是某一方面的测量条件。

19、可靠性:可靠性指的是从一个测验或是测量的被测量者得分到施测者同等程度接受的所有可能条件下被测者均分的概化的精确性,即从测量对象在样例测量上的得分到全分域的概化精确性,或者说是从样例到接受的观察全域的概化程度。 20、随机平行测验:随机平行测验所进行的测量是观察全域中的一个样例,也就是从观察全域中随机抽取出来的,观察全域的所有测量即使有差异,也可通过随机抽样的原则来排除。

21、随机侧面:随机侧面是指满足以下两种条件的侧面:(1)观察样本容量(侧面水平数)远小于观察全域的容量;(2)每个观察样本(侧面水平或条件)是随机地从观察全域中挑选出来的,即观察全域中未被挑选为观察样本的观察可以同等程度地替换观察样本。 简答

1、什么是测验的信度?影响信度的因素有哪些? 答案:

(一) 信度指的是测量结果的稳定性程度。换句话说,若能用同一测量工具反复测量某人的同一种心理特质,则其多次测量的结果间的一致性程度就叫信度,有时也叫测量的可靠性。这是信度的描述性定义。信度的操作性定义,主要包括三个方面:①、信度乃是一个被测团体的真分数的变异数与实得分数的变异数之比,即r =s /s 。②、信度乃是一个被试团体的真分数与实得分数的相关系数的平方,即r =PT 。③、信度乃是一个测验X ( A 卷)与它的任意一个“平行测验”X ' ( B 卷)的相关系数,即r =P 。

(二) 测量信度是测量过程中随机误差大小的反映。随机误差大,信度就低,随机误差小,信度就高。

- 15 -

409出品 禁止盗版 在测量过程中影响随机误差的因素主要包括被试、主试、测试内容、施测情境等。 (1)

被试方面,就单个被试而言,被试的身心

健康状况、应试动机、注意力、耐心、求胜心、作答态度等会影响测量误差,就被试团体而言,整个团体内部水平的离散程度以及团体的平均水平都会影响测量信度。 (2)

主试者方面,就施测者而言,若他不按指

导手册中的规定施测,或故意制造紧张气氛,或给考生一定的暗示、协助等,则测量信度会大大降低;就阅卷评分者而言,若评分标准掌握不一,或前紧后松,甚至是随心所欲,则也会降低测量信度。 (3)

施测情境方面,在实施测验时,考场是否

安静,光线和通风情况是否良好,所需设备是否齐备,桌面是否合乎要求,空间阔窄是否恰当等等都可能影响到测量的信度。 (4)

测量工具方面,以测验为代表的心理与教

情境一致、避免意外干扰。 3、简述信度的作用。 答案:

(一) 信度是测量过程中随机误差大小的反应,并不

反应测量过程中系统误差的大小; (二) 信度帮助不同测验分数之间进行比较; (三) 信度可以用来解释个体测验分数的意义。 4、简要叙述各种信度系数对应的误差来源。 答案:

(一) 重测信度:时间的不同所带来的随机影响,如气候、偶然的噪音或其他干扰,以及引起被试本身身心状态变化的因素如疾病、疲劳、情绪类型、焦虑等。

(二) 复本信度:测验两种形式是否等值,测题取样是否匹配,格式是否相同,内容、题数、难度、平均数、标准差是否一致,以及被试方面情绪波动、动机变化等,还有测验情境的变化、偶发因素的干扰。

(三) 分半信度:主要是内容取样,不同的分半方法就有不同的分半信度,分开的两个相对独立部分等值才可进行计算。

(四) 同质性信度:主要是内容的异质性,测验内容抽样不同使同质性信度受影响。因为测验既无复本也无重复测量,只是使用内在一致性系数估计同质性信度,所以测验的题目选择就非常重要。 (五) 评分者信度:主要是被试得分会受到评分者的主观判断,不同的评分人员对相同被试的评分存在着差异。 第五章 单选

1.下面四个概念中与效标效度无关的是(D ) A.同时效度 B.预测效度 C.效标测量 D.因素效度

2.效标指的是衡量测验有效性的外在标准,通常是我们要预测的( A)

A.行为B.言语 C.学业成就 D.心理

3.通过考察测验的区分度可以确定测验的 (B) A.内容效度 B.构想效度 C.效标效度 D.相容效度

4.( A)指的是测验题目对有关内容或行为取样的适用性,从而确定测验

是否是所欲测量的行为领域的代表性取样。 A.内容效度 B.构想效度 C.效标效度 D.区分效度

育测量工具是否性能稳定是测量工作成败的关键。一般地,试题的取样、试题之间的同质性程度、试题的难度等是影响测验稳定性的主要因素。 (5)

两次施测的间隔时间,在计算重测信度和

稳定性与等值性系数(复本信度之一)时,两次测验相隔时间越短,其信度值越大;间隔时间越长,其他因素带来影响的机会就多,因而其信度值就可能越小。

2、怎样提高测量信度? 答案:

(一) 适当增加测验项目的长度。 题目太少会降低测量的信度,可以增加一些与原测验题目具有较高同质性的项目,增加测验长度。但应注意新增项目必须与试卷中原有项目同质,且新的数量要适度,不能只追求数量不保证质量。

(二) 采用因素分析和鉴别力分析提高测验信度。 (三) 利用公式矫正因测量误差引起的相关弱势。 (四) 控制测验项目的难度。 是测验中所有试题的难度接近正态分布,并控制在中等水平。这样,被试团体的得分分布就也会接近正态分布,且标准差会比较大,以相关为基础的信度值就必然也会增大。

(五) 选取恰当的被试团体,提高测验在各同质性较强的亚团体上的信度。

(六) 此外,要降低随机误差:受试者情绪状态要保持稳定,主试要保证按照规定实施测验,同时测验内容避免题意模糊造成歧义以及保持测验的物理

- 16 -

409出品 禁止盗版 5.( D)是指一个测验看起来好像是所要测量的东西的程度。

A.构想效度 B.同时性效度 C.相容效度 D.表面效度

6.如果测验的效标资料是经过一段时间后获得的,这样的效度称(B )

A.同时效度 B.预测效度 C.构想效度 D.内容效度

7.计算两种测验之间得分的相关,其中一种测验是待研究效度的,另一种

是已有效度证据的成熟的测验,但两者测量的是同一种心理特质,假如相关高,说明新测验所测得特质确实是老测验所反映的特质或行为。这种方法叫( C)

A.区分效度B.逻辑效度 C.相容效度 D.构想效度

8.(B )是检验测验分数能否有效地区分由效标定义的团体的一种方法。

A.相关法 B.区分法 C.命中率法 D.失误法 9.在编制测验时,效度是重要的要考虑的特性。如果是编制最高行为测验, 除了内容效度 ,也要求( A) C.较好的外形判断 D.主观性

10.如果其他条件相同,样本团体越同质,分数分布范围越小,测验效度就越(B )

A.高 B.低 C.大 D.接近1 11.如果一个测验在测验使用者、测验人员尤其是受试者看来是有效的,那 么,此测验具有( A) A.表面效度 B.内容效度 C.构想效度 D.效标关联效度

12.如果研究表明,高考分数与大学学习成绩有高度正相关,那么可以认为,对于大学生而言,高考分数具有较高的 (B ) A.表面效度 B.内容效度 C.构想效度 D.区分度

13.假设你要测查一个儿童的智力,你测量了他眼眉以上的周长,你测量了五次,得到一个平均数,然后将平均值乘以7得到该儿童的IQ,这种测量 IQ的程序( C)

A.不可信,也无效 B.不可信,但有效 C.可信,但无效 D.既可信又有效 14.内容效度主要用于考察(D )的有效性。 A.智力测验 B.人格测验

C.特殊能力测验 D.成绩、技能测验 15.在测验理论中,效度被定义为在一组测量中与测量目标有关的真实方差(或称有效方差)与(D )方差的比率。

A.误差 B.系统误差 C.随机误差 D.总 16.当测验用于强调维护社会公平时,应重视( A) A.总命中率 B.正命中率C.基础率 D.录取率 17.测验长度、即测验的数量可影响信度系数,如在一个测验中增加同质题目( D)

A.可使信度提高 B.可使信度降低 C.对信度无影响 D.对信度有影响,按情况而定 18.检验研究结果的数据分析程序与方法的有效性的指标的是( D)

A.内容效度 B.构想效度 C.外部效度 D.系统结论效度

19.关于同质性信度,下列说法正确的是( A) A.是检验测验内部所有题目的一致性 B.是用同一种测验反复测量的一致性 C.是检验两个测验在内容上的等质性

D.其关键是应该关注题目的内容与形式,而不论其正、负相关

20.一个测验能够测量到理论上的构想与特质的程A.内容效度 B.效标效度 C.构想效度 D.相容效度

21.测量所欲测量的心理特质接近性程度的心理测量学指标是(D )

A.难度B.信度 C.区分度 D.效度

22. 效标效度的研究可以验证构思效度,下列哪一项不包括( A)

A.一个测验若效标效度理想,不能作为构思效度验证的一个指标

B.将不同被试者形成相对的对照的两组,比较其成绩

C.效标效度也可将被试者按测量分数分成高、低分组进行比较

D.也可按心理特质的动态变化对被试者进行测量比较其文化

23. 效标效度的主要评估方法中不包括 ( C) A.命中率法 B.区分法 C.失误法 D.相关法 24.下列有关构思消毒的说法正确的是(B) A.构思效度可以由单一维度描述

B.构思效度的大小首先取决于事先假定的心理特质理论

A.较高的表面效度 B.较好的专家判断预测效度 度,称之为( C)

- 17 -

409出品 禁止盗版 C.当实际测量的资料无法证实我们的理论假设时,表明一定是构思效度不高

D.各种人格理论之间可以比较构思效度 25.α系数被称为内部一致性系数,它是(B ) A.对分法信度系数的推广 B.项目间相关系数的指标 C.该测验所测特质的度量 D.测试及格标准的指标

26.效度系数的实际意义常常以决定系数来表示,如测验的效度是0.80,测验的总方差中有(D )的方差是测验分数的方差。

A.36℅ B.46℅ C.56℅ D.64℅ 27.效度主要表示测验是否( C) A.达到了编题者所要的难度 B.满足了经典测量模型

C.测出了所想测的特质 D.提供了良好的评分标准

28.关于效度的性质正确的是( A)

A相对性 B再评鉴测验的效度时,不考虑目的 C绝对性 D针対被试的有效性

29.反映测验预测个体在某种情境下行为表现的有效程度为( C)

A.内容效度 B.构想效度 C.效标效度 D.相容效度

30.最常用来建立实证效度的方法是( A) A.相关法 B.区分法 C.命中率法 D.失误法 多选

1.效度的性质有(ABC)

A针对测验结果 B针对某种特定的测验目的 C只有程度上的差异 D针对测验内容 2.效度与信度的关系有以下几种(ABD) A高信度高效度 B高信度低效度 C低信度高效度 D低信度低效度

3.构念效度的着重点是(ACD)

A测验本身 B测验分数能否与校标测量有高度相关 C测验赖以编制的心理构念理论 D测验测量到该理论构念或特质的能力

4.常用的效度概化验证的方法有(BD) A专家评定法 B交叉效度评定 C统计法 D元分析法

5.根据效度验证的证据来源,我们把效度分为(BCD)

A表面效度 B内容效度 C效标关联效度 D构念效度

6.内容效度的估计方法有(ABD)

A专家评定法 B统计法 C元分析法 D经验法 7.效标的选取应满足(ABCD) A相关性 B有效性 C无污染 D客观性 8.计算效标关联效度的方法有(ABC) A相关系数法 B分组检查法 C取舍正确率 D专家评定法 9.影响效度的因素有(ABCD) A测验本身的因素 B效标因素 C样本的代表性 D干涉变量 10.阿斯丁将效标细分为(BC) A理论效标 B观念效标 C效标测量 D表面效标 11.效度可应用于(ABCD)

A测验编制 B人员的选拔、分类与安置 C决策 D效度与信息组合

12.对被试用新旧两个同类测验进行测量,求其分数之间,如果相关高,则说明两个测验所测的是相同的性质,这得到的是(ACD) A同时性效度 B继时性效度 C相容效度 D构想效度 填空 1. 2.

效度是指一个测验或量表实际能测出其所要信度高是效度高的必要而非充要条件,测验效测的心理特质的程度。

度受到信度的制约。 3. 4.

收集大量资料和证据来检验测验效度的工作当测验的使用者打算在某种程度上改变测验

过程,叫做效度验证。

的布局、结构、语言或内容时,“本地效度验证”研究是绝对必要的。 5. 6.

常用的效度概化验证的方法有:①交叉效度评目前有些学者对效度概化的元分析有一些的

定;②元分析

批评性的意见,主要集中在:效度证据良莠不齐;“文件柜偏差”(杂志很少刊登负面结果);效标不可靠性等方面。 7.

效度有多种不同的分类方式,最常用的分类方式是根据效度验证的证据来源,把效度分为:内容效度、效标关联效度、构念效度。 8.

内容效度的评估方法有:专家评定法、统计法、

经验法。 9.

内容效度比较适合于①评价成就测验;②某些对员工进行选拔和分类的职业测验。

- 18 -

409出品 禁止盗版 10. 效标关联效度是指测验分数与某一外部效标之间的一致性程度,即测验结果能够代表或预测效标行为的有效性和准确性程度。

11. “效标污染”是指主试知道了被试的测验分数而影响了对其效标分数的评定。

12. 由于效标是衡量测验是否有效的标准,因此能否找到合适的效标会直接影响我们对一个测验的效度的评定。一般来说,效标的选取要满足以下几个条件:①相关性;②有效性;③无污染;④客观性;⑤实用性。

13. 同时效度与预测效度的目的不同,同时效度用于检测现有的某种能力或特质的有效性,即描述当前状态时的有效性,而预测效度则表明测验对某种行为预测的有效性。

14. 估计效标关联效度的计算方法有:相关系数法、分组检验法、取舍正确法。

15. 构念效度的资料可分为两大类:一类是有关测验内部结构的资料;另一类是有关测验所测量特质(构念)的影响因素的动态资料。

16. 能够反映测验效度的资料有:内部一致性;与其他测验的相关;发展变化;因素分析;多特质—多方法研究;结构方程建模;认知心理学上的证据。 17. 因素分析是确定心理特质的一种方法,因而特别适用于构念效度。因素分析本质上是分析行为资料相互关系的一种精确的统计技术。

18. 目前很多研究者都在致力于提高研究的外部效度,其中效度概化是外部效度研究的一个方面。 19. 效度比信度更为重要,从一开始编制测验就应该注重提高测验的效度,尽量避免其他因素对效度的影响。影响效度的因素主要有:测验自身的因素;效标因素;样本的代表性;干涉变量。

20. 影响效度的因素中,与效标有关的影响因素有:效标的选择;测验与效标之间的测验类型;效标测量的信度。

21. 在进行效度解释时应注意以下两点:一是效度系数的大小;二是对效度系数随时间而产生的变化进行解释时应当小心。

22. 基础率和录取率对于测验的功利率有重要影响。录取率是指采用某种选拔程序所录取人员同候选人员的比例。基础率是未经选择的总体中自然存在的合格人员的比例。 名词解释 1.

效度:指一个测验或量表实际所能测出其所要测的心理特质的程度。

2.

效度验证:收集大量资料和证据来检验测验效

度的工作过程就叫效度验证。 3. 4.

效度的概化:指在某一情境中所做的效度研究交叉效度评定:从同一总体中分别独立选取的能否推广到其他的情境。

不同被试样本对测验效度进行独立检验的过程。 5. 6.

内容效度:指一个测验实际测到的内容与所要效标关联效度:指测验分数与某一外部效标间

测量的内容之间的吻合程度,又称逻辑效度。 的一致性程度,即测验结果能够代表或预测效标行为的有效性与准确性程度。 7. 8.

效标:即效度标准,是指独立于测验结果,反同时效度:指测验与同时获得的效标资料的一

映测验目的的行为参照,也称效标行为。 致性程度。 9.

预测效度:指测验结果对效标行为的预测程

度。

10. 构念效度:又称结构效度,是测验能说明心理学上的理论结构或特质的程度,或用心理学上的某种结构或特质来解释测验分数的恰当程度 11. 构念:指用来解释人类行为的理论框架或心理特质,它是心理学中抽象的假设性概念,特质或变量。

12. 表面效度:是测验要求被试做的事情和被试对此理解之间的互动。

13. 聚合效度:如果两个测验是测量同一质的,即使用不同的方法进行测量,它们间的相关也是高的。

14. 区分效度:如果两个测验是测量不同质的,即使用相同的方法进行测量,它们间的相关也是低的。

15. 内部效度:又称内部一致性效度,它反映了测验的构念效度。

16. 外部效度:指将研究结果概化到其他情境和总体的程度。

17. 功利率:使用测验所带来的利益的大小。 18. 录取率:指采用选拔程序所录取人员与候选人员的比例。

19. 基础率:指未经选择的总体中自然存在的合格人员的比例。 简答题

1. 简述效度的误差来源。 答案:

凡是能产生随机误差和系统误差的因素都会降低

- 19 -

409出品 禁止盗版 测验的效度。一个效度低的测验,其得分在很大程度上收到与测验目的无关的因素影响,而效度高的测验则受无关因素影响很小。效度的误差来源,可归纳为以下三个方面:

(一) 测验组成方面:试题是构成测验的要素,测验的效度取决于试题性能。凡测验的取材、测验长度、试题的区分度、难度及其编排方式等都与效度有关。要想提高测验的效度,须谨慎选择实验材料,适当安排测验的长度,使试题具有相当的鉴别力而且难易程度适中。

(二) 测验实施方面:测验的实施程序是影响效度的重要因素。若主试能适当控制测验情境,遵照测验手册的各项规定而实施,就能避免外在因素对测验结果的影响。

(三) 被试反映方面:被试的兴趣、动机、情绪、态度和身心健康状况等,都能影响其在测验情境中的行为反应。

2. 影响效度的因素有哪些? 答案:

影响效度的因素主要有:

(一) 测验自身的因素。在统计学上,测验的长度、测验的信度都会影响测验的效度。

(二) 被试的取样。用来做效度研究的效度样本,必须是测验所要应用的团体的较好代表,取样的策略是:将全体受测人员都包括在内,或从团体中随机取样,只用经检验合格的人。

(三) 所用的校标。校标测量的可靠性、校标和测验分数的关系类型都会影响到效度。

(四) 干涉变量。同一测验对于具有不同特征的团体其效度可能有很大不同。干涉变量指的是人的某些特征,由于这些特征的影响,使得不同的团体具有不同的可预测性。

3. 内容效度的特点有哪些? 答案:

内容效度的特点有以下两方面: (一) 内容效度的特定性

内容效度不是普遍适用的,而是根据具体情况分析得来的,如果测验编制者和测验使用者二者定义的内容范围相同,则编制者报告的内容效度对于使用者而言是有意义的,否则就没有意义;内容效度也有时间上的特定性,适合过去总体的代表性样本未必符合现在的总体。 (二) 常与表面效度混淆

内容效度是由够资格的判断者详尽地、系统地对测

验作评价而建立的,而表面效度是由外行对测验做表面上的检查而确定的。虽然二者都与测验内容有关,但判断的标准不同,前者只考虑题目与测量目的之间明显的、直接的关系,后者则同时考虑题目与测量目的、内容总体之间逻辑的微妙关系。 4. 简述效度与信度的关系。 答案:

(一) 效度与信度之间既有差别又有联系 (二) 差别:信度与效度所涉及的误差不同,信度考虑的是随机误差的影响,而效度还需考虑对测验目的无关的变量所引起的系统误差。

(三) 联系:信度高不一定效度高;效度高时,信度必然高。

5. 简述因素分析法在效度验证中的作用。 答案:

(一) 建立构想效度的常用方法是因素分析。通过因素分析,研究者可以探明测验究竟测到了几个彼此相对独立的因素,测验各组成部分甚至各试题在几个公共因素上的负荷大小,从而从整体关系和各个方面对测验所测心理特质的结构进行量化分析。因此,因素分析是测验结构效度验证的一种重要手段。

(二) 利用因素分析这一方法,测验编制者还可以在测验编制过程中进行测题的编选。编制心理测验时,测验编制者总试图使用少数几个测验尽可能完整地反映人的心理状态。,从心理测量学的角度看,好的测验所测量到的应该是同一个变量。为达到这一目的,可通过实施大量测题,并计算测题间的相关后,进行因素分析,选取在一般因素上负荷高的测题构成测验。因素分析法在选题中的应用保证了测验符合预定的要求,提高了测验的结构效度。 第六章 单选

1心理测验题目的来源应该排除(A)

A直接翻译国外测验的题目 B已出版的标准测验 C理论和专家的经验 D临床观察和记录 2测验编排的一般原则应排除(C) A难度逐步上升,先易后难 B将同类型的测验组合在一起

C答案混合排列 D依各种类型测题本身的特点编排题目与选项 3下列说法中,(B)不是对测验环境条件的要求。 A完全遵从测验手册对环境的要求 B安排测验材料

- 20 -

409出品 禁止盗版 C记录下任何意外的测验环境因素 D在解释测验结果时也必须考虑环境因素 4(B)会提高智力测验、成就测验和能力倾向测验的成绩。

A过高的焦虑 B适度的焦虑 C一点焦虑也没有 D 过度抑郁 5无论哪种测验,为使评分尽可能客观应(B) A及时而清楚地记录反映情况 B准确无误的计分、合分

C要有计分键 D对照计分键,对反应进行分类

6与正式施测的时限相比,对新编制的测验做试测1时的时限应(D)

A减半 B较短些 C完全一致 D较长些 7初测用的测验并非正式测验,初编题目的数量根据要求应(C)最终所需要的数量。

A少于 B等于 C多于 D有时多于、有时少于 8. 要考查对事物的辨别和判断的能力,宜用的题型是(B)。

A.简答题 B.选择题 C.论文题 D.填空题 9.项目分析时一般将总分最高和最低的( C)的被试划分为高分组和低分组。

A.7% B.17% C.27% D.37% 10. 大多数适合普通人群的测验如果要有较大的区分能力,一般应选择接近( B)难度的项目。 A.低 B.中 C.高 D.无所谓 11. 有一个满分为5分的测验项目,全体被试在此项目上的平均分为3分,则此项目的难度P是(C)。 A.20%

B.40% C.60%

D.80%

12. 要想使项目区分度越大,难度应越接近于(B)。 A.0 B.0.5 C.0.75

D.1

编成后要用于哪些团体。只有对受测者的(ABCD)等心中有数,编制测验时才能有的放矢。 A年龄 B受教育水平 C社会经济条件 D阅读水平

2.心理测验在内容方面的要求是(ABCD) A. 内容符合测验的目的 B. 语句简明扼要

C. 内容取样要有代表性 D. 题目间内容要相互独立 3.测题常见的排列方式有(AC) A. 并列直进式 B. 公共汽车式 C. 混合螺旋式 D. 专列式

4.心理测验命题在理解方面的主要要求是() A. 有确切的答案

B. 除创造测验和人格测验外不应具有引起争议的可能

C. 内容不要超出受测团体的知识水平和理解能力 D. 格式要不被人误解

5. 选择题要编好题干,也要编好选项,必须注意(ABCD)

A. 题目问题明确,避免与选项用词一致 B. 选项简明扼要,长度相等

C. 每题只能给一个正确答案 D. 选项最好用同一形式

6. 要使测验具备较高的信度和效度,需要对测验进行标准化,主要包括(ABCD)

A. 测验内容的标准化 B. 适测过程的标准化 C. 测验评分的标准化 D. 解释测验分数的标准化 7 .在选择题目形式时,需要考虑(ABCD) A.测验的目的 B材料的性质 C接受测验的团体特点 D各种实际因素 8.审定试题时要注意题目的(ABCD)

A范围应与测验计划的双向细目标表相一致

D.37%

B数量要比最后所需的数目多一倍至几倍 C难度必须符合测验目的的需要 D说明必须清楚明白

9混合螺旋式编排方式的特点有(AD)

A将不同性质的测验题目交叉排列 B将性质相同的测验题目归为若干分测验 C难以维持作答的兴趣 D难度逐渐提高

10研究表明,(ABCD)者,测验焦虑教高 A对自己能力没有把握 B抱负水平过高,求胜心切

13. 项目分析时划分高分组或低分组时,一般是选取总分最高和总分最低的( B) A.10%

B.27% C.33%

14. 在一次测验中,按被试测验总分从高到低排列,将总分最高的27%和最低的27%定为高分组和低分组。两组在某一是非题上的通过率分别为PH=0.54,PL=0.28,则此道题的鉴别指数D是(B) A.0.13

B.0.26 C.0.41

D.0.82

15.在一次测验中,16名被试在一道是非题上通过的人数为4人,则此题目的难度P是(B) A.15% 多选

1.在编制前首先要明确编制的对象,也就是该测验

B.25% C.75%

D.85%

- 21 -

409出品 禁止盗版 C缺乏自信、患得患失、情绪不稳定 D测验成绩关系重大,压力过大 填空

1.____是平均数等值的扩展,是指两个不同形式上变换分数的平均数和标准差是相同的。(线性等值) 2.在CTT 中,测量误差是一个统计量,它依赖于样本;而在_____中,测量误差不是一个统计量,它依赖于能力水平,是关于能力水平的函数。(IRT) 3.根据等值对象的不同,测验等值包括两方面的内容,一是测验分数等值,二是_____等值。(项目参数)

4.根据等值的应用性质不同,可以将等值分为水平等值和________等值。(众向或垂直)

5.测量等值的性质和条件主要有公平性、对称性、横跨群体的不变性和______。(样本组间的一维性) 6.题库建设工作过程大致包括试题开发、分析等值、存储建库和______。(动态维护)

7.理论上,在测验中,题目的难度在接近或等于____时时比较理想的难度,此时的项目具有最大的

等值)

19.题库建设工作过程大致包括如下几个阶段:______、分析等值、______和动态维护。(试题开发,存储题库)

20.理论上,在测验中,难度接近或等于______是比较理想的难度,此时项目具有最大的鉴别力。(0.5) 名词解释 项目等值:

1.项目分析: 细化的、对测验中每个项目的具体分析,信度好与效度高必然是高质量的项目的综合反映。

2.难度: 是指项目的难易程度。在最高作为测验中称为“难度”,而在典型作为测验中则指“通俗性”。

3.区分度: 是指测验项目对被试心理品质水平差异的区分程度,又称鉴别力。

4.经典测验理论(CTT): 人们将以真分数理论为核心理论假设的测量理论及其方法体系,统称为经

鉴别力。 (0.5) 典测验理论,?也称真分数理论。 8.根据在等值时以何种理论作为指导,可以将等值分为经典测量理论等值和______等值。(项目反应理论)

9._____又叫二值计分,即只有答对和答错两种情况,记为1或0。(二分法计分)

10. ______是指测验项目对被试心理品质水平差异的区分程度,又称鉴别力。(区分度)

11.广义的项目分析包括______和______两个方面。(定性分析,定量分析或质的分析,量的分析) 12. 计算区分度常用的方法有相关法和______。(项目鉴别指数法)

13. 布鲁姆对教学目标的分类是记忆(知识)、理解、应用、分析、 和 。(综合,评价) 14.在教育测验中或学绩测验中,______是确定测验目的的唯一依据。(教育目标)

15. 在布鲁姆的教育目标分类系统中,教育的目标可分为认知、_______和______三大类。(情感目标,运动技能)

16.测验等值的理论包括______和______。(经典测验理论等值,项目反映理论等值)

17. 等值数据资料的收集方法一般可以分为采用以“人”为媒介的的______设计和______以“题目”为媒介的______设计。(共同组等值,共同题等值) 18.值转换模型中,最为简单的是______。(平均数

5.项目反应理论(IRT): 项目反应理论也称潜在特质理论或潜在特质模型,是一种现代心理测量理论,其意义在于可以指导项目筛选和测验编制。 6.测验等值: 在心理与教育测量中,把测量同一种心理特质的不同测验分数,通过一定的数学模型转换成同一单位系统中的过程就称为测验等值。 7.题库: 是许多测验或考试合格试题的有效存储,目的是为了高效成批生成具有指导性能的试卷服务。

8.项目分析: 测验项目分析就是对预测结果进行统计分析,确定项目的难度和区分度。 简答

1、编制心理测验一般要经历哪些步骤?应该遵循哪些原则? 答案:

(一)测验编制的准备阶段:确定目的与制定计划 (1) a) b) c)

确定测验目的

首先,明确测验用途 其次,分析测验目标 最后,了解测验对象

拟定编题计划

(2)

(二)测验的正式编制阶段:产生测题与合成测题 (1) a)

产生测题 搜集有关资料

- 22 -

409出品 禁止盗版 b) c) a) b) c)

选择测题形式 编写修订测题

合成测题 预测和复核 项目选择和编排 等值副本的编制

3、什么是区分度与难度?两者的关系怎么样? 答案:

(一) 区分度是指测验项目对被试心理水平差异的区分度,又称鉴别力。

(二) 难度是指项目的难易程度。在最高作为测验中称为“难度”,而在典型作为测验中指“通俗性”。两者都是指在总体中能够正确或确切回答某项目的人数。

测验的标准化

(三) 关系:难度与区分度都是针对一定的团体进行的,一般来说,较难的项目对高水平被试区分度高,较易的项目对低水平的被试区分度高。 4.测验指导语的作用是什么? 答案:

指导语的作用一是向受测者说明测验的目的,以便解除受测者的顾虑;二是向受测者说明如何对测验项目反应。确定指导语时,要注意不要暗示受测者应该选择什么样的答案。一般要求测试的主持者和指导语都应保持和表达中立的态度,不倾向于答案中的任何一种方向。指导语必须事先拟好,印在测验项目的前面,并且力求清晰、简单、明了,不致引起误解。对受测者不熟悉的测题类型,应当有一至两个例题。

5.在测验实施时主试应该注意哪些问题? 答案:主试施测应该注意: (一)施测前应做好准备工作

(二)指导语应不要暗示受测者应该选什么 (三)进行测验时不能受到外界和施测者的干扰 (四)评分要客观公正 第七章 单选

1.如果被试个心理测量中的得分处于第94个百分位,意思是(B)。

A.这个被试正确回答了94%的题目。

B.这个被试的得分超过了94%的标准化样本。

公平性。又叫等价性,测验等值转换应具

C.这个被试的得分超过了6%的标准化样本。 D.上述都不正确。

2.下列不属于标准分数的是(A)

A比率智商 B离差智商 CT分数D标准九分数 3.(B)是具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。

A团体 B常模团体 C手册人群 D样本 4.常模样本量的大小,一般最低不小于(D) A100或500 B800或1000 C20或25 D30或100 5.全国性常模,样本量一般要在(B)之间

测验内容的标准化 实施过程的标准化 评分计分的标准化 分数解释的标准化

测验性能评估 编写测验指导手册 主要原则:

(2)

(三)测验编制的完善阶段:测验标准化与性能评估 (1) a) b) c) d)

(2) (3) (4) a) b) c) d)

信度好:信度主要指测量的可靠性或一致性; 效度高:效度主要测量的有效性或正确性; 难度适中;

区分度强:区分度即鉴别力,是衡量测题对不同水平被试区分程度的指标,它是评价试题质量、筛选试题的主要指标与依据。

2、什么是测验等值?它的具体性质与要求有哪些? 答案:

(一) 在心理与教育测量中,把测量同一种心理特质的不同测验分数,通过一定的数学模型转换成同一单位系统中的过程就称为测验等值。

(二) 测验等值的条件与性质实质上是统一的。 首先,要进行等值的测验必须是测量同一心理特质或能力(即同质性)

其次,只有信度相等的测验才能等值(即等信度性) (三) 具体来说,测验等值的性质和条件主要有如下几点: (1)

有公平性。 (2) (3)

对称性。又称可逆性,指等值转换关系是横跨群体的不变性。测量等值转换关系应

双向的。

具有唯一性、不变性。 (4)

样本组间的一维性。又叫一致性、同规格

性。指北等值的测验都必须是测量同一维的心理特征,等值处理的结果应该不受到进行等值处理所采用的考生样本组的影响。

- 23 -

409出品 禁止盗版 A1000~2000 B2000~3000 C3000~4000 D 4000~5000 6.样本大小适当的关键是样本要有(A) A代表性 B特殊性 C相关性 D可比性 7.取样的是指从()中选择有代表性的样本(C) A总体 B全体 C目标人群 D样本 8.常模分数又叫(A)

A导出分数 B原始分数 C粗分数 D总体分数 9.常模分数构成的分布,就是通常所说的(B),它是解释心理测量分数的基础。

A常模分数 B常模 C导出分数 D分数 10.发展常模就是(D)

A常模 B个人的分数 C团体的分数 D年龄量表 11.在(A)量表中,个人的分数指出了他的行为按正常途径发展方面出于什么样的发展水平。 A年龄 B态度 C智力 D人格

12.常模样本中6年级的算是平均分35,某儿童在算数测验中35,那就是说,该儿童的算术年级当量是(B)

A5年级水平B6年级水平 C7年级水平D8年级水平

13.王红在30名同学中物理成绩是80分,排列第五名,则其百分等级为(C) A65 B75 C85 D95

14.高考的最高分为650,其分等级为100,最低分为105分,百分等级为0,要录取20%的学生进入大学,百分等级为80的百分位数(D) A500 B512 C 532 D541

15.Z=A+BZ式中Z为转换后的标准分数,A、B为根据需要指定的常数。加上一个常数是为了去掉(B),乘以一个常数是为了使单位变小从而去掉小数点。

A整数 B小数 C付值 D分值

16.当原始分数不是正态分布是,也可以使之正态化,这一转换过程是()

A线性的B非线性的 C直接的 D间接的 17.(A)过程主要是将原始分数转或为百分等级,再将百分等级转化为正态分布上相应的离均值,并可以表示为任何平均数和标准差。

A正态化 B线性化 C百分制 D分布均匀 18.最早使用T分数者是(C)

A退孟 B桑代克 C麦柯尔 D西蒙

19.当以50为平均数,以10为标准差来表示时,通常叫(B)

AZ分数 BT分数 C标准九分数 D离差智商

20.标准九分时一种标准分数系统,其量表是个9级的分数量表。它是以(A)为平均数,以()为标准差的一个量表。

A5; B6;3 C8;5 D10;7 21.标准十分,平均数为(B),标准差()。 A6;2 B5;1.5 C6;1.5 D7;1.5

22.标准二十分,平均数为(C),标准差为()。 A12;5 B11;4 C10;3 D 9 ;2

23.最简单而且最基本的表示常模的方法就是(A),有时也叫做常模表。

A转换表 B分布表 C对照表 D都不是 24.测验的使用者利用(A)可将原始分数转换为与其对应的导出分数,从而对测验的分数做出有意义的解释。

A转换表 B分布表 C对照表 D都不是 25.对于某些特殊的群体来说,情况很具体,我们就需要制定(B)

A普通常模 B特殊常模 C一般常模 D剖面图 26.对一个测验来说,通常(B)。

A只有一个常模团体 B有数个常模团体 C必须有一个以上的常模团体 D常模团体越多越好 27.如果原始分数的分布是正态的,那么Z分数的范围大致是从(C).

A-1到+2B0到1C-3到+3 D-4到+4 28.百分等级量表是常用的测验量表之一,它属于(D)量表。

A等距 B比率 C命名 D等级

29.某学生通过测评后,得到他的算术是6年级水平,阅读是5年级水平,那么,该测验采用的是下面哪种类型的发展常模(D)。 A发展顺序量表 B智力年龄 C百分等级 D年级当量

30.在心理测验中,通过将被试的反应与标准答案相比较而获得的测验分数叫(A)。

A原始分数 B导出分数 C常模分数 D掌握分数 31.标准分数是(C),因此可以做加减运算,而不能做乘除运算。

A命名量表 B顺序量表 C等距量表 D等比量表 32.常模参照测验的常模包括(A)。

A发展常模 B年龄常模 C年级常模 D标准分数常模 多选

1.常模团体的选择一般包括(ABCD)。 A确定测验目标 B确定一般总体

- 24 -

409出品 禁止盗版 C确定目标总体 D确定样本 2.常模团体的选择一般包括(BCD) A确定测验目标 B确定一般总体 C确定目标总体 D确定样本 3.常模团体的条件包括(ABCD)。

A群体构成的明确界定 B对群体具有代表性 C样本量大小要适当 D具有新近性 4.导出分数的特性(ABCD)。 A与原始分数等值 B具有意义 C等单位 D具有参照点

5.发展顺序量表可以告诉人们某儿童的发育与其年龄相比(ABC)。

A超前 B滞后 C正常 D以上都不是 6.标准分数可以通过(AB)和()得到。 A线性转换 B非线性转换 C计算 D变化 7.常模表示一种最简单、最基本的且常用的呈现常模资料的方法。它的构成要素为(BCD) A团体分数 B原始分数

C导出分数 D对常模团体的有关具体描述 8.下列哪些描述符合成就测验原始得分的特点?(AD)

A无绝对零点 B有等距的单位 C 各学科分数可直接比较 D可转化为标准分数 9.发展常模包括(BCD)。 A百分等级 B发展顺序量表 C智力年龄 D年级当量

10.在参照常模的分数解释中,下列哪些是标准分数常模?(AD)

AT分数 B比率智商 C掌握分数 D标准九 填空

常而设计的,它不使用各年龄的平均分数, 而以婴幼儿代表性行为出现的时间为衡量标准。(顺序量表)

7. 商数包括比率智商、教育商数和 (成就商

数)

8. 标准分数可以通过线性转换,也可以通过非线

性转换得到,由此可将标准分数分为两类:线性转换的标准分数和 。(常态化的标准分数)

9. 韦氏测验的离差智商是表示在以 为平均

数、 为标准差的量表上的分数。(100, 15)

10. 是把内容分数与常模分数结合起来

使用。(内容标准分数)

11. 结果参照是用 的水准来表示分数。(效

标行为)

12. 为了对测验分数做出确切的解释,我们需要常

模资料和 。(效度资料)

13. 基于计算机的自适应测验的终结有两种方法:

和测验程度固定方法。(时间长度定值法)

14. 建立CBTI系统有两种最基本的方法:临床方

法和 。(概率方法)

15. 在对计算机化测验解释中巴纳姆效应的研究

发向

。(认为事实上任何一种计算机化的报告都是正确的而完全接受它,而不考虑它的有效性或相关性)

16. 是以5为平均数,以2为标准差的

量表。(标准九)

17. 离

差智商的优点

是 1. 分数组合层次包括项目的组合、和测验或预测源的组合。(分测验或量表的组合)

。(同样的智商分数在任何年龄水平上都代表同样的相对位置)

2. 常用分数合成的推理方法有单位加权、等量加

权、 和多重回归。(等量加权)

18. 教

育商数的计算公式

3. 多重分段有两种主要模式是综合分段

和 。(连续栅栏)

为 。(EQ=(EA/CA)*100)

4. 选人是从申请人中挑选出最佳者, 是将每个

人放在最适当的位置或类别中。(安置)

19. 依据 在测验中使用计算机,应用计

算机来对测验进行施测或解释,或是选择治疗方法,称为计算机自适应测试。(项目反应理论)

5. 制定常模需要三步:(1)确定有关的比较团体;

(2)获得该团体成员的测验分数;(3) ;(把原始分数转化为量表,该量表能把个人分数表示成在这个团体内的相对位置)

20. 内容参照具体包括:掌握分数、正确百分

数、 、等级评定量表。(内容标准分数) 名词解释

1.分数合成:有些测验是由几个分测验或量表组成的,每个测验或量表都有自己的分数,这些分数可

6. 是为了检查婴幼儿心理发展是否正

- 25 -

409出品 禁止盗版 以组合到一起得到一个合成分数。

2.临床判断:根据直觉经验,主观将各种因素组合以得出结论或预测的方法叫临床判断。

3.推理方法:不考虑各个变量间的经验关系,而是根据某种先验的理想程序来推理性加权的方法叫推理方法。

4.单位加权:单位加权就是将各个变量(题目,分测验或测验)直接相加而得一合成分数。 5.等量加权:等量加权就是将所有分数换成标准分数(Z分数),然后再把它们加以组合。

6.多重分段:多重分段就是把人类分成达到最低标准(接受)与未达到最低标准(拒绝)两类,而不在这两组人内部作进一步的区分。

7.综合分段:综合分段就是当几个变量没有确定的阈限,而各个预测源分数又可以同时获得时,把几个预测源与效标的关系综合起来考虑,在保证合成体的预测效度最高的前提下,分别确定出每个预测源的最佳分数线。

8.连续栅栏:当预测源分数只能陆续得到,而每个变量又具有自己特定的阈限(可接受的最低水平)时,不必让每个申请者都在所有的预测源上尝试,只有申请者通过第一项,才能进行下一项的方法就是连续栅栏。

9.多重回归:多重回归是研究一种事物或现象与其他多种事物或现象在数量上相互联系和互相制约的统计方法。

10.多重相关系数:多重相关系数R,表示预测源(作为一个合成体)与效标测量间的相关,R^2表示效标的变异可由预测源来解释的比例。

11.渐进效度:一个预测源加入合成体后所增加的R值,叫渐进效度。

12.原始分数:这种直接从测验上得到的分数叫原始分数。

13.导出分数:通过统计方法由原始分数转换到量表上的分数叫做导出分数。

14.常模参照测验:在分数解释时如果参照的是被试总体的分数分布(常模),则测验称为常模参照测验。

15.标准参照测验:如果分数解释时参照的是某一事先定好的标准,则成为标准参照测验。。 16.常模:常模是参照标准的一种,指有一定代表性且数量足够大的样本(即标准化样本)在某项测验上的分数分布。

17.发展量表:将个人的成绩与各种发展水平的人

比较而制成的量表叫发展量表。

18.智力年龄:一个儿童在年龄量表上说得的分数,就是最能代表他的智力水平的年龄。这种分数叫做智力年龄,简称智龄。

19.年级当量:年级当量是指把学生的测量成绩与各年级学生的平均成绩比较,看他相当于几年级的水平。

20.顺序量表:顺序量表是为了检查婴幼儿心理发展是否正常而设计的,它不使用各年龄的平均分数,而以婴幼儿代表性行为出现的时间为衡量标准。

21.比率智商:智商被定义为智龄与实际年龄之比。为避免小数,将商数乘以100,以此种方式所获得的智商叫比率智商。

22.教育智商:教育智商为教龄与实际年龄之比。 23.教龄:教龄就是指某个年龄的儿童所取得的平均教育成就。

24.成就商数:成就商数是将一个学生的教育成就与他的智力做比较,即教龄与智龄或教商与智商之比。

25.百分等级:一个分数的百分等级可定义为在常模团体中低于该分数的人数百分比。

26.标准分数:标准分数是将原始分数与平均数的距离以标准差为单位表示出来的量表,因为它的标准单位是标准差,所以叫标准分数。

27.常态化的标准分数:先把原始分数转化成百分等级,然后从正态曲线面积中查出对应的标准分数,由这种方式所得到的分数叫常态化的标准分数。

28.T分数:当常态化标准分数以50为平均数(即加上一个常数50),以10为标准分数(乘以一个常数10)来表示时,通常叫做T分数。

29.标准九:标准九是以5为平均数,以2为标准差的量表。

30.离差智商:离差智商是将一个人的测验分数与同年龄组的人比较所得到的标准分数。

31.内容参照分数:标准是对测验所包含的材料掌握的程度,将分数与此种标准比较可以得知一个人知道什么和能做什么,因为涉及的主要是测验的内容,所以把这种分数叫做内容参照分数。 32.结果参照分数:比较标准为外在效标,即用预期的效标成绩来解释测验分数,因为涉及的是后来的结果,所以把这种分数叫做结果参照分数。 33.掌握测验:有时,我们只想知道被试对一些基

- 26 -

409出品 禁止盗版 本知识和技能是否掌握,并不需要对被试做进一步的区分(采用“全”或“无”计分),在这种情况下,只要定出一个可以接受的最低标准九可以了,这种测验就叫掌握测验。

34.掌握分数:代表最低熟练水平的分数叫掌握分数。

35.正确百分数:正确百分数就是被试答对题目的百分比。

36.内容标准分数:内容标准分数就是把内容分数与常模分数结合起来使用的分数。

37.等级评定量表:对于各种技能,是不能用回答问题来确定其掌握和熟练水平的,通常我们需要采用等级评定量表来报告一种活动的熟练水平或一种产品的质量。

38.结果参照:结果参照又叫效标参照,是用效标行为的水准来表示分数。

39.线性等值:不用相同的百分等级作中介,而用相同的标准的标准分数作等值的基础,此种方法叫线性等值。

40.适应性测验:适应性测验是指对被试根据已经掌握的情况,选取合适被试能力水平的题目进行测试。

41.巴纳姆效应:心理学将人们这种相信伪造的,模糊地,而且通常是积极地人格反馈的倾向称为称为“巴纳姆效应”。 简答

1. 测验分数为什么要合成?说明合成测验分数

的主要方法。 答案:

(一) 使用测验时,需要将几个分数或几个预测源组合起来获得一个合成分数或做出总的预测。包括项目的组合、分测验或量表的组合、测验或预测源的组合等。

(二) 测验分数要合成是因为测验实施以后,将受测者的反应与答案作比较即可得到每个人在测验上的分数,这种直接从测验上得到的分数叫原始分数。原始分数本身没有太大的意义,当知道一个学生的分数是80分时,并不能由此判断这个学生的成绩是好或坏。为了使原始分数有意义,同时为了使不同的原始分数可以比较,必须把它们转换成具有一定的参照点和单位的测验量表上的数值。通过统计方法由原始分数转化到量表上的分数叫做导出分数。有了导出分数,才能对测验结果作出有意义的解释。

(三) 合成测验分数的主要方法有: (1)

临床判断。在实际工作中,人们常常会根

据经验对各变量做直觉的组合。这时,研究者是根据直觉经验,主观地将各种因素组合以得出结论或预测的方法。临床法的优点是能从整体上对各因素加以综合考虑,不但考虑到各个因素的相对重要性,还能考虑到各因素间的交互作用,这种考虑具有高度完形性质;同时,每个判断都是针对特定的个人做出的,能考虑到每个人的具体情况。临床法的缺点是主观加权可能受判断者的偏见的影响,不够客观,没有精确的数量指标,判断者需要受过训练并具有丰富的经验。 (2)

推理方法。不考虑各个变量之间的经验关

系,而是根据某种先验的理想程序来做推理性加权。包括单位加权和等量加权。单位加权最简单的方法是将各个变量(题目、分测验或测验)直接相加而得到一个合成分数。等量加权比较麻烦,需要将所有分数转换成标准分数(Z分数)。 (3)

多重分段。当用测验来决定取舍时,必须

确定一个分数线,分数在这条线以上的人接受,在这条线以下的拒绝,这是只有一个预测源的情况。在实际决策中,人们往往不只使用一个预测源。这种方法只是把人分为达到最低标准(接受)与未达到最低标准(拒绝)两类,而不在两组人内部做进一步的区分。根据确定分数线的不同情况,多重分段可有两种主要模式:综合分段、连续栅栏等。 (4)

多重回归。多种分段假设预测源间不具有

互偿性,但这对许多心理变量来说是不适用的。当同时采用几个预测源来预测一个效标,而这些预测源变量之间又具有互偿性时,多重回归是最常用来组合分数的模式。多重回归方程式的导出相当复杂,一般是借助计算机来进行的。 (5)

合成分数的特殊方法。在某些情况下需要

采用一些特殊的方法来组合分数,比如:完形记分、轮廓分析等。所谓完形记分就是将各个变量看作一个整体,不是孤立的看每一个反应结果,而是看总的反应模式。在某些情况下,完形记分可以使效度增加。轮廓分析主要是考虑被试在各个测验或量表上所得分数的轮廓,而不是将各个变量做简单的线性组合。

2. 确定常模团体时,应注意哪些问题。 答案:

(一) 群体构成的界限必须明确。

(二) 常模团体必须是所测群体的一个代表性样本。

- 27 -

409出品 禁止盗版 (三) 取样的过程必须明确且有详尽的描述。 (四) 样本大小要适当。一般情况,最小样本为30~100个。要是全国性的常模,一般的以2000~3000人为宜。

(五) 常模团体必须是近时的。

(六) 注意一般常模与特殊常模的结合。 3.离差智商与比率智商的本质差异是什么? 答案:

(一) 离差智商(IQd):智商的一种形式。智力发展水平测量指标。美国心理学家韦克斯勒在智力测验中首创。以某一年龄段内全体人的智力分布为正态分布,以该年龄组的平均智商为参照点,以标准差为单位求得的个体在智力测验中的标准分数。表示与同年龄组的人相比,某个体智力水平的高低。平均数通常为100,标准差在韦克斯勒智力量表中为15,在斯坦福-比奈量表中为16。离差智商=100+15Z或=100+16Z。

(二) 比率智商(IQr):智商的一种形式。表征个体智力发展相对水平的一种指标,斯坦福-比奈智力量表首次采用。计算公式为IQ=MA/CA*100%,式中IQ表示比率智商。MA表示心理年龄或智力年龄,CA表示实足年龄或实际年龄。依赖智力年龄与实足年龄的比值。

(三) 离差智商与比率智商的本质差异是离差智商克服了比率智商的局限,同样的智力分数在任何年龄水平上都代表同样的相对位置,不再受各年龄水平智商变异性不同的困扰。若有了变化,便可判定人的智力有了变化。在智力测验中已取代比率智商而被广泛使用。

4.为什么说测验的原始分数不能用来解释测验的结果? 答案:

原始分数反映了被试作答正确的程度,但是不同原始分数单位不同,一般不能直接反映出被试之间的差异状况,不能刻画出被试相互比较后所处的地位。为了使原始分数本身具有意义,使不同测验的分数可以相互比较,就必须将原始分数转换为导出分数,即按照一定的规则,经过统计处理后获得的具有一定参考点和单位,且可以相互比较的分数。 5.标准参照测验和常模参照测验的区别是什么?你认为会计师职业资格考试是什么性质的考试? 答案:

(一) 标准是指在编制测验和解释测验分数时所依据的知识和技能领域,而不是指分数的分界标准。

标准参照测验就是在对测验结果进行评价时不是以常模为标准,而是根据特定的操作标准和行为领域,对个体作出是否达标或达到什么程度的判断,而不考虑他人分数的测验。

(二) 常模是测验分数的总体分布形态,一般用测验分数的平均数和标准差表示。用常模可以确定一个被试测验分数的相对高低,即他在所属群体的能力或知识连续体上的相对位置。常模参照性测验就是以常模为评价测验分数优劣标准的测验,常模被视为测验分数的参照,它关心的不是一个人能力或知识的绝对水平,而是他在所属群体的能力或知识连续体上的相对位置。 (三) 二者的区别 (1)

标准参照测验是将被试的分数与某种标

准进行比较来解释。这种测验常常用来检验学习效果,看对指定的内容范围掌握的如何或达到某一标准。衡量测验优劣的主要指标是内容效度。 (2)

常模参照测验是将一个人的分数与其他

人比较,看其在某一团体中所处的位置。也就是把受测者的成绩与具有某种特征的人所组成的有关团体作比较,根据一个人在团体内的相对位置来报告他的成绩。所谓常模就是指具有某种共同特征的人组成的一个群体。

(四) 会计师职业资格考试属于标准参照测验。这种考试并不要求该考生与同时参加一类考试的其他考生进行比较,通过比较获得考生在团体中的相对位置,比如说排名等,而是以知识概述为依据,确定试题范围为测试考生是否达到某一级别的要求,从而划定一定的分数作为标准(比如60分),达到这个标准的考生即认为是合格的,可以颁发相应的资格证书。因此这种考试关键取决于试题的内容效度,即内容是否能衡量考生的真实水平。 第八章 单选

1.测验标准化的第一步是(B)。 A.程序标准化 B.指导语标准化 C.结构标准化 D.调查标准化 2.测验选择最基本的原则是(A)。 A.符合测量目的 B.测验具有科学性 C .符合道德伦理标准 D.测验具有可比性 3.使用测验的目的(C)。

A.更好地完成实验 B.了解评定对象各方面行为性质

C.对评定对象的特质行为或现象作质与量的估计

- 28 -

409出品 禁止盗版 D.完善量表,提高实验的信效度

4.一般来说接受一整套人格服务包括施测、评分计分、结果解释和出具书面报告大约需要(C)元人民币。

A. 50~100 B. 100~200 C. 200~300 D. 300~400 5.测验材料的保密室保证(D)和测验发挥效用的一个重要方面。

A.测验简便性 B.测验科学性 C.测验敏感性 D.测验公平性

6.测验敏感性与测验的(B)以及结果表达形式有关,又受测验的标准化程度和信度高低的影响。 A.功效 B.项目数 C.可比性 D.分析 7选择测验时常常需要考虑的测量学指标有信效度、难度、常模以及(D)。

A.时效度 B.标准化程度 C.敏感度 D.区分度 8.在测验中主试应表现的亲切、随和以减轻被试的(B)。

A.理解性 B.测验焦虑 C.兴奋程度 D.害怕程度 9.对那些赋予了主试在测验实施过程中的一定程度的(A)、主动性和判断权利的测验,主试尤其要谨慎并按照自己所接受的专业训练来实施。 A.灵活性 B.可靠性 C.可行性 D.准确性 10. 下面符合测验中测量学要求的是(D)。 A.可行性 B.实用性C.准确性 D.简便性 11.以下一定属于测验前的准备的是(B)。 A.告知被试测验的真实目的 B.事先告知被试测验的内容范围 C.主试经验丰富 D.主试性格温和、表现亲切

12.时限的确定,在很多情况下受施测条件以及被试特点的限制,其中最重要的是要考虑(A)。 A.测量目标的要求 B.测量的简便性 C.测量的时效性 D.测量的功效性

13. 下面不符合测验中测量学要求的是(C)。 A.功效性 B.敏感性 C.可行性 D.时效性 14.以下不属于测验使用者的资格审定方面的是(B)。

A.测验使用者的角色 B.测验的准确性 C .测验的性质 D.特定情境因素

15.测验使用者是指那些为测验的选择、实施、评分计分、测验分数的分析解释、(D)以及任何部分建立在测验结果上的决策等负有责任的个体。 A.统计分析结果 B.结果验证 C.信息反馈 D.传达测验结果

16.为了达到最优测验选择,测验使用者首先应该做的是(C)。

A.了解测验接收者的变量 B.具备关于测验所需的知识 C.了解测验分数将作何使用 D.了解测验的注意事项

17.测验使用者具备有关测验实施程序的知识和实施标准化的技能,以下包括的是(A)。 A.具备关于编制、修订测验的知识

B.深刻理解测验接受者的法律权利并保证其实现 C.熟练标准化施测的程序 D.保证测验相关信息的保密性

18.测验使用者要保证测验相关信息的(B)。 A.科学性 B.保密性 C.时效性 D.可行性 19.(B)不仅是测验使用者提高自己的专业技能的一个重要方法,也是减少测验误用的重要保障。 A.保证测验接收者的合理权利

B.具有在有经验的测量专业人员指导下练习和发展其测验技能的受督导经历 C.与测验接收者保持良好的联络 D.与同类测验使用者密切交流 20.测验接受者的权利不包括(C)。 A.被报知所拥有的权利与责任 B.受到公正的对待

C.有权在事后追加费用 D.测验结果在法律允许范围内被保密 21.侵犯隐私权不可能是其原因的是(D)。

A.测验被错误用来对个体进行决策的唯一基础 B.测验宣传过了头

C.侵犯隐私对这一概念本身的误解 D.测验有失伦理道德

22.测验结果的保密中最基本的一项原则(C)。 A.在任何情况下保护被试隐私 B.给被试提供所需信息

C.在被试同意情况下可交流主试所获得的被试信息

D.告知被试测验结果

23.测验信息的有效交流的目的不包括(B)。 A.消除测验神秘感 B.提高测验简便性 C.提高专业监督的力度 D.消除测验焦虑 24.测验过程的标准化不包括(C)。 A.评分计分的标准化 B.标准时限 C.测验者的知识技能 D.标准化指导语 25.中国心理学会与(C)年颁布了《心理测验管

- 29 -

409出品 禁止盗版 理条例》和《心理测验工作者的道德准则》。 A.1990 B.1991 C.1992 D.1993 26.测验前的准备不包括以下哪个方面(B)。 A.事先告知被试确切的时间、地点、内容等 B.主试不告知被试测验的真实目的 C.主试熟知指导语并流利表达

D.主试熟悉具体程序、准备实验的辅助材料 27.美国心理协会(APA)在(C)年成立了心理学伦理标准委员会。

A.20C初 B.20C30年代后期 C. 20C40年代后期 D. 20C50年代后期

28.美国心理协会(APA)于(B)年首次公开颁布心理测验发行的伦理标准。

A.1945 B.1950 C.1955 D.1960 29.20xx年APA颁布了(《C》),这一规范不仅详细阐述了测验使用者一般资格的具体要求,还针对讨论了某些特殊情况下对测验使用者的相关资格要求。

A.教育与心理测验标准 B.心理测验和诊断的技术推进 C.测验使用者资格 D.标准化测验使用者的责任

30.(C)年APA颁布了《测验使用者资格》,这一规范不仅详细阐述了测验使用者一般资格的具体要求,还针对讨论了某些特殊情况下对测验使用者的相关资格要求。

A.1998 B.1999 C.2000 D.2002 二、多选题

1.所选测验必须符合测量学要求,具体可参考如下几个方面:测验的科学性、测验的简便性还有(ABD)。

A.测验的功效性 B.测验的时效性 C.测验的可行性 D.测验的敏感性

2. .测验过程的标准化包括(ABCD)。

A.评分计分的标准化 B.标准时限 C.测验的环境条件 D.标准化指导语

3.选择测验时常常需要考虑的测量学标准有(ABCD)。

A.信效度 B.难度 C.区分度 D.常模 4. 测验前的准备包括以下方面(ACD)。 A.事先告知被试确切的时间、地点、内容等 B.主试不告知被试测验的真实目的

C.主试熟知指导语并流利表达 D.主试熟悉具体程序、准备实验的辅助材料

5.测验分数的(BD)要求测验是按照测验开发者的指示进行施测和评分计分的。

A.简便性 B.有用性 C.敏感性 D.可比较性 6.综合美国心理学会和其他专业委员会以及我国对测验使用者资格的要求可以归纳出以下几个重要方面(ABCD)。

A.具备测量学和心理测验方面的基本理论知识 B.具备最优测验选择方面的知识技能

C.具备对残障人士和不同语言背景的受测量者施测的知识技能

D.具备测验程序知识和实施标准化测验的技能 7.测验信息的有效交流的目的包括(BCD)。 A.保证测验的公平性

B.保证被试在最佳状态下接受测验

C.提高专业监督力度 D.消除测验神秘感. 8.大众对测验的认识偏差(BC)。 A.测验神秘论 B.测验万能论 C.测验无用论 D.测验科学论

9.ACA在19xx年颁布的《RUST》中提出测验使用者的资格审定取决于以下方面(ABCD)。 A.特定情境因素 B.测验使用者的角色 C.测验的性质 D.测验目的

10. 一般来说接受一整套人格服务包括(ABCD),大约需要200~300元人民币。 A. 施测 B. 评分计分 C . 结果解释 D. 出具书面报告 名词解释 1.

标准化施测:当给被试的指示、施测条件和评分步骤都遵循同样详细和一致的程序时,此过程就可称为标准化施测。 2.

测验的功效性:使用的测验能否全面清晰地反

应要评定内容的特征 3.

测验使用者:是指那些为测验的选择、实施 、评分积分、测验分数的分析解释、传达测验结果以及任何部分的建立在测验结果上的决策或行动等负有责任的个体。 4. 5. 6.

测验的敏感性:测验能测出受测者某种特质、测验的简便性:测验要简明省时、方便实施 测验的科学性:测验的技术参数是否符合测量

行为、或程度上的有意义的变化

学的要求 7.

测验的时效性:一项测验有一定的使用时效

简答

1.所选测验要符合测量学要求,具体考虑哪些?

- 30 -

409出品 禁止盗版 答案:

(一) 测验的功效性

(二) 测验的敏感性

(三) 测验的简便性

(四) 测验的科学性

(五) 测验的时效性

2.测量有关的伦理问题有哪些

答案:

(一) 对受测者隐私权的保护

(二) 测验材料的保密与测验信息的交流

(三) 测验结果的保密

3.测验使用者的资格

答案:

(一) 应该具备测量学和心理测验方面的基本理论

知识

(二) 测验使用者应该具备最优测验选择方面的知

识和技能

(三) 应具有对残疾人士和对不同语言背景的受测

者施测的知识和技能

(四) 有关测验实施程序的知识和实施标准化测验

的技能

(五) 测验使用者受督导的经历

- 31 -

更多相关推荐:
心理课的心得体会

在接触心理学这门学科的以前,它总给我一种太神秘的感觉,总以为它很深奥也很虚幻,但是通过这一个学期的学习,我被它的科学性,真实性所折服,可以说它是实实在在存在的东西,与此同时我还发现心理健康与身体健康同样重要,同…

心理学学习心得体会

张延通过12天心理学的学习培训,我将会不断的提高心理学的理论知识,同时我也会把三位老师交给我们的方法很好的运用到实践中去,不断的学习成长,争取做到在尊重他人的同时,我好,你好,世界好。有句话说的非常好好:搬开别…

心理培训心得体会

我很荣幸能有机会参加这次学生干部心理培训活动,培训以开展讲座的形式进行,从心理健康专题的讲说中,我懂得了学生干部如何应对心理压力,自信风采,为自己喝彩。也更深刻的明确了学生干部的工作职责,作为学生干部所要具备的…

上心理课的心得体会

心理健康课其实就是一门关于心理健康的课程,它不仅是针对大学生,而是针对所有在不人。在面向素质教育的时代,拥有健康的心理应是现代社会每个人所具备的条件和基础,是每个人能够健康成长的重要保障。随着年龄的不断增长。处…

心理学心得体会

心理学心得体会姓名:zjl学号:班级:土测09-2一学期的心理学课结束了,说实话真的舍不得。这是我第一次接触心理学,在我觉得还没有碰到她的皮毛时就结束了。在没接触心理学之前,我一直觉得自己是个知心姐姐,能够开导…

心理培训的心得体会

心理培训的心得体会我参加了沙坪坝区中小学心理健康教师培训班此次心理健康培训的时间虽然仅7天但在我的心理却激起了层层涟漪我相信这次培训给与我的东西决不止心理学的理论知识它会有一种延续性影响我的生活影响我的工作影响...

心理培训心得

放飞心灵,从你我做起------20xx级班级心理委员培训心得学院:班级:姓名:感谢学校给我们提供这次机会,让我们比较系统的接受了一些有关心理方面知识的培训,使我们这些心理委员掌握了一些发现同学心理问题以及干预…

学习心理学的心得与体会

学习心理学的心得与体会心理学一个既熟悉又感到陌生的词联合国卫生组织指出21世纪困扰人类的不是环境问题不是资源问题也不是恐怖主义而是来自于人类心理的问题诸如情结的烦闷学业与工作的压力孩子厌学感情困惑等等这些因素都...

犯罪心理学心得体会

犯罪心理学心得体会通过学习犯罪心理学我对这门科学有了更深的理解犯罪心理是人类固有的潜在心理犯罪是一种特别危险的侵害法益的不法行为我国刑法第十三条规定一切危害国家主权领土完整和安全分裂国家颠覆人民民主专政的政权和...

普通心理学心得

普通心理学心得普通心理学这门课程对于我来说是第一次较为系统的接触和学习心理学坦率的说虽然在平时接触过心理学的丁点知识但是对于系统心理学的了解很少而且片面的认为心理学对于自己没有太大的意义虽然它是一热门的学科也很...

心理健康教育学习心得

近日参加了电大心理健康教育概论学习通过这段时间的学习我获得了许多新知识使我对工作有了新的思考受益匪浅感想颇多我想就此问题谈谈自己从这次学习中获得的体会一通过学习使我认识到了心理健康教育的重要意义心理健康教育是一...

心理健康教育心得体会

心理健康教育心得体会一通过学习使我认识到了心理健康教育的重要意义心理健康教育是一种时代的要求良好的心理素质是人的全面素质中的一个重要组成部分是未来人素质中的一项十分重要的内容心理健康教育的具体目标是使学生不断正...

心理心得(54篇)