书城心理学心理学通论
32312500000010

第10章 心理测量学

几乎整个20世纪,心理学家一直都在探究评估人的属性的各个方面的方法,包括情感与恐惧、技能与能力倾向、信仰与态度、欲望与需要、悟性与兴趣等。他们的追求有两个主要的目的:其一是在理论上获得关于人类心理学知识的进展,另一个是在实践中寻找把这些知识用于实践的方法。

心理测量学是心理学的一个分支学科,它以心理学和统计学理论为基础,论述各类心理与教育测量中的一般编制原理及实施、计分、解释的标准化方法。

心理测量作为一种测量工具和研究手段,在人才选拔、就业指导、临床诊断及学绩评估方面,有着极其广泛的应用。

第一节 科学心理测量的产生与发展

要了解当代心理学的各个领域,不可不了解心理测量,因为测量是在当代心理学的各个领域从事理论研究和实际应用的重要手段。要研究心理测量,不可不考察它的发生发展的历史。

一、中国古代的心理与教育测量

我国古代具有非常丰富的心理测量思想,而且具有非常鲜明的特色。

中国是心理与教育测量技术的故乡。在中国古代社会,现代心理与教育测量的主要领域——能力测量、人格测量、学绩测量等均有所涉及。

(一)能力测量

早在2500多年前,我国古代教育家孔子就曾根据自己的观察,评定学生的能力差异,把人分为中人、中人以上和中人以下,这实际上相当于测量学中的命名量表和次序量表。

汉代的董仲舒已论及到注意测验,他说:“一手画方,一手画圆,莫能成。”

三国的刘邵在《人物志》中把人的才能分为——清节、法家、术家、国体、器能、藏否、伎俩、智意、文章、儒学、口辩和雄杰。

6世纪中叶,我国江南就有了类似于现在的婴儿发展测验的“周岁试儿”习俗。清代的益智图(俗称七巧板)、九连环可以认为是最早的创造力测验。

(二)教育测量

据史料分析,世界上最早的教育测量出现于中国西周奴隶制社会时期。

《礼记·学记》记载,西周的“国学”中已经建立具有相当系统性的教育测量制度:“比年入学,中年考校。一年视离经辨志,三年视敬业乐群,五年视博习亲师,七年视论学取友,谓之小成。九年知类通达,强立而不反,谓之大成。”

汉代在考试制度、考试类型和考试功能方面都作了重要的发展。在考试制度方面,调整了太学考试时间,开始用三种形式来考学生:“口试”、“策试”及“射策”,首开了笔试的先河。在考试功能方面,汉代十分重视教育测量功能的发挥,已经把考试运用于督促和检查学生的学习,使考试成为了太学学校管理的手段之一。

除了学校内部测量的自身发展以外,取士制度自汉以来的发展,客观上也对我国古代乃至于西方的教育测量发展起了促进作用。

西汉时,选拔官吏主要通过征辟和察举,乡选里举进行。至东汉开始渗入考试因素。经过魏晋南北朝时期的“九品中正”制,逐步实现了制度化。最后至隋炀帝大业二年(公元606年)发展成为科举制,是最早的学绩测量的实例,在中国延续了1300年。其间,不仅创造了分科考试、“弥封”、复评等方法,而且在命题、考试组织、反舞弊等方面形成了一套制度。欧美各国通过考试选拔官吏的方法是18世纪末、19世纪初从我国学去的。我国的科举制度对欧美的公务员制度的建立和教育测量方面都产生了较大的影响。

(三)对测验理论的最初探索

我国古代不仅在测验运用方面做出了杰出的贡献,而且在测验理论上也有着惊人的突破。

早在2000多年前,孔子在《论语》中就提出“性相近,习相远”的观点,这是对人类个别差异的认识。

孟子就指出了测量人类心理的必要性和可能性。他说:“权,然后知轻重;度,然后知长短。物皆然,心为甚。”西方学者直到20世纪20年代才解决了这一理论问题。

前面提到的刘邵曾对人才鉴定的意义、可能、困难和方法作了系统的论述。他认为,人才鉴定对于知人善任、振兴国家事业具有重要的意义。而人才之所以能够鉴定是因为人的才能和性格必然要表现在人的外部行为中。他把人的行为表现概括为九种,称为“九征”。通过观察这九种外部表现就可以知道人的才能和性格的特点。尽管如此,刘邵仍然认为人才鉴定很不容易。这主要是因为:一方面,鉴定者“各自立度”;另一方面,被鉴定者“表里不一”,行为“似是而非”。为了克服这些困难,他提出了一套识别人才的方法:“八观”和“五视”。这一套方法是自孔子以来对观察法的系统总结。

对于我国古代的心理与教育测量思想的重要特点可以总结如下:

第一,中国古代社会的心理与教育测量思想都是描述性的,而非定量的。这符合当时的科学技术的发展水平。

第二,中国古代社会的心理与教育测量是分类式的。能力测量和成就测量(即科举考试)分成了高、中、低几个层次;性格测量分成了若干种类。

第三,中国古代社会的心理与教育测量思想注重对人做整体的鉴定和评价,并倾向于和人的道德品质联系起来。

第四,中国古代社会的心理与教育测量思想与教育中的因材施教及人才使用有着密切的联系,心理测验的产生与社会的需要紧密相连。

二、西方的心理测量的产生与发展

心理测量产生的最初原因是对智力落后和精神病人治疗的需要。19世纪,由于社会上对智力落后和精神失常者实行人道主义,在欧洲和美洲开设了一些护理精神病人的特别医院,因而急需确定收护标准和客观化的分类方法,首先必须区分精神错乱者与智力落后者。法国医生伊斯奎洛尔(Esquril)经过种种尝试最后断定:一个人驾驭语言的能力,是他智力水平的最可靠的标志。

另外,随着工业的发展,社会分工日益精细,因而有了专才训练与职业指导的需要,这也是促使测验发展的重要因素。特别是后来各种特殊能力倾向测验,更是直接应实践的需要而产生的。

在西方一些国家,工业革命成功后,对劳动力的需要急剧增加,工厂大量采用童工,许多地方官与工厂主订约,每雇佣20个童工,必须带1个低能者。第一个用科学方法研究低能者的是法国医生意太。他的学生沈干(Seguin)继承其师半途而废的事业,用生理训练法进行了多年试验,并于1837年创办了第一所专门教育智力落后儿童的学校。后来,其他一些欧美国家也陆续设立低能学校或在普通学校设特别班。在这种情况下,单靠长期观察和社会公认来鉴别智力落后儿童就很不够了。1864年,沈干出版了《白痴:用生理学方法来诊断与治疗》一书,介绍了在感觉辨别力和运动控制力方面训练落后儿童的方法,其中的一些方法如形式板被后来的非言语智力测验所采用。

(一)心理测验起源于个别差异的研究

科学家最初发现人的心理的个体差异的重要性是起因于天文学上的一个事件,这就是格林威治天文台事件,它引起了学者们对个别差异的研究。但是,当时的心理学家们并不关心个别差异的测量。直到19世纪末时,心理物理学的发展才促进了对心理现象的量的测定。

1879年,冯特在莱比锡大学设立第-所心理实验室。这一时期的实验心理学家长于生理学和物理学,主要目标是要发现人类行为的一般趋势,注意的焦点是行为的共同性而不是它的差异性。但是在研究中发现,对于同一刺激,各人的反应常常不同。起初以为这是由于实验步骤上的错误。经过长时间的实验才认识到,此种差异并非由于偶然的错误,而是由于个体间能力上的真正差别。于是,引起了个别差异的研究。要研究个别差异必须有测量工具,由此便引起了测量运动。

另一方面,早期的心理实验提出了严格控制观察条件的要求。例如,在一个测量反应时的实验中,给予被试者的指导语可能明显地提高或降低被试者的反应速度。再如,周围环境的照度和色调可能明显地改变视觉刺激物的形象。这表明,只有在标准状况下,被试者所作的观察报告才是有价值的。这为测验的标准化打下了基础。

(二)心理测验的早期尝试

第一个推动心理测量运动的是优生学创始人、英国生物学家和心理学家弗兰西斯·高尔顿(Francis。Galton)。1869年,他出版了《遗传的天才》一书,提出人的能力是由遗传而来,并设想人的能力的分布是常态的,其差异是可以测量的。他在1884年的国际博览会上设立了一个人类测量实验室,参观者付3个便士就可以测量到自己的某些身体素质和视听觉的敏锐性、肌肉力量、反应时以及其他一些简单的感觉、运动功能。博览会闭幕后,这个实验室迁到伦敦的南圣顿博物院,在这里继续开办了6年之久。用这种方法,系统积累了关于简单心理过程方面的9337人的材料,是第一个大量系统地测量个别差异的尝试。高尔顿设计了许多简单的测验,如判断线条长短与物体轻重等。他在1883年出版的《人的能力研究》一书中说:“外部世界的信息是通过我们的感觉到达我们大脑的。我们的感觉越敏锐,获得的信息便越多,获得的信息越多,我们的判断与思维便越有用武之地。”高尔顿还注意到,白痴对于热、冷、痛鉴别能力较低。这一观察结果使他进一步确信,感觉辨别力“基本上是心智能力中最高的能力”。高尔顿还是应用等级评定量表、问卷法以及自由联想法的先驱。他的另一个很重要的贡献是把统计方法应用于对个别差异资料的分析。他将以前数学家们所研究出来的统计技术改造为简单形式,使那些未经专门训练的调查者也能使用。他不但扩充了古特莱特的百分位法,还创造了-种粗浅的计算相关系数的方法。他的学生皮尔逊推进其事业,创立积差相关法,成为测验学者寸步不能离的工具。

在心理测验的发展史上,美国心理学家卡特尔(R。B。Cattell)占据了一个特别突出的位置。卡特尔早年留学于德国,师从冯特。他将新兴的实验心理学与刚刚兴起的测验运动结合起来,不顾先生的反对,完成了题为《反应时的个别差异》的博士论文。1888年,在剑桥大学任教期间,他与高尔顿过从甚密,深受其影响,在差异测量方面的兴趣得到加强。回美后,卡特尔在宾夕法尼亚大学讲授心理学,综合了冯特、高尔顿的学说,以各种心理测验来研究个别差异。他在自己的实验室内编制测验50个,包括测量肌肉力量、运动速度、痛感受性、视听敏度、重量辨别力、反应时、记忆力以及类似的一些项目。他于1890年发表的《心理测验与测量》一文,描述了这些测验。这篇论文首创了“心理测量”这个术语,还由高尔顿加上了一篇附录表示支持。在此文中,卡特尔说:“心理学若不立足于实验与测量上,决不能够有自然科学之准确。”又说:“心理测量若有一普遍的标准,则其科学的与实际的价值一定可增加不少。”他当时就极力主张测验手续和考试方法应有统一规定,并要有常模以便比较。所有这些都是测量学上的重要观念。但他的测验皆脱胎于冯特的实验室,测量的大多是感知和运动过程。对同一个人来说,几项测验的结果往往很不一致,而且测验得分与老师评定的智力等级或学习成绩相关极低。因此,在教育上缺乏实用价值。这启发后来的研究者探索其他途径来研究智力的差异。

与此同时,其他一些学者在心理测验方面也做了大量工作。1889年,厄恩(Oehrn)曾编制一组测验,测量知觉、记忆、联想和运动机能;1892年,波尔顿(F。E。Bolton)用数字测量儿童的记忆力;1895年,包尔登(Bourdon)发明勾销测验,其结果虽与智力关系不大,但此法现在依然通行;1897年,艾宾浩斯(Ebbinghaus)用算术运算、记忆广度、句子填充测验施测于小学生,最复杂的要数句子填充,其结果与学业成绩十分相符,这大大有别于卡特尔的低级心理过程的测验;1903年,克莱(Kelly)已有以智龄为常模的思想,可惜此后未深加研究。

这些事实说明,科学的心理测量不是哪一个人独立创造的,而是时代发展的必然产物。

(三)比奈的贡献

著名美国学者波林(E。G。Boring)指出:“在测验领域中,19世纪80年代是高尔顿的10年,90年代是卡特尔的10年,20世纪头10年则是比奈的10年。”

比奈(A。Binet),1857年生于法国尼斯市,其父为医生,其母为艺术家。比奈在青年时学习医学,却对心理学更有兴趣。1886年发表第一部著作《推理心理学》。1889年同亨利(Henry)在索那建立法国第一所心理学实验室,后任实验室主任。1891年发表《个性的变化》一书。后来,他还对一些著名的计算家、棋手和盲棋手的思维活动做了研究,于1895年创办法国第一份心理学杂志《心理学年报》。同年他与亨利联名发表文章,批评当时流行的测验太偏重于感觉,过于集中在测量简单的和特定的能力方面。他们认为,测量比较复杂的功能,不必苛求精确度,因为这些功能的个别差异比较大。1898年,比奈在哲学杂志上发表《个性心理学中的测量》一文,提到许多测验,如画方形、比较线的长短、记忆数目、词句重组、回答含有道德判断的问题、了解抽象文章的意义和折纸等等,后来有许多采用在他的量表中。在这篇文章中,他还提出心理测量的根本原理在于将个人的行为与他人比较以归类,这是近代测验理论的基本思想。1903年,他的另-本著作《智力的实验研究》问世,在此书中他所讲的智力是广义的,包含一切高级心理过程,并且表现在推理、判断以及运用旧经验解决新问题的行为上。他以自己的两个女儿作为被试,所用的测验有填字、图片解释等。有些后来亦用于他的量表中。1904年,法国教育部委派许多医学家、教育家与科学家组织一个委员会,专门研究公办学校中低能班的管理法,比奈亦是委员之一。他决心将测验的理论研究变为实际的应用,不顾众人的反对,极力主张用测验法去辨别有心理缺陷的儿童。经过细心研究,次年与其助手西蒙(T。Simon)在《心理学年报》上发表一篇论文,题为《诊断异常儿童智力的新方法》,在这篇文章中介绍的就是第一个智力量表——比纳-西蒙量表(Binet-Sinom Scale)。

1905年的量表有30个由易到难排列的项目,可用来测量各种各样的能力,特别侧重于判断、理解、推理,亦即比奈所谓智力的基本组成部分。虽然这些测验也包括了感、知觉的内容,但其中言语部分所占的比例远较同时代的其他测验大。不过该量表比较粗糙。1908年做了修订,采用智力年龄的方法计算成绩,并建立了常模,这是心理测验上的一个创新。1911年做了第二次修订。就在这一年,比奈不幸谢世,终年54岁。

在心理测量的发展史上,比奈的贡献是不可磨灭的。因此,美国心理学家宾特纳(Pintner)说:“在心理学史上,假使我们称冯特为实验心理学的鼻祖,我们不得不称比奈为心理智力测量的鼻祖。”

(四)心理测验的发展

比纳-西蒙量表问世后,迅即传至世界各地。各种语言的版本纷纷出现,其中最著名的是美国斯坦福大学推孟(L。M。Terman)教授1916年修订的斯比量表,其最大的改变是采用了智商的观念。早在1911年,德国汉堡大学心理学家斯腾(Stern)就曾提出用儿童的心理年龄除以实足年龄所得的“心理商数”来表示聪明程度。推孟在修订比纳-西蒙量表时将其改称为“智商”,从此,“智商”一词便为全世界所熟悉。

心理测验运动自20世纪初兴起,20年代进入狂热,40年代达到顶峰,50年代后转向稳步发展。在此期间,测验主要有以下几方面的发展:

[1]编制出一批操作测验,既可弥补语言文字量表在理论上的缺陷,又可以用于文盲和有言语障碍的人。非文字量表以宾特纳的最好。

[2]编制出团体智力测验,扩大了测验的应用范围。促进团体智力测验发展的原因,是第一次世界大战时美国军队对官兵选拔和分派兵种的需要。在推孟的研究生奥蒂斯(A。S。Otis)所编团体测验的基础上,发展出军用甲、乙两种测验,对200多万官兵进行了智力检查。战后,此种测验经改造广泛用于民间,为教育与工商各界普遍采用。

[3]多重能力倾向测验逐渐受到重视。早在第一次世界大战前,一些特殊能力(如音乐、美术、机械等)倾向测验已经在实际应用中得到发展。30年代后,随着因素分析理论的发展,多项能力倾向测验在第二次大战后编制出来,这种成套测验为分析个人心理品质的内部结构提供了适用的工具。普通能力倾向(智力)测验也向多元分析形式发展,主要代表是美国学者韦克斯勒(D。Wechsler)所编制的儿童智力量表(1949)、成人智力量表(1955)和学前智力量表(1967)。其特点为:一是用离差智商代替比率智商。二是由各个分测验结果可以得到言语、操作和全量表三个分数,即可以区分个别间差异,也可以评定个别内差异;对人的能力的描述,从笼统地谈聪明、不聪明,转向区分智力的不同侧面,说明人人皆有所长和所短。

[4]正当心理学家们忙于发展智力测验的时候,传统的学校考试也正在进行一场改革。卡特尔的学生桑代克(E。L。Thorndike)等人,利用心理测验原理,编制了第一批标准化的教育测验。因此,后人尊称他为教育测验之鼻祖。一些专门的教育测验机构也在一些国家陆续成立起来,如美国教育测验中心成立于1947年,是目前世界上最大的测验编制和研究机构。它有心理学家、教育学家和各方面的学科专家2000余人,并配有现代化的计算设备。

[5]心理测验的另一领域涉及情感适应、人际关系、动机、兴趣、态度、性格等人格特点。人格测验的先驱是克雷丕林(E。Kraepelin),他最早用自由联想测验来诊断精神病人。人格问卷或自陈量表的原型是1917年武德沃斯设计用于士兵的个人资料调查表,以后一直被奉为情绪适应调查表的范本。1931年问世的罗夏克(Rorschach)墨迹测验则是投射测验的发端。人格测验后来也发展到要求数量化,如明尼苏达多相个性调查表等。

[6]60年代后,由于认知心理学的崛起,将实验法与测验法结合,产生了信息加工测验,为了解心理能力提供了一些补充方法,使心理测验出现了新的发展趋势。近年来,耶鲁大学的心理学家斯腾伯格(Sternberg)从信息加工的角度提出了关于智力的三元理论,认为智力是个体对内外情境中信息进行加工处理的能力,由成分性智力(compontential intelligence)、经验性智力(experiential intelligence)和实用性智力(contextual intelligence)等三部分组成。

(五)心理测量发展的特点

纵观心理测量的发展历史,可看出以下几点:

[1]先是以解剖生理特征为根据,而后转向对心智活动的测量。

[2]由测量简单的感知能力,发展到测量复杂的认知能力。

[3]由笼统的单一量数以评定个别间差异的观念,转变为以多个量数兼顾个别差异与个别内差异的观念。

[4]心理测量学是随着实验心理学的发展而产生的,二者在发展过程中由合到分,最后又走到一起来了。

目前的心理测验虽然看起来很简单,却是经过几代心理学家用了近一个世纪的时间反复探索才找到的,其发展主要受了两方面因素的影响:

一是心理学理论的发展。1904年英国心理学家斯皮尔曼(C。Spearman)提出智力的二因论,认为人类智力可分为普通因素和特殊因素二部分,比奈测验所测得的只是普通因素。后来人们又对特殊因素发生兴趣,而编出各种特殊能力测验。30年代智力的多因论兴起,瑟斯顿(L。Thurstone)由因素分析求得七种基本的心理能力,随之发展出一批多重能力倾向测验。60年代,美国南加州大学教授吉尔福特(T。Guilford)的智力结构理论代之而起,提出发散思维为智力的因素之一,从而开拓了测量创造力的新领域。

二是统计学方法的进步。早期的心理测验主要应用相关法进行研究。30年代后,因素分析法盛行,不但推进了能力测验的发展,还促进了人格理论与人格测验的发展,卡特尔16种人格因素测验就是采用因素分析法编制的。当代信息加工测验的发展与一系列新的数学模式的提出是同计算机的应用分不开的。

第二节 一般测量概述

一、定义及分类

1.定义

测量就是依据一定的法则使用量具对事物的特征进行定量描述的过程。

2.分类

根据测量对象的性质和特点,可以将各种不同形式的测量大致分为4种类型:

[1]物理测量:对事物的物理特征的测量;

[2]生理测量:对机体生理特征的测量;

[3]社会测量:对社会现象的测量;

[4]心理测量:对人的心理特征的测量。

二、测量的基本要素

任何测量必须具备两个基本要素,即测量的参照点和测量的单位。

1.测量的参照点

测量的参照点指的是在测量工作中必须有一个量的起点,这个起点就叫做测量的参照点。参照点有两种:一种是绝对参照点,即以绝对的零点作为测量的起点。比如长度和重量测量就是建立在以绝对的零点为参照点的基础上的测量。另一种是相对参照点,即以人为确定的零点为测量的起点。如地势高度的测量,就是以海平面为测量的起点。最理想的参照点是绝对参照点。

2.测量的单位

不同测量的单位是不同的。理想的测量单位应当具备两个条件:一个是要有确定的意义,即对同一单位来说所有人的理解是相同的;二是要有相等的价值,即单位与单位之间的距离是相等的。但是教育与心理测量中的单位往往很难达到这个要求,它远不如其他测量中使用的单位成熟和完善。

三、心理与教育测量的性质

随着科学的发展、技术的进步,人们不但对物体的长度、重量、温度以及时间、空间、运动等物理特性做出了越来越精确的测量,而且不断地尝试着对人的感知、记忆、思维、想像、注意、情绪以及能力、气质、性格等心理特性进行测量,并摸索出了一些方法,加深了对人类心理现象的了解,促进了心理学理论的发展。

辩证唯物主义认为,心理是脑的机能,是客观现实的反映。人的心理既是主观的,又是客观的。心理的客观性、存在性决定了心理的可知性、可测性。譬如我们平时说的“怕”这种心理现象,虽不是物质实体,但也是一种客观存在,伴随有一系列生理变化,并能用仪器测量出来。从脉搏、呼吸、心跳、血压、皮肤电及外显行为的改变,便可以推测其“怕”的程度。

当然,由于心理现象本身十分复杂,目前的测量方法尚未完善,心理测量无论就其可靠性和准确性都远不如物理测量。但测得不准不等于不能测,现在不能测不等于将来不能测。不承认心理现象的可测性,是唯心主义的不可知论。

(一)心理与教育测量的定义

1.定义

心理与教育测量指的是依据一定的心理学和教育学理论,使用测验对人的心理特质和教育成就进行定量描述的过程。

所谓一定的法则,指的是在测量时所采用的规则或方法。例如,用秤测物体的重量,依据的是杠杆原理;测量人的智力,是根据智力理论编制测验,看被试在测验上的得分,如此等等。使用好的法则,可以得到准确的测量效果;使用不同的法则,则会得到不相同的测量效果。许多事物易于测量,因其使用的法则易于确立和遵守。心理现象难以测量,是因为很难设计清晰而良好的法则。随着人类认识的发展,人类的测量法则不断完善,人类的测量也就越来越准确。

所谓“事物”,指的是我们所感兴趣的东西,说得更明确些,是引起我们兴趣的事物的属性或特征,测量就是确定这些属性或特征的差异。

所谓“数字”,是个比数值意义更广泛的概念,可以表示数量,也可以不表示数量。一般说来,用数字对事物加以确定,就是确定出一个事物或事物的某一特性的量。但有时也可把数字当作一种事物的符号,而不反映事物的量,如“1班、2班、3班……”等。通常人们说的测量,指的是前一种情况,即根据特定方法,采用一定的操作程序,给事物确定出一种数量化的价值。

2.特点

[1]心理与教育依据的法则在很大程度上只是一种理论,很难达到如同物理测量依据的法则那样普遍被人们接受的水平。

[2]心理与教育测量的对象是人的心理特质和教育成就。教育成就的含义比较明显,是指一个人通过接受教育而获得的知识水平。心理特质的含义则比较含混,不大可能给予清楚的界定。这就决定了心理与教育测量只能是一种间接测量。

[3]心理与教育测量的量具是由有关领域的专家编制,经过长期的试用、修订、完善而逐渐形成的标准化测验。它的编制是一项高度专门化的系统工作,要达到科学所要求的水平决非易事。

[4]心理与教育测量的目标虽然是对人的心理特质和教育成就进行定量分析,但这种定量分析的精确度远不及物理测量的精确度高。这是由人的心理特质的高度复杂性所决定的,同时也与目前的测验编制理论不够先进、测验编制的技术水平不高有关。

(二)心理与教育测量的理论基础

1.心理与教育测量的理论基础

1918年,桑代克曾指出,“凡是客观存在的事物都有其数量”。1939年,麦柯尔指出,“凡有其数量的事物都可以测量”。这两个命题就是心理与教育测量的理论基础。

2.人的心理的可测性

[1]人的心理现象和知识水平如同其他一切物理现象一样是有差异的,这种差异既有质的方面,也有量的方面。所以有必要测定出这些差异的数量。

[2]心理特质和知识水平虽然不是物理实体,不能直接测量,但是可以通过观测人的外部行为的差异来测量人的心理特质和知识水平。

[3]心理与教育测量的准确性、可靠性和精确度同物理测量一样是相对的,其技术也会随着科学技术的发展而逐步提高,也会越来越完善。

(三)心理与教育测量的量表的水平

从本质上讲,心理与教育测量的量表属于顺序量表。

1.参照点

从使用的参照点来说,教育测量和心理测量领域的参照点均为相对参照点。

2.测量单位

从所使用的单位来说,教育与心理测量的单位远没有其他测量的单位成熟和完善。一方面是教育与心理测量所使用的单位的意义不太明确;另一方面是在教育与心理测量中的单位常常不等值。

(四)编制测验应当具备的基本条件

1.行为样本

样本是指从整体中抽取出来作为测量对象的一组样品。

行为样本指一组被抽取出来的、作为直接的测量对象的行为。比如,要知道学生的数学运算能力的高低,就可能选择若干有代表性的数学问题,要求学生解答这些问题。学生在解答这些问题时的行为就是要测量的直接对象;当根据这一组行为来推断其整体的数学运算能力时,这一组行为就是数学运算能力的行为样本;而引起学生行为的那些数学运算问题就是测验。

2.标准化

测验的标准化就是指测验的编制、实施、记分以及测量分数的解释的程序的一致性。

测验标准化需要具备以下的条件:

(1)测验内容的标准化

测验内容的标准化是向所有接受测量的个人实施相同的或等值的测验内容,它是标准化的首要前提。

(2)施测条件的标准化

施测条件的标准化是指所有接受测量的个人必须在相同的施测条件下接受测验。包括相同的测验情境、相同的指导语和相同的测验时限。

(3)评分规则的标准化

评分规则的标准化指所制定的评分规则要足以使不同的评分人的评分结果保持最大程度的一致,它要求评分结果具有客观性。

(4)测验常模的标准化

常模是一组有代表性的被试群体的平均测验分数。它表示的是普通人的一般状况,指的是理想上达到的程度。常模指的是被试群体实际达到的程度,常模不同于标准。以常模为参照编制的测验叫常模参照测验;以标准为参照编制的测验为目标参照或标准参照测验。

3.难度与应答率

(1)难度

项目的难度是通过计算被试答对某一项目的人数比例来确定的。它是在编制教育成就测验和各种形式的能力测验时一个很重要的指标。

(2)应答率

应答率是通过客观地统计计算被试对某一项目的回答数来确定的。它针对的是如态度测验、兴趣测验、性格测验等不存在难度问题的测验。

4.信度和效度

(1)信度

信度指的是一个测验的可靠性,即用同一测验多次测量同一团体所得结果之间的一致性程度。它是衡量测验科学性的最基本的指标。

(2)效度

效度指的是一个测验的有效性,即一个测验在多大程度上能够测到它所要测量的心理特质。效度是衡量测验科学性的最重要的指标。

四、心理与教育测验的种类及其功能

(一)心理与教育测验的种类

1.按测量对象分类

(1)智力测验

智力测验旨在测量个人的智力(一般认知能力)水平的高低,即通常所说的聪明程度。国内外比较有名的智力测验有“斯坦福-比内量表”、“韦克斯勒智力量表”、“瑞文推理测验”和“卡特尔超文化智能测验”等等。

(2)能力倾向测验

能力倾向测验旨在测量个人的潜在的才能,预测个人的能力发展倾向。一般可以把它分为两种:一般能力倾向测验和特殊能力倾向测验。

(3)成就测验

成就测验旨在测量个人在接受教育后的学业成就。成就测验有两种:一是学科成就测验;二是综合成就测验。

(4)人格测验

人格测验旨在测量个人在诸如兴趣、态度、动机、气质、性格等方面的心理特征。人格测验主要分为两类:一类是自陈人格问卷,如“明尼苏达多相人格调查表”、“卡特尔16PF测验”、“艾森克人格问卷”等;一类是投射测验,如“罗夏克墨迹测验”、“主题统觉测验”等。

2.按测量方式分类

(1)个别测验

个别测验是同一主试在同一时间内只能测量一个被试。如“斯坦福-比内量表”、“罗夏克墨迹测验”等。

个别测验有许多优点,如,有机会获得测验分数之外的信息;容易建立起融洽的合作关系;对特殊的被试只能用个别测量。当然个别测验也有不足,如费时、手续复杂、对主试的要求高等等。

(2)团体测验

团体测验是同一主试在同一时间内能测量许多被试。如“瑞文推理测验”、“陆军甲、乙种团体智力测验”以及绝大多数自陈人格问卷均属于团体测验。同样,团体测验也有许多优势,如节省时间,可以在短期内收集到大量的测量数据;另一方面,团体测验也存在一些缺陷,如不易控制被试的行为,易产生测量误差,从而影响测量的信度和效度等等。

团体测验与个别测验关系密切,团体测验可用于个别测量,但个别测验不能用于团体测量。

(二)心理测验的功能

心理测验的基本功能是测量个体间的差异或同一个体在不同场合下的反应。测验在实际工作和理论研究中有着广泛的应用。

1.测验在实际工作中的应用

(1)选材

在教育、工业、军事、艺术和体育等部门,人们经常面临着选材问题,也就是要辨认那些具有最大成功可能性的人。根据对各种活动的分析,找出各种活动所要求的心理模式,然后根据这些特征设计出各种能力、人格和学绩测验,预测人们从事各种活动的适宜性,可以提高人才选拔和职业训练的效率。

例如,美国1942年制定全套方案对飞行员进行选拔,结果淘汰率由65%下降到36%。我国近年来制定的《学习飞行能力预测方法》,从注意广度、视觉鉴别、运算能力、地标识别、图形记忆等几方面进行测验,大大减少了人力和物力的浪费。

(2)安置

心理测验在学校对学生如何按能力分班以做到因材施教、早出人才,在工厂和部队如何根据每个人的特长分配工作和兵种,以做到人尽其才,在提高劳动生产率和部队战斗力中发挥作用。借助于心理测验,可以使我们在人和工作之间做出较好的匹配。

(3)诊断

对于智力落后者的鉴别是促进心理测验发展的原动力之一。直到今天,在临床上对各种智能缺陷、精神疾病和脑功能障碍的诊断仍是某些心理测验的主要用途。

测验的诊断功能不只限于临床,在教育工作中还可以用测验来发现学生适应不良的原因和学习困难之所在,搞清是缺乏某种特殊能力,还是某方面的知识没有掌握,亦或是性格不良,从而采取适当的帮助和补救措施。专门为某一学科编制的诊断测验还可以确定学生所犯错误的类型,找出每个学生在学习中的弱点,以决定采用什么方法弥补。

(4)评价

测验可以评价人们在学习和能力上的差异、人格的特点以及相对长处和弱点,评价儿童已达到的发展阶段等。既可用于评价学生,也可用于评价教师和教学方法;既可用于评价个人,也可用于评价集体。测验还有助于人们的自我了解和自我评价。

(5)咨询

各种学业、能力、兴趣、性格测验可以服务于升学、就业指导,还可探察人的情绪困扰和人格障碍,为当事人的自我决策和行为矫正提供参考意见。

用测验来解决实际问题时,要注意测验资料只是作决定时要考虑的一个因素,而不是充分的条件,要做出一个好的决策还必须考虑其他方面的信息。

专栏:我国首次对应征青年进行心理检测

新华网北京2002年10月31日电(记者陈辉李克强):全国部分地区在今冬征兵体检中将进行心理检测试点。这是我国首次对应征青年进行心理检测。

据介绍,我国从上个世纪60年代开始对飞行员进行心理检测,80年代后对初级指挥员和汽车驾驶员、领航员、航天员等专业人员进行心理检测。今冬征兵心理检测试点在北京、陜西、湖南、内蒙古、广东、宁夏、云南、江苏、河南、黑龙江等省、直辖市、自治区的部分地区展开。对应征青年进行心理检测,是为了从源头上控制精神和心理不健康的青年进入部队,保证兵员质量,增强部队的战斗力。

这次征兵心理检测对象是初检合格后的男性应征青年,分为《性格特征调查量表》和《运算能力测验》。《性格特征调查量表》是从国际最著名的MMPI-2测验中筛选近200道题目对应征青年进行心理检测,以达到对严重心理障碍、精神疾病的识别和预测。《运算能力测验》是透过基本加减法运算,对应征青年的数字运算能力、语言理解能力、信息加工速度等进行检测,鉴别应征青年的智商。以上两种心理检测都是采用纸笔测验和计算器辅助评判的方法。

2.测验在理论研究中的应用步骤

(1)搜集资料

几乎所有的心理学领域都涉及个别差异问题,而测验是用来搜集有关资料的一个简便易行而又较为可靠的方法。譬如对智力的发展速率、智力的个别差异、团体差异以及影响智力发展的环境和遗传因素等问题的研究,大量资料都是由测验得到的。

(2)建立和检验假说

心理学中的许多理论是在测验资料的基础上提出来的,并且用测验来检验。心理测验在基本理论的研究中所起的作用是不容忽视的。如智力结构理论的提出和发展,智力测验就起了重要作用。在教育工作中,不同教育措施的效果也要靠测验来比较和检验。

(3)实验分组

在心理学研究中,常用测验来对被试进行实验分组以达到等组化的要求。

总之,心理测验充实了研究心理学的方法,不但推动了心理学理论的发展,而且使心理学更好地为实际服务。

五、正确地对待和使用心理测验

(一)对心理测验的看法

自测验问世以来,人们对其毁誉不一,有两种极端看法:

1.心理测验完美无缺

一些人对心理测验效能高估,对测验奉若神明,单纯依靠测验做各种决定,而不考虑从其他方面来的信息。他们迷信分数,把测验分数绝对化,甚至把测验分数的微小差异也看作具有重大的实际意义。特别是在20世纪20年代,随着团体测验的兴起,测验在西方风靡一时,泛滥成灾,忽略了测验还只是个粗糙的工具。当测验结果与那些毫无根据的期望大相径庭的时候,对测验的失望、怀疑,乃至敌视情绪便油然而生。这一狂热运动实际上反而延宕了心理测验的进一步发展。

2.心理测验无用且有害

心理测验在其发展过程中不断受到人们的批评。测验的反对者认为测验是根本无用的,依靠测验往往会做出许多错误的决定。

在西方对心理测验的另一种批评是,某些人格测验侵犯了个人秘密,违背民主原则。他们认为人的个性和态度是自己的事,与学习或工作的成功无关,不应该在做实际决定时加以考虑。美国加利福尼亚州的立法机关通过的一条法令规定:凡涉及学生“家长或监护人的个人信仰、私生活、家庭生活、品格或宗教方面的问题,禁止施行任何测验、问卷、调查或检查……除非书面通知学生的家长或保护人,说明需要施行这样的测验、问卷、调查或检查,并得到他们以书面形式所表示的同意……”

人们对测验最强烈的批评是测验为宿命论和种族歧视、阶级压迫提供了心理学依据。近年来,对此问题国际上已取得渐趋一致的看法。人们普遍认为,这不是测验本身的过错,测验是一个工具,测的是人的心理的差异,至于这个差异是先天的还是后天的,这要看使用者持哪种心理学理论,而与测量工具无关。现在大多数人认为测验测量的是教育成就和现有能力,是遗传与环境、成熟与学习相互作用的结果。至于测验为少数种族主义者和统治者所利用,这种情况确实存在。早期的智力测验由于内容多是白人和城市中产阶级所熟悉的材料,黑人和劳动人民在测验上得分较低,于是有人便得出了黑人和劳动人民天生愚笨的结论。但此种观点很快就受到正直的心理学家的批判。譬如,美国明尼苏达大学心理学教授欧文·戈茨曼就曾明确指出:“美洲黑人和其他美国人的平均智商之间的差异,几乎完全可以用从胎儿起直至整个一生的处境不利来说明。”

对文化背景影响测验分数的问题已经研究了很多年。最初,有些研究者企图发展排除文化影响的测验,可是人们很快就认识到这是行不通的,于是又转向编制所谓文化公平的测验。还有人根据亚文化群的特点,为不同文化背景的团体编出不同的量表。所有这些努力都取得了一定的效果。所谓公平只是相对的,更重要的是找出造成各个团体文化差异的因素,然后再设法去消除它。

(二)对心理测验的正确态度

1.心理测验是研究心理学的一个重要方法和作决策的辅助工具

俄国化学家门捷列夫说过:“从开始有测量的时候,才开始有科学。”

从心理学的发展史来看,心理测验是在心理学由思辨科学转向实验科学后产生的。对行为的客观测量代替了内省法,这是一个进步,是继实验法之后,在心理学研究方法上的又一次唯物主义尝试。测验法较之观察法和旧法考试更准确、更客观,同时由于测验对被试的取样大,并能研究较为复杂和高级的心理现象,因而可弥补实验法的某些不足。

但是,测验不是鉴别个别差异的惟一方法,更不是万能方法。测验的作用是有限的,只有把各种方法结合起来,才能对人的心理现象做出全面的考察。当现实需要做出决定时,应当采用最有效的信息。如果它能从测验分数得到,那就使用测验;如果别的方法能提供更好的信息,那就不用测验。重要的是对各种方法的功效做出评价,权衡利弊,尽可能公正地、客观地采用最理想的程序。

对待心理测验正确的态度应该像鲁迅先生说的那样,对外国一切好的东西都采取拿来主义,为我所用。

2.心理测验作为一种研究手段和测量工具尚不完善

心理测验无论在理论上和方法上都存在不少问题,绝不能认为测验分数对于人们的能力和人格提供了非常准确可靠的指标,在对测验分数作解释,尤其是对个别人作预测时必须十分小心。

在某些情况下,测验使人做出了错误的决定。但在更多的情况下,测验能为我们提供用其他方法得不到的有用信息。

测验的主要问题是缺乏坚实的理论基础。关于智力和人格目前还没有统一的定义和理论。有人可能会质问心理学家:你连什么是智力和人格都没搞清就想要测量它们,岂不荒唐?我们说这种情况在科学史上是屡见不鲜的。譬如,在对万有引力定律一无所知时,人们仅根据简单的杠杆知识就能称物体的重量;在认识到物体受热分子运动加速以前,人们仅根据热胀冷缩这一现象就可以测量物体的温度。正是由于秤和温度计等测量工具的发明与使用,促进了对物理现象的研究,发展了物理学理论。世界第一把石斧绝不会削铁如泥,世界上第一杆秤也绝量不出克的千万分之一。任何一个工具只有在使用中才能发现,从而不断改进和完善。如果当初因为秤不够准、刀不够快就禁止使用,那么,今天的电子天平和金属切割机就绝不会产生。

3.为了更好发挥心理测验的效能,必须防止心理测验的乱编滥用

心理测验是十分有用的工具,但对测验的使用必须加以控制。心理测验之所以遭一些人的反对,除了测验本身的问题外,在很大程度上是出于测验的误用带来严重的社会后果,败坏了测验的信誉。为此,美国心理学会于1954年制定了《心理学家的道德准则》和《心理测验与诊断方法的技术建议》两个文件,对测验的发行和实施原则做了明确规定,对使用者的资格也做了严格的限制。中国心理学会也制订了相应的文件,规范心理测验的行为。

(三)心理测验的注意事项

为了防止测验的乱编滥用,要注意以下几个问题:

1.心理测验的编制和修订要注意科学性

编制和修订心理测验是一项十分复杂的工作,必须由有关领域的专家来主持。他们不但要对该领域(如智力、人格等)的心理学理论有较深造诣,而且要通晓测验的基本原理和编制技术。对心理学和测量学一窍不通或一知半解就来编制或修订测验是应该禁止的。

测验的首要条件是标准化。标准化测验在编制时要遵循特定的程序,不但要有统一的内容、施测程序和评分方法,而且要有较高的效度和信度,还要有解释分数的常模资料或其他参照标准。即使国外广为流行的测验,在引进时也必须根据试测结果修订常模和某些不合适的题目,简单照搬或仅凭主观经验稍加更改就拿来应用,是很危险的。

2.心理测验的出版和发行要严加控制

对于大多数心理测验来说,泄露测验内容,可能会使测验失效。因此,测验的出版发行必须严加控制。不应在科普读物上发表测验题目。在一般公开发行的书籍上(包括某些教科书)介绍能力或教育测验需要举例时,最好用模拟题目。编制和修订一个测验需要很长时间,有的测验经过几十年的使用和反复修订已渐趋完善,一旦公开发表,便整个报废。某些人格测验对题目的保密要求虽然不像能力测验那样强,但广为散发也会增加误用可能性,造成不良的社会后果。为了保护测验,防止测验失密,不让一般人熟悉测验内容,需要有相应的出版法来保证。

正式发行的测验,必须备有详细的测验手册或说明书,不仅要讲清施测和计分方法,而且应提供足够的信息以使得人们能对测验本身做出评价。没有效度和信度资料的测验是不能发行的。

目前在某些科普刊物上登载的测验多半是游艺性的,不能正式拿来使用。在宣传和介绍测验时则要实事求是地讲清测验适用范围,指出其不足和局限,不要夸大测验的功能。

3.心理测验使用者要具备一定的资格

心理测验的选择、施测、计分和解释都必须由受过专门训练的心理学工作者、教育工作者或医生来进行。一般说来,个别施测的智力测验和大部分人格测验对使用者的要求较高,而学绩测验的使用者只要受过初步训练即可。

测验的使用者既要有能力,又要恪守一定的职业道德。在宣传和分析测验结果时要谨慎行事,要考虑对当事人可能产生的影响。在一般情况下,告诉当事人的应是对结果的解释,而不是简单宣布一个分数;要保护受测者的利益,如对测验结果保密等,如果发现受测者在能力、人格或学习上存在某种问题,要给以辅导和帮助,并尽可能提供相应的教育和治疗上的措施,把诊断与矫正结合起来。

4.要学习和宣传测量理论

乱编滥用测验的根源在于不懂测量理论。为了解决这个问题,有必要提倡心理学和教育学工作者学点测量学。对广大教师宣传和普及测量理论,促进考试科学化,亦属当务之急。对国外的测量理论和测验一样,也要加以适当改造,使之适合我国国情。

复习思考题

1.我国古代对心理测量的发展做出了哪些贡献?

2.心理测量在西方是如何发展起来的?

3.心理测量有何特点?

4.报刊及网上的有关心理特征的测量是否准确可靠?为什么?