书城社会科学教育统计与测量研究(教师继续教育丛书)
8814400000002

第2章 教育测量与评价概述(2)

从整体上看似乎教育评价比教育测量所包含的内容更广、综合性更强些,但一定要把教育测量活动与教育评价活动看成是毫无关系的两种活动,或者说教育评价必须以教育测量为基础,这也不符合事实。正如格朗兰德所说的,当把“评价”一词特别地用于课堂教学情境时,其含义存在一些混乱。在一些情况下,它与测量是同义词。在另外一些情况下,它与测验是同义词。例如,当教师进行一次成绩测验时,他们可以说他们在“测验”学生的成绩、“测量”学生的成绩,也可以说在“评价”学生的成绩。此时,人们很少会想到这三个术语有什么不同。但在一些情况下,评价是指不依赖于测量的各种评价方法,它是一个集合名词,此时,评价与测量的区别在于,“评价是对学生行为的定性描述”(例如,对学生行为的轶事记录),而测量则相反,“它是对学生行为的定量描述”(例如,测验分数)。此外,王汉澜教授也指出:“测量的数量化结果,如果不依据测量的目的进行分析、解释和评价,就是无意义的东西,所以测量包含有一定的评价。”一定程度上,一些标准化的教育测量过程,由于测验经过标准化过程,使原先意义不明确的原始分数有了科学的分数解释系统,其本身就包含有一定的价值判断。有些教育测量在社会公认的价值标准下,其本身也隐含着价值分析与价值判断。如通过高考制度来选拔与评价人才,实际上隐含着一种颇有争议的价值判断标准,即“高分=优秀的考生=高素质”。

总之,教育测量与教育评价既存在区别又有一定联系。在一些情况下,两者之间是一致的,许多教育测量本身就含有价值判断。国内外一些教育测量方面教科书,有的用“教育测量与评价”作书名,有的仍用“教育测量”,还有的用“教育评价”作书名,正说明了这一点。

(二)教育评价与教育评估

对教育评价和教育评估这两个常用的概念,不同学者有不同的看法。有些学者认为这两个概念意义不同,“评价”即评定价值,而“评估”并不表示价值。因此,建议在教育实践活动中使用“评价”这个概念,不要使用“评估”这个概念。有学者认为,“教育评估与教育评价通常没有严格的区别。但是被评的事物往往都是相当复杂的,不可能用纯客观的标准加以测定,而且在“评”的过程中已经加入了主观因素,评的结果不可能是绝对客观的,而有主观推测、估量和估价的主观判断成分。对教育的评定更是如此,因为这是对精神的度量,很难是纯客观的。所以“教育评估”比“教育评价”更确切。”此外,有些人在引用他人的定义时把“评价”改成“评估”,另一些人则把“评估”改成“评价”,为己所用。可见,到目前为止,这些概念在使用时还存在着一些混乱。

我们认为,教育评价与教育评估这两个概念既有联系又有区别。

首先,从英语表示来看,教育评价和教育评估是不同的。前者通常用“educationalevaluation”表示,而后者通常用“educationalassessment”表示。既然英语词源不同,那么,其意义也必有所差别。国内有些文献以及有些人把“assessment”译成“评价”,严格说来是不够准确的。

其次,从目前国内出版的有关著作来看,不论是主张用“教育评价”这个概念,还是主张用“教育评估”这个概念,研究者都把这些学科的起源追朔到教育测量运动、美国著名的“八年研究”及其相应的人物(如泰勒等人)。既然教育测量、教育评价、教育评估源出一处,那么,它们必有相通与交叉之处。

第三,“评估”一词,含有“评判”、“评量”、“估测”、“估算”等意思,因而,也就包括对事物的质量、价值、程度、数值等进行估测判断。有些人认为,“评估”没有价值判断,而“评价”才有价值判断。其实,这种认识也是不全面的。如果说对事物的经济价值作判断也是一种价值判断的话,那么,企业资产评估、房地产评估等也含有价值判断的成份。因此,教育评估和教育评价是两个相近的词语,它们在内容上有交叉,也有区别;教育评估可能有的价值判断,也可能没有价值判断。当教育评估过程含有价值判断时,它和教育评价是一样的;当教育评估过程没有包含价值判断时,它和教育评价就有一定的差别。假如教育评估的重点是对教育现象在数量上做出测量或估算,此时,教育评估与教育测量就可能处于同一层次的意义上。

第四,从概念及习惯用语上来理解教育评估,如同美国国家评估委员会主任迪肯(F.G.Dikey)所讲,评估就是“由一个组织或机构对这所学校或学科是否符合某一事先确定的质量标准作出鉴定的过程。”因此,把“教育评估”概念用于产量评估、资产评估、房地产评估、实验室建设评估、办学水平评估、课堂教学水平评估、人的心理评估等,比较符合评估一词的本意。

通过以上分析,我们认为教育评价、教育评估、教育测量这三者之间是两两既有联系又有区别、既有交叉重叠部分又有相对独立的部分。如果硬要用一个概念来取代另一个概念,这是不合宜的。

(三)教育测验与考试

测验作为测量的工具,用它可以引起人的有代表性的行为,以便对人的行为特性或心理特性进行测量与评价。因此,“测验”一词往往是教育测验或心理测验的简称。教育测验是教育测量的一个工具,在教育评价或教育评估过程中常被用来收集资料。考试有广义与狭义之分。广义的考试,泛指人类社会一切测度和甄别人的身心各个方面之群体或个体差异的活动。狭义的考试,则指由主试根据一定社会的要求,在一定场所,采取一定的方式方法,选择适当的内容,对应试者的德、学、才、识、体诸多方面或某方面进行有组织、有目的测度或甄别的活动。在学校教育与人才选拔过程,教育考试是根据教育内容和目标,学者选择有代表性的内容与问题,按照一定的方式,对应试者的知识、技能等进行测量与评价的过程。因此,可以说考试也是一种教育测验。

总之,教育测验的概念比教育考试的概念更广大并且测验包含考试。测验或考试都是教育测量与评价的一种工具。在某些情境下,教育测验活动或教育考试活动本身就是一种教育评价(评估)活动。

(四)教育统计与测量评价

教育统计、测量与评价三者存在着这样的关系。一方面,教育统计分析所处理的数据资料,大多是来自教育调查、实验、观察、测量或评估所得的数据,教育统计方法包括描述统计与推断统计两部分。另一方面,教育测量与评价活动的开展或者从事教育测量与评价研究工作,往往要借助教育统计学有关方法,才能达到教育测量与评价的目的。目前,教育统计学、教育测量学和教育评价学已成教育科学的重要分支,它们虽然有各自相对独立的研究内容和方法,但无论是过去还是现在,它们之间都是相互联系的。因此,我们根据这些学科的内容特点以及内容整合的趋势,构建了教育统计与测量评价综合课程的内容框架。

教育测量与评价的学科地位和在教育改革中的作用

目前,在许多发达国家和地区,教育测量与评价已成为教育科学体系中极其重要的学科之一。这是因为,教育测量与评价的科学理论不仅在教育教学及教育管理等实际工作中具有重要的应用价值,而且对社会各个领域人才的选拔与评价起了中广泛而重要的作用。所以,认识教育测量与评价的学科地位和作用,反思目前我国教育测量与评价的学科建设和学科地位对学习教育测量与评价这门课程是非常有必要的。

一、教育测量与评价是现代教育科学研究的三大领域之一

20世纪教育科学研究的迅速发展,逐渐形成一个庞大的教育科学体系。在这个体系中,许多已经形成研究对象相对明确、研究内容相对独立、研究成果已相对完整的学科分支。这些学科分支主要有教育学、教学论、课程论、教育心理学、教育史、比较教育、教育统计学、教育测量学、教育评价学、教育管理学、教育哲学、教育社会学、教育经济学、教育科学研究方法、教育实验设计、教育技术学、教育评估与督导、教育生态学等。在学科建设中,教育测量与评价既可看成是教育测量学与教育评价学内容的整合并侧重于教育测量的一门综合性教育课程,又可以看成是一个兼容了教育统计、教育测量、心理测量、教育评价、教育评估、教育督导甚至教育科学研究方法等在内容的学科群。因此,教育测量与评价在教育科学体系中具有十分重要的地位,他们既是教育科学体系中带有综合性、技术性、实践性、应用性等特征的应用性学科,又是人们依据教育基础理论和教育规律来指导教育实践通常所依赖的技艺与方法,对体现教育科学学科的价值在许多方面起着“代言人”的特殊作用。

综观当今世界许多发达国家,教育基本理论研究、教育测量与评价科学研究以及教育发展理论研究已成为现代教育科学研究的三大领域。

我国自改革开放以来,教育测量与评价理论研究和实践取得一定的进展。教育统计、教育测量、心理测量、教育评价等课程得到恢复并得到一定的重视。为了加快我国在这一领域的发展,有关部门采取“请进来”和“走出去”的办法,了解国外的科学发展动态,翻译与编写了一些教科书,以适应高校教学与科研的迫切需要。同时,在老一辈专家的带领下以及有关部门的支持下,国内一批教学与科研人员大力开展考试学、教育测量、心理测量、教育评估、教育评价、教育统计学的理论研究和实际工作;成立了全国性的教育统计与测量、心理测验、教育评价、考试学、人才测评等学术团体;国家及地方政府纷纷建立有关考试机构;创办多种期刊杂志,如《中国考试》、《中国高校招生考试》、《考试、目标、评价》、《考试研究》、《教育评价》、《中国高等教育评估》、《教育督导与评估》、《教育统计与测验》、《考试报》、《自学考试杂志》等;这些促进了我国教育测量、教育评价、教育评估、高等教育自学考试、各类资格证书考试的理论研究与实际工作的发展,并使“教育测量与评价”学科重要的社会价值和应用领域日益突现。

但是,教育测量与评价的理论研究还不能适应我国教育实践的需要。比如,我国教育科学学科专业建设、学位点建设的实际情况;许多人对教育测量与评价学科重要性的认识还不到位;特别在教育学科分类和有关学位专业目录中,找不到教育测量与评价学科的名称。这与国外的情况仍有一定差距,值得人们深思。

二、教育测量与评价在教育改革中的重要作用

(一)教育测量与评价在教育系统中的作用

教育本身是一个系统。所谓系统,指的是具有一定目的、有输入和输出的、且具有反馈功能的有秩序的整体结构。在教育系统中,学校、教师、学生、教育方案、课程、教材、教学训练、考试评价等都是这个系统的组成部分。显然,我们期待教育方案、课程、教学等都能给学生带来某种变化,但不是说所有的教育方案、课程、教学都同样有效地改变学生,也不是所有的学习者会按同样的方式发生变化或有同样的变化程度。因此,当我们根据教育目标和计划,把教育方案、课程、教学等因素(输入条件)作用于学生身上后,需参照教育目标和计划,对教育效果(输出)及其输入条件的妥当性予以测量评估、价值分析和判断。然后,把这一测量与评价过程所获得的信息反馈给教育者、学习者以及有关教育决策者,以便改进教育的策略与方案,更有效地达到教育目的。同时在教育系统运转过程中,除了对教育效果(输出)要进行测量与评价外,还要针对影响教育效果的诸因素(输入)进行客观的分析和评价。教育测量与评价在教育系统中对实现教育目标起着十分重要的作用。

(二)教育改革常常以教育测量与评价的改革作为突破口

我们知道,教育考试和教育评价具有很强的导向功能。平常说:考试是根指挥棒,就是这个意思。从世界教育发展史的教育改革行动来看,因考试指挥不当使教育教学走上不健康之路继而引发教育改革运动的典型例子不少。例如,20世纪初的英国在建立了“11岁”考试制度后,竞争异常激烈,导致英国的小学教育为考而学,内容窄化,“应试教育”倾向严重。更甚者,有些地方的教育当局还根据“11岁”考试成绩来评价学校和教师的教学水平,造成许多不良影响,引起社会各界人士的担忧和指责,同时也引发许多教育论争及其后的教育改革行动。到20世纪70年代末催生了“英国国家课程改革”计划的实施与推广。类似地,20世纪初期澳大利亚国家的学校中考试之风非常盛行,“周考、月考、学期考”等正规考试次数频繁,学校根据考试成绩作出关于学生升级留级或奖励的决策;有关教育当局则根据各校各科的考试成绩,给学校和教师发奖金,甚至以明确的技术标准把考试分数同教师的薪金联系起来定量发放。这种措施虽然在一定程度上调动了教师与学校的工作积极性,但也导致“为考而教、为考而学”的教育局面,使教育偏离了正确的轨道。因此,也引发了澳大利亚政府当局对基础教育进行一系列的教育改革。其他一些国家,如美国、日本、印度等国也有类似的经历。而我们中国本来就是“考试制度”的发源地,重视考试本来就是无可厚非。“因为,作为一种手段来说,我国的考试,确实是最“古”的,也是‘最好’的。”但由于考试特别是像高考这样的关键性考试具有指挥棒的导向作用,因此,在升学竞争激烈、教育观念落后的情况下,“应试教育”倾向就会出现,教育就会偏离正确轨道,这对培养跨世纪人才和提高中华民族的整体素质来讲,显然是不利的。正是在这种教育与社会发展背景下,我国政府要求所有学校都要全面推进素质教育,并且启动了国家新一轮基础教育课程改革方案,把课程改革、教与学的方式改革以及考试评价制度改革等统整起来。

总之,不论是从国外的如英国国家考试制度及其课程改革、澳大利亚国家考试制度及教育改革、美国的教育测量运动及“八年研究”中的课程与教育评价制度改革、还是从国内如我国解放以来考试制度改革来看,教育考试与教育评价制度改革不仅作为教育改革的一项重要内容,而且有时还作为教育改革甚至政治体制改革或政治运动的突破口。因此可见,教育测量与评价在教育改革中常居于突出位置,起着重要的作用。

(三)科学运用教育测量与评价是教师的专业素养和能力

正确评价学生的发展是教师职业能力的重要组成部分。