在放假前夕的一天,校长向一位即将接任新班的教师进行例行工作谈话。在谈话中,校长告诉教师:新接的这个班级的学习风气、学习习惯、学生的情感态度、考试成绩等方面总体不错,但有少数后进生,成绩比较差,纪律也不很好,个别学生调皮还有点“名气”……末了,校长向教师提出一个问题:对于这些后进生,你怎么看待呢?用什么样的方法去带好这个班级呢?
这位被问及的教师这样回答:后进生嘛,哪儿都有,人群总是由上中下、优中差构成的。任何人都有缺点,也都有优点。至于方法么,我呀,主动跟他们接触,做好朋友,给有积极表现的委派个组长什么的,小孩都有上进心理,更喜欢表扬,这样以后调皮学生就变乖了……校长在心里边思忖着:对人的评价观念、对人的认识态度是教育的基本要素……教师拥有正确的评价观念可能会使这个班级面貌产生更新的改观。
学生的素质教育评价,德、智、体、美、劳样样都要看;对学校的教育效果,家长、社会都在进行着不同的评说;学校内部的教育教学管理,学生、教师、领导都有着各自的评价话语。
一、孔子“德行并重”的人本思想
1.全人评价观
孔子教育学生,并不在于把学生培养成为有某种专门技能的人才,评价教育的着眼点是使之成为广泛适应社会的人才。
孔子的学生樊迟向孔子请教农稼、苗圃之事,受到孔子的冷遇,认为如果学农稼、培植园艺之事,“老农”、“老圃”更精通(见《论语·子路》)。这一点被用来指责孔子轻视体力劳动,实不尽然。孔子本身就“少也贱,故多能鄙事”。从另一方面理解,可以说孔子的教育内容并非这些专门技能。
曾子是孔子的弟子,他曾说“笾豆之事,则有司存”(《论语·泰伯》),“笾豆之事”是指行礼、作仪式之类的技艺,“司存”是执掌此仪式的专门人才。这表明,曾子并非鄙视礼仪、礼节,只是认为这样的专门技能自有司存管理,君子所贵之“道”,乃广也。
一个全人的观念,这是孔子教育思想评价的重要内容与倾向。
2.重人重德的教育评价观
“孔子以诗书礼乐教。”(《史记·孔子世家》),“子以四教:文、行、忠、信。”(《论语·述而》),这些内容所侧重的方面虽各不相同,但围绕着“成人”、“成德”这一主题来评价教育行为则是共同的。如“诗”、“书”主于“文”,是立言的根本,“礼乐”主于“行”,是立身行事乃至“成人”、“成德”的根本。所谓“兴于诗,立于礼,成于乐。”(《论语·泰伯》),孔子教育他的儿子孔鲤也是要学诗、学礼,否则无以立言、立行,这是从“独善其身”的自我修养方面说的。儒者在确立了“成人”、“成德”之后,才可能“兼济天下”。
重人重德的另一方面即“政事”。“政事”即行政、主政大事之意,是以自我修养为基础的,先行“修己”、“成德”之后,才能进一步“修己以安人”、“修己以安百姓”(《论语·宪问》)。子路在做费氏宰时曾经举荐子羔为费宰,这事被孔子知道了,孔子指责子路是在作践、伤害子羔,“子以其未尝学也”。子路这样回辩:“有民人焉,有社稷焉,何必读书,然后为学?”孔子听了后很不高兴,把子路称为“佞者”(见《论语·先进》),认为只有在完成自我修养的基础上,才可以从事政治、社会之事,以“兼济天下”,否则将害人害己。从这件事,足见孔子把“成人”、“成德”的评价标准提到了一个重要的高度。
孔子的学生也有各自不同的特点。以“德行”、“子之楷模”著称的有颜渊、闵子骞、冉伯牛、仲弓,以“言语”、能言善辩见长的有宰我、子贡,以“政事”、管理才干而著称的有冉有、季路,以“文学”、“笔墨传之”著称的有子游、子夏(见《论语·先进》),这些学生可以说是孔门中比较著名的几位,才能各有特点,但孔子最重视的还是他们的“德行”。如孔子评价子贡不如颜渊。宰我虽以“言语”闻名,但孔子斥之为“不仁”,认为其不行三年之丧而自觉心安理得是“德行不端”。冉有善于“政事”而为季氏聚敛钱财,孔子告诉他的学生们说:“非吾徒也,小子鸣鼓而攻之可也”(《论语·先进》)。子夏以“文学”见长,孔子责之以“汝为君子儒,无为小人儒。”(《论语·雍也》)。
有这样一件事:孔子的学生仲弓长于德行,经常做好事、善事,但讷于言而敏于行,时人评价其只知“仁”而不知“佞”之机变,有“傻帽”、“本分老实”的意思。孔子则在他人面前不时称赞仲弓,说他做得不够,不一定称得上至高境界的“仁”,但没有做“佞”事,这绝对是人之立本所在(见《论语·公冶长》)。
这些,都足以说明孔子之教育的重心在“成人”、“成德”方面。
以孔子为儒家的创始人,其教育方法的最本质特征是启发式的教育,这是与其心性论联系在一起的。所谓“成人”、“成德”之教,其标准就在每个人的心中,教育也就是帮助人们发现自身本有的“善”,“成人”、“成德”的关键还是要依靠主体自身的转化。
二、基于人本思想的技术性评价研究
从纵向看,从古代到今天的教育,从横的方面看,中国与外国的教育,任何一种教育体制、教育模式和教育行为,无论在什么样的社会体制和经济环境中运行,都要考查其教育教学的绩效。在考查绩效的方法策略上,随着时代的演进,技术在不断进步,标准在逐渐提高,评价的方法策略也在不断变化和改进着。
1.从口试到笔试
(1)口试
最初,中外考查教育效果都采用口试的方法。
采用口试这种方法,能够直接面对被测试的对象,使得测试内容的范围、属性、程度、特征等因素,都能够很好地表现出来,能够被直接观察到。因此,口试的方法显得直观,也比较客观,针对性比较强。
但是,口试也具有很大的局限性。口试只能一对一的进行,由于方法自身的特点使然,速度慢,耗费时间和精力,效率低。同时,口试的主观色彩比较强,评价结论往往随着主、客体双方情绪、情感、个人意愿等因素的变化而波动,又难以取得前后一致的评价标准。
(2)笔试
后来,随着学校规模的发展,学生人数在不断增加,于是出现了笔试。
笔试作为评价的主要方法之一,其突出优点在于:
一是效率提高。较之口试而言,其效率有了很大的提高。可用同一个测试题目测量许多学生,可以在不同地点同时进行,对测试条件也比较宽泛,可以选择不同的方式和场合。
二是客观性增强。命题内容确定,呈现形式固定,对每一学生都同一,显得客观。在很多考查内容和测试点上,被试者可以从容作答,把自己的知识系统地表述出来,能够比较好地反映被试者的真实水平,降低了主观因素对评价过程的影响。
但是,笔试的弊端也同样显而易见:测试时间是规定了的;当时的笔试都是论文体裁的试题,大都是以文字表述的方式;这种试题数目少、容量小,出题方向单一,考查的内容层次、涉及的范围、检查面等都很有限;评分过程不可能避免主观因素,存在着片面与笼统的弊端,阅卷者个人的认识取向、情感好恶、价值判断,都影响着评价过程的客观性。
小资料
我国起自隋唐时代的科举考试,实是世界上最早应用笔试的先例。
在欧洲古代教育史上,口试也是进行教育的主要方式。直至1702年英国的剑桥大学才开始使用笔试。美国则更晚,1845年笔试才应用于普通学校。
1845年,在美国教育家贺拉斯曼(Horace.M.)的倡导下,波士顿文法学校率先引入了笔试。
2.教育测量运动
自20世纪初,在美国,开始产生了教育测量运动。教育测量运动发端于美国,很快在世界各地传播开来。教育测量运动兴起的原因是当时教育发展变革的需求。19世纪物理学、医学、天文学等发展,使数量测定获得了快速突破,刺激了人文社会科学的发展。
德国的冯特于1879年在莱比锡大学设立心理实验室,用实验和测量的方法研究人的心理;英国的高尔顿1882年在伦敦成立人类学实验室研究个别差异,以及皮尔逊为这种研究所设计的统计方法等,对教育的推进产生了很大的影响。美国的卡特尔,曾就学于冯特,后来又到英国向高尔顿学习人类学和向皮尔逊学习统计学。回国后便设立心理实验室,并于1890年发表论文主张在教育领域开展心理测量。
1904年,教育心理学家桑代克发表了被认为是教育心理测量学史上具有划时代意义的巨著《精神与社会测量学导论》,提出了“凡是存在的东西都有数量,凡有数量的东西都可以测量”的著名论点。在这种思想指导下,他领导学生编制标准量表,从事教育测量的试验工作。此后,在不到20年的时间里,在美国的教育研究领域里,相继有数以千计的心理测量论文著述被发表,教育测量运动在更大的范围得到了推广应用。
当时,保证测量客观化的重要手段是测量标准化,即测量的内容与形式对所有被试者都是一样的,施测的条件也完全相同,有统一的施测方式、步骤、指示语、评分规则,有标准的时限和记分方法等。此外,标准化测量还建立了常模,即以同一群体作为参照物,把群体内各个成员在某一测量位置的成绩的平均值作为参照标准(常模),用个人的成绩与这个常模相比较,以了解个人在这个测量的次数分配上所处的相对位置。这样,就可以较为客观地测出学生之间的差异。
但初期的教育测量内容偏重于记忆性的知识,不能测出学业成就的真实水平,也不能涵盖学业素质的全部内容,更难测得反映客观性强的数值。当然,也就无法综合各方面的材料对学生的学业成就进行关联性的解释。
教育测量主要着眼于测量知识数量,而忽视了知识以外的因素,譬如能力因素、心理因素、个性发展因素、道德因素等人的发展性因素,忽视了教育目标这一极其重要的内涵。
在测量中,以心理学、测量学、统计学为指导原理,为改变传统考试中的主观性强、可信度低的弊端,使考试客观化。由此而开展的教育测量运动是“现代教育评价的原点”。
小资料
客观性考试的先驱是英国学者费舍尔(Fisher.G.),于1864年编制成《量表集》。
高尔顿(Galton.F.)、卡特尔(Cattell.J.M.)等一批教育心理学者的研究,提出了个人差异心理发展的理论、实验、统计方法。
1904年,美国教育家桑代克(Thorndike.E.L.)发表了划时代的著述《学力与社会测量导论》(An Introduction to the Theory of Mental and Social Measurements),开始了教育测量运动。桑代克被称为“教育测量之父”,其测量的著名论断:事物性的就是客观存在的,客观存在的就是可以测量的。
1905年,法国的比纳(Binet.A.)和西蒙(Simen.T.)发表了《比纳-西蒙智力测量量表》,提出了智商、智力年龄等概念。
3.教育评价的兴起
1930年前后,由于美国经济大恐慌而引起的社会危机,促使一些教育家开始对教育的根本问题进行探讨,教育观点也随之有所改变。从主智的教育转而主张全人格的教育,从对知识、学科理论的关注转为对人本、人文的关注。当时的进步主义教育联盟就曾以培养人的品格、发展人的多方面才能为教育目标,对课程内容和教学评价进行了长达八年之久(1933~1940年)的实验研究。与此同时,为了检查比较新旧两种教育形式的效果,他们推举泰洛等人组织起了评价委员会,开始了教育评价的试验研究。
教育评价不同于教育测量之处在于:
——关注人本主义教育评价思想,从单一的智力测量转变为全人格的考查。加强了对学生的学习心理品质、学习态度和教师的教学技术方法运用效果的考查。
——批判了当时教育测量中存在的偏重于记忆、主观臆测的成分过多、考查内容片面等问题,同时也继承了教育测量中运用数学原理、心理学指标、统计学模型等技术方法,并对某些指标进行了改进、移换。例如,改进和完善了教育测量中的依据心理学、统计学的原理和方法,使测量趋于技术化、标准化,从而得以客观地比较学生的学业成绩。这些原理和方法,以及在这一时期发展起来的客观性量表的编制方法,依然在今天的教育评价过程广泛地应用着。
——增加了教育评价的新内容,例如学校管理、班级教学管理、课程、课程标准、教学的情况及其教育绩效,利用客观的方法收集数量资料,作为教育评价的主要依据,由此设计了一套相对系统的评价技术方案。
小资料
“八年研究”,是美国教育评价学研究者泰勒(Tyler.R.W.)在1933~1940年间进行的教育实验,其立论依据的核心是:教学评价的本质是对课程、课程标准、教学这三者的实现程度描述,实现程度决定教育效果,对效果的追寻可以评价实现程度。