(程少堂2013年3月9日按:现在艾斯纳的“教育鉴赏”很时髦。我在上世纪九十年代也曾提出建构《语文教学鉴赏学》。见我在做中学老师期间发表的最后一篇文章、《中学语文》1990年第8期《开创语文教学法研究的新局面 》http://www.yuwenwei.net/ReadNews.asp?NewsID=9000)
课程评价的理论流派与典型模式(下)
本章继续探讨课程评价的理论流派与典型模式,主要研究20世纪70年代中期以后分别在英国和美国诞生的两种模式——课程评价的研究模式以及教育鉴赏与教育批评模式。
课程评价的理论流派与典型模式(下)
第一节 课程评价的研究模式
英国著名课程论专家斯腾豪斯1975年出版了其主要代表作《课程研究与开发导论》(An Introduction to Curriculum Research and Development)。在这部课程论名著中,斯腾豪斯在批判、继承传统课程理论的基础上,确立了一系列新的课程理念,如课程开发的“过程模式”(a process model),课程开发的“研究模式”(a research model),“教师作为研究者”(the teacher as researcher),等等。在此基础上,斯腾豪斯提出了一种“研究取向的”(research-oriented)课程评价模式。自此,“评价即研究”(evaluation as research)作为一种崭新的课程评价理念传播开来。
一、课程开发的过程模式
斯腾豪斯对过程模式的建构是从对泰勒原理的批判开始的。
在《课程研究与开发导论》一书中,斯腾豪斯从一个课程开发者的视角,对泰勒原理进行了详尽而透彻的分析与批判,客观地指出了其贡献与局限。在此基础上,斯腾豪斯建立起其过程模式的理论框架。
(一)目标模式批判
斯腾豪斯首先通过检讨理论的性质来展开对目标模式的批判。
斯腾豪斯认为,在诸如课程研究这类行动领域或“策略性科学”中,理论的职能有两种:一是把我们已获得的资料和事实组织起来,提供对事物的一种理解;二是具有一种实施的和思索的倾向,为行动提供一个基础和依据。用这两种职能来观照目标模式,斯腾豪斯认为,它首先为我们提供了一种手段或方法,把课程开发中大量的变量、问题与活动组织起来,加深我们对课程开发的理解,斯腾豪斯因此称它是“一种雄心勃勃的综合性理论”。[①]这种尝试是必需的,也是重要的。但是,在斯腾豪斯看来,在策略性科学中,这种为了高度综合而进行的思辨却存在着潜在的危险,其主要原因是人们缺乏有关的实际知识,致使理论的建构缺乏应有的资料基础。因此,这类理论所达到的逻辑上的一致性往往是以牺牲牢固的基础为代价的。也正因如此,这种高度综合的理论从知识进步的角度看也许有很大效用,但在应用于实际时必须格外小心,它们逻辑上越令人满意,可能越不适用。“在一个策略性领域,不应该过于信任地提倡或采用它们作为大规模行动的基础,这一点很重要。我们必须谨慎地认识到,从目标模式中——或其他模式及理论中——我们有了一种解决课程问题的系统方法,而不是一种包治百病的教育万应灵药。……这种理论的职能不是要求人们忠实于它,而是吸引批评与试验检验,以导致它自身的证伪或完善。”[②]显然,斯腾豪斯此处的批评并非直接针对目标模式本身,而是针对人们对目标模式的态度,特别是那种对目标模式的盲目崇拜、不加分析地用于实际的做法。
至于目标模式本身,在斯腾豪斯看来,把目标模式普遍应用于课程开发存在两个基本障碍:[③]一是目标模式误解了知识的本质;二是目标模式误解了改善课程实践的过程的本质。斯腾豪斯认为,对于训练行为技能来说,目标模式是很适用的,它通过分析,使要形成的操作行为明晰化,从而促进了训练过程,如在军队中和工业界,使用目标模式取得了很明显的成效。但对于知识的学习来说,目标模式显然是不适宜的。这是因为,知识的本质在于人可以运用知识进行创造性思维。“教育通过将人引入作为人类思维系统的文化知识,增进了人的自由。知识形式最重要的特点是,人们可以用它进行思维。与信息不同,人由此进入了知识的本质,这一本质是一个支持创造性思维,并为判断提供框架的结构。”[④]因而,课程应该考虑知识中的不确定性,鼓励个体化的、富于创造性的学习,而不是把学习作为满足预定目标的尝试。从这个意义上说,“教育即引导儿童进入知识之中的过程,教育成功的程度就是它所导致的学生不可预期的行为结果增加的程度。”[⑤]目标模式显然与此要求相悖。按照斯腾豪斯的说法,目标模式的实质是通过目标的分析,使教育结果的质量标准“形式化”(formalization)。这样做的结果,实际上是降低了质量标准。此外,目标模式还有使知识服务于既定目标的“工具化” (instmmentalization)的倾向,这是“为了满足目标而使用损害内容的方法”。[⑥]目标模式通过武断地规定思维界限及对知识中的未决问题武断地限定答案,使学校获得了一种凌驾于学生之上的权威与力量;而教师的角色则从一个复杂的知识领域中的学生,转变为传授学校认可的观点的师傅了。这就歪曲了知识的本质。
关于第二种误解,斯腾豪斯认为,目标模式的方法基本上是一种通过使目标明晰化而改善实践的尝试。这种做法在逻辑上是合理的,但却不能改进实践,因为人们不可能通过将杆升高而不是改善跳高技能来提高跳高水平。因而,理想的做法应该是帮助教师改进教学,发展他们在课程实践中的批判、反思意识和能力。这便是斯腾豪斯的过程模式努力的宗旨。
(二)过程模式的基本内容
斯腾豪斯所提出的过程模式是以英国著名教育哲学家彼得斯 (R.S.Peters)的知识论为理论依据的。彼得斯认为,知识以及教育本身具有内在的价值,因而无需通过教育的结果来加以证明。这类活动有其自身固有的完美标准,能够由于这些标准而不是由于其导致的后果而被评价。人们可以争论知识本身所具有的价值,而不是争论知识作为达到目的的手段的价值。因而,艺术和知识形式,如科学、历史、文学欣赏与涛等,是课程设置的基本部分,其合理性能够被内在地加以证明,而不必作为达到目的的手段来被证明。对知识的选择是基于内容,而不是基于其所引起的学生行为的具体结果。[⑦]而诸如知识的过程、概念以及标准等形式,是无法适当地转化为操作水平上的目标的。据此,斯腾豪斯提出,课程开发的任务就是要选择活动内容,建立关于学科的过程、概念与标准等知识形式的课程,并提供实施的“过程原则”(principle of procedure)。
如上所述,活动内容的选择标准是其是否“含有内在价值”。斯腾豪斯给出了拉思(J.D.Rath)的鉴别标准供参考,其中共有12条纲目:[⑧]
1.在所有其他条件相同的情况下,如果一项活动允许儿童在活动过程中作出自己的选择,并能对选择所带来的结果作出反思,则这项活动比其他活动更有价值。
2.在所有其他条件相同的情况下,如果一项活动在学习情境中允许学生充当主动的角色而不是被动的角色,则这项活动比其他活动更有价值。
3.在所有其他条件相同的情况下,如果一项活动要求学生探究各种观念,探究智力过程的应用,或探究当前的个人问题或社会问题,则这项活动比其他活动更有价值,,
4.在所有其他条件相同的情况下,如果一项活动使学生涉及实物教具(即真实的物体、材料与人工制品),则这项活动比其他活动更有价值。
5.在所有其他条件相同的情况下,如果一项活动能够由处于不同能力水平的儿童成功地完成,则这项活动比其他活动更有价值。
6.在所有其他条件相同的情况下,如果一项活动要求学生在一个新的背景下审查一种观念、一项对于智力活动的应用,或一个以前研究过的现存问题,则这项活动比其他活动更有价值。
7.在所有其他条件相同的情况下,如果一项活动要求学生审查一些题目或问题,这些题目或问题是我们社会中的人们一般不会去审查的,是典型地被国家的大众传播媒介所忽略了的,则这项活动比其他活动更有价值。
8.在所有其他条件相同的情况下,如果一项活动使儿童与教师共同参与“冒险”——不是冒生命或肢体之险,而是冒成功或失败之险,则这项活动比其他活动更有价值。
9.在所有其他条件相同的情况下,如果一项活动要求学生改写、重温及完善他们已经开始的尝试,则这项活动比其他活动更有价值。
10.在所有其他条件相同的情况下,如果一项活动使学生应用与掌握有意义的规则、标准及准则,则这项活动比其他活动更有价值。
11.在所有其他条件相同的情况下,如果一项活动能给学生提供一个与别人分享制定计划、执行计划及活动结果的机会,则这项活动比其他活动更有价值。
12.在所有其他条件相同的情况下,如果一项活动与学生所表达的目的密切相关,则这项活动比其他活动更有价值。
斯腾豪斯认为,像目标模式那样列出——张行为目标一览表,并不能帮助我们获得达成这些目标的手段,而分析有价值的活动的标准以及分析被认为是有价值的活动的结构,才能更为清楚地趋近教学中的“过程原则”。
关于“过程原则”,其本质含义在于鼓励教师对课程实践的反思批判和发挥创造作用。以斯腾豪斯领导制定的“人文学科课程计划”为例,该课程计划提出,教师应遵循下列五项“过程原则”:[⑨](1)教师应该与学生一起在课堂上讨论研究具有争议性的问题;(2)在处理具有争议性的问题时,教师应持中立原则,使课堂成为学生的论坛;(3)对于具有争议性的问题的探究,主要方式是讨论,而不是灌输式的讲授;(4)讨论应尊重参与者的不同观点,无须达成一致意见;(5)教师作为讨论的主持人,对学习的质量和标准负有责任。斯腾豪斯明确提出,教师的身份是“和学生一起学习的学习者”,只有这样,才能通过发现法和探究法而不是通过传授法进行教学。在对学习结果的评定中,教师则不像在目标模式中那样,是一个对照预定目标打分的评分者,而是对活动加以批评以促进发展的批评者。
由上可见,课程开发的过程模式是通过对知识和教育活动的内在价值的确认,鼓励学生探索具有教育价值的知识领域,进行自由自主的活动。它把学生视为一个积极的活动者,教育的功能则在于发展学生的潜能,使他们自主而有能力地行动。它倡导“过程原则”,强调过程本身的教育价值,主张教育过程给学生以足够的活动空间。它强调教师和学生的交互作用,教师在课程开发与实施过程中不是学生行为的主宰者、控制者,而是学生的学习伙伴、学生行为的引导者。
在课程开发的过程模式中,教师具有充分的自主权。过程模式并不给出过程中铁的原则,可以说,它是一种“排除原则”(principleof removing)——把无效的、不利于广泛的教育目的达成的做法识别出来并加以排除的原则,这就给教师主动性的发挥留有余地。但同时,这也对教师的素质提出了较高的要求。因此,斯腾豪斯后来又首倡“教师作为研究者”(the teacher as researcher)的课程思想,[⑩]认为教师进行课程开发与实施必须以对课程问题的卓有成效的研究为前提,从而开课程研究重视教师主体性的风气之先河。
总之,过程模式把学生主体性、创造性的发展作为教育的广泛目标,尊重并鼓励学生的个性特点,并把这一目标与课程活动、教学过程统一起来,进而又将其统一于教师的主体作用中。它突破了目标模式“工具理性”的藩篱,把课程开发建立在实际的教育情境基础上,这显然是符合时代潮流的一种取向。
二、课程评价的研究模式
在《课程研究与开发导论》中,斯腾豪斯写道:
课程研究必须关切对可能性与问题的艰辛的考察。可以说,课程评价应当引导课程开发并与课程开发融为一体。这样,课程开发与课程评价之间概念上的分离就被打破,此二者一并融合为研究。课程研究本身必须是解释性的,而非像早先的课程开发传统那样是劝告性的。[11]
在斯腾豪斯看来,不仅应当打破课程开发与课程评价之间的割裂状态,而且应当使二者融为一体,提升为“课程研究” (curriculum research)。换言之,课程研究是课程开发与课程评价的本质。我们不禁要问:斯腾豪斯如何得出此结论?
1972年12月,英国著名课程论专家、教育评价专家麦克当纳和帕勒特(B.MacDonald & M.Parlett)召集了14名国际知名教育评价专家,在剑桥丘吉尔学院召开了一个小型的课程评价国际研讨会。这个会议系统批判了传统的以泰勒的“目标达成模式”为代表的“预定式课程评价模式”,确立了一系列新的课程评价理论与模式。著名的“回应模式”、“解释模式”都是通过这个会议确立起来的。参加这个会议的课程评价专家也因此被称为“新潮流评价者”(new wave evaluators)。斯腾豪斯就是在批判、继承这批“新潮流评价者”的课程评价理念的基础上确立起其课程评价的研究模式的。
斯腾豪斯认为,“新潮流评价者”走出了“预定式课程评价模式”的框束,关注课程评价过程,主张课程评价应回应评价委托人的需求,倡导把课程评价视为一个解释框架,这些观点为课程评价开辟了一个全新的视域。但是,“新潮流评价者”关心一门课程或一种教育实践的“优点”或“价值”,但他们的标准并不明确。他们对评价听取人和对评价结果呈现方式的关切往往掩盖了其中的问题。他们追求“如实描述”,但他们也经常说允许根据他们自己的价值观对评价作一定的歪曲。事实上,并不存在所谓的“如实描述”,只存在根据标准和概念框架进行的意义的创造。为了适应评价听取人的需要而对评价过程和结果的扭曲,极易导致随意输入未经检验的假设和标准。评价听取人的反应可能是诱人的,特别是当这些人在政治上拥有权力的时候。追求取悦于评价听取人的新奇之言,极易导致评价流于虚妄。
斯腾豪斯指出,“新潮流评价者”对评价标准的漠视很有可能导致回避实际存在的问题,阻碍“以研究为基础的课程革新” (research-basedinnovation)。因此,必须重建课程评价的标准,使课程评价的过程真正成为课程研究的过程,在课程研究的过程中推进课程改革的进行。
斯腾豪斯指出,评估一门课程或一项教育实践的标准有五条:意义性、潜能性、兴趣性、条件性、解释性。这五条标准是对“新潮流评价观”的继承与超越。
(一)意义性(meaning)
一门课程是否有意义是课程评价的第一条标准。什么是课程的意义?斯腾豪斯指出:“一门课程可以根据知识本身的标准进行批判性讨论。”[12]根据知识本身的标准,一门课程有意义,意味着它有“继续产生可以揭示现象本质的新命题的能力”。[13]而对课程意义的判断,不能根据课程指南或学习材料,而要通过对不同课堂情境中课程实施状况的观察来进行。在斯腾豪斯看来,恰当的课程评价的一个重要因素是哲学批判(philosophical critique)。对课程进行哲学批判的目的不是评定课程的价值,而是揭示课程的意义。当然,揭示课程的意义自然也包括对课程价值的评定。哲学批判的资料只能通过观察与课程相对应的课堂而获得,不能凭空想象或思辩。
(二)潜能性(potential)
一门课程是否具有潜能是课程评价的第二条标准。什么是潜能?答案取决于课程开发者、实施者和评价者所信奉的价值观、所参照的理论取向、所参照的课程政策制定者的兴趣,等等。如,课程在改善阅读能力方面的潜能是什么?课程在激发教师动力方面的潜能是什么?课程在激发学生能动性方面的潜能是什么?课程在激发学生参与社会生活方面的潜能是什么?等等。对课程潜能的评价首先需要明确一门课程所追求的目标是什么,并据此判断一门课程实现目标的潜能有多大。除此之外,还要判断一门课程超越课程目标的潜能有多大,就是说一门课程除达成预定目标外,还有多少其他潜能,这些潜能的性质是什么。评价课程潜能的时候应特别关注课程实施过程,因为一门课程可能具有潜能,但这些潜能很难在实践中实现。
(三)兴趣性(interest)
课程是否具有兴趣性是课程评价的第三条标准。斯腾豪斯说:“兴趣’作为一条标准,是指一门课程在实践中所提出的问题。”[14]只要这些问题在不同的教育情境中反复出现,或者它们具有重要的适切性,那么它们就是令人感兴趣的。一个处理人力资源或教材资源的问题是令人感兴趣的,因为该问题反复出现;一个在给定的课程情境中判断儿童工作的标准是令人感兴趣的,因为该问题提出了有关质量和广泛的重要性的基本问题。斯腾豪斯所提出的“兴趣”标准似乎是指课程在实践中是否提出了普遍的、大家共同感兴趣的基本问题。但我们认为,应把课程在实践中是否真正引起儿童的兴趣作为评价课程的基本标准。
(四)条件性(conditionality)
课程的条件性是课程评价的第四条标准。斯腾豪斯说:“‘条件性’作为一条标准,是要求课程评价者把课程的潜能和兴趣与学校和班级的情境条件联系起来。”[15]任何一门课程,要使其潜能性和兴趣性发挥出来,就必须依赖相应的情境条件。探究这种情境条件是课程评价者的重要任务。“研究一门课程或一种教育实践的条件性,可以帮助课程决策制定者通过评定这些条件如何在他自己的情境中起作用,来预测他所作出的决定的后果。”[16]斯腾豪斯所确定的“条件性”这——标准借鉴了“新潮流评价者”的观点。
(五)解释性(elucidation)
课程的解释性是课程评价的第五条标准。把解释性作为课程评价的一条标准提出了这样的问题:采用这门课程或这种教育实践在多大程度上阐明了教育的变革问题?这门课程或这种教育实践是有助于建构一种一般意义的课程变革理论呢,还是有助于建构我们这所特定的学校的课程变革理论呢?由此看来,课程的解释性是指一门课程存在的理由或根据,即它是否与整个教育变革相关联,是否具有内在的理论根据,在逻辑上是否是彻底的。斯腾豪斯所确立的“解释性”标准显然吸取了“解释模式”的合理内核。
(六)课程评价的五条标准之间的关系
课程的意义性、潜能性、兴趣性是课.程本身的内在品质,也是课程评价的内在标准。课程的条件性是指课程产生意义、发挥潜能、引起兴趣所需要的条件,该标准所解决的问题是如何将课程与特定学校和班级关联起来。课程的解释性是指课程存在的合理性,显然,课程是否有意义、是否有潜能、是否有兴趣是课程存在的重要根据,课程能否有效实施也是课程存在的重要根据,从这个意义上说,课程的解释性包含了其余四个标准。
当课程评价走出目标达成模式的框束,关注真实的课程实施过程的时候,它就为课程研究奠定了基础。不论是汉密尔顿、帕勒特的“解释模式”,还是斯太克的“回应模式”,都有一种把课程评价作为课程研究的过程的追求。当然,正如斯腾豪斯所批评的那样,这些模式往往走向极端,忽视了课程评价的标准,这就易于把课程评价引上非理性的甚至是信口开河的歧途。斯腾豪斯的“研究模式”则致力于建构使课程研究合理化的标准,这就使课程评价既克服了泰勒的目标达成模式的机械性,又能够在理性的轨道上前进。斯腾豪斯的课程观集中体现了英国课程理论的风格:深受哲学的影响,具有浓郁的理性色彩。
第二节 教育鉴赏与教育批评模式(上)
前已述及,20世纪80年代中期以来,课程评价领域出现了新的势头,其核心概念“评价”(evaluation)正在被“评定”(assessment)所代替。“虽然‘评价’一词在美国教育文献中出现的时间并不太久远,但作为较陈旧的词汇,它不再像一度出现过的那样流行。‘评定’一词正温和但却坚定地向它推进。”[17]在这场课程评价改革的新思路中,艾斯纳作为中坚力量,提出了一系列全新的评价思想和操作模式。他的评价模式被称作“教育鉴赏与教育批评”(educational connoisseurship and educational criticism)模式。
一、课程评价的功能和形式
(一)课程评价的功能
艾斯纳在系统提出其教育鉴赏与教育批评模式之前,首先对课程评价的一般功能和形式进行了独创性的思考。艾斯纳探讨的主要问题包括:课程评价的基本功能;课程评价的主要内容;艺术地报告教育评价的主要形式。[18]
艾斯纳指出,尽管许多人认为评价是类似于给定分数这类的事情,但事实上,评价在教育中有着各种广泛的功能。在教育评价的各种功能中,下列五种尤其重要:诊断;修订课程;比较;预测教育需要;确认目标是否达到。下面逐项考察这些不同的功能。
1.诊断
艾斯纳认为,课程评价的诊断功能最常运用于学生的学习情境中,“诊断”一词本身有一种医学的涵义。对学生进行“诊断”,是为了“开出”具有教育效益的处方。医学类比的意义是:它意味着给学生的处方要适合学生所面对的困难的性质。但该类比也有局限:因为学生不是病人,他们一般没有要治疗的疾病;并且,尽管有医学技术的标准形式控制着医生的药剂处方,规范着医学诊断的程序,但实际上,所有对医务工作者有用的精密仪器、处方以及技术,没有一样适用于教育工作者。当然,在阅读以及其他一些学科领域(如数学),有智力测验及诊断测验,但人们对这些工具可以寄予的信任是有限的。此外,由这些工具得来的成绩很大程度上受到学生生活于其中的文化条件的制约。尽管这样,我们仍可以把诊断作为评价的一项功能来谈论。进行诊断可以显示出这种努力,即找出或试图找出学生在特殊学习问题中所具有的困难的缘由。在拥有许多有效诊断工具的阅读领域,有可能运用测验来评定攻克语言难点的技能、段落意义、一般理解以及词汇的掌握等。运用这类工具的目的是为了给教师以指导,以便为某个在特定领域学习中存在困难的学生提供合适的教学。
还应该指出的是,诊断学习困难不一定非使用测验不可,在最一般的程度上,实际上所有教师所运用的方法都是为了确认学生是否理解了所教的内容。例如,艺术教师可以通过查看学生的作业或者观察学生在课堂上的表现,来“诊断”学生艺术学习的优劣。例如,这个学生也许不能恰当地使用材料作为表达的媒介,另一个学生可能注意不到他的作品的形式特点,而还有的学生可能会在她正在制作的作品中不适当地加入黏土。在每一种情况下,学生的问题类型都需要不同的“解决”方式或教育“处方”。
但更为常见的是,课堂上任何向学生解释某些事情的教学尝试,都是试图确认这种解释是否被理解。这样做需要一些诊断形式:教师对学生提出的要求需要解释、证明、引申出关系。学生所问的问题也给教师提供了诊断信息。确实,如果辩证地看待教学,教师们做的许多事情都将被看作是他们对学生所处位置及对学生所需的理解。使用例证来澄清一个不被理解的观点需要一些概念,这些概念要给学生提供比单纯的解释更多的感知。好的例证要在学生当前的理解水平、他们的经验与教学的直接目的之间架起必要的桥梁。人们也许会说,选择正确的例证是诊断性评价的结果。
这类诊断的古典例证也许出现在柏拉图《理想国》的第六篇中。在格劳考恩(Glaucon)提出“知识的性质”这一问题之后,苏格拉底给了他一个意象,努力帮助他掌握柏拉图认识论中使用的真理的等级。格劳考恩没能抓住这一意象的意义(一条直线分成四个部分,意在展示真理的各种水平),于是,苏格拉底在第七篇——开始继续告诉格劳考恩那个著名的洞穴比喻,它更为生动地描述了苏格拉底刚才试图解释的关系。这里,柏拉图给我们的即是一个教学又是一个诊断评价的意象。
当认识到格劳考恩不能理解抽象的解释时,苏格拉底解释得更为具体,并使用了洞穴、阴影及太阳等生动的意象,帮助格劳考恩掌握关于知识的性质的观点。苏格拉底把他的例证加以个性化,帮助学生理解他试图教的东西。认识到对个性化的需要,评价就必然发生了。评价在这里被用作诊断和监视。因此,评价中的诊断可以被自觉地应用在教学情境中,或更通常地应用在为辨别学生所长所短而特别设计的测验情境中,并由此为变革课程提供基础。
2.课程修订
艾斯纳认为,课程评价的第二个功能是修订课程。即把改善正在开发的课程计划和课程材料作为评价的重要目的。这也就是斯克瑞文所谓的“形成性评价”。在开发课程材料的教育实验中,这类评价贯穿于最终产品——一整套课程——产生前的各个阶段。这些阶段之一集中于课程内容和目的的评价(课程开发过程并非都始于目的和内容,课程活动本身可以为目的提供一个起点)。在学习活动产生以前,课程评价者会对选择过的内容及形式化了的目的作一些评估。这个过程本身是课程开发过程的一部分,它为把内容和目的转化为预定的学习活动奠定了基础。
如前所述,一旦评估过了内容并对学习活动予以形式化,课程材料就成了试验的温床。与其他事情相比,这为学校提供了与发展教育事业相关联的机会,从而给学校以激励。它也为那些选择尝试新课程材料的教师提供了一个霍桑效应(Hawthome effect)[19]的典范。
如果课程开发者和一个评价者去教室参观,约定看使用新材料的课堂、观察教师并就课程材料与他们进行交谈,开发者会深入存在的问题内部而获得一些观感,并了解到可能的解决办法。例如,对于使用新材料的特定年龄的孩子来说,新材料也许过于复杂,学习活动也许变得太单调,教师自然地处理新材料也许有困难,其解释也许混乱并因而导致误解,等等。在新材料作为“温室试验”的结果而得以修订以后,它将在“田野试验”的范围内推广开来。从理论上讲,这些评价步骤将使课程材料不会有大的教育失误。
20世纪60年代早期,美国课程开发运动启动之时,就有关于期望创生“排斥教师”(teacherproof)的课程的谈论。经过几年的时间,这种期望让位于更为现实的“教师并非仅仅是课程开发者的传声筒”的观点。教师是不能也不应回避课程开发的。课程材料本身不能保证任何事情,它们的作用就是扩展教师和学生可以作业的资源范围,它们不是教师的替代物。
在艾斯纳看来,利用评价来修订课程是课程评价的核心功能之一。课程修订是对教育进行改进的回馈机制的一个典型,以减少简单地把评价实践作为对学生进行分类、给予奖赏或者进行选拔的倾向。尽管分类、选拔和奖赏历史上曾是评价的重要功能,但当评价发挥这种功能时,学业成绩改变的责任就全部落在了学生而不是学校身上。如果学生学业失败,按照惯常的假定,这要归咎于学生(这一假定广泛地盛行于英国和欧洲大陆,在那些地方,评价实践的设计被用来为不同形式的中学分配生源和为大学入学作尽可能的选拔)。然而,当学生的学业成绩被看作是教育计划有效性的一个标志时,改进课程的可能性就增加了,其主要的一个贡献就是提高教育质量。
3.比较教育计划
艾斯纳认为,课程评价的第三个功能是比较教育计划、教学以及学校的其他方面(如学校组织的形式)。教育决策的制订是着眼于提高学校提供的教育经验的质量。这意味着当一个学校委员会决定用一种开放式的计划来设计学校建筑时,这一决策隐含着这样的信念,即这样的计划将对该计划打算为之服务的学生产生有益的影响。学校中有许多(并非所有)决策的改变是基于某些新决策欲意实现的价值观。“新数学”被采用,[20]是因为人们开始相信它对于学生理解数学的逻辑或结构是重要的;同伴指导(peer tutoring)之所以被接受,是因为人们相信学生间的彼此教学所带来的益处是不能从一种师生关系中获得的;协同教学(teamteaching)应用于学校,是因为教师合作被认为有可能开发他们作为教师的长处;开发相关艺术计划,是因为这类计划被认为能帮助学生欣赏不同艺术门类中的共同因素。评价的比较方法是探寻这些信念是否正确。“新数学”是否确实比“旧数学”有助于学生理解数学结构?同伴指导是否确实能提供多数典型的师生关系所不能提供的益处?等等。教育决策建基于关注所考虑的改革效果的证据,在这一意义上,对这些计划的比较性评价原则上是有效获得这类证据的一种工具。
然而,艾斯纳进一步指出,关于课程决策制订的比较方法的使用,尚存在一系列悖论。首先,教育材料和学校组织的方式并不具有那种标准化的准确性,就像评价电灯泡的寿命,如果电力公司说一个灯泡能燃烧大约740小时,那么十有八九它的寿命将会在那个记录上结束。教育材料和教育实践的新形式不能由僵死的材料来确立精确的标准,因此,在一个系统中被评价为有效的计划,并不能保证在其他系统中同样有效。而且,新系统将肯定不同于最初使用材料的那些系统。这样,一项采用新课程、运用新的学校组织形式或使用新的安排程序的决策,必定在很大程度上基于这类材料、组织形式以及程序的吸引力,而不是“过硬的资料”。
即使这类资料能够得到,也要花几年的时间来评价计划,以恰当地获得“硬资料”。到那时,实施改革的愿望也许已经按常规发展,它最热情的鼓吹者也许已经离开了学区,对这类改革的需要也许已经改变,或者一些新的甚至更有前途的改革已经出现在视野中。由此看来,教育计划的比较是困难的。这种困难不仅是因为上述理由,而且也因为新的计划通常倾向于获得一些与旧有计划的设计所不同的成就目标。很少有这种情况,即现有计划的目标被认为没有优点。因此,当人们把一项新计划的允诺与现有计划的允诺相对照并加以权衡时,会发现对它们的效用不能进行严格的比较,因为它们指向不同的目标。由于这里的问题不是一项计划在某事情上做得比另一项计划更好(这样事情就简单多了),比较的问题就格外地复杂。然而,如果只是涉及它们自身的目标和非预期结果,那么不同计划的效用就能够比较。这类比较并不提供关于采用什么和实施什么的直接而肯定的结论,但它将扩展思考的空间,以从中引申出足够的教育结论。
4.确定教育需要
艾斯纳认为,课程评价的第四个功能是预测或确定教育需要。教育需要的概念与需要评定的实践直接相关,其中,要运用各种收集资料的方式,在社区或学校公众中收集信息,以确定合适的教育目标。例如,美国联邦教育办公室(U.S.Office of Education)和后来的国家教育研究所(National Institute of Education)经常要求教育改革建议的作者首先作一个需要评估,来证明所提议的计划能满足现有的需要。提出建议的作者将会运用成就和态度测验实施访谈,并通过收集社区领导的陈述来测定公众的意见,以表明对寻求资金的计划的需要。需要评估成了判断教育改革的重要性的过程。
计划是服务于社区或学校公众的,对他们进行研究不是没有道理的。同时,还必须注意的是,教育需要不像云或草地——样,它们并不是径直摆在那里等着你通过访谈或测验去发现,教育需要是对教育事件的问题进行判断的产物。教育需要的构成依赖于人们所持的教育价值观。显然,学术理性主义者与一些社会改造主义者所接受的教育需要是不一样的。学术理性主义者会这样看待学校公众并作出结论:学生没有对过去的欣赏能力,不知道人的主要智慧作品,就不能正确地思考。社会改造主义者则宣称,学生需要知道环境正在被毒害,偏执和种族仇视正在蔓延,世界要获得拯救,就需要一个共同的政府。
一个人的价值观念会影响其对环境的看法,这在他对环境的描述中体现得非常明显。测验的选择、相关研究人群的确定、获得和分析资料的方式,这些都反映了一个人所看重的价值观。如果一个人重视好奇心、想象、感受能力,他就有可能用这些词汇来描述教育需要。如果一个人重视阅读技巧、计算能力及整洁,他就会寻找其他形式的资料。简单地说,我们选择的教育需要决定于我们认可的课程事件。在某种程度上,我们发现的就是我们要寻找的。
5.确定目标是否达到
艾斯纳认为,课程评价的第五个功能,也是课程评价的最传统的一个功用,就是把评价作·为确定教育目标是否达到的一个方法。强调评价的这一功能的理论是明确的。教育计划应该是有目的的,因此,它们应该有目标。为了有意义,这些目标应该非常具体,以便有可能判定它们是否实现。目标一旦在具体的有意义的水平上被形式化,就成为评估学生成就的标准。设计具有这种功能的评价,是为了提供任务以及确定可能获得与目标相关的资料的情境。因此,评价可以被当作一个典型的反馈机制:如果学生没有达到目标,就要求他们重来;如果已经达到目标,就让他们通过,并进入更高水平的学习;如果课程对特定学生或一组学生无效,就加以修订,或改变目标。
这一功能着重于评价的应用,认为清晰的形式化目标是有意义评价的中心和必要条件;没有目标的“清晰”陈述,就不可能有评价。这在艾斯纳看来是不正确的。这一假设深深地根植于许多国家教育部门送达学区学校的评价材料中:目标是决定计划是否有效的标准,评价是收集资料和对它们进行分析的方法。
在艾斯纳看来,用目标来评价教育计划的有效性是有一定道理的。然而,评价的网可以而且应该撒得比特定目标或一种特定课程所具体到的目标体系更广泛。教育计划的结果并非是完全预设好的,因此,仅对预期的那些目标进行评价会导致忽视那些同样重要的有时甚至是更为重要的非预期结果。把目标作为评价教育计划的标准是评价的一个重要功能,但用事先计划好的目的或目标来局限评价,从教育的角度看,似乎显得过于浅薄。
应该注意的是,把目标用作评价的基础,突出了教育实践的特定理念。布卢姆(B.S.Bloom)于1967年提出的“掌握学习”是这类实践之一。掌握学习理论假定,学校不应该首先关注运用对学生进行相互比较的工具对学生分类。在历史上,学校担负着社会分层的角色,其结果既挫伤了那些没有成功的学生,又损失了社会无论如何本应保证的天才资源。掌握学习理论与此不同,它认为学校不是要设计出对学生进行彼此比较的评价程序,试图把有能力的学生从没有能力的学生中区分出来,而应该制定掌握的具体水平——特定目标,而且应该就学生对这些目标的掌握来评价学生,且对个别学生来说,不管他们达到掌握要花多少时, 间。这样一种教育实践理论实际上会给所有学生以成就感,长期实施会有益于他们的精神健康和能力发展。
在对掌握学习的描述中,艾斯纳简单地指出了在这种教育实践观下评价所担负的功能。在这种观点中,评价的形式要求具体地、可操作地定义掌握的概念,因此,它需要一系列的行为目标。
评价应该决定目标是否达到,这一理念不仅突出了掌握学习的概念,而且也对两种典型测验作出了区分,它们是常模参照 (norm-referenced)和标准参照(criterion-reference)测验。在常模测验中,IQ测验和大多数成就测验都是例证,这些测验就某个人或某个小组的表现与其他个人或小组的表现相比较。测验的构成是在个人的表现之间作出区分,并使得测验制作者或使用者能够对个人在小组中进行排列。排列可以是个人的或在小组中的,最为常见的是根据个人的表现把个人放在参加测验的人群中的上半段或下半段。排列可以进一步精确到四分位数——个人是位于人群中的前四分之一、四分之二、四分之三还是最后四分之一。无论使用哪种具体方案,常模参照测验的区分特征就是,报告个人在这类测验中得到的分数,并且在与他人成绩的关系中解释分数的意义。
标准参照测验是在与某些标准的关系中测量成就。其目的不是把个人与一个小组作比较,而是确定个人是否达到测验参照的一些标准。驾驶员培训计划、打字课以及其他技巧取向的课程都使用标准参照测验。与此相关的还有契约学习——教师和学生就要完成的教育任务、预期的成果及完成的时间达成共识,它本身就与作为评价的基础的界定目标相关联。
(二)课程评价的主要内容
艾斯纳指出,课程评价是这样一个过程,它的主要内容包括三方面:课程本身、提供的教学以及实现的结果。艾斯纳认为,课程正是由相当直接的背景来辩护的。除非一个人对课程的内容和学习活动的质量进行评价,否则,他就不具有判定课程是否值得教的基础。用柏拉图的话说,“没有经过检验的课程可能是不值得学习的”。
1.课程内容的意义
怎样评价课程内容的意义?艾斯纳认为应坚持以下标准。首先,可以对课程内容的教育意义进行判断。目前,判断内容的意义的标准只有从一套关于什么值得教育的价值观中引申出来。但无论这些标准是什么,以及它们对不同的小组和个人将有什么不同,这些标准的应用对于首次对课程的价值作出评估都是重要的。一些如何运用这些标准的例证也许有助于理解这一点。
以美国州教育委员会和地方学区选择教材的过程为例。教材是大多数课程的基础要素,作为教学工具,它是基于吸引力和可行性而被采用的。由于民权运动和妇女解放运动,美国采取了有关种族和性别歧视的具体标准来评价教材和其他课程材料。无论一种教材的教育内容是多么有吸引力和有意义,如果它用一种不适当的见解来看待少数民族群体或暗含损害性别形象的东西,那么把它作为学校中孩子们的学习材料就会遭到反对。在加利福尼亚,州教育部(1975)就教育资料,包括教材内容的指导方针论述道:
男性和女性的角色
为了鼓励每一个孩子的个性发展和自尊,当教学材料刻画人物(或富有人类特征的动物)时,应当在各种广泛的职业、情感和行为情境中刻画女性和男性、女孩和男孩,在人类潜能的全部领域里展示两种性别。
情感——例如恐惧、愤怒、挑衅、兴奋或脆弱——应当随机地发生在不论性别的个人身上。
传统上由一种性别的人从事的活动,应当通过展示这种性别的人进行的非传统活动加以平衡。
少数民族成员和文化群体
为了保护我们社会的文化多样性,培养每一个孩子的民族自豪感,根除歧视的种子,并鼓励每一个孩子的个性发展,当教学材料刻画人物(或富有人类特征的动物)时,应当平等地展示白人和少数民族人物,用各种广泛的职业和行为角色刻画他们,并展示少数民族和文化群体的贡献,由此增强所有人的自尊和潜能,并帮助少数民族群体成员发现他们在社会中的合法地位。
显然,这些特定的标准尽管重要,但只展现了与评价教材或课程相关的有限的部分。内容本身的智力意义是而且应该是评价的一个重点、核心。例如,在科学课的教学中,什么是学生将要涉及的概念、概括判断及教材的智力意义和有效性?如果概念处于理智的边缘,概括判断琐细而过于抽象,以至于对专家以外的人很少有什么启发,那么学校似乎就不应当把学生的时间安排在这些材料上。如果传播的理念超出了资料证据而不再有效或简直没有意义,那么花大量的精力帮助孩子们学习这类材料就没什么意义。艾斯纳因而认为,对一些课程内容,从其智力重要性及它可能传递的潜在信息的意义上进行评估,是课程评价的一个恰当焦点。
但是,由于课程是为人考虑的,而且由于人有不同的侧重,因此,艾斯纳认为,对课程的评价也需要关注课程对其所为之考虑的人的适切性。判定课程内容的适切性至少要抓住两种形式。第一,重要的是,判定课程包含的内容和任务是否在与其相关的孩子的发展范围之内?从发展的观点来看,对于特定发展水平的孩子来说,有些种类的内容是不合适的。准备的概念可用来对心理上的任务、内容和学生的特性之间的关系作出判断,尽管有时学校会滥用这一点(皮亚杰的工作经常被用于支持这种观点)。因此,一门课程中的内容,从其学科的意义上来看也许安排得很好,但如果它不适合特定组群的孩子的发展,仍会遭到反对。
第二,对内容的评价要涉及到内容所包含的经验对于学生经验背景的适切性。课程内容也许具有智力重要性及发展适切性,但仍有可能不适合学生的背景或兴趣。当然,艾斯纳认为,这一标准的重要性将随着一个人的课程取向而发生变化。对于某些持学术理性主义的人来说,学生对于特定学科的需要兴趣可能还不如把个人的适切性看作有意义教育的中心条件而加以关注来得重要。尽管如此,对这一标准仍不能完全置之不理。如果学生的经验背景与学到的内容相距太远,以至于使内容实际上丧失了意义,那么显然,无论这种课程在其他背景下多么有说服力,它对这一学生群体也是不合适的。这里要记住的是,在课程评价中,内容的教育意义是要优先考虑的。如果内容给人以误导或是无效的,随后的评价就是不必要的了。但即使是课程被判断为在智力上没有缺陷,人们仍要从它是否适合于使用的群体的角度对它的发展性和经验性作出评价。
当然,除了已经指出的课程内容的教育意义、课程内容的发展适切性、课程内容对学生经验的适切性这三种标准外,还有其他可用来评价课程的标准。事实上,任何被认为与课程开发相关的维度,都关系到课程开发之后对课程的评价。
2.教学的质量
艾斯纳认为,课程评价的第二项主要内容是所提供的教学的质量。尽管有些教育理论家并不对教学和课程作出区分,但艾斯纳认为,出于下述几个理由,区分还是有益的。首先,一个人可能并且通常事先作出用于课堂中的课程计划。因此,至少在某些阶段,课程开发是发生在课堂以外的一个过程,菲力浦·杰克逊 (Phillip Jackson)称之为“先期教学活动”(pre-active teaching)。第二,课程的智力意义可以独立于教学的好坏而被评价。一个教师的教学也许非常卓越,但他所教的理念或技巧却可能是琐屑的、有偏见的、无效的。相反,某项课程也许是没有缺陷的,它关注智力特性并适合学生的发展性和经验性,但一个教师的教学也许如此糟糕,以至于学生只是遭受混乱和挫败。每一种情况中的教育问题都是不同的,如果没有在课程与教学之间作出区分,恐怕它们很难显现出来。
当然,评价教学质量,说比做要容易。致力于界定有效教学的品质的努力有很多,但大多数都被证实不是非常有启发性。对有效教学进行研究和界定的途径具有科学的特征。对量化、可重复性及概括化的需要,经常导致通过高度还原论的途径去研究教学,这是一种试图探询具体因果关系的途径。这里的假设是,通过确认具体的因果联系,最终建立一种教学的整体观。迄今,这种事实还没有发生。那么究竟应该如何评价教学质量呢?艾斯纳认为,教学中那些可以被课堂上敏感的学生来评价的方面包括:教师建立的其与班级关系的类型,教师们解释的清晰性,教师表现出的热心程度以及教师提出问题的种类。尽管这些具体品质还没有被量化实证研究证明有助于教学效果,但它们是评价教师在教学中的所作所为时要考虑的因素。它们与对教师的评价相关,尽管量化实证研究迄今还没有证明它们的功效。艾斯纳认为,当作这样的理解时,我们就接近了教育中认识论问题的中心。
什么是真实的?什么可算作证据?显然,关于教学或关于教育实践的其他大多数方面的科学证据是相当有限的。可用于判断教育实践的硬性数据非常之少,甚至这些极少的数据也需要一种非科学的跳跃式理解,因为引申出原始结论的实例对于应用结论的群体来说似乎并不完全相同。确实,如果教育实践者把他们的教育实践建立在硬数据上,我们的学校将不得不关闭。因而,假设理解的唯一来源是实验室,就会使人们陷于无助的境地。至于提供足够的理解,有许多适当的经验及对这些经验的批判性反思是可以应用的。艾斯纳所确定的几种教学品质,仅仅是教学中能显现的以及被评价的相关维度中的几个。没有对教学以及对课程的评价,人们就会对什么时候有困难、困难的来源是什么一无所知。
3.获致的结果
艾斯纳认为,课程评价的第三项主要内容,也是最为独特的内容,是对学生所获结果的评价。选择“结果”一词来与“目标”相对并不是偶然的。目标是计划的终点,它们是一个人希望通过教育计划所到达的目的地。但采取的路线并不总是通向计划的目的地;即使通向目的地,在路上也可以学习很多额外的东西。因此,“结果”是一个比“目标”宽泛的词汇。目标的达到可以包括在结果中,但结果之中通常包括更多的东西。
图5—1展示了一种课堂上可能实现的结果的简单的三分图。图中,圆的一个扇面是关于学科特性的结果(subject-specific outcomes),第二个扇面是关于教师特性的结果(teacher-specific outcomes),第三个扇面是关于学生特性的结果(student-specific outcomes)。
学科特性的结果直接与所教的内容相关,这类结果不一定但可以与课程的目标相关。关于学科特性的结果为什么不一定与课程目标相关,有这样几种理由。首先,学习领域中的许多课程尽管没有明确表达的目标,但仍有教育功效。第二,甚至当日标是具体的时,实现的结果也可能是目标没有界定过的,尽管这种结果也是在学科学习的情境之中。评价如果着重于学科特性的结果,就意味着这种评价集中于一种课程或该课程组成部分的学科材料的学习。这种评价经常通过使用标准化测验或教师制定的成就测验来进行。一般来说,这类评定集中于在一门学科中学生获得的共同结果。例如,多项选择测验向学生群体展示同样的测验条目体系,这类条目不允许为个性化的反应留有余地;正确答案与错误答案混在一起,学生必须从中作出选择。这类测验揭示的是编制测验时编制者的选择所决定的东西。因此,使用这类测验时,关于学生的理解,人们所了解到的是与测验编制者的选择相关的东西。这些条目都是从课程提供的内容领域中提取的。由于在“目标”或多项选择测验中很少甚或没有给学生留出余地,以证明他们对课程或内容没有提供的方面的理解,那些方面在思考中就被轻易地忽略了。
关注学生在一门课程中学到了什么具体内容,是传统的成就测验主要关心的事情。找出学生已经学会了什么,几乎总是意味着找出教会他们的内容。这样一个中心对于评价是有用的,但它仅展现出某一非常复杂的画面的一个部分。学生不仅按计划学习,而且由于在内容与他们的其他兴趣之间形成独‘无二的智力关系,他们也因此而发生学习。他们也许因为课程内容的刺激而学习那些仅略微触及内容的东西。这些结果对于教育评价而言都是成熟的,他们都是学生特性的结果。
艾斯纳指出,如果有人提出“除了我所教的以外,学生在我的课堂或课程中还学到了什么”这一问题,那他就开始转向学生特性领域。并且,如果有人开始开发获得对这类结果的一些理解的程序,他就是在从事学生特性方式的评价。显然,如果向一个学生或一组学生提供的选择没有为展现那些可能唤起个性化学习的东西提供机会,这类结果就不会明显。如果我们想知道我们所教的内容或课程的个性化的有用副产品是什么,那么用于评价的任务或方法必须是结果充分开放的,以允许这类个性化学习出现。访谈、开放式论文、计划,这些评定形式的参数能够为学生展现他们所建构的个人意义提供机会,它们都需要在评价中发挥作用。当然,这类程序不是集中于提供比较的数据,它们将集中于特性化结果的展现。
得出特性化结果——换言之,即个性化学习——的程序,在方法、意义上不同于通常用于建立成就测验的程序。典型的建立成就测验的程序不仅需要向学生群体提供共同的条目体系,而且要求大多数学生都能做好条目,或者剔除那些能在分类上区别出男生和女生表现的条目。典型的成就测验的目的就是提供能对学生作出区分的分数。区分的类型要在学生对于向他们全体提供的同样的条目体系的不同表现中寻找。通常,群体的表现距离常态曲线越近,测验在统计上的可靠性就越大。
然而,艾斯纳进一步指出,用一套共同的条目对所有学生评定共同的内容,可能破坏个性化教学或培养学生态度和兴趣的努力。我们经常说,教育的期望是鼓励学生在学校中寻求特定的兴趣,教师应该灵活而富有想象地开发教学计划,特别是适合于他们的学生的计划,然而,测验仅仅是从对所有学生都相同的内容领域寻求共同的结果,这与上述期望通常是不协调的。如果我们真正关心对不同学生要区别不同的课程,则对学生特性评价形式的需要将变得越来越重要。
艾斯纳认为,学生所获结果的第三个部分,是通过对教师所教内容的引申展现出来的。教师个人所表现出的理智风格,他们所持的标准、冒险的愿望、对不同观点的忍耐性,他们的价值观,这些方面对教学而言不是无关紧要的。确实,由于这些特征似乎比内容学习更具渗透性,教师对学生的学习或许具有更重要的影响。无论是在小学还是在最高水平的大学,与一个真正伟大的教师一起学习,能帮助学生获得比揭示一些特定内容的体系更多的东西。
艾斯纳深刻地指出,小学年龄段的孩子在40个学周中每天要花5个小时甚至更多的时间与教师在一起,对于他们,教师的个性品质意味着什么?今天,这些问题是不能回答的。教育评价的常规概念很少把它们包括进用于评定学校教育结果的程序中。然而,这些问题以及可以举出的其他问题并不是学校教育中无关紧要的方面。除非人们意识到教师的个性、价值观和兴趣影响教育结果的可能性,否则很可能得不到这些问题的答案。要求学生把教师的贡献而不是教师提供的那些课程内容个性化,将是很有趣的。学生对教师的贡献将会说什么?那些与个别教师相处超过一定时间的学生表现出从教师的个性中获得的特征、兴趣、态度或探究风格了吗?一种有理解力的教育评价理论至少应把教师特性结果作为保证考试效度的三种因素之一。
艾斯纳的结果评价的思想是极其深刻的。当我们只关注“学科特性的结果”评价时,教育中最重要的东西——学生特性与教师特性,就变成不是被排除的对象,就是被压抑的对象。怎样通过对“学生特性的结果”与“教师特性的结果”的评价而彰显并提升学生特性与教师特性,是课程评价未来的发展趋势。
(三)如何艺术地报告教育评价
艾斯纳指出,公众想知道他们对学校的投资是如何被使用的,这一愿望越来越强烈。那么,该如何生动地向他们报告发生在课堂或教室中的事情?报告学校教育成效的典型程序有两种。第一种,引导父母相信他们的孩子得到的等级恰当地描绘了他们在学校中做得怎样,并且孩子的等级也隐含着学校做得怎样。好的等级意味着孩子做得不错;差的等级意味着孩子做得不好——尽管由于教育中保护消费者利益主义的加强,差的等级也许意味着学校而不是孩子做得不好。第二种,向公众报告学校做得怎样的另一个主要工具是标准化测验。在美国的许多州,标准化成就测验是由州立法机关托管的,在有些城市,报纸通过在校学生的等级来公布一个学区的平均成绩。父母和其他市民阅读这些报告,并根据一个学校或学区在一些地区或国家区划中所占的等级,得出关于这个学校或学区的教育质量的结论。这些分数通常不受社会经济因素或其他可能影响测验分数的条件因素的妨碍。这样,公众获得的一系列测验分数就先在地为他们提供了一种关于教育精确性的虚假感觉。尽管没有足够的教育者会宣称,阅读和数学标准化测验的成绩恰当地表现了教育质量,但对于所有的实践目标,这些测验分数变成了公众判断学校功效的主要指标。由于公众使用这类分数作判断,学校管理者就感到需要把教师的注意力集中到那些可能导致取得较高的标准化测验分数的活动上。一所成功的学校(顺延开去就是管理者是成功的),就是学生取得了较高标准化测验分数的学校。
艾斯纳指出,大多数教育者会说,不论字母等级还是标准化测验分数,都不能体现教育经验的丰富性,它们也不能恰当地揭示学校的教育质量。然而学校确实用基于这类成绩的等级及教务长们的排列名单给学生以奖励,并在认识分数的局限的同时,对它们的重要性予以合法化。尽管教育者指出,标准化测验分数不一定表征学生的学习情况,然而这类测验管理机构的激增及他们的结果的随后公布,正如报道的那样,经常会引起误导。这确实是教育的讽刺。
这种状况的产生有几个缘由。第一,对于评价精确性的渴求在学生成绩的量化中得以表现,这种量化的成绩又进一步被转化成等级。不知怎地,当学习的复杂形式被简化为一个单独的分数或等级字母时,就被认为隐含着一种精确的客观性。第二,父母对于他们的孩子或学校的成绩,经常想要一种清楚的指标。对许多家长来说,关于学生或学校成绩的质性描述,给人一种复杂而不确定的不安的感觉。即使会产生误导,简单也经常比那种也许只有教育鉴赏才能领悟的复杂更可取。
为了使孩子获得向上的教育流动,父母为他们制定了必须达到的适当的评定标准。对于简单和简洁的这种偏爱,与父母制定标准的这种评定不无关系。学生在中学的等级会在相当程度上影响他们进大学。而得到的分数等级,其功用之一就是划分层次等级。简言之,为了选拔而应用于学生的标准及学校教育等级观念的保留,强化了分数等级体系的使用,因为它们易于转化成简单的数字指标。各科成绩平均分、班级名次(class standing)、大学入学考试分数,这些在一个有竞争的教育市场中,远比揭示教育的其他宽泛多变的形式容易比较,虽然后者更有启发性。为了有一个便于比较的统一尺度,人们寻求减少多样性。
艾斯纳进一步指出,标准化测验分数和等级成为判断教育质量的基础的第三个理由是,我们没有为公众提供其他选择。由于忽略这类选择,等级实践的传统就建立起来了,因为公众需要它。然而,如果我们思考报告的问题——帮助父母和他人了解学校中发生的事情,就要注意一系列广泛的可能性。
艾斯纳认为,揭示教育事件的特性及孩子们学习质量的问题,可以被看作是一个艺术问题。那么,教育评价的结果该如何传达,才能揭示发生在学校和教室里的事件的复杂性、歧义性和丰富性?
对这个问题的回答要部分地依赖于这种认识,即人们之间通过不同的表达形式进行交流,而每一种形式具有表达不同类型的理解的作用。数量指标对某些目的是有用的,但不能解决所有问题;书面描述对于理解某些事件有所帮助,但它不能复制某些目的下的视觉形象;源于统计的常模有助于探明趋势,但却忽视独特的事件。简言之,如果一个人思考人们用以表达和理解的方法的范围,并把它与报告教育评价结果所用的方法范围作比较,那么很明显,我们通常所用的报告的典型形式在教育生活中只占极少部分。要获得教育生活的丰富性,并进而帮助公众理解和评估课堂或学校中存在的问题及取得的成就,就需要构建一幅评价全景。这样一幅全景画的产生,可能要使用从各方获得的、通过不同类型报告程序揭示的广泛信息。
这些程序之一,很有可能是教育批评(educational criticism)。这种批评旨在帮助父母理解一所特定的学校一个学年的课程中所发生的事情。学校中的关键事件是什么?它们是如何发生的?学生和教师是以什么方式参与的?这类事件如何能被强化?这类事件促使孩子们学习什么?琼斯女士的课堂像什么?孩子们从事的是什么种类的活动?琼斯女士提供了什么她自己独特的东西?在她的课堂上,孩子们学校生活的特色是什么?孩子们从她的课堂上得到了什么与标准化测验所揭示的不同的东西?像这些问题,如果由有效的教育批评来回答,将会让父母对学校和教室有所了解,这是现在大多数评价所没有做到的。即使是对教育非常重视的父母,对他们的孩子在学校中得到的教育经验也只是有一点模糊的认识。首先,在使用报告卡片的学校,卡片对于以上所描述的那些种类的事件没有给出任何说明。报告卡片的内容主要集中在按照某些标准学生做得怎样,而这些标准本身是含糊不清的。即使学校用家长教师协商会来代替正式的报告卡片,家长和教师之间的讨论也很可能集中于学生的表现而不是要他们参与的课程计划方案。
向家长揭示教育计划的丰富性的另一媒介是电影和录音磁带。人们可以利用电影或磁带获得教育生活的侧面,就学校实际提供的东西向家长和其他人展示生动的画面。当然,这类磁带和电影的制作要求一定的技术,这是当前多数评价者还不具备的。然而,技术的缺乏不是反对开发它们的理由。电影和录音磁带的使用,甚至静止幻灯片和照片的使用,如果它们是用艺术的、有教育识见的眼光取得的,则它们都能提供大量的信息。制作这类揭示教育资源的视觉材料的任务才刚刚被接触到。明智的教育批评及明智地教育性地使用磁带和电影,其目的在于更仔细周到地透视教育生活。通过批评性叙述的弥补,这类视觉材料相当大地扩展了交流的渠道。
使用静止的照片对于揭示教育生活的侧面也有很大潜力,这是成就测量甚至艺术性批评也可能做不到的。这类视觉表达的经典实例已经存在,艾斯纳举例说,其中最引人注目的也许是阿尔弗雷德·斯迪格里兹(Alfred Stieglitz)的“男人的家庭”。由于斯迪格里兹创造了那个展览,引发了大量其他视觉报告档案的出现。这些档案提供给我们的,以及他们可能刻画出的学校生活的教育质量,是一种切题的揭示方式。当他们艺术地进行创造时,他们的作品能帮助我们替代性地参与到学校提供的生活中去。目前,这类媒介作为教育报告的明确形式的使用,在美国的教育中还很不够。即使出现也是偶然的,与学生年鉴或报纸联系在一起,而不是作为学校用于理解和报告正在做的事情的正式资源的一部分。
在过去的几年中,人们的注意力正逐渐集中于使用非文本材料描绘学校教育。发生在教育者中的这种兴趣,类似于最近发生在人类学者中的对“视觉人类学”的兴趣。这一在教育和人类学中新产生的兴趣隐含着这样一种认识,即人们用以表征世界的形式规定着表征和传递的内容的参数。即使是有相当天分的作家,也不能用文字表达所有事情。例如,有些东西需要通过视觉形象来表达。绘画所刻画的可能是文字所永远无法揭示的。因此,把表达的选择局限在文字上,特别是陈述性语言上,就是限制对我们感兴趣的世界的传达。
教育批评以及录音磁带、电影摄影和静止照片的使用,仍可以由其他对教育生活能提供更多理解和恰当画面的信息类型来弥补。这些弥补形式之一是录下学生和教师的会谈,包括录下他们的工作及目的、他们的快乐、他们遭遇的环境和问题、他们关于教育改革的意见、他们在学校中的志向、他们最看重或轻视的结果,等等。把会谈录制到盒带上,能够以一种包含观念、信仰和感情的方式去录制和编辑,这些在书写的问题单上很少得以表达,在成就测验中则永远不可能表达出来。会谈的自然性——这要产生于既熟知会谈技术又了解教育理论和实践的有技巧的会谈者——能够带来在目前还不能轻易获得的资料。
应该注意到,听录音带上的会谈本身也许要求一种需要开发的鉴赏能力。如果要对一个人所说的进行全面的评价,他说了什么和没说什么,某事是如何说的,表述的语气,等等,则所有这些有含义的非语言暗示都需要洞察了解。然而,我们所有人都把这类技巧发展到了相当的水平——它们是生存技巧,并且即使它们不能被完善到一个最适当的水平,我们也已经学会了如何充分地倾听别人谈话,以从中得到尽可能多的信息。
可以用于对学校或课堂进行适当评价的其他信息,还包括对学生作业的分析。在典型的评价程序中,考试分数、论文获得的等级、着手进行的和已经完成的计划的等级,都是向家长报告他们的孩子在学校取得的进步的资料。这样做的时候,有些事情很不确切,例如,一篇论文得B等,是否是指这篇论文与班里其他同学的论文质量相比较而言,是否是基于该生花在写作上的努力而言,它是否代表了本学期开始以来该生所取得的进步的数量,或者它是基于所有这些标准的结合。这些等级程序还不是我所指的对学生在学校中的作业的全部分析。这类程序的问题是,它们提供的是结论,而不是揭示作业的特征和进步的类别以及学生遭遇的问题。要做到后面这些,首先需要密切注意一个孩子或班级创造了什么。如果作业是一篇论文,人们也许描述这个孩子如何组织这篇论文、立论或所用论据的质量如何、创作作业时想象涉及的范围。作业的这些方面可以与其他孩子或班级创作的作业相比较,并可以伴随能帮助成人或孩子理解已经完成的作业的批评。例如,如果想帮助学校委员会或一群家长理解人类的发展是不平衡的,同样年龄的孩子无论是技巧还是理解都处在相当不同的水平,那么,展示班上一定范围的孩子创作的作业——而不仅仅是最好的——将会有所助益。只展示最好的作业会隐藏差别的范围,并歪曲教师必须在其中工作的真实的教育画面。当这种范围的视觉展示伴随着批评性描述和分析时,将非常有助于学校委员会清晰地了解一些课堂表现的真实性。
这里,艾斯纳试图说明的主要观点是,关于学校中发生了什么,明了有什么长处和短处,什么需要支持、什么不需要支持,等等,这些与一些公众——家长、学校委员会成员、学生、州负责机构——进行交流的问题,可以被看作是一个艺术性问题。这样理解这一问题将是非常有益的。它是一个把对教育实践及其结果的画面加以表现、感受和揭示结合在一起的问题。这类画面的构建既可以利用人们在交流时常用的各种方式,也可以利用那些能获取、抓住发生在课堂生活中最短暂的事件的新技术。
这种教育评价方法很少能得到考试评价研究的欣赏。实际上,这些研究的通常特点是,试图寻求量化“目标”和非个性化,集中关注成绩测量。而不关注做过的事情(过程)与结果(产品)之间的关系。常规的评价训练仍然保留着心理测量的痕迹,尽管心理测量技术对于描述教育成就的某些方面是有效的,但它无法包含教育的全部。当用心理测量方法培训年轻的评价者时,一个共同的问题是忽视教育实践的规范方面和理论方面。教育是一项规范性的事业,判断什么具有教育性依赖于一个人的教育价值观。把教育评价变成一系列有限的量化方法——它们包含着自身的价值观,只是这些价值观经常不被公开和评价——就是把教育评价者变成技术人员,把教育评价变成技术过程。然而,教育评价远不止于此。任何范围狭隘的技术技巧用于教育系统,也不可能揭示其背景的丰富性。要理解哪怕是有教区制度(parochial means)保障的学校的意义,也意味着需要一些教育质量的观点和一些对教育实践历史的理解。
艾斯纳指出,在讨论教育评价的语境中提及教育史和教育理论的重要性,看起来也许有点奇怪。在这类话语中很少发现这些话题,并且当它们被作为培养未来评价者的教育计划的一部分出现时,更多的时候是为了满足制度的需要而不是考虑到它们的重要性。然而,教育评价需要一幅精到的、解释性的“地图”,它不仅能在教育情境中把琐屑的东西从重要的东西中区分出来,而且能理解所看到的东西的意义。没有一种规范的和历史的观点,对教育事件的理解和评价就是死板而乏味的。
二、对传统评价观的渊源分析及批判
早在20世纪60年代,艾斯纳即以其对行为目标和传统分科课程的一系列批判文章而闻名于课程理论界。其后,他对美国教育研究中实证分析的单一模式的批判、对质性研究方式的提倡、对意义建构的多重途径的见解、把文艺批评思维方式引入教育的尝试,生动地拓展了人们的教育视野,给教育研究领域带来了一股清新的空气。在这一过程中,艾斯纳也对传统的评价模式进行了批判。概括起来,主要包括以下几个方面。[21]
第一,从总体目的看,传统的评价模式追求的是预测与控制。艾斯纳指出,课程评价领域的诞生是以启蒙运动以来现代科学的发展及其方法论为背景的。17世纪后期和18世纪,诸如孔多塞 (M.C.de Condorcet)和孔狄亚克(E.B.deCondillac)等学者,利用伽利略(C.Galilei)等人改造过的自然科学方法研究自然,试图掌握自然规律。后来,孔德(A.Comte)等人把自然科学的研究方法沿用到社会研究领域,试图建立与自然科学类似的社会科学。他们坚信,社会和自然一样可以进行研究,不仅能揭示出其规律,而且这些规律能够组成理论之网,满足人类的求知需要。世界不再超出我们的控制之外,人类能够理解世界运转的真相,相信其特征能够被经验地试验,并且,在一些情况下,世界自身能够被控制。而19世纪后半叶建立的心理学实验室则表现了用自然研究方法来研究人类的努力。人类是自然的一部分,如果自然能够被理解,那么人类为什么不能呢?因此,艾斯纳强调,美国的心理学特别是
美国的教育心理学根植于欧洲,引导它们成长的理念在本质上是一样的:理解自然如何运作并通过这类知识对其加以控制。西方的理念在目的上不是创造一种合作的关系,而是进行控制。
受上述理念的影响,19世纪末20世纪初发展起来的课程评价,无论是早期的测量和测验,还是20世纪中期占据主流的目标评价模式,其特征都是预测和控制。通过预先确定的标准、常模或目标,将被评对象的特质强行纳入一定的框架之中,凡是不符合预定框架的,都被排除于评价范围之外。这样,评价将不可能全面反映教育的实际状况,而只能提供片面或歪曲的教育形象。评价者拥有绝对的主体地位,被评价者则成了被控制的客体,这实际上颠倒了本来的主客关系,从根本上有悖于教育精神。真正的教’育追求的是合作、协商,在交往中求得共同的发展。
第二,从认识论上看,传统的评价追求的是认知兴趣。艾斯纳认为,传统的评价是一种寻求知识(knowledee-seeking)的活动,它关心的是“事实”,试图建立性质上稳定不变的模型,提供理论知识。但教育主要是一种实践活动,与其说它关注什么是真实的,不如说它关注作出好的决定。因此,评价应当是一种作出决定(decision-making)的活动,它不应当只关心理论知识,而应该为作决定提供可靠背景及有用的推测信息。艾斯纳相信,一旦评价被作为复杂的教育实践中的一项重要因素而概念化,它就有可能为改善和增进实践作出贡献。在这一点上,艾斯纳与施瓦布有着共同的见解。
第三,从评价标准上看,传统评价追求一元化的价值观。重视科学性、客观性的传统评价为了能有效地预测和控制教育现象,往往把被评对象置于一个共同的标准或常模之下,用评价者认可的某一种价值观要求被评对象。在这种评价标准的导向下,学生的个性差异被抹煞,学习的内容、方式、目标等简单趋同,而所谓个性化的教育,只不过是在学习进度上有所变化而已,根本无视学生个性的复杂性、丰富性。
第四,从方式上看,传统的评价追求的是科学范式下的量化。对数量的迷恋是现代科学的基本特征之一。在现代科学的视界下,数学具有一种次序和精确性,它能减少主观性和不可测量的推论,有助于主流的理性观念渗透于社会科学。此外,它提供的数据能够用新兴的统计工具处理。能否进行量化至今仍被作为衡量一门学科科学性的一个标志。在这种思路下,传统评价把复杂的教育现象简化为数字,把丰富的质还原为量,凡是不能量化的现象都被摒弃于评价的范围之外,其结果,评价并不能反映教育的真实状况,因此也无助于教育实践。
第五,从结果上看,传统评价重结果而轻过程。传统评价往往把行为目标作为判断的依据,而行为目标是结果取向的,它重视的是学习结束后的成就,而忽略学习的过程。这给学校教育带来了很多弊端,如,只重视可测量的外在行为目标,忽视内在情意目标和态度的培养;课程、教学和评价之间被处理成线性关系,缺乏内在的有机联系及有效的反馈调节;简单地看待学生取得的成绩,看不到成绩背后不同的动机取向和努力程度等。
此外,艾斯纳还从科学评价范式的内部出发,指出有些评价研究在数据资料的搜集和处理方面存在不适当等问题。
艾斯纳对传统评价的批判,从评价产生的整个社会文化历史背景人手,既说明了传统评价的历史合理性,又充分显示出它在当今时代背景下的局限性和改革的必要性。这种批判是深刻而充分的,切中了传统评价的要害。他对传统评价诸种特质的分析,找出了传统评价诸多弊端产生的原因,为人们准确地把握评价的实质提供了有效的参照。总之,艾斯纳的批判是全面而深刻的,他不仅看到了评价中存在的表面问题,而且触及了传统评价的深层理念。
三、对传统课程评价的改造
从上述对传统评价的批判出发,艾斯纳试图对传统评价进行改造。这种改造主要从三个方面人手:一是从课程开发的角度提出了“空无课程”(the null curriculum)的问题;二是从改造评价标准的角度提出了表现性目标的问题;三是从评价方式的角度提出了要重视质性评价的问题。
(一)空无课程[22]
“空无课程”是艾斯纳在《教育想象》(1979)一书中提出的一个概念。艾斯纳认为,既往的课程研究只关注显在课程和潜在课程,即学校的实存课程,但仅有这些是不够的。在课程开发过程中,研究者和设计者应考虑学生心智发展的协调性与课程领域的全面性。以此为标准来观照学校中的课程,就可以发现,在实存课程之外,尚存在着一个空缺的领域,这个领域即艾斯纳所说的“空无课程”。用艾斯纳的话说,如果我们关心学校教育计划的结果,且关心课程在实现这种结果中的作用,那么,我们除了要考虑教什么以外,也要考虑学校不教什么。在艾斯纳看来,教什么和不教什么,对这两个问题的研究是同等重要的。
艾斯纳指出,学校教育要培养学生广泛的心智过程,即一切与心智有关的过程。因为在现实生活中,许多颇具创造性的思维并不仅仅是语文、数学等逻辑性思考的结果,它们的运作要依靠视、听、嗅、味、触、动等多种感觉器官的协调配合。但在现行的课程和评价模式下,学校教育对心智过程的理解已经被严重地窄化,似乎心智过程就只是与语文或数学有关的逻辑性思考。因此,学校课程的设计难免有失偏颇,比如,只重视语文、数学等逻辑性强的学科,忽视音乐、舞蹈、视觉艺术等学科的教学,这种现象使学生接触不到严肃的艺术形式,他们的艺术欣赏和创造能力也不能自行发展。此外,像法律、经济、人类学以及心理学等学科,在现行课程计划中也都付之阙如。因此,现行的学校课程和评价模式已经使学生失去了某些有效的心智过程,失去了本应具有的许多变通途径。这会严重限制学生与世界交往的方式和创造能力的发展。
关于空无课程的问题,艾斯纳虽然是从课程开发的角度提出的,但实际上,它也为人们思考评价问题提供了另一条别致的途径。评价不仅要按照预定标准考察实存课程及其结果,而且还要把眼界放开,从教育的根本上考察空无课程及其造成的后果。评价从而也就逼近了教育的本真状态。
(二)表现性目标(expressive objective)[23]
在课程评价领域,长久以来,一直是以课程目标作为评价的标准,而且,为了保证课程计划(包括评价)的清晰性、具体性和可操作性,这种课程目标又往往被形式化为小单位的行为目标。艾斯纳指出,课程目标的用途和形式化的方式,某种程度上是受不同教育观念隐喻的影响的。把具体的行为目标作为评价标准,实际上是受20世纪以来占据主流地位的工业化隐喻和行为主义隐喻的影响。
教育观念的工业化隐喻在20世纪的一二十年代最为流行,那是一个绩效运动崛起的时代。这一运动采取适应工业的方式——特别是时间和动作研究(motionstudy)——来提升教育过程并使它更为有效。把这样的观念引入学校,必须完成下列工作。首先且是最重要的,是判断教育产品数量和质量的标准必须形式化。第二,为了确认最有效的方法,必须进行时间和动作研究。第三,任何能够形成惯例和指令性的东西,都不给工人留下判断的余地,因为他们的决定也许会导致无效和错误。第四,判断产品质量的不是学校中的工作者,而是产品的消费者——社会。第五,教学任务分成便于管理的若干单元,以利于对教学及在生产线上的每一步进行评估。在这种有关教育观念的隐喻中,学校被视为“工厂” (plant),“监督者”(superintendent)指导着工厂的操作。教师从事“工程师”(engineering)的工作,学生则是按照“客户”(consumers)要求被工厂加工的“原材料”(raw material)。进而,产品的检验是用生产线上使用的“质量控制标准”(quality control standards),在常规差距(regular intervals)水平上进行的,亦即用数量值来表示,以减少错误的可能性。产品规格(product specifications)是在原材料被加工前就规定好了的。在这种情况下,效率——其测量首先涉及成本——是能够确保的。
教育观念的行为主义隐喻是由华生(J.B.Watson)、桑代克 (E.L Thorndike)、贾德(C.H.Judd)等一批心理学家所倡导的。在这种理念下,教育被设想为对行为的塑造,那么,把教师看作是行为的工程师是可能的,也是恰当的。教育过程被全部设计成促使儿童接受预知类型的行为,这样就有可能开列出产品说明书,用以控制质量标准,辨别学生经过适当的教育过程后所具有的终端行为。在这种观点下,教师的任务是使用科学地发展起来的资料,减少错误,使自己的工作像一个工程师那样更为高效。如果孩子对我们安排好的任务不感兴趣,教师的问题不是查明孩子的兴趣所在,而是去激发孩子完成事先安排好的任务。通过建立适当强制的课程表,我们就可以塑造出预想中确认的孩子。
艾斯纳认为,上述隐喻导致的行为目标并不能涵盖学校教育的所有责任。作为一种对文化传递负有责任的机构,学校理应关心促使学生接受那些智力规则和技能,这将使他们有可能获益于前人的贡献。要完成这一任务,就必须学会一系列社会界定的技能——阅读、书写和计算,它们都是进一步探究人类文化所赖以为基础的规则体系的例证。但同时,学校也应关心促使孩子对已有文化作出贡献,这一点要通过为个体提供对自己所际遇和建构的观点进行解释的机会而实现。艾斯纳指出,对过去的简单重复是走向僵尸文化的必定途径。
基于上述的双重关注——帮助孩子成为已有文化工具的娴熟使用者,帮助孩子完善并拓展这些工具从而使文化得以生动地保留,艾斯纳提出,应当区分课程计划中能够被形式化的两种教育目标类型。第一种类型即上述的行为目标,可称之为“教学性目标” (instructional objective);第二种类型即艾斯纳提出的“表现性目标” (expressive objective)。
教学性目标是清楚地说明学生在完成一项或更多的学习活动后所接受的特定行为(技能、知识条目等)的目标。这些目标适合于规划或早期的标准界定。它们通常是从诸如规则之类的文化成果中引申出来的,并且以适当的时间间隔呈现给接受它们的孩子。
教学性目标被用于课程开发的预测模式。预测模式中预先选择的活动被用来促使孩子获得目标中包含的具体行为。在这种模式中,评价的目的在于决定目标达成的程度。如果目标没有达成,接下来就要采取各种行动:也许是调整目标,也许是改变教学方法,也许是修改课程内容。使用教学性目标,其最终行为的清晰是至关重要的,因为它是评价课程效果的标准。在这种课程计划中,学生的终端行为与目标是同构的。
表现性目标与教学性目标大不相同。表现性目标并不指明学生经过一种或多种学习活动后接受的行为。表现性目标描述教育际遇:它辨别孩子们作业(work)的环境、处理的问题、从事的任务;但它不指明他们从际遇、环境、问题或任务中学习了什么。表现性目标为教师和学生提供了一种探究、遵从或集中注意于探究者有特殊兴趣及重要问题的邀请。表现性目标是唤起性的,而不是规范性的。
表现性目标是一种预期性主题,它使得早先习得的技能和理解得以应用,但通过这种应用,那些技能和理解能够被扩展、精致化并具有个人特质。表现性目标期待的不是学生们反应的同质性,而是多样性。在表现性场景(context)中,教师希望为学生提供一个使意义个体化的情境,学生的作品(products)无论在理论上还是在性质上,都像他们自己那样丰富多彩。因而这种情境中的评价任务并非为作品提供一项共同的标准,而是对产品结果作出反应,以便揭示它的独特性及意义。在表现性场景中,作品对于制作者来说,很可能与际遇它的老师一样,具有同样多的惊奇。
表现性目标可以这样陈述:
·理解(interpret)“失乐园”的意义;
·检查并评估“老人与海”的意义;
·用金属和木料制作一个立体形状;
·参观动物园并讨论那里有趣的东西。
应该注意的是,这类目标并不把学生经过一项教育活动后所能做的事情具体化,确切地说,它们是界定学生的际遇的类型。从这种际遇中,教师和学生都获得对评价有用的资料。在这种场景中,评价的形式近似于艺术批评,这就是,评论者评价一部作品,研究它的质量和意蕴(import),但并不引导艺术家趋向于作某一特定类型的画。评论者所做的主要事情是针对已完成的工作,而不是描绘它的建设蓝图。
表现性目标的提出让人们领悟到,教育并非只能“生产”一些预定规格的“产品”。在更广泛的意义上,教育对人的发展所起的作用是开放的。因而,评价不应该也不能只有一种模式、一种标准,否则,评价就会丢失教育中更重要的东西。在以表现性目标出现的学习情境中,由于评价是在学习结果形成之后进行的,这就避免了教学过程对发展的消极控制,教学成了一个引导的、随机展开的过程。在这种情境中,过去习得的技能与理解被用作探究更深刻的意义或困惑的工具。有时,遇到的问题需要发现新的智力工具,这就会引发创造性行为和创造性贡献。
事实上,正如艾斯纳指出的,由于儿童学习程度的不同和个性的多样性,界定潜在的成果性际遇比具体化的教学性目标用途更大。因此,表现性目标才是教师经常运用的目标。另外,在不同的学科中,教学性目标和表现性目标的应用范围可以有所区别,如在数理学科中更多地使用教学性目标,而在艺术等学科中则更多地使用表现性目标。
(三)评价的质性方式
艾斯纳指出,传统的评价领域过于强调科学范式下的量化方式,人们倾向于认为,能够用来获得知识的最可靠的途径就是科学,因此,在教育上受重视的探究,至少是受重视的经验探究,其特征是科学的。使用其他的方法,如使用隐喻、类推、比喻或者其他诗意的手段,就是丢弃了严格。在这种思路下,传统的评价方式在范围上过于狭隘,不能解释复杂的教育现象。因此,20世纪60年代末起,人们开始对传统的评价模式进行反思批判,并试图探索其他可行的评价范式。这种努力的结果是至70年代中期发展出所谓“解释的评价”(illuminative evaluation)。[24]解释的评价是依据人种志的研究范式提出的,它不是测量预期的教育效果,而是对整个课程方案进行整体而深入的研究,并强调观察、访问等质性探究的方式。
根据艾斯纳的分析,人种志之所以作为教育实践和教育评价研究的一种范式而受到青睐,是因为:首先,对那些寄希望于科学地理解教育的人而言,人种志作为文化人类学的一个分支,属于社会科学的家庭成员,用它来研究教育实践,这种延伸并非肆意歪曲;第二,像克利福德·杰茨(Clifford Geertz,1973)所解释的,人种志是关于文化意义的铭文,它稳固地记录了思想并有利于检查和修正,这样的目标适合于许多希望理解学校的人;第三,人种志实践的历史几乎与心理学一样长,尽管这些实践实际上并不像局外人所看到的那样严谨,但有科学追求的人相信,人种志能够用于发现课堂生活的基本类型并系统地揭示它的深层结构。确实,美国许多教育学院提供的研究生课程,都计划教给学生在教育研究中如何使用质性方法,并由人种志学者担任教师。
艾斯纳所呼唤的质性评价方式与人种志有所不同。在他看来,在人类的探究领域中,艺术家的工作最为集中地体现了质性方法的性质。因此,艾斯纳认为,要了解质性探究方式的组成,最好的办法就是分析那些使用质性探究方式的人的作品。[25]
艾斯纳援引杜威的观点指出,艺术家使用质性模式,既探究作品的形式,也探究获得这些作品所使用的方法。他们工作的结果是一种质的整体,如一支交响乐、一首诗、一幅油画、一段芭蕾舞。这些作品具有在理智上唤起对某种经验的理解的能力,因此我们把这些作品称为艺术。因此,艾斯纳强调,质性探究方式的运用是在艺术中发现的。
质性探究的另一种形式是在那些探究艺术家作品的人,即艺术批评家的作品中发现的。艾斯纳认为,艺术批评家的工作是一项困难的工作,他们把组成艺术作品的那些必要的、不可言喻的特质,翻译成有助于他人更深刻地理解这些作品的语言。在这个意义上,批评执行着理解的中介的职责,它讨论艺术作品的组成特质,是为了让那些缺乏批评家的鉴赏素质的人能够更全面地理解作品。艾斯纳援引杜威的话说,“批评的功能是对艺术作品感知的再教育”。在这种视界下,批评家的任务首先不是进行判断,而是执行“撩开遮住视线的面纱”这一艰巨工作。由此,艾斯纳提出,课程评价的质性探究方式应该是“教育批评”(educational criticism)。
“教育批评”的提出,是艾斯纳对评价领域的一个独特贡献。它内蕴的理念也切合于评价领域新出现的“评定”这一概念。艾斯纳也因此成为评价领域改革的中坚人物。
四、教育评定新概念的特征
自20世纪80年代中期以来,“评定”概念逐渐代替了“评价”,开始在课程评价领域流行。相对于传统的评价概念,“评定”有着一些全新的特征,艾斯纳曾对此作过系统的总结。他认为,新的“评定”概念应具有如下八个特征。[26]
(一)用于评定学生所知与所能的作业(tasks)要反映学生在校外的世界中将会遭遇到的事情,而不能仅仅局限于学校内部
艾斯纳指出,传统的学生评价的特征之一,是它远离人们在校外所从事的那些工作。但学校教育的终极目的并不是要证明学校的正确和优异,而是提高学生解决校内外问题的能力,甚至是深化和拓展学生对日常生活进行解释的能力。因此,评定的作业不能仅仅局限于学生在课堂情境中能做的事情,而且要反映他们在校外的生活情境中所能做的事情。
艾斯纳认为,现在一些认知心理学家(Greeno,1989;Oliver,1990)所称的“情境学习说”(situated learning)或“背景认知说”(grounded knowing),即与上述主张相吻合。“情境学习说”指出,学生对某一事件的认知和学习,与其所发生的情境密切相关。因此,与日常生活极少有相似性的事件及测验条目,其所得分数可能对这类生活的预见价值极小。比如,一个学生也许在代数学测验中知道如何计算方程式,但却不知如何处理非代数情境中的等量关系问题。因此,新的评定实践需要提供类似于人们在日常生活中遇到的那类重要挑战的作业。
(二)对学生进行评定的作业应该揭示学生是如何解决问题的,而不仅仅是针对他们得出的结论
目前学校中的大多数测验,特别是所谓的客观性测验,并不提供学生任何得出答案的方式的信息。供选择的答案是由试题编制者提出的,学生的任务是选择,而不是建构一种反应。其结果是,评价不可能判别出推理的性质或思考的过程、答案的取舍、假设的形成,或者包含于学生得分中的解释。然而,对于任何关注学习迁移能力和概括化过程的教育理念而言,推理的过程都是至关重要的。因此,评定作业的建构要使得学生有可能在有关问题解决的思考中作出合理的观察和推理。这是新的评定概念的一个重要特征。
理解学生如何获得答案,会为教师更好地修改教学计划或选择教学策略提供基础,知道学生在解决问题的过程中考虑什么,另一方面也显示出他们忽略了什么。在促进学生问题解决技能的发展中,教师对这种问题的处理与判别答案是否正确具有同样重要的作用。
(三)评定作业要反映它所由出的理智共同体的整体观念
艾斯纳认为,教学中的任何理念、观念或意象都不是孤立的,它们都属于某个独特的理智共同体,遵循着某些共同的价值观念,并在彼此的联系中获得意义,从而组成一个观念的网络。理智活动不仅要掌握这些观念自身,而且还有另外一个重要的任务,那就是理解观念之间的相互联系,把握它们在整个网络中的位置。艾斯纳把这种任务的完成称为一种“美学成就”(aesthetic achievement)。但在教学情境中,并非所有理念都被固定在这类网络中。当学生不被教导或学习把理念作为一种网络——一种变化的网络——的一部分来理解时,理念就变得僵死。新的评定就是要以某种方式创造机会,让学生展示自己对探索过的理念、观念和意象间相互联系特征的理解。简言之,其目的是帮助学生证明,他们已经把理念作为更大领域的一部分,以及作为历史地处于一种话语共同体中的组成因素而掌握了它。
艾斯纳指出,这样的学习有两种好处。第一,它既增加了内容的意义,也提高了学生的记忆,因为它允许理智网络间的联结,并因此而减少了无意义的信息碎片。第二,由于越来越多的模糊“信息条”聚集到一起,提供了一幅相关理念领域的连续画面,这就增加了学习将具有美学特征的可能性。
(四)评定作业不必局限于单独完成,可以用小组合作的形式来共同完成
现行有效评价的主导意向是,让学生个体在测验中工作,以免学生从同伴那里得到答案。艾斯纳认为,这种意向与美国的个人主义传统有关,但事实上,在成人的生活世界里,我们遇到的许多重要问题都需要小组成员的参与和合作。学校教育的重要功能之一,是帮助青年一代获得在成人团体中生活所必需的技巧,因此,对成人生活形式的删改或排斥是毫无意义的。这意味着,课程有必要设计成小组作业,使参与与合作成为课堂活动中受欢迎的正常部分,就像它们现在是成人活动的一个正常部分一样。这也意味着,对小组合作完成的作业以及个人在其中的贡献作出评定,就成了评定工作的组成部分。
艾斯纳批评现行的等级评分是基于对学生成绩的正态分布假设,它把学生放到与同伴竞争的境地:一个学生是A,另一个就是B。这样,人为地把优秀确定为罕有的智力成绩,因此只把这种奖励给予少数几个人。这对培养学生的合作精神是不利的,应予以改变。
(五)新的评定应该允许一个问题拥有一个以上可行的解决方法或答案
艾斯纳曾经指出,教育研究方法论中的普遍信念之一是对客观性的推崇。客观性既是指一个人对世界的观点或理解与世界本身是相同的状态,即本体论的客观性(ontological objectivity),也是指方法上不允许任何个人的判断和解释融人对世界进行描述的方式,即程序性的客观性(procedural objectivity)。[27]艾斯纳认为,在建构主义者的价值观念中,前者是站不住脚的;而后者,如果工具是有效的,即不求助于判断便能使用,则是可以达到的。例如,用于为测验成绩打分的光学扫描仪的使用,就说明了判断成绩等级的一种客观的程序方法。
程序性的客观性之所以成立,是因为担心个人判断以及进而导致的主观臆断将影响本应完全客观的对事件状态的描述。艾斯纳认为,这种方法论优先的观点限制了可用于要求学生的重要方式以及合理的反应类型。多项选择测验(multiple choice test)也像它之前的正误测验(true and false test)一样,是作为对程序性的客观性的遵从而出现的。但是,单个正确的回答和单个正确的解决不是理智生活的常态,也不是日常生活的常态。人们在其理智努力中面临的问题,与他们在日常生活中面临的问题一样,充满着有待理智抉择的解决方法。在测验中,多数甚或全部正确的答案和解决方法都只有一个,这种设计所传递的信息,与人们从事严肃的探究活动时所面临的情况是不相符合的。
鉴于上述考虑,艾斯纳提出,应该设计出允许和推崇替代性反应方式(alternative ways of responding)的评定作业。当然,对于大规模的温度测量式的评定任务,这种作业的使用也许是有局限的,甚或是不合适的。但当我们想知道一个学生如何或者是否能够处理疑难问题、争议或提问时,替代性反应就不仅是可能的,而且是必须的了。正是这种作业的提供,使得我们开始接近实践的适切性和理智的真实性这双重的理想。
(六)评定作业应该具有课程适切性,但这里的课程不局限于教授的课程
评价的常规方法强调这样的观点,即一项内容有效的测验需要反映已经呈现给学生的内容。这样的要求当然是明智的。让教师或学生为没有教过的内容负责是不公平的。然而,测验对课程的适切性却因此被引向极端。教育的主要目的之一是促使学生在其他环境中而不是在教学环境中运用他们所学的知识。对学生而言,重要的是带着一套可更改的工具,从他们学习的情境中脱离出来,因为他们极少会以学习时的形式遇到所学的内容。这一目的鼓励学习的迁移,甚或更多。它强调促使学生对一套理念或技巧进行改造或改写,使之适合于与教学情境相似但却不能肯定的材料和任务。
因此,这项特征的意蕴是,需要把评定实践设计得既适合于课程,但又不局限于课程。那就是,评定作业应有可能使学生在他们已经习得的理念上展示他们的理智应变能力。仅仅概括学校所教的内容,充其量是一种记忆的测验,它无论如何也不可能展现期望达到的迁移范围。因此,揭示学生在原理水平上使用所学知识的能力,这样的作业结构在新的评定中是相当重要的。
(七)评定作业应要求学生展示对结构和整体的敏感性,而不是简单地感知分散的部分
艾斯纳指出,人类探究的结果极少是一系列通向确定无疑的目标的单独步骤。在真实的世界中,探究的步履蹒跚,它的方法和目标都不确定,并显示出灵活性及与理智的探究者使用的探究模型相关。由此,艾斯纳提出,要求学生在有较大疑难的情境中而不是在大多数典型标准化测验的问题情境中从事创造性的作业,也许有可能观察到他们在活动中作出决定的过程。这种练习的目的是创生某种环境,学生分配知觉和解决问题的能力能够通过这种环境被认识。它为教师提供的信息将促使他们通过问题情境,在考虑更广泛的大量因素的情况下,给学生以帮助。
艾斯纳举例说,在艺术性的作业中,这类技能最为重要。一个上绘画课的学生必须不仅注意一条胳臂的轮廓,而且要把它作为身体的一部分,注意它与身体的关系。更进一步地要把身体或人物形象作为一个整体,仔细处理它与整幅绘画的关系。换句话说,不仅要注意人物形象,而且要注意背景,这对于创造一幅紧凑的或令人满意的画是非常关键的。
(八)评定作业应允许学生选择一种表现形式,用以展示自己的所学
用于团体成绩测验的重要设想之一,是所有参加测验的学生应该得到同样的题目。这在实践中就意味着,不仅题目要不顾学生的差别而完全相同,而且学生反应的形式也要求相同。多项选择测验提供一套同样的问题和一批同样的可替代答案。一群参加测验的学生能够拥有的分数以近似于正态曲线分布的方式排列。
艾斯纳明确指出,当测验的主要目的是对学生进行等级划分时,这种程序有一定的实效。但如果评定的作用是确定学生解释和应用他们所学东西的独特性,那么,一套同样的题目和同样的替代反应也许是不合适的。因此,在评定的新方式中,应该不仅让学生有机会就所学的东西构建他们自己的反应方式,而且也应该允许他们选择展现自己所学知识的方式。例如,在学习了一个单元的历史或社会后,一些学生也许选择创作一首民歌或一首诗,或者写一篇小故事;在学过生物学之后,一些学生也许会选择建造一个进化的三维模型,或者写出一条关于进化的未来预测。作为新评定的一部分,这种实践对学生而言象征着个性倾向、创造性特质以及个人的理解和创造都是学校所关心的价值观。
艾斯纳告诫说,最好记住,在特殊专业领域之外的“真实世界”中,个体确实创造着他们自己的反应,并在对经验的反应中创造他们自己喜欢的方式。在经历一次巴黎之旅后,一些人写诗,另一些入画画,还有些人则展示他们所拍的照片,谈论他们的经历。恰恰是在这种对“共同经验”的不同反应中,我们的文化生活日益丰富。对差异的赞美与文明的创造是一致的。在这种文明中,个人风格对人类共同利益的贡献是独一无二的。新的评定概念的发明和使用对上述观念的认识具有重要作用。
从上述对新的评定概念特征的概括可见,艾斯纳对评定的要求有如下几个特点。
第一,强调评定向生活世界的回归。现代科学的发展使得科学主义、工具理性盛行,抽象的逻辑推理成了判断一切事物的标准,人类创造的理性方法反过来成了奴役人类生活的工具,其结果导致了科学世界日渐与生活世界的分离。这种结果严重困扰着21世纪的人类理性生活。因此,呼唤健全的理性,呼唤向生活世界的回归成为21世纪一股强劲的思想潮流。艾斯纳对评定特征的概括即显示出这一倾向。他不仅在第一条中首先明确提出了这一问题,而且在后面的条目中也始终以此作为论据,强调要以课堂生活以外的“真实生活”、“真实世界”中的真实问题作为建构作业评定的基础,强调学生真实经验的重要性,强调教学对真实生活的适应性。这里,我们似乎看到了杜威(J.Dewey)的影子。
第二,强调多元价值取向。多元文化论和知识观是在21世纪发展起来的。多元主义认为,各种文化、知识以及持有他们的个体之间只有特征的不同,而不存在价值的高低、品质的优劣。人类文化和文明就是在这种多元共通交往的过程中发展、丰富的。这种观点已得到人们的广泛认同。艾斯纳把这种观点贯彻到评价领域,主张评定不能使用“一刀切”的标准,而应该给学生留有充分的选择余地,不仅对问题的解决可以有不同的方案,而且表现自己所学的形式也可以由学生自己选择。在艾斯纳那里,学生真正成了学习的主人,而且也有了个性化的特点。但对多种个性的尊重同时也意味着对交往、合作的肯定,因为个性存在的意义正体现在它对社会整体文明的贡献当中。艾斯纳的这一主张是符合人类文明发展的总趋势的。
第三,强调对美学鉴赏观念的借鉴。对审美教育有独特见解的艾斯纳把美学鉴赏的观念引入评定领域,要求用一种类似于美学鉴赏的态度和方法看待评定问题,强调观念之间的联系和整体性背景。在这点上,艾斯纳吸收了布鲁纳(J.S.Bmner)等结构主义者的观点,但作为一个建构主义者,艾斯纳更相信知识的建构特征、情境特征,用艺术鉴赏的品质给评定中的体认、直感乃至灵性留下了更多的余地,从而把评定引向更为精致的、解释性的途径。对此,艾斯纳所创建的教育鉴赏与教育批评(educational connoisseurship and educational criticism)评定模式将会有更全面的体现。
第四,强调对教育动态结果的把握。正是在上一观念的影响下,艾斯纳不把学生的学习以及其他教育现象看作是僵死的固定物,而是注重其发展性、可变性。因此,艾斯纳不主张评定对学生学习、经验及成绩负责,也反对评定只提供看起来明晰、简洁而实际上却丢失了教育动态意义的测量数字。
正是因为艾斯纳的评价观不仅是评价方法的改革,而且也是教育观念的更新,所以艾斯纳本人也担心,“解释性的评定实践能满足公众对评定的那种抽象肯定的欲望吗?公众必须持有什么样的教育观才能接受缺少抽象指标的评定?理性定向的英才教育能包涵这种教育观吗?具有功能性差异的评定概念是否将增加评定方式在更为个性化方面的可接受性?”[28]艾斯纳也希望,通过类似上述那种仔细而可靠的界说,公众会逐渐理解并重视这种新的评定,这样,评定将不仅会为改善儿童教育作出贡献,而且也将为更新普遍的教育观念作出贡献。
第三节 教育鉴赏与教育批评模式(下)
在对传统的课程评价领域进行全面检讨的基础上,1976年,艾斯纳在《美育杂志》(Journal of Aesthetic Education)上发表了题为《教育鉴赏和教育批评:它们在教育评价中的形式和功能》(Educational Connoisseurship and Educational Criticism:Their Forms and Functions in Educational Evaluation)的文章,首次把文艺批评中的鉴赏与批评概念引入课程评价领域,提出了课程评价中的教育鉴赏与教育批评模式。1977年,他又在《师范学院报告》(Teachers College Record)上发表了《论教育鉴赏与教育批评在评价课堂生活中的应用》(On the Use of Educational Connoisseurship and Educational Criticism for Evaluating Classroom Life)一文,进一步阐述了这一评价模式及其应用。1979年,艾斯纳出版了《教育想象:论学校计划的设计和评价》(The Educational lmagination:On the Design and Evaluation of School Programs)一书,全面论述了教育鉴赏与教育批评的思想基础、理论模型、实践特征、操作实例以及对这种模式的一些反思、检讨等。该书分别于1985年、1994年两次再版,教育批评模式在评价理论和实践中的影响也日渐扩大。按照艾斯纳的看法,这种由艺术家使用的鉴赏与批评方式,最能体现他所竭力提倡的质性研究方法的性质。
一、教育批评、教育鉴赏及其相互关系
(一)什么是教育批评、教育鉴赏
归纳艾斯纳对“教育批评”的概括,可以得出这样的结论,即所谓教育批评,就是把组成课程计划和课程活动的那些必要的、不可言喻的特质,翻译成有助于他人更深刻地理解这些计划和活动的语言。从这个意义上说,批评执行着理解的中介的职责,它讨论教育计划和教育活动的组成特质,是为了让那些缺乏批评家的鉴赏素质的人能够更全面地理解这些计划和活动。艾斯纳引用杜威的话说,批评的功能是对艺术作品感知的再教育,在这种视界下,批评家的任务首先不是进行判断,而是“撩开遮住视线的面纱”。
批评的特点是什么?艾斯纳认为,批评有两个特点。首先,批评是一项经验性的工作(empirical undertaking)。“empirical"一词来源于拉丁文“empiricus”,意思是“对经验敞开”。批评家描述或翻译出的特质,必须能够根植于批评所针对的学科领域,正是在这个重要的意义上,批评是经验性的。在这个意义上,对批评的检验就是检验其有助于理解的工具性效果。人们通过批评而进行的理解不是孤立的、抽象的,而是质性的、联系的。
批评的第二个特点是,任何事物都能成为它的对象。在这里,艾斯纳强调,所谓的批评并不意味着否定性的估价,而是阐明某些事物的特质,以便对该事物的价值作出估价。尽管“批评”是一个常用于艺术的词汇,但它也用于运动,用于研究评定,用于人类行为的评估,特别是用于社会体系以及大量地运用于人类与世界交流的其他领域。原则上说,没有什么事物不能成为批评的对象。
关于教育鉴赏,艾斯纳首先指出了什么是鉴赏——有见识的感知行为,亦即鉴别对象的精妙、复杂及重要特质的洞察过程。在艾斯纳看来,鉴赏是一种私人的行为,它由对某一特质的认知和欣赏组成,但它既不需要公众的判断,也不需要公众对那些特质的描述。把这种认识推广到教育,就是艾斯纳所谓的教育鉴赏。他认为,作一个鉴赏家,就是知道如何审视、洞察以及欣赏。
教育鉴赏要以经验为基础。艾斯纳认为,一个人必须拥有大量的课堂实践经验才能发展高超的鉴赏能力,才能够区别在某个实践体系或其他体系中,什么是最重要的。经验为鉴赏提供了必要的背景知识。但艾斯纳又指出,一个人花在课堂上的时间长度,并不必然表示他所达到的鉴赏水平。因为在艾斯纳看来,花在某件事情上的时间以及所从事的活动内容有两种。一种是按既有框架对其中发生的事情进行归类认识(recognition)。如指明这是一棵栎树,另一棵是榆树;这是反身跳水,那是转体一周加一个翻腾式跳水。另一种是鉴别某一课堂本身所具有的特点,即进行一种感觉探究。如这棵栎树与其他栎树有何不同,或这棵榆树、那个反身跳水、这个转体一周加一个翻腾式跳水有何特殊之处。而只有后者才是鉴赏活动所必需的感知(perception)。因此,如果一个人观察课堂首先是为了认识而不是明了(see),则他花在课堂中的时间对发展鉴赏能力很少有什么作用。为了发展鉴赏能力,一个人必须具有感觉精细、变成人类行为的学生、集中注意于自己的感知的热望。观看是一个必要的条件,但观看是要从事的基本工作,只有明了才能达到目的。
(二)教育批评与教育鉴赏的关系
艾斯纳指出,教育与艺术一样,有效的批评必须以仔细、深刻的鉴赏为基础,精细的洞察力是批评的第一必要条件。艾斯纳非常强调对事物细节的感知和把握,认为如果没有对微妙而重要的细节的感知能力,批评就很可能是表面的甚或空洞的。因此,鉴赏对于批评是必要的,它提供的真实的基本内核正是批评的资料。鉴赏与批评二者之间的主要区别是:鉴赏是欣赏的艺术,而批评是揭露的艺术。用艾斯纳的话说,批评是打开鉴赏所感知的事件或对象性质的一种艺术,批评是鉴赏的公开方面(public side)。也正是在这个意义上,艾斯纳才说,一个没有批评技巧的人可以是鉴赏者,但一个没有鉴赏技巧的人却不可能是批评者。鉴赏是对事物特质、细节的感觉、体悟,而批评则是用适当的语言形式把感觉、体悟到的特质、细节揭示出来。
这里就涉及批评的语言问题。那么,用什么样的语言形式才能恰当地把鉴赏到的东西表述出来呢?艾斯纳认为,要使用隐喻 (metaphor)或者表征(rendering)。艾斯纳认为,批评的语言与艺术的语言一样,基本上是非推论性的。就是说,它不是通过指出事实来传达信息,而是通过暗示,通过运用呈现(present)而非表现(rep- resent)的概念形式或感情来传达信息。在艾斯纳看来,表现的符号,即用于常规话语中的那种类型,就像是路标,它指示人们达到某一品质,但并不打算让他们自己拥有表达的品质。他举例说,“听听(listen),鸟在叫”是一种文字的推论表达,但“听(hark)!听!百灵鸟!”包含着一种前者所没有的能量。前者是表现的,它引起我们的注意,以便使我们具有某种确定的经验,而后者展示给我们的形式本身就能激发起经验;前者是一种常规的表达,后者是一种诗意的表达。教育批评需要的就是与后者类似的语言形式。
二、教育批评的四个构成方面
艾斯纳认为,教育批评由四个方面或维度构成:描述方面 (descriptive aspect)、解释方面(interpretative aspect)、评价方面 (evaluative aspect)、主题方面(thematic aspect)。艾斯纳指出,这种区分是为了分析的方便,事实上,这四个方面在实践中是交织在一起的。但是,这种区分也有助于人们敏锐地感知批评的焦点,并能促使人们更加智慧地阅读或创造批评。
(一)教育批评的描述方面
教育批评的描述方面就是一种用语言来界定、描绘、叙述或者表达教育生活的有关性质的尝试。比如,海尔德小姐的四年级班上是一种怎样的生活?马克先生的代数课进度如何?教育批评的描述方面集中于更为有限的特征。比如,这个特定的孩子如何与同伴联系?这个教师通过她的语气给了学生什么样的潜在信息?学校可视环境的性质是什么,它给学生传达了什么样的学校生活信息?这些都是教育批评的描述方面所要集中关注的。
关于教育批评描述的对象,艾斯纳强调,批评者不能像记流水帐一样记下事物的方方面面,而是要写出自己认为重要的东西、有倾向地选择的东西。正是这种选择及其深刻的表达,让人们理解了批评者在评价工作中的部分感知。另外,艾斯纳指出,描述还要兼顾事物的普遍性品质与个别性品质。普遍性品质是那些使得一类情境和物体特征化的品质,比如哥特式建筑内部的尖拱、莫奈的风景画中的亮光、装配线上呆滞机械的一致;个别性品质是整体内部的那些特殊品质,比如西比留斯第一交响曲第二乐章中的过门曲调、教师微笑中的支持性质等。这二者都是教育批评的主要描述对象,但从前面的论述看,艾斯纳似乎更乐意强调后者。最后,艾斯纳认为,“游戏”(game)性质也是批评性描述的一个正当对象。例如,这个课堂运作中教育生活的规则是什么?这个学校社会性生活的支撑结构是什么?这种学校组织、教学或者评价模式中的核心价值观是什么?等等。这些都可成为批评描述的对象。
在艾斯纳看来,批评者的描述语言必须是最有魅力、最敏锐的,因此,批评的描述方面是批评中最具艺术性的一个方面。
(二)教育批评的解释方面
艾斯纳指出,尽管描述和解释之间并不存在明显而清晰的界线,但它们的侧重点和中心有所不同。批评的理解方面要求指明:对于涉及到的那些东西而言,情境意味着什么?这个课堂是如何运作的?什么思想(ideas)、理念(concepts)或理论(theories)可用以解释它的主要特征?就是说,批评不仅要描述课堂生活中发生的具体事件,而且要就这些事件的性质、情境、结构以及支持它们的价值观给出适当的解释。
艾斯纳认为,对课堂事件、教育生活的解释,可以使用社会科学中的思想理论。这些理论提供了一种理念地图,使得教育批评能对已发生的事件作出令人满意的交代,并预见某些结果。艾斯纳举例说明了社会科学理论在这方面的运用。假如某人作为教育批评者观察一个普遍使用契约的班级,该班用8、9岁的孩子与教师签定的书面协议来规划和监视学校中指定任务的完成情况。这样做的目的是为了在以批评的敏感性和生动性为特征的课堂中,创造一种个别化的需要水平。那么,这些契约对于学生和教师意味着什么?它们的长期效果是什么?孩子们经历着什么样的伴随性学习(concomitant learning)?契约创生了什么类型的社会关系?并且,当契约普遍存在于一个课堂中时,它们如何影响孩子关于学校教育目的的观念?为了回答这些问题,人们可以参考社会科学中大量的思想理论来解释面对面群体中契约关系的附属结果;可以参考解释为什么契约有可能增加独立性而不是主动性的强化理论(reinforcement theory);可以运用认知领域的理论,这些理论与学习中歧义的重要性相关、与契约对学生容忍歧义的能力的影响相关。在这里,问题的关键不是有一种理论可用以解释课堂中发生事件的意义,而是有各种各样的理论。重要的不是事实本身,而是对事实的解释。理论提供的不是单一的思想、关于学校的固有意义的某些结论,而是可用以获得关于事件的选择性解释的框架。
艾斯纳指出,把来自社会科学的各种理论运用于解释学校和课堂中发生的事件,这不是一项简单的工作。首先,人们必须了解要运用的理论。其次,人们必须能够判断一种特定的理论适合于某一特定的事件或情境。这需要兼具理论知识和实践智慧。艾斯纳认为,教育批评者的任务与人种志学者的工作一样,就是寻求事件的深层结构、规则或者它们赖以形成次序的模式。这是一项艰苦的事业。
(三)教育批评的评价方面
简单说来,教育批评的评价方面就是对教育事件作出价值判断。正如艾斯纳所说,教育是一项规范性的事业,它是一个激励个性发展并对社会福利作出贡献的过程。因此,只要教育批评中的选择性描述一开始运行,就必然暗含着一系列的价值判断。评价自然地贯穿在批评的感知活动中。
退一步说,即使情况并非如此,评价也仍是必需的。因为教育批评的目的是改进教育过程,只要人们对这个过程中的问题还存有疑虑,就必须依赖评价。孩子们所经历的教学形式对他们是有所帮助还是阻碍?他们接受的思维习惯是有助于进一步的发展抑或阻碍进一步的发展?在一堂课中,相对于附属学习,直接学习有什么样的价值?诸如此类的问题,都需要运用教育的标准来回答。教育批评家不像社会科学家,后者不负有评价某一文化或群体的教育价值的职业责任;而前者则要把这种责任作为自己工作的一部分。
那么,什么是教育的标准呢?显然,它们不应该来自主观臆断、不加批判的偏好。艾斯纳认为,真正有能力的教育批评家不仅对他所认同的教育价值是警醒的,而且对自己反对的教育价值也同样如此。教育批评家将能够为价值选择提供依据,同时又能意识到其他人也许不同意这些选择。为这类价值观提供依据,不仅需要教育的历史和哲学知识,而且需要学校的实践经验。
艾斯纳批评说,在过去一个相当长的时期内,对教育事件的评估往往只用一套价值观,就好像对这类事件只能赋予一套价值观。但是,把不同价值观赋予教育事件,带给教育的可能是一种张力。因为它正好能够打开争议、讨论之门,而这点正是教育实践所需要的。事实上,每个系统的教育事件、每项教育政策、每种模式的学校组织或教学形式,都有一定的长处和一定的取向。教育批评就这些问题所引发的讨论越多越好。艾斯纳认为,理智和尽职的思考所追求的就是对于一个问题或决策实行多重检视,从不同的角度观察现象,衡量得失利弊,并最终导向选择决策的核心思考及枝节问题。教育问题与政治一样,否认复杂性就是专制的开始。教育批评能够对这类复杂的适切性有所贡献,并因此为作出教育判断提供更恰当的基础。
(四)教育批评的主题方面
教育批评的主题方面是指主要思想和结论的提炼,这些思想和结论是从先于它们的材料中取得的。它要回答的问题包括:这个特定的教育批评必须提供的教训是什么?从中可以学到什么特别的东西?它总的来看意味着什么?可见,教育批评的主题方面提供给读者一种能促使读者抓住关键点的总结。在某种意义上,教育批评中的主题不仅提供对象关键特征的精华,而且也提供自然主义的概括,指导人们感知其他的班级、学校或者教学实践。尽管没有一个班级与其他任何班级是相同的,但在个别班级中提炼的特征,也许与其他班级中发现的特征有一些联系。主题的确定不仅总结了批评的关键点,而且也能促使人们把批评作为理解其他教育情境的一种方式。
总之,尽管在教育批评的这些不同维度之间没有明显的界限,但它们的中心和侧重点有所不同。描述方面的目的在于生动地表达在情境中觉察到的特质。解释试图为表达的东西提供一种理解,这需要通过存在于其他事情中的、来自社会科学和历史的思想、理念、模型和理论。评价方面试图评估描述的或解释的事件、对象的教育意义或重要性。这里,批评家的主要作用是运用教育标准,以使对这些事件作出的判断基于一些具有教育意义的观点。在完成这种任务时,教育史知识和教育哲学是关键。前者为比较提供必要的语境,而根据后者的理论,可以作出基本的价值判断。教育批评的主题方面则是对教育批评主要观点的一种总结,并为人们理解其他教育情境提供一种参照。显然,按照艾斯纳的论述,教育批评的这四个方面并非分别呈现于读者面前,它们仍是一个质的整体。但这种理论上的划分,既为读者也为批评者提供了建构批评的必要形式。
三、关于教育批评的信度、效度、概括化等问题
以质性探究为特征的教育批评和教育鉴赏,其结论能否经得起检验?这种探究形式能否概括化,从而把结论推广到其他情境中吗?它们所做的结论在什么范围内是有效的?如何决定信度?我们如何知道教育批评是否可信?对于这些问题的解决,艾斯纳是从对科学哲学上所谓客观性的重新审视入手的。
科学探究通过对客观性、对经验概括化的保证,给出了描述、解释和预见三位一体的承诺。因此,概括化的工具、统计性的程序、可以进行结论检验的研究设计、结论的信度和效度,是社会科学长期坚持并煞费苦心地追求的东西。对此,艾斯纳认为,首先应该回答的一个问题是,客观性意味着什么?这是回答后面一系列问题的一个根本。
传统科学秉持的是符合论的真理观。在这里,所谓客观,就是指人类所发现的东西与自然状态的实在毫无二致地符合。艾斯纳认为,这种客观的概念是幼稚的。实际上,我们所有人都是通过与环境的互动建构实在的概念的。被我们当作真实的东西,不仅是所谓客观环境条件的产物,而且也是我们如何解释环境的产物。对环境的这种建构要受我们的先前经验——包括我们的期望、我们所持的信仰以及我们用来定义客观条件的理念工具——的影响。因此,所谓的客观性,就意味着我们信奉我们相信的东西,且他人也分享我们的信仰。艾斯纳把这种处理方式称为“约定性效度”(consensual validation)。它的作用就像人们曾一度坚信燃素、以太以及以地球为中心的宇宙的存在一样,也像正统的宗教徒对宗教的虔信。尽管科学取向的人也许会反对这种说法,但艾斯纳指出,科学标准下的所谓真实并不能穷尽所有的探究方法,甚至在科学内部,科学家本身所持的信仰也不能被科学方法所确证。这种现象在社会科学中尤为常见。艾斯纳举例说,弗洛伊德、斯金纳、埃里克森、皮亚杰等的信徒,其在基本假设上的不同并不能通过科学方法来解决。这些心理学派别关于实在的理解,其基本理论结构都不相同。他们的信仰体系究竟是正确还是错误,并没有标准的测验来衡量。每一种学说都有一个信仰者共同体,他们都坚信那种学说体系中的信仰。由此,艾斯纳总结道:客观性是信仰者共同体主体间一致性的一种机能。对于一套思想,我们可以建设性地提问的,不是它是否真的符合自然状况,而是它是否有用,是否能让人们更有效地工作,是否能促使人们用更丰富和敏锐的方式洞察现象,是否能让人把智慧延伸到重要的问题上去。可以看出,艾斯纳显然是杜威实用主义哲学的忠实信徒。
基于上述观点,艾斯纳提出了达到教育批评“约定性效度”的两种重要程序,即“结构的确证性”(structural corroboration)和“参照的适切性”(referential adequacy)。
(一)结构的确证性
“结构的确证性”是指收集资料和信息,并在它们之间建立联系,最终创造出一个为一些组成证据所支持的整体情境的过程。当证据之间彼此一致、情节成立,每一条都恰如其分,能产生出意义并组成论据时,这种结论在结构上就是有确证性的。艾斯纳举了一个家喻户晓的例子来说明结构的确证性:在英国女作家克丽斯蒂(Agatha Cristie)的《东方快车谋杀案》中,大侦探波洛发现车上有一名男子被谋杀,他要找出谁是谋杀者。波洛把一点点的蛛丝马迹放到一起,克服矛盾,使证据之间彼此支持,最终成功地解决了这一难题。在这个情境中,波洛凭借丰富的经验和想象,使并不连贯的证据彼此之间合乎逻辑地一致起来并相互支持,这是解决问题的关键。这就是艾斯纳所谓的“结构的确证性”。
表现在教育批评文献的撰写或阅读上,“结构的确证性”要求对所呈现的情境的描述或者对这些情境的解释是彼此支持的。比如,教师在课堂中真的是一个受欢迎的角色吗?抑或他的行为是特定情境中的特殊行为?教师是学生真正的支持者吗?抑或他仅仅用一种表面的、因袭的反应方式来证明他对学生的关心?对于诸如此类的问题,并不能仅仅从课堂观察中得出结论,只有当课堂观察结果同时能得到其他证据的支持和确证时,才能作出恰当的回答。
(二)参照的适切性
“参照的适切性”是指把批评与批评的对象相对照,以检验批评是否有助于人们理解教育现象。艾斯纳是从教育批评的目的角度提出“参照的适切性”这一程序的。正如前面已经说过的,教育批评的目的是加深人们对教育现象和事件的理解,为人们理解教育现象和事件提供一种参照。一项有效的批评应该使得人们能够用一种新的、更适当的方式经历并体悟客体和情境。批评家的工作是促使人们理解被忽略的东西。当批评家的工作能够让人发现提示所指的那些客体、事件或情境时,这项批评就具有了“参照的适切性”。
至于批评家之间可能存在的分歧,艾斯纳认为,批评的特长不在于能够保证批评意见的一致。人们已经意识到,复杂的事物往往拥有几层不同的含义,伟大的艺术作品给人的启迪也常常是方方面面的。传统的评价为了追求一致性,采取的是简化复杂的教育现象或只关心简单现象的做法。这种评价当然无益于教育实践。教育批评给人的不是一种终极性的确定评价,而是扩展人们对教育现象的感知和理解。课堂是一个具有浓郁现象学氛围的情境,具有不同教育取向和兴趣的批评家应该从中发现不同的事件,并进行描述、解释和评价。
由上可见,对于教育批评的信度与效度问题,艾斯纳通过对传统科学中客观性的质疑,并以建构主义为主旨,给出了一帖“诚则灵”的药方。这显然与20世纪以来科学哲学界对以客观性为基础的现代科学的全面反思有关。
关于教育批评的概括化,亦即其推广性的问题,艾斯纳认为,与传统的科学式评价不同,某一批评的结果虽然并不能直接推广到其他场景中去,但它可以产生另外两种典型的普遍性:一是使得感知过程更为精致;二是创造新的预期形式。
在艾斯纳看来,教育鉴赏是一种能力,它并不只是针对特定的客体。教育批评的作用之一是促使人们领悟教育客体和事件,它让人们学会了如何看待教育现象,发展理解性探究的习惯,而不再使用对教育情境的陈腐反应方式,这就提高了人们对教育现象的品质及其关系的体验能力,其结果导致了人们教育鉴赏能力的发展,使人们对教育现象的感知变得更为灵活和精致。或者说,艾斯纳在批评中重视的不是结果的直接推广作用,而是一种实践的鉴赏能力。
所谓新的预期形式,艾斯纳指的是通过教育批评而产生的新概念及其在另外情境中的运用。教育批评的主要作用是帮助人们识别某一情境体系的独特性,但要能准确地把握这种独特性,揭示其表现方式,就需要一些新的概念。批评一旦能拎出这些概念,就能使人们在今后的评价情境中有意识地寻找它们。批评就通过这种类似地图式的功能,创造了对未来的预期形式。艾斯纳认为,较之通过科学的控制而产生的概括,这种预期形式对于教育实践的作用更为有效,因为前者是通过人为的控制——人为地选定对象或事件、人为地规定对它们的处理方式等——来建立概括化,从而摒弃了事件的情境性,而后者则是从日常情境中直接创造出来的。
总之,教育批评与教育鉴赏是根植于并最终回归于教育实践的一种评价模式,它的根本旨趣不在于提供理论,而在于改进、提升教育实践。
--------------------------------------------------------------------------------
[①] Stenhouse,L.(1975). An Introduction to Curriculum Research and Development.London,England: Heineman. p.70.
[②] Stenhouse,L.(1975). An Introduction to Curriculum Research and Development.London,England: Heineman. p.71.
[③] Ibid.,p.79.
[④] Ibid.,p.82.
[⑤] Stenhouse,L.(1975). An Introduction to Curriculum Research and Development.London,England: Heineman. P.82.
[⑥] Ibid·,p·83.
[⑦] Stenhouse,L.(1975). An Introduction to Curriculum Research and Development.London,England: Heineman. P. 84—85.
[⑧] Ibid.,p. 86—87.
[⑨] See Elliot,J.A.Curriculum for the Study of Human Affairs:The Contribution of Lawrence Stenhouse. Journal of Curriculum Studies,15(2):112.
[⑩] Stenhouse,L.(1975). An Introduction to Curriculum Research and Development.Chapter 10.
[11] Ibid., p.122.
[12] Stenhouse,L.(1975). An Introduction to Curriculum Research and Development.London,England: Heineman. p.117.
[13] Ibid..
[14] Stenhouse,L.(1975). An Introduction to Curriculum Research and Development.London,England: Heineman. p·119.
[15] Stenhouse,L.(1975). An Introduction to Curriculum Research and Development.London,England: Heineman.
[16] Ibid..
[17] Eisner,E.W.(1994).The Educational lmagination:On the Design and Evaluation of School Programs(3rd.Edition).New York:Macmillan. p.195.
[18] Eisner,E.W.(1994).The Educational lmagination:On the Design and Evaluation of School Programs(3rd.Edition).New York:Macmillan. Chapter 8.
[19] 所谓“霍桑效应”,是指工人、学生因受到研究人员的关注而增加了产量或提高了成绩。
[20] “新数学”系美国于20世纪50年代末、60年代初受苏联卫星上天的影响而进行的结构主义课程改革运动中推出的数学课程,如SMSG数学就是当时典型的“新数学”。
[21] See Eisner,E.W.(1994).The Educational Imagination.Chapter 8,9,10; (1985).The Art of Educational Evaluation.The Falmer Press.Chapter 8,9,12.
[22] See Eisner,E.W..The Educational Imagination.pp.97-100.
[23] See Eisner,E.W..The Art of Educational Evaluation.Chapter 3.
[24] 参见黄光雄编译:《教育评鉴的模式》,台湾师大书苑有限公司1989年版,第323-342页。
[25] Eisner,E.W..The Educational Imagination.pp.212-215.
[26] Eisner,E.W..The Educational Imagination,pp.203-209.
[27] See Eisner,E.W.(1991).The Enlightened Eye:Qualitative Inquiry and the Enhancement of Educational Practice.New York:Macmillan.
[28] Eisner,E.W..The Educational Imagination. P.210.