第四章 行为科学:理智成绩与学习
上一章已指出,越来越多的文献证明,在主试和被试之间的相互作用中, 主试所抱有的假设可以充当自我实现的预言。然而,在上述的研究中,受主 试的假设影响的被试行为没有明确地同被试的理智成绩联系起来。鉴于本书 的中心命题是一个人对另一个人理智成绩的预言可能最终决定另一个人的理 智成绩,所以,考察关系到理智上有关行为的那些人际的、自我实现的预言 的案例就显得特别重要。这就是本章的目的。首先我们将考察从以人类为被 试的实验中得出的证据。然后再考察从以动物为被试的实验中得出的证据。
人类行为
对墨迹的解释
对一组墨迹作出大量供选择的解释的能力与根据标准智力测验所界定的 理智能力相关(Sommer, 1958; Wysocki, 1957)。事实上,一些研究表 明,在对墨迹作出反应时所涉及的知觉对象数与正常的智商分数的相关程度 几乎与两个基于不同测验上的智商分数的相关程度一样高。最近,马威特和 马西娅(Marwit and Marcia, 1967)做的一项实验是为了检验这个假设: 被试对一组墨迹作出反应的数量是主考期望的函数。由修习实验心理学学程
的 36 个本科生担任主考。他们的任务是对修习心理学导论的 53 个学生进行
墨迹测验。其中一些主考或根据他们自己的假设,或根据研究负责人的假设 预言被试会有许多反应。其余的主考或根据他们自己的假设或根据研究负责 人的假设预言被试反应较少。结果表明,假设的来源没有造成任何差异。预 言会有更多反应的主考比预言会有较少反应的主考获 得的反应多 54%(p< O.0003)。从统计显著性以及从效应量两方面来看,似乎有把握作出如下结 论:主考的预言可能是决定被试对墨迹刺激作出反应中的创造性的一个重要 因素。
不仅对墨迹的反应总数与标准智力测验分数有关,涉及人的知觉对象的
反应数量和比例也与此有关(Sommer, 1958; Wysocki,1957)。在最近报 道的一个实验中,马斯林(Masling,1965)使他的一半主考相信,从参加墨 迹测验的被试反应中,应该获得比动物知觉对象相对更多的人类知觉对象。 他使另一半主考相信,从被试的反应中应该获得比人类知觉对象相对更多的 动物知觉对象。结果表明,后一组获得的动物知觉对象和人类知觉对象的比 率,比前一组从被试的反应中寻找相对更多的人类知觉对象的主考获得的比 率高 33%(p=0.04)。根据上述两个实验,似乎可以说,至少对墨迹的解 释可能一部分是由执行这项任务的主考的期望决定的,尽管斯特劳斯
(Strauss,1967)发现主考的期望在被试对运动与色彩反应上的比率没有任 何影响。
完成理智任务的成绩
在下述实验中,被试的反应与一种或另一种理智能力具有更直接的关 系。沃坦伯格-埃克伦(Wartenberg-Ekren,1962)雇用了 8 个主考,每个主
考用《韦克斯勒成人智力量表(WAIS)》的“积木构图”(Block Design) 分测验对 4 个被试进行测试。每个主考分管其中的两个被试,这两个被试据 说在学校里的成绩等第比另外两个被试高。尽管事实上所有主考都期望据说 是获得更高等第的被试取得优异成绩,正如实验后的问卷调查所表明的一 样,但在“两种”被试的成绩中没有获得任何差异。这些否定的研究结果可 能部分地归因于这些主考专门努力避免他们期望的影响。因此,其中一位主 考主动地设计了一种“遮蔽法”(blind procedure),不看编号名单下被试 所属的“种类”。但是第二个主考虽非故意,却不知道他的一半被试的所属 种类。
被试对其主考行为所作的等级评定的第二次分析表明,当主考接触据说 是取得更高等级的被试时,主考以一种更友好的、更亲切的、更偏心的以及 更鼓舞人心的方式对待被试,显示出更富于表情并且采用更多的手势
(Rosenthal,1964)。尽管我们可能期望这些更热情的行为影响被试的成绩, 但在所述的这项研究中没有出现。这是令人惊奇的,因为戈登和杜里(Gordon and Durea, 1948)发现,当主考更热情地对待八年级的被试时,获得的智 商分数比当主考更冷淡地对待青少年被试时所获得的智商分数高出 6 分。最 近,克劳(Crow,1964)发现,即使是大学年龄的被试,当他们受到比较热 情的对待时,也会在完成译码任务中取得更好的成绩,这种译码任务非常类 似于韦克斯勒成人智力量表中的分测验[“数字符号”(Digit Symbol)]。 韦尔、科瓦尔和贝克( Ware,Kowal,and Baker,1963)的一项实验要求被 试侦察信号。参加实验的被试都是现役军人。结果发现,当主试较热情地对 待被试时,被试在侦察信号时明显地更加警觉,当主试冷淡地对待被试时, 被试就不太警觉。最后,萨克斯(Sacks,1952)报道了一些引人注目的结果, 在托儿所受到热情对待的儿童的智商分数要比受到比较冷淡对待的儿童的智
商分数增加将近 10 分。
所报道的那些研究的共同之处是所使用的各种各样的被试给人的印象比 较深刻。一般说来,事实的确如此:获得理智上更有能力的表现的是热情的 主考而不是冷淡的主考。不过,在沃坦伯格-埃克伦的实验中,热情似乎没有 带来差异,而且我们也没有任何权力说为何没有带来差异。她的基本结果是: 有关智力测验分数的预言不必是自我实现的,这一点也得到了雷·马尔里(Ray Mulry)在私人通信中所说的最近研究的支持(1966)。格特、马尔里、霍兰 和沃克 (Getter, Mulry, Holland, and Walker, 1967)雇用了 10 个 主考对 60 多个大学生进行韦克斯勒成人智力量表全部试题的测试。要求主考 期望 1/3 的被试取得最好的成绩,期望 1/3 的被试取得较差的成绩,对 1/3 的被试不抱任何期望。结果表明,能够归因于主考期望的被试理智成绩没有
表现出任何差异。 据我们所知,只有另外一项研究的任务是一种标准化的智力测验,探讨
了主考预言的自我实现效应。那就是拉腊比和克兰萨瑟(Larrabee and Kleinsasser, 1967)所做的一项有独创性的实验。他们让 5 个主考用韦克 斯勒儿童智力量表(WISC)对 12 个中等智力的六年级儿童进行测试。每个被 试都要受两个不同的主考测试,其中一位主考测试双数题,另一位测试单数 题。对于每一个被试,一个主考被告知该儿童智力超常,另一个主考则被告 知该儿童智力低常。那些期望儿童取得好成绩的主考所获得的智商总和要比 那些期望儿童取得较差成绩的主考所获得的智商总和的平均数高 7.5 分。但
这种差异可能是偶然出现的,概率是 100 次中有 9 次。如果只考虑 WISC 的操 作分测验,那些被期望取得好成绩的儿童的益处不超过 3 个智商分数,而且 很容易偶然发生。如果只从 WISC 的言语分测验来看,那些被期望取得好成绩 的儿童的益处则超过 10 个智商分数(p<O.05)。受主考期望影响最大的分 测验是信息,它的期望益处是由偶然造成的,其概率大约是 1/2000。这样, 可以看出,如果被试是儿童,主考的预言就可能是自我实现的;如果被试是 成人,上述两项研究已表明这是不太可能的了。
最近,赫维茨和詹金斯(Hurwitz and Jenkins, 1966)做了另一项实 验,其任务不是标准化的智力测验,而是两项标准的实验室学习测验。3 个 男性主试对 20 个女性被试进行机械言语学习任务和数学推理任务的测验。要 求主试期望一半被试取得较好的成绩,期望另一半被试取得较差的成绩。
在机械学习任务中,呈现给被试一列配对的无意义音节,并要求他们根 据呈现的配对音节中的一个音节,回忆出另一个音节。主试出示 6 次音节配 对以便被试学习。那些相信被试更聪明的主试所接触的被试取得的成绩比另 一半被试稍好,尽管这种差异在统计上没有显著意义,而且数量也不大;那 些据说是更聪明的被试学到的音节比另一半被试学到的音节多 11%。然而, 在据说是更聪明的与据说是更迟钝的被试之间,配对无意义音节的学习曲线 确实表现出了差异。在 6 次呈现的过程中,“更聪明的”被试的学习成绩比 “更迟钝的”被试的学习成绩明显地一律上升或逐步提高。就准确回忆与出 示次数之间的等级相关系数而言,“聪明的”被试是 0.71,“迟钝的”被试
是 0.50(差异 p<O.02)。
在数学推理任务中,被试必须学会使用 3 种不同容量的广口瓶,以便准 确地获得某种指定的水量。在关键的尝试中,用历时更长而又更惯常的程序 得到正确的解决方法的人给予半分,用历时更短而又更新颖的程序得到正确 的解决办法的人则给满分。主试预言会取得较好成绩的被试比预言会取得较 差成绩的被试获得了更高的分数(p=0.08)。在预言取得较差成绩的被试中, 只有 40%的被试获得了新颖的解决方法,而在据说是成绩较好的被试中,88
%的人获得了一种或几种新颖的解决方法。被预言是聪明的被试所犯的差错
亦只有被预言是迟钝的被试所犯差错的 57%。 总结上述所报道的研究似乎可以看出,被试完成理智任务的成绩至少有
时可能无意地为主考的预言所决定。强调自我实现预言的无意的方面也许是
合适的,因为在上述的几个实验中,主考和主试都在试图努力避免自己的预 言影响被试的成绩。
动物行为 行为科学与生物医学有一种传统,即用动物作实验被试,即使最终兴趣
所在的生物是人。这种用动物代替人的选择有时是因为使用动物更为便利,
有时却为实验程序的性质所决定,因为这种实验程序若不先在动物身上试验 就用人作被试可能太危险。有时,还有一种积极的益处,即动物被试不太可 能尝试猜测实验意图,从而不会尝试“有意促使”实验成功,或者甚至“故 意破坏”这种意图的实现(Orne,1962)。所以,如果能够证明即使是动物 被试的行为也可能是主试、训兽员或教师的期望或预言的结果,动物被试就 构成了一种强有力的证据来源。巴甫洛夫(Pavlov)认为这是大有可能的。
不是所有知道巴甫洛夫这个名字的人都知道巴甫洛夫对拉马克1的习得 的性格特征的遗传学说感兴趣。事实上,他搜集了证据来证明变异的传递发 生在白鼠学习能力的案例中。然而,在 1929 年的第 13 届国际生理学大会上, 巴甫洛夫做了非正式的说明:对他的实验所做的更严密的检查表明,白鼠的 学习能力没有提高。这种检查所表明的是助理研究人员的教学能力提高了, 这位助理研究人员也许期望获得他似乎负有责任的学习能力的提高
(Gruenberg,1929)。
早在巴甫洛夫从事拉马克学说的实验之前,1904 年就有一个例子,涉及 一匹以“聪明的汉斯”(Clever Hans)闻名的马的行为的自我实现预言
(Rosenthal,1965)。汉斯能用蹄击地做加减乘除运算。它能够拼、读和解 决音乐和声问题以及回答私人问题。它的主人冯·奥斯滕(Von Osten)先生 是德国的一位数学教师,他不像当时其他聪明动物的主人,没有凭借这匹马 的才能去赢利,而且似乎不可能有任何行骗的意图。他很乐意让别人在他不 在场时向汉斯提问,从而可以排除主人的暗示是汉斯具备这些能力的理由。 在一系列十分出色的实验中,芬斯特(Pfungst,1911)发现,只有在提问者 本人知道答案并且只有在汉斯用蹄击地以表示回答期间能看到提问者的情况 下,它才能回答问题。最后,有人发现,无论人们何时向汉斯提问,他们都 稍向前倾以便更好地看见汉斯的蹄。结果发现,那正是汉斯开始用蹄击地时 未被人意识到的信号。然后,当汉斯接近表示正确答案的次数时,提问者通 常会表现出很细微的头部运动。这种几乎觉察不到的暗示是要汉斯停止击地 的信号,因而汉斯又做对了。提问者期望汉斯在正确答案的数目上停止击地, 这事实上是在“告诉”汉斯正确答案,从而实现他自己的预言。芬斯特在早 期没有如此方便地获悉这方面的所有情况。经过一系列长期的、巧妙的实验 之后,他才了解到汉斯成功的秘密。芬斯特很有说服力地总结了发现汉斯才 能的困难。“从学生中寻找本该从教师中找到的东西。”芬斯特和其他人被 这句话导向歧途太久了。
迷津学习
这个实验的意图是用数目大于一匹马的动物来检验自我实现预言的假设
(Rosenthal and Fode, 1963)。修习实验心理学学程的一个班大半学期一 直在用人类被试做实验。现在要求他们再做一个实验,这也是该学程的最后 一个实验,而且是第一次用动物作被试。告诉这些主试一些有关的研究,这 些研究已经证明,善于走迷津与不善于走迷津的本领可以通过善走迷津和不 善走迷津的白鼠之间的连续近亲繁殖而在白鼠的不同鼠种中培养出来。他们 得到了 60 只完全供实验室用的普通白鼠,由 12 个主试平均分配。但是告诉 其中一半主试,他们的白鼠善于走迷津,而告诉另一半主试,他们的白鼠不 善于走迷津。白鼠的任务是学会跑到高架 T 型迷津两臂中较暗的一臂。T 型 迷津两臂的一臂是白色的,另一臂是灰色的,两臂可以互换;“正确的”或 有奖赏的一臂出现于左右两端的次数是相等的。每当白鼠跑到正确的一臂 时,它就获得一点食物。连续 5 天,每天给每只白鼠 10 次机会以便使它们知 道迷津较暗的一臂就是得到食物的一臂。
1 ①拉马克(Lamarck,1744—1829)是法国著名的博物学家和进化论者。——译者
表 4-1 5 天中每天正确反应的平均数
天数 对被试的信念 p
迟钝的白鼠
聪明的白鼠
第一天
0.73
1.33
0.03
第二天
1.10
1.60
—
第三天
2.23
2.60
—
第四天
1.83
2.83
0.05
第五天
1.83
3.26
0.03
平均数
1.54
2.32
0.01
从表 4-1 我们了解到,从第一天起并随着实验继续到第五天,被认为是
善于走迷津的白鼠果然善于走迷津(p=0.01)。被认为是更聪明的白鼠的成 绩天天在提高,而那些被认为是不善于走迷津的白鼠的成绩只是在前三天有 所提高,以后的成绩就愈来愈糟。白鼠有时不肯离开出发点。在被认为是聪 明的白鼠中,这种情况发生的次数占总实验次数的 11%,但在据说是迟钝的 白鼠中,这种情况发生的次数占总实验次数的 29%。这种迟疑次数比率的差 异在 0.001 水平上是显著的。即使白鼠都作出反应并且都作出正确的反应, 被认为是聪明的那些白鼠要比作出正确反应的但被认为是迟钝的白鼠更快地 跑向迷津中有食物的一臂(p<O.02)。
实验结束以后,所有主试都对各自的白鼠以及他们自己对其白鼠的态度
和行为评定等级。那些期望白鼠有更好成绩的主试认为自己的白鼠更聪明、 更亲切、更可爱。这些主试在自己与白鼠接触时感到比较轻松,并把自己对 动物的行为描述为更亲切、更友好、更热情和不多嘴多舌。他们还陈述道, 他们对待自己的白鼠要比那些期望白鼠取得不好成绩的主试温和得多。
斯金纳箱中的学习
下一个要描述的实验也用白鼠作被试,但这次不是用迷津而是用斯金纳 箱(Rosenthal and Lawson, 1964)。因为主试的人数(39 位)超过被试 数(16 只白鼠),主试以两三人为一组进行实验。再次使一半主试相信他们 的被试是专门为成绩优异而饲养的白鼠;使接受另一半白鼠的主试相信他们 的白鼠在遗传上就是劣等的。
在这项实验中,要求白鼠的学习要比在迷津学习研究中所要求的学习更 加复杂。这一次,白鼠必须按序列学习,在整整一个学季后学会下列行为: 卡嗒声一响就跑向食盘;按压杠杆以得到食物奖励;知道食盘可能关住,因 而有时按压杠杆并没有食物奖励;学习只有卡嗒声(而不是食物)为强化物 的新反应;只在灯亮时而不是在灯不亮时按压杠杆;最后,拉一下线圈灯就 亮,这种灯光告诉白 鼠按压杠杆就能得到一点食物。
每组主试分别在 5 个实验室中的一个实验室做实验。表 4-2 分别表明每 个实验室中据说是聪明和据说是迟钝的白鼠的成绩的平均(标准化)等级。 较低的等级意味着较好的成绩。在所有 5 个实验室中,如果主试预言白鼠有
更好的成绩,白鼠果然表现出更好的成绩。
表 4-2 5 个实验室中操作学习的平均等级
实验室 对被试的信念 p
迟钝的白鼠
聪明的白鼠
1
5.3
4.3
—
2
6.5
4.9
—
3
5.8
5.l
—
4
4.6
3.7
—
5
6.0
4.1
—
平均数
5.6
4.4
0.02
正如在迷津学习的实验中一样,目前这项研究的主试也被要求对他们的
白鼠以及他们自己对这些白鼠的态度和行为评定等级。那些期望白鼠获得优 异成绩的主试再次判断他们的白鼠更聪明、更亲切和更可爱。那些据说是“有 才能的”白鼠的“教师”又是把他们自己的行为描述为更亲切、友好、热情 以及不多嘴多舌。同那些“遗传上天赋不足”的白鼠的“教师”相比,那些 得到“天赋特高的”白鼠的主试往往更密切地注视自己的白鼠,搬弄白鼠的 机会更多,并且对它们很少多嘴多舌。人们真想知道,那些相信自己的白鼠 较差的主试对白鼠说了些什么。
在这项斯金纳箱的实验中,搬弄白鼠的绝对次数要比迷津学习实验中搬
弄白鼠的次数少得多。不过,那些相信自己的白鼠是斯金纳箱中聪明的白鼠 的主试搬弄白鼠的次数相对多于那些相信自己的白鼠迟钝的主试。在这两个 实验中,额外搬弄据说是比较聪明的白鼠,可能有助于这些白鼠表现出优良 的学习成绩。
除了斯金纳箱研究的主试所报道的搬弄次数上的差异是他们对被试的信
念发挥作用的结果之外,在所报道的对动物观察的专注程度上也有差异。那 些被认为较聪明的动物得到了更仔细的观察,因而对白鼠在斯金纳箱中的行 为的更仔细的观察,很可能导致对所期望的反应给予更迅速和更合适的强 化。因此,也许由于相信会看到更有希望的反应而导致的更仔细的观察,可 能使期望有良好成绩的主试成了更有效的教师。
水槽中的学习
自从汤普森和麦康奈尔(Thompson and McConnell, 1955)证明在真涡 虫(planarian)这种低等水生蠕虫中可能发生经典条件作用以来,人们在这 种生物上投入了大量的理论兴趣和研究活动。真涡虫赢得这种兴趣,是因为 它是种系发生学上最低等的生物。它可能具有大脑原基。围绕真涡虫进行的 部分研究活动探讨了各种有可能会同这种实验结果相混淆的人为现象问题。 例如,已经证明,不同的主试在对真涡虫学习翻身的研究中获得了迥异的结 果,尽管这些差异的原因还不清楚(Rosenthal and Halas, 1962)。
这里让我们最有兴趣的是科达罗和艾森(Cordaro and Ison,1963)对
蠕虫行为的研究。他们用了 17 个主试对 34 只真涡虫做一项条件反射实验。 其中使 5 个主试期望他们的蠕虫(两只)已经学会作出多次翻身和收缩反应。 使另外 5 个主试期望他们的蠕虫(也是两只)还没有学会作出多次反应,而 且,在“仅仅 100 次的尝试”中,也不能指望它们翻身和收缩。第三组的 7 个主试每人也得到两只蠕虫,但被告知其中的一只已受过训练,另一只未受 过训练。把这些蠕虫放在口宽 1/2 英寸、底深 1/4 英寸的 V 型水槽中,主试 观察这些蠕虫的行为。
表 4-3 在主试期望的四种条件下获得的真涡虫反应次数
主试期望 反 应 平均数
收 缩 翻 身
单纯的高
18
47
33
混合的高
15
30
23
混合的低
5
15
10
单纯的低
1
10
5
表 4-3 总结了科达罗和艾森的实验结果。不管主试预言自己的两只蠕虫
会有同样的结果,还是预言两只蠕虫会有相对立的结果,当主试期望有更多 次的翻身和收缩时,他果然获得了更多次的翻身和收缩(p<O.005)。根据 这些结果(以及早先报道的其他结果),我们不能肯定,是主试对蠕虫行为 的知觉受到了主试预言的影响,或者是蠕虫的行为直接受到了主试预言的影 响。然而,马尔里(私人通信,1966)认为,如果对真涡虫的刺激不是自动 的,那么主试靠系统地变换程序就能无意地提高蠕虫的反应能力。更能引起 人们兴趣的可能性是,主试的呼吸和体温上的变化可能导致蠕虫反应能力的 变化。在私人通信中,斯坦利·拉特纳(Stanley Ratner, 1967)认为,这 样的效应不是完全不可信的。
重复实验
英格拉哈姆和哈林顿(Ingraham and Harrington, 1966)的重要研究 中所采用的实验设计,实质上与科达罗和艾森首倡的实验设计一样。他们也 采用条件反射作用的任务,但在被试的选择上,遵循种系发生的等级系列, 重新采用上述实验用过的白鼠作为被试。
在英格拉哈姆和哈林顿的研究中,提醒主试要给被试等量的搬 弄,这种 提醒应该有助于减少这种可能性:主试的预言是自我实现的,是由于搬弄被 认为是聪明的或迟钝的动物的次数上的差异造成的。在前述用白鼠作被试的 研究中,主试的期望因主试得知他们的被试是专门培育为聪明的和迟钝的白 鼠而有所不同。在科达罗和艾森的研究中,主试的期望因主试得知他们的蠕 虫事先有未学会表现出多次反应而有所不同。在英格拉哈姆和哈林顿的研究 中,主试的期望因主试得知白鼠的能力可能是遗传的差异而显示出更加微妙 而又少有决定意义的差异,但是这些据说的差异其实是他们自己的实验正要 研究的。
尽管在搬弄白鼠和产生期望的方式上的指导语存在差异,英格拉哈姆和 哈林顿还是发现,主试期望取得优良成绩的白鼠果然取得了优良的成绩,虽 然统计上的显著性水平给人的印象不太深刻(p=0.08)。表 4-4 在类似于呈 现科达罗和艾森的研究结果所采用的那种表格中显示了他们的研究结果。对
表 4-3 与表 4-4 的比较表明,四种条件下的成绩等级排列是完全一致的(rho
=1.00)。此外,在这两个研究中,单纯的高期望组与单纯的低期望组之间 的差异,要比混合的高期望组与混合的低期望组之间的差异大两三倍。
4-4 白鼠在主试期望的四种条件下获得的平均成绩
主试期望 成绩
单纯的高 54 混合的高 53 混合的低 45 单纯的低 33
由于上面提到的差异以及由于任务和所采用的测量单位的差异,把英格
拉哈姆和哈林顿的研究结果与上述报道中以白鼠为被试的研究结论直接作比 较是困难的。不过,把他们的结果与在上述迷津学习实验中获得的结论作一 粗略的比较是可行的。这两个实验都持续了五天时间。表 4-5 表明那些被认 为是优良白鼠的成绩优于那些被认为是低劣白鼠在每一天以及整个实验中的 成绩百分比。在每个当作整体的实验中,那些被预言取得优良成绩的白鼠确 实取得了优良成绩的百分比,与那些被预言会取得不好成绩的白鼠确实取得 不好成绩的百分比,两者的平均数都是 55%。然而,若按每天的实验结果计 算,这两个研究中主试期望的效应随着时间的变化而不同。第一天,两种研 究的结果很接近,但从第二天开始,英格拉哈姆和哈林顿发现期望效应的量 持续下降。另一方面,在罗森塔尔和福德的研究中,从第一天到第三天,期 望效应的量下降,第三天之后一
表 4-5 被预言取得优良成绩的白鼠优于被预言 取得不好成绩的白鼠之成绩百分比
天 数 实 验
英格拉哈姆-哈林顿
罗森塔尔-福德
第一天
78 %
82 %
第二天
95 %
45 %
第三天
69 %
17 %
第四天
31 %
55 %
第五天
0 %
78 %
平均数
55 %
55 %
p
0.08
0.01
每组被试数( N )
27
30
直到实验结束,效应的量开始逐步上升。在英格拉哈姆和哈林顿的研究中,
期望效应随时间的推移而呈下降的趋势在统计上是显著的(p<O.02),而在 罗森塔尔和福德的研究中,期望效应呈曲线变化的趋势在统计上也是显著的
(p<O.002)。只有进一步的研究才能有助于我们理解这种差异。
脑损伤白鼠的学习
据我们所知,还有一项已经报道的实验研究了主试期望对动物学习的效 应,这就是伯纳姆(Burnham,1966)所做的一次有独创性的实验。他请了
23 个主试,每个主试都训练一只白鼠解决 T 型迷津中的辨别问题。其中约有 一半白鼠的脑因皮质切除而受到损伤,而其余的白鼠接受假的外科手术,从 颅骨到脑都被切开了,但没有切除任何脑组织。那些主试得知,该研究的目 的是试图了解脑损伤对辨别学习的影响。通过对每只白鼠标上受损伤或者未 受损伤来控制主试的期望。有些真正受损伤的白鼠被准确地标为受损伤,但 有些却被故意错标为未受损伤;有些实际上未受损伤的白鼠被准确地标为未 受损伤,但有些则被标为受损伤。表 4-6 表明了白鼠在每一种条件下的学习 能力的中位数等级。较低的等级指明较好的成绩。毫不奇怪,那些主试相信 未受损伤而实际上也未受损伤的白鼠获得了最好的成绩。它们的成绩与所有 其他动物的成绩的差异在 0.02 水平上是显著的。此外,不足为奇的还有,当 白鼠实际上是受损伤时,主试的期望没有造成任何差异。不管主试对被试的 信念是什么,脑受到损伤的白鼠总是学不好。有些奇怪的是,那些主试相信 受损伤而实际上并未受损伤的白鼠与那些真正脑损伤的白鼠的成绩却一样 差。
表 4-6 在四种条件下辨别学习的中位数等级
实际条件 对被试的信念
脑受损伤
未受损伤
脑受损伤
14.0
14.0
未受损伤
14.5
5.5
现在,我们总结从一般用动物被试作研究中了解到的情况,似乎可以看
出,那些主试期望有能力完成任务的动物往往果然有能力完成任务,而那些 被期望没有能力完成任务的动物往往也果如预言没有能力完成任务。
白鼠在斯金纳箱中找到自己获得食物的方式的实验结果是从本章过渡到 下一章的通道。该研究开始时,那些分配到据说是迟钝白鼠的主试被告知他 们会发现自己的白鼠学习迟缓。然而,他们又得到保证,“已经发现,即使 最迟钝的白鼠总有一天能学会所要求的反应”(Rosenthal and Lawson,
1964)。这样,那些据说是迟钝的白鼠被说成是可教的,只是进步缓慢罢了。 据此,了解分配到“迟钝”白鼠的主试是令人感兴趣的,他们中间竟有 47% 的人相信他们的被试是不可教的。那些分配到“聪明”白鼠的主试,只有 5
%的人同样对他们的白鼠的未来抱悲观态度(P=0.007)。人们想从这种结 果中了解的是,假如告诉教师一个儿童是可教的但进步缓慢,应该得到教育
但处境不利,教师会产生什么样的一些信念。
第二部分 教师期望
第五章 处境不利的儿童
学校通常在 9 月份开学,成千上万来自各种家庭的年近 6 岁的儿童开始 了一年级的学习。这是他们焦急不安的时刻,他们带着兴奋与不安的心情, 还伴有期待的感情:“这位老师会喜欢我吗?我什么时候学习阅读?她会喜 欢我吗?”
跨进一年级的教室是儿童迈出的一大步。这可能是一种令人欣喜的或毁 灭性的体验。教师对儿童笑脸相迎,看着他们想想这一年会有什么收获。打 扮得干干净净的白人小孩可能会学得不错;黑皮肤和棕色皮肤的小孩属于下 层社会,他们学习上将会有问题,除非他们看上去格外干净。凡是看上去不 干净和需要手帕的白人小孩都会有麻烦。如果教师撇开肤色不论,只看下层 社会儿童在数量上的优势,她就会知道她的工作将是困难的和不能令人满意 的。教师希望她所教的儿童都能学好,但她知道下层社会的儿童在学校里学 得并不好,就像她知道中产阶级儿童的确学得好一样。当她第一次面对全班 微笑,欢迎他们大胆地加入一年级的学习,并依据中产阶级的尺度来测定他 们的成败时,她就知道了所有这些情况。儿童也向她报以微笑,却没有意识 到教师已对他们作过第一次测量了。当他们向教师讲话时,教师会听到儿童 讲话吐字清晰,或者带有鼻音,或者结结巴巴,或者带有地方口音,教师再 次使用中产阶级的尺度衡量他们一番。随后,他们的阅读准备情况或智力也 将得到测量。在这第一学年里,儿童要受到多次检查,以了解他们的情况, 了解他们入学时具备的条件。
在教学楼里,二年级的教师知道,她的大多数下层社会的学生不如中产
阶级学生。无论在什么学校,在 9 月份开学的第一天,教师看看自己的班级 就知道这一年里哪些儿童将学得好,哪些则学不好。正式和非正式的测量结 果有时修正开学第一天的印象。一个邋遢的儿童可能很聪明,一个棕色皮肤 的儿童可能学得很快,一个黑人儿童读起书来可能就像小天使,而一个穿着 整洁的中产阶级儿童可能是十足的笨蛋。有时的确是这样。但如果教师预言 中产阶级儿童一般在学校中取得成功而下层社会的儿童一般在学业上落后并 终归失败,她通常是对的。
贫穷造成的处境不利 当前,注意力突出地集中在我们学校中教育处境不利的儿童身上。这些
儿童学习规范语言的经验不足,对学校文化的无知,以及因而造成的学业成
绩不佳是注意的中心。大量研究报告指出,处境不利儿童的智商低于中产阶 级儿童的智商,他们的阅读低于标准水平,他们的态度是消极的,而且他们 的行为使教师感到头痛 (Becker,1952 ;B. Clark, 1962 ; Davis and Dollard, 1940; Sexton, 1961)。按照定义,处境不利儿童来自下层的 社会经济群体,在这些群体中,低收入和与学校文化不相容的价值观紧密联 系在一起。学校中处境不利儿童学业失败的人数大于中产阶级儿童学业失败 的人数。
哈维格斯特称这种儿童为社会处境不利者,他预言,美国学校将在今后
的十年里“竭力扫除妨碍大约 15%的儿童在学校中学习有用内容的社会不利 情况??而且这意味着美国大城市低收入家庭大约 30 %的儿童”
(Havighurst,1965,p. 3)。美国卫生、教育和福利部正在通过为低收入 就学区的学校提供大量资金来鼓励这方面的努力。这种措施是根据《1965 年 初等和中等教育法案》第一编制定的,“这一新法案主要强调的是通过为这 样一个任务而批准的最大的联邦拨款计划来满足被剥夺了教育机会的儿童的 特殊需要”(U.S.Office of Education, 1965)。
由于教育和才能的发展有密切的关系,而才能在今天的市场又极为重 要,下层社会儿童的教育成绩普遍低下便引起了联邦政府的惊愕。技术革新 和国际政治危机需要受过教育的劳动力,这意味着那些没有从学校教育中受 益的处境不利的儿童相当于是对国家未来熟练劳动力的一种浪费。
在过去的几年中,几乎绝大多数的文献都描述了教育上处境不利的学习 者、他们的住宅、家庭情况、邻里、教师以及他们在中产阶级学校的气氛中 学习时所碰到的挫折。处境不利的根源多种多样,归结起来有经济的、社会 的、文化的和(或)语言方面的因素,这取决于作者的取向。我们在这里只 能探讨其中一些因素。
收入与学业成功
塞克斯顿(Sexton,1961)关于收入与教育机会之间关系的研究发现, 若家庭平均收入超过 7000 美元,儿童的成绩便在年级水平之上;若家庭平均 收入低于 7000 美元,儿童的成绩便在年级水平之下。显然,成绩差是累积性 的,也就是说,到了八年级来自收入最低家庭的学生的成绩至少比来自收入 最高家庭的学生的成绩落后两年。这一事实证明了贝克尔(Becker,1952) 认为差距拉大的观点,也符合卡尔(Kahl,1961)的研究结果:“老百姓” 的男孩到他们准备上九年级的时候,其成绩水平比智力相等但社会地位高的 男孩低得多,即使这些男孩在早先的学年中取得了相似的成绩。
塞克斯顿发现了“大城市”天才儿童教育计划中各收入群体之间的进一
步分化:在选入参加这一教育计划的 436 名学生中,没有一个来自 5000 美元 以下的收入群体,其中却有 148 名学生来自 9000 美元以上的收入群体。
成就训练
成就动机领域的研究指出,在家庭的成就训练上有阶级与文化的差异
(McClelland,1961)。当儿童进入强调中产阶级价值观的学校时,这些差 异可能引起冲突。众所周知,中产阶级儿童的竞争性是很出名的,自婴儿时 代起他们就一直被鼓励有所成就,因为美国中产阶级家庭培养儿童的做法散 发着成就的概念。具有相似成就取向的亚文化群的儿童也发现学校文化是熟 悉的,而且具有教养性(Rosen, 1959; Strodtbeck, 1961)。弗洛伦斯·克 卢克洪(FlorenceKluckhohn,1953)的价值观表明了主要美国人的典型形象, 这种美国人在家中受到的训练所强调的是养成进取个性之价值观的能动性文 化(activity culture)。“在家里和社区中没有获得这些特定价值观的儿 童在与把这些价值观视为理所当然的年轻人竞争时不大可能取得成功”
(Cloward and Jones, 1963, pp.193-194)。
贫乏无力的训练
对处境不利儿童失败的另一种理论解释也是基于家庭训练,或者更确切 地说,是基于缺乏家庭训练。一些作者假定,下层社会家庭中所用的语言造 成儿童在校学习的困难。工人阶级家庭使用一种有限制的语言形式,而中产 阶级家庭使用一种较精致的语言形式。伯恩斯坦(Bernstein,1960)相信, 随着处境不利儿童在学校生活的时间不断延长,除非他学习学校中使用的中 产阶级语言,否则,这种困难可能增大。洛班(Loban,1964)在确定儿童中 偏离标准英语的情况中发现,社会阶级与交流便利之间有着坚实的关系。
语言之外的社会阶级因素看来也对学习有影响。多伊奇(Deutsch,
1963)说,下层社会儿童没有学会“注意”。他们的看、听和倾听习惯在家 庭情境中没有得到训练。相反,中产阶级儿童从幼儿时代起就被鼓励去区别 含意、见解和判断,所有这些便构成了阅读的准备状态。
贫民教育计划
大量研究结果表明了中产阶级儿童与下层社会儿童在学业成绩和所测能 力上的差异。事实上,学业成功与社会阶级地位的关系已经得到了证实,可 以认为是“经验的法则”(empirical law)(Charters,1963,pp. 739~
740)。教育工作者当前力图使这种关系成为历史,迫于联邦机构施加的要求
采取行动的压力,他们正在制定种种实验计划来增加下层社会儿童的教育机 会。美国教育总署在过去几年中率先提出了面向教育处境不利者的教育计 划。1965 年 4 月约翰逊总统签发的《初等与中等教育法案》集中更大的注意 力于美国处境不利的儿童,该法案第一编批准 1966 年为这些儿童拨款 10 亿 多美元。
面临着由联邦出资提高贫穷儿童的成绩的机会,学校已在制定各种要由
联邦机构批准的教育计划。其中许多教育计划在结构上是历时性的,因而种 种研究结果暂时还不是定论。最终的目标看来是一致的,那就是通过提高自 我形象、潜力和抱负来增加教育机会。这些教育计划最根本之处似乎在于努 力依靠对儿童起作用的手段——矫正性阅读、咨询与指导、文化经验、父母 参与以及卫生福利服务——来克服学习障碍。这些教育计划旨在强调儿童与 家庭内的不足之处,而且这些计划都是补偿方法。 (见 Wrightstone, McClelland, Krugman, Hoffman, Tieman, and Young,日期不明)。显 然,各种不同研究结果都被解释成处境不利的儿童总是有点缺陷,因而教育 工作者应当关注他们早期贫乏无力的训练以及关心他们在成就定向中由亚文 化决定的差异。
这些耗费巨大的特殊教育计划的前提只是某种建议:学校本身可能有种 种不足之处。这些前提极少认为教师的态度和行为可能是促使学生失败的因 素。然而,教师对下层社会儿童的反应与这些儿童缺乏成功可能是难解难分 的。
教师变量
在为处境不利儿童制定的教育计划中忽视了教师的作用,这么说并不表 示理论或者研究忽视了教师。正如将从它们出版的日期中可以看到的,甚至 在盛行并有利于关注处境不利者之前很久就提出了好的理论,进行过好的研 究。例如,贝克尔(1952)在芝加哥的研究中发现,贫民学校的教师和中产 阶级学校教师使用不同的方法,教师和行政人员对下层社会儿童的期望较 低,学业上的差距随着年级的升高而拉大,儿童的态度和个人卫生触怒了教 师,因而教师想尽快转到“好”学校工作。戴维斯和多拉德(Davis and Dollard,1940)甚至更早就得出了相似的研究结果。他们分析了课堂中社会 阶级标准发挥作用的情况,发现下层社会儿童因自己的出身而受罚,他们还 发现,“他由于父母‘无知’、他讲的方言、他的衣着,很可能还有他的黑 皮肤而受到教师以及教师所喜欢的学生的毁谤”(Davis and Dollard,1940,
pp. 284~285)。沃纳、哈维格斯特和洛布(Warner, Havighurst,and Loeb,
1944)得出的研究结果表明,学校中对社会结构中不同地位的人抱有有区别 的态度。
多伊奇(1963)与威尔逊(Wilson,1963)的重要研究工作进一步支持 了早期研究工作者的见解。多伊奇(1963)指出,“对学习的非常消极的态 度正是在学校情境中逐步形成的”(p.178),造成处境不利的责任在学校, 因为下层社会儿童在学校里学到的是消极的态度。威尔逊(1963)在研究了
3 所社会阶层分化的学校后指出,教师把分歧的标准加以正常化在某种程度
上造成了下层社会青年中抱负与成就之间的分叉,也就是说,“教师期望与 标准的变异促成学生成就与抱负的差异。”(Passow, 1963, p. 183)下 层社会学校中的教师既不制定出像中产阶级学校中那样高的标准,也不关心 把儿童培养到年级水平。根据所测定的成绩来看,对低阶层的儿童评价过高, 而对高阶层的儿童评价过低。
伯顿·克拉克(Burton Clark, 1962)对贝克尔研究结果的反应对确定
贫民教育计划的前提也很有意义。
北方城市黑人和其他黑肤色的少数民族人口众多,而且持续增长,使得教师的反应 成为少数民族教育的一个重要方面。在北方都市里,只有歧视不是主要的因素。问题在于 少数民族儿童的特征(而非肤色和种族)影响教师和学校运作的方式。在某种重要意义上 说,消除歧视并不会消除少数民族问题;因为只要大量出身于文化上被剥夺的下层社会背 景的儿童是肮脏的、凶暴的、无心学习——或者在他们教师的眼里看来是这样,教师就可 能以不同的方式对待他们,教给他们的东西更少,而且想避开他们。(p.99) 里斯曼(Riessman,1965)通过制订师资培训计划表达了他的关心。他
说:“师资培训计划的目标是发展对低收入文化的兴趣和尊重,这与意识到 低收入环境的困难是截然不同的。这种理论认为,这将导致对儿童及其家长 真的是‘期望愈多,得益愈多’。”(p.16)
里斯曼的主要论点看来是处境不利儿童被低估了,下层社会经济群体有 积极的特征,这一立场应被作为一种“工作假设,一种积极的神话,因为这 样做我们就能与贫民相互配合,而不是对他们施加影响”(1962,p.166)。 这些作者至少在一种公式上意见是一致的:被界定为处境不利的儿童得 到的教师期望是没有能力学习。其他作者和观察者也都同意。伯纳德·阿斯 贝尔(Bernard Asbell,1963)在《不像其他儿童》(Not Like Other Children) 一文中报道了他访问学校与教师的情况。“在我所到之处,教师看来一心想
着的是‘期望什么’,而极少想他们可以达到什么”(p.116)。
克瓦雷塞斯(Kvaraceus,1965)把为处境不利者制定的教育计划作为“允 诺或借口的教育计划”来讨论,他坚持认为,“我们必须停止向处境不利者 投射失败。哈莱姆青年不受限制的机会 (harlemYouth Opportunities Unlimited, HARYOU)研究指出,教师所抱的低的成绩期望起到了自我实现 预言的作用。教师常常用心理学工具和测验来强化和证实他们低的预言”
(p.30)。 麦金龙(Mackinnon,1962)观察到,“如果我们的期望是,一个具有特
定智力的儿童不会对他所面临的任务创造性地作出反应,尤其是如果我们使 儿童知道了这种期望,那么,他创造性地作出反应的可能性就会大大减少”
(p. 493)。肯尼思·克拉克(KennethClark,1963)、希尔森和迈尔斯(Hillson
and Myers, 1963)、卡茨(Katz,1964)、里夫林(Rivlin,日期不明)、 罗斯(1956)等人都陈述了相同的见解。肯尼思·克拉克谈到,被剥夺了教 育权利的儿童成了“一种教育的自我实现预言的牺牲品。”(1963,p.150) 也许这一见解最详细的表述是 《少数民族聚居区的青年 (Youth in theGhetto)》(HARYOU, 1964)的作者们,他们认为,“当教师与校长对 儿童的学习能力持一种低的看法时,儿童很少超过这些期望”(p. 203)。 他们进而说到,有效的贫民教育计划“将只是来自一种坚定的信念和主张: 学生能够学好”(p.244)。在判断教师期望的重要性时,他们说:“现代社 会科学的全部影响力量证实了这一判断”(p.244)。这句话意味着,现代社 会理论家往往感到期望变量很重要,但是社会科学比社会理论具有更重要的 东西,这种更重要的东西就是证据。
教育的自我实现预言的重要性的证据以数据的形式表明,处境不利的儿
童从三年级到六年级愈来愈落后。尽管就某些目的而言,这种数据很重要, 但还不足以证明教师期望的效应。诚然,教师的自我实现的预言可能有责任, 但是其他许多因素可能也有责任。
从已经提出的这些理论和证据来看,我们能够合理地作出结论的至多
是,人们没有期望处境不利儿童会在学校中学好。现在,我们需要问一问, 是否有充分的证据表明,教师的期望或者预言导致她对学生的评价或者学生 实际成绩的差异。
学生评价 当知道或者相信了某个学生的某些情况时,也就知道了他的其他真的或
假的情况。这就是所谓光环效应,伦纳德·卡恩(Leonard Cahen,1966)最
近的一项实验充分证明了这种效应。卡恩感兴趣的是确定学生能力倾向的虚 假信息是否会影响教师对学生测验的评分。被试是 256 名进修教师,要求每 个进修教师对“学习准备状态”(learning readiness)的一种新测验评分; 并告诉每个进修教师,在阅读测验和智商测验中得分高的儿童在这种新测验 中得分也高。在每份试卷上都标明学生的智商和阅读水平。这些虚构的分数 有时高,有时则低。卡恩的研究结果清楚地表明,当进修教师对据说是比较 聪明的儿童所做的测验进行评分时,他们对这些儿童的可疑处给与了更为善 意的解释,而当他们对据说是迟钝的儿童的测验进行评分时,对儿童的可疑 处则给予了不大有善意的解释。当“知道”一个儿童聪明时,这个儿童的行 为就被评价为比被“知道”是迟钝的儿童所表现出来的同样行为具有更高的
智力品质。在评定儿童对个别实施的标准化智力测验的反应中,也出现了这 种光环效应(Sat-tler, Hillix, and Neher,1967)。
人们常常指出,来自少数民族群体,特别是来自黑肤色群体的儿童,尤 其有可能是不利的光环效应的受害者(HARYOU,1964)。雅各布森(Jacobson,
1966)最近的一项研究可作为例证。 要求两组教师根据带有美国人的外貌或墨西哥人的外貌对一批陌生儿童
的照片作等级评定(“美国人”未作界定)。在评定的等级上,教师的意见 高度一致。然后,要求这两组教师以同样的方式对墨西哥人血统的儿童的照 片作等级评定,一组教师不认识这些儿童,另一组教师则执教于这些儿童所 在的学校。结果两组意见极不一致。墨西哥人血统的儿童所在学校的教师把 那些智商较高的儿童当作更像美国人。只有在可获得儿童智商分数的情况 下,智商与外貌才有显著的相关。显然,教师在他们对“看似墨西哥人”的 知觉上是一致的,只有到他们知道一个儿童是怎样接受测验时,知觉才发生 了变化。
这项研究提供了课堂中处境不利儿童的进一步信息。一年级和二年级中
(在阅读方面)成就最大的墨西哥人血统的儿童,都被两组教师当作明显地 更像墨西哥人。这种相关在三四年级发生了逆转,到了五六年级逆转更大, 也就是说,高年级中成就最大的学生在两组教师看来都更像美国人。这项研 究表明了这种可能性:如果一个墨西哥人血统的儿童在教师看来更像美国人
(即盎格鲁-撒克逊人),教师对他的学业期望就可能像对中产阶级儿童的期
望一样,这是与更像墨西哥人或下层社会儿童因而有成绩差异的墨西哥人血 统的儿童的期望相比较而言。
教师对学生的评价决定于许多变量。有时,教师认识到处境的种种不利,
或许有时还创造许多处境不利。对儿童的评价(因光环效应而减低或提高) 可能会传递给儿童一种特定的成绩期望,这个儿童则可能会实现教师的预 言。
学生成绩 教师对学生成绩的期望的根源,不只是学生的肤色、外表或背景信息。
教师对学生理智能力的期望的最重要根源之一是标准化的智力测验和成绩测
验(Deutsch,Fishman,Kogan,North,and White-man, 1964; Gibson,
1965; Goslin, 1966; Pequignot, 1966)。即使这些测验之一的实施或 多或少是适当而有效的,结果可能影响教师对儿童随后的理智成绩的预言。 从某种意义上说,这是能力倾向测验与能力测验的目的,而这种目的的利弊 在通俗报刊和专门文献中都有所讨论。然而,有时候实施标准化智力测验时 周围的特殊环境大大减轻了这种测验结果对教师期望的影响。在这种情形中 就可以怀疑这种测验结果是无效的。下面是这方面的一些例子。
蒂纳是一个智力发展迟缓的小孩,她在幼儿园呆了两年,在一年级呆了 三年。由于她是班上的一员,每年都参加测验。她在一年级的最后两次分数 使她的智商超过了 140。她熟记了学前儿童识字本,并能准确地“阅读”。 蒂纳的最后一位一年级教师是刚从大学分来的新手,在她不了解蒂纳的上述 情况之前,她相信蒂纳是班上的优秀学生。
比利是一位平平常常的六年级女孩,在参加一次初级中学升学成绩测验
时,她采用了国际商用机器公司卡片(IBM card)上错误的部分,结果她的 分数居于第二百分的位置。在五年级,她没有参加成绩测验。她被安排在新 学校的差生班级,而且这种安排在年末测验前不能变动。她板着面孔在班上 度过了这一年,从而成了一个没有长进的逃学生。
一般说来,在把儿童安排到各学习轨(learning tracks)或能力组
(ability groups)时,一种测验要与其他测验一并考虑。例外主要出现在 一年级或儿童转到一所新学校却没有从前的成绩记录时。在幼儿园,儿童第 一次参加智力测验与一年级开学测验,期望的循环可能就从此开始。好动的 儿童常常使教师分心,出乱子,随后就被调换班级;通常,他们没有学到参 加开学测验所要求具备的背景知识(用彩笔作记号、听指导语、学会转页等)。 佩德罗就是一个这样的小家伙,他爱打架、专横、闹事而且做出难以预料的 事。在实验中,校长私下向幼儿园教师吐露,佩德罗表现出了当领袖的所有 迹象。“今天看到一个儿童具有如此不受限制的、不受中产阶级的种种人为 事物所约束的自由精神,这难道不神奇吗?”“如果把这个男孩交给一位力 图逐渐消除儿童的这种高兴劲的教师,这个男孩的情况会怎样?”这位教师 一开始就用新的眼光来看佩德罗,而佩德罗则认识到了教师的赞许,求助于 她,并在那一学年成了她最好的学生。他的得意是明显的。而且,他的测验 分数与教师的推荐使他进了一年级的尖子班,他继续情绪饱满地在学校学 习,并使所有的教师都感到满意,他是班级这个大家庭里学习成功的第一个 人。
有一家从墨西哥来到一所美国学校,该校的行政人员凭预感把这家的四
个儿童都安排在进度快的尖子班,并告诉每位教师,每个小家伙都聪明,除 了在学习英语时给予鼓励之外,这一年教师不必担忧了。到了年终,教师要 求行政人员免去这四个儿童的测验,因为他们的英语尽管进步很快,但还不 足以完全应付测验。这四个儿童都被建议继续留在尖子组学习。到第二年年 终,他们和同学一道参加了智力测验和成绩测验,他们的得分超出了平均水 平。
这些事例佐证了这样一个命题:智力测验分数影响教师对学生成绩的期
望,而且教师的期望可能成为自我实现了的预言。但在有关这一课题的所有 文献资料中,只发现一项实验是专门为检验该命题而设计的,这就是克利福 德·皮特(Clifford Pitt, 1956)的实验。
实验证据
皮特(1956)用来做试验的学生是 165 名 IQ(智商)在 94 以上的五年 级男孩。皮特对他们进行了一次标准化智力测验。大约 1/3 男孩的 IQ 被准确 地报告给了他们的教师。另外 1/3 男孩的 IQ 也被报告给了他们的教师,但
IQ 分数被人为地提高了 10 个点。还有 1/3 男孩的 IQ 同样被报告给了教师,
但 IQ 分数被人为地降低了 10 个点。这些都是在学年之初做的。到了学年年 终,对这三组儿童的学业等第、成绩测验、教师的等第评定和学生的自我等 第评定进行了比较。
皮特得出的结果有损于教师自我实现预言效应的假设。他发现,被人为 地提高或降低的 IQ 对客观成绩测验实质上没有影响。对此可能有不少解释, 现列述如下。
1.教师对学生 IQ 的了解实际上并不影响学生的成绩。
2.教师对学生 IQ 的了解对学生的成绩有影响,但是,由于皮特实验中的教师在知
道 IQ 分数之前七八周就认识了他们所教的儿童,所以,这种影响因教师基于个 人对每个男孩成绩较多的了解所产生的期望而消失了。
3.有这样的影响,但只有当教师是女性时才有。
4.有这样的影响,但只有当学生是女性时才有。
5.有这样的影响,但只有在教师有学士学位时才有。(皮特实验中的教师仅有 14
%受过大学本科教育)
6.有这样的影响,但只有在儿童是五年级以下的学生(或更大年龄的儿童,尽管 不大可能)时才有。
7.有这样的影响,但只有在儿童的 IQ 低于 94 时才有。
在下面的几章中,我们将有机会再次考虑其中的一些解释。然而,目前 还没有办法确定所列的各种解释中哪些是正确的,如果有的话,或者至少说 哪些解释比其他更加正确。
皮特的确发现了儿童的 IQ 被人为提高或降低所产生的一些令人感兴趣 的效应。这些效应出现在学生的自我等第评定中。那些 IQ 被人为降低的男孩 逐渐感到(1)他们在学业上不如其他男孩努力;(2)学校对他们比对其他 男孩更艰难;(3)他们的教师在评定等第上对他们的要求比对其他儿童更严 格;(4)学校不大使人愉快。所以,尽管教师对学生 IQ 的信念并不影响学 生的学业成绩,但它的确影响学生对他们自己、他们的教师和学校的看法。 这些研究结果使人联想起沃坦伯格-埃克伦(1962)报道的研究结果。她发现, 主考的期望并不是影响大学生获得 IQ 分数的一个重要因素。可是,在她的研 究中,被试感到受到了主考的区别对待,这取决于主考期望的是成绩水平高 还是低。但在这两项研究中,成绩不受教师或主考的期望的影响,可是学生 却能以某种微妙的方式告诉我们,他们受到了不同的对待。
许多,也许是绝大多数学校运用能力分组或分轨的方法。按照这种方法,
能力相似的儿童被分在一起,而且只要保持能力的相对同质性,在分轨的学 校里也把他们分在一起。当儿童成绩的变化看来可以有合理的上下变动时, 儿童可以进入更高或更低的组或轨。但 是大多数儿童并不更换组别。一旦安 排在快轨、中轨或慢轨,儿童往往就呆在那个轨。一个特定组或轨的成员资 格,就像一个处境不利组中的成员资格一样,或像一个特定的 IQ 分数一样, 是教师对学生的理智能力产生期望的一个根源。查尔斯·弗劳尔斯(Charles Flowers,1966)在他的研究中所运用的正是这种教师期望的根源。
就我们所知,在探讨教师期望效应的另外唯一的一项实验研究中,弗劳 尔斯运用了不同的方法,但其逻辑与皮特所采用的相同。皮特用了虚假的 IQ 分数,弗劳尔斯则用了虚假的能力分组去了解教师期望对学生成绩的影响。 弗劳尔斯的研究是在两个不同城市的两所不同初级中学中进行的。这两 所学校都位于城市萧条的地区,这些地区学生的教育处境不利,分组教学成 了惯例。在每所学校中选择了两个七年级班,由 IQ 与成绩测验分数确定的他 们的“实际”能力只是一般,而且彼此相当。在每所学校中,配对的班级中 有一个班被人为地称作是该校尖子组之一。当然,没有告诉教师其中一个班
级的分组是人为造成 的。 在进行实验的那个学年末,对所有儿童的阅读和算术能力以及 IQ 进行复
测,这些都是已经对儿童作了预测的变量。在其中的一所学校中,人为提高
的组(24 名儿童)的阅读和算术成绩比控制组(19 名儿童)好,虽然从统计 上看这一效果并不显著。提高班与控制班之间的 IQ 没有差异。
在另一所学校,情形正好相反。人为提高组( 19 名儿童)的 IQ 比控制 组( 19 名儿童)的 IQ 多 5 分,而且这一超出在统计上具有显著意义(P< O.03)。提高班与控制班之间的算术或阅读成绩没有差异。
在对这项研究下结论时,弗劳尔斯请儿童注册学习的各门课程的任课教 师回答许多有关这些儿童的问题。对提高组与控制组的教师回答情况进行比 较,结果表明有许多可能的差异。与控制组教师相比,据称是优异组的教师
(1)更经常地提到儿童能做什么而不提他们不能做什么;(2)发现班上根 本就没有纪律问题(尽管几乎所有控制组儿童的教师都报告有纪律问题);
(3)更经常地提到激发学生学习动机的种种努力而很少提到教学材料的不适 当;(4)喜欢教 “更高的”能力组。
除与皮特研究的情形一样外,弗劳尔斯也的确得出了有利于教育自我实 现预言之假设的某种证据。为什么他会发现在一所学校中成绩更多地得益于 有利期望而在另一所学校中 IQ 更多地得益于有利期望,这仍是争论未决的一 点。无论如何,所显示出的增量不是戏剧性的,这有几种可能的解释。
1.即使自我实现预言真的发生了,在数量上也不是戏剧性的。
2.自我实现的预言可能是戏剧性的,但当儿童已是七年级时就不是了。
3.自我实现的预言可能是戏剧性的,但在所描述的研究中,每个学生都牵涉到许 多教师,以致效果被冲淡,不及每组只有一个教师时的效果强。
4.甚至在弗劳尔斯研究中所显示的非戏剧性的增量也可能太高,而且教育的自我 实现预言事实上并未发生。 最后一种可能性是由于皮特与弗劳尔斯研究设计间的差异所引起的。在
皮特的设计中,每位教师都有机会与三个实验组的儿童发生交互作用。因为
每位教师都有均等的机会影响 IQ 被如实地告知、被人为提高和被人为降低的 儿童,所以,教师之间的个别差异的影响不能说明任何差异——如果他发现 任何差异的话。在弗劳尔斯的研究中则不是这种情形。在弗劳尔斯的研究中, 实验组与控制组大都有不同的教师,从而他得出的结果可能是由于教师间的 个别差异所致。也许据称是优异组的教师是好教师,因而该组获得的益处更 多的是由于良好的教学而不是教师期望。目前还无法确证这个问题,但这个 问题的另外一面应该显示出来。这另一面表明,教师之间的个别差异显示控 制组也得益于教师优势,而实验组却显示出教师期望更加戏剧性的效应。要 回答我们遗留下的这个问题,还需依赖另外的证据。
第六章 奥克学校实验
在这一章里,我们将描述专门为检验下述命题而设计的一项实验计划, 这个命题是:在一特定的课堂内,那些被教师期望有较大智力发展的儿童将 显示出这样较大的发展。总的设计(和该实验的某些结果)已经在初期报告 中简要陈述了,但在这里我们将能详细描述这种实验程序以及所得出的结 果,其中大多数内容在我们的早期报告撰写完毕以后方才获得(Rosenthal
and Jacobson, 1966,待出版)。
奥克学校 这个实验是在我们称为奥克学校的公立小学中进行的。为此,我们有必
要对奥克学校的招生社区、儿童本身、奥克学校的教育组织和该校的教师稍 作描述。
社区
该社区是一个大城镇的旧城区,并且完全可以划分为三个部分:(l)座 落在小山上的漂亮的中产阶级住宅区,这一区域里的儿童不多;(2)通往镇 工业区的弯弯曲曲的街区,建有整洁的别墅和新的两层式套房,这一区域里 的儿童也不多;(3)房子破烂的胡同小巷,这一区域里的儿童很多。
在这个旧城区,几代以前就居住了意大利移民,他们很久以来靠种植蔬
菜换来不动产业、城市政治以及大大小小繁荣的企业。他们的名字(虽不是 他们的容貌)是奥克学校许多学生的世袭遗产,因 为多年以来显然发生了种 族的混合。
儿童
然而,奥克学校的大多数儿童来自人口占绝大多数的下层阶级社区。这 些儿童的父亲大多是不熟练的或半熟练的工人。许多儿童出身于破裂的家 庭,他们的母亲工作和(或)家庭接受福利基金的救济。
虽然如此,奥克学校还是极少有穷得令人绝望的儿童。在一个中产阶级
观察者看来,有些儿童得到的照顾看来不如其他儿童,但他们既非营养不良, 也不是衣衫褴褛。他们看上去倒是需要洗澡、刷牙,或许牙齿还需要修修补 补。很少有儿童需要教师推荐他们到学校自助食堂中去就免费午餐。例如, 若是一个儿童的衣服确实穿破了,教师家访便知道这一家不是没钱而是“用 钱不当”。儿童的下层阶级地位的确也在语言和经验的文化贫困上表明出来。 参观学校的人发现,这些儿童一般都是喧闹的、引人注目的。学校给人 以一种友善感而没有认真努力的气氛。这也许是学校成绩普遍偏低的一个促 成因素。学校办公室毫不威严,实际上,办公室似 乎既是一个“贷款处”, 又是一个亲切友爱的照管站。儿童不断前往借还午餐费,不断去喊头痛、要
治疗。
全校 650 名学生中大约有 1/6 是墨西哥血统的儿童,这是注册入学的唯 一的少数民族群体。就学区黑人家庭的儿童看来,他们完全成了多数民族群
体。墨西哥血统的儿童似乎聚在一起,这可能是由于他们语言的共性,但也 可能是由于他们校外的家庭和社会组织造成的。他们掌握西班牙语言的熟练 程度不同,有的只知道英语中的几个西班牙文单词,有的则让来访的墨西哥 大妈慢慢讲话才能听懂她的意思。
学校的注册人数从来都是不稳定的。学生转入转出似乎是办公室人员处 理的日常事务,不过这样的学生实际上约在 200 名以下,或者在一年期间约 占总人数的 30%。这些转校生通常是因为父亲找工作的问题、迁居到“更好” 的街坊、转入和转出邻近的天主教学校而造成的。其中许多转到他校的学生 几个月后又回来了。
能力分组
奥克学校根据学区政策把儿童分到各能力班或能力轨,这种分班或分轨 主要以阅读成绩为依据。从一到六年级各有三种班级,称为高、中、低组, 或者快、中、慢轨。转入或转出的学生很少属于高能力组或占学生 1/3 的高 成绩组。在低能力组中,墨西哥血统的儿童的人数和来自其他低收入家庭的 儿童人数都很不相称。墨西哥血统的儿童占该校学生总数的 17%,但快轨儿 童中只有不到 6%的儿童是墨西哥血统的儿童,而慢轨儿童中将近 29%是墨 西哥血统的儿童,这一分布上的差异偶然产生的情况极少。①
在墨西哥血统的儿童中,男孩和女孩均等地分布在三个轨之中。而在非
墨西哥血统的儿童中,男孩过分集中于慢轨,女孩过分集中于快轨。奥克学 校里非墨西哥血统的儿童中约有 53%是男孩,快轨儿童中却只有不到 38% 是男孩,慢轨儿童中近 69%是男孩,这一分布上的差异有很显著的统计意 义。②
奥克学校儿童不是根据 IQ 分数而是根据阅读成绩分班,这种阅读成绩主
要是由教师的判断和成绩测验分数来确定的。不过,三 轨的平均 IQ 却有很大 的差异。在实验开始前,对该实验所包括的有 370 名儿童的子样本作了非言 语的智力测验。表 6-1 显示了三轨中每一轨的平均 IQ,以及全校墨西哥血 统与非墨西哥血统的男孩、女孩的平均 IQ。在所示四个小组的每一组中,所 在轨愈高,平均 IQ 也愈高(这样一种序列的确切 p 值等于 0.0046)。表 6-1 还表明,墨西哥血统的儿童的 IQ 大大低于非墨西哥血统的儿童的 IQ;与快 慢轨中非墨西哥血统的女孩的 IQ 之间的巨大差异(26·7 分,t=8.59)相 比,快慢组中墨西哥血统的女孩的 IQ 之间的差异相对来说很小(9.8 分,t
=1.53)。 教师在下一学年升级时提出分组建议。在这一学年期间,教师可以不顾
前任教师的建议而把儿童转到较高能力组或较低能力组,但是这类调动不 多,上下调动大多为下一学年提出。
① 就我们实验中包括的一个有 370 名儿童的子样本而言,墨西哥血统的儿童与非墨西哥血统的儿童在三轨
中的分布差异 p 远不到 0.01(X2=24.9,df =2)。
② 就我们实验中包括的有 308 名非墨西哥血统的儿童这一子样本而言,男孩和女孩在三轨中分布的差异 p
远不到 0.01(X2=23.8,df=2)。
表 6-1 三轨中墨西哥血统与非墨西哥血统的 男孩与女孩的非言语 IQ 分数
轨 男 孩 女 孩
墨西哥血统 非墨西哥血统 墨西哥血统 非墨西哥血统
N
IQ
N
IQ
N
IQ
N
IQ
快
5
l00.6
52
112.0
3
93.3
85
109.0
中
10
89.4
57
99.5
12
91.8
34
97.5
慢
15
82.6
55
89.9
17
83.5
25
82.3
总计
30
87.6
164
100.2
32
87.6
114
101.7
这种关于能力分组的学区命令所依据的宗旨是,不论儿童是高成就者还
是低成就者,课堂内的能力分布范围愈窄,儿童遇到的挫折愈少,取得的成 果愈多。奥克学校的成绩是全镇 12 所小学中成绩最差的一所。应该注意到, 其他 3 所成绩最差的学校招收的学生也主要来自下层阶级和(或)不同文化 的家庭。在进行该研究时,这 些成绩差的学校的行政人员对能力分组的可取 性提出了质疑。
教师
奥克学校有 20 名教师,其中男教师仅两名,两位教师教 4 个半日制幼儿 班的全体儿童,其余的教师则负责教其余 6 个年级的各轨儿童。教师往往年 复一年在同一个年级任教。但在年级内各轨轮流依次更替。
教师的平均年龄是 35.1 岁 (σ=10.4), 年龄最小的 23 岁,最大的
50 多岁。教学经验与我们从年龄范围中所期望的一致,从 1 年到 30 多年不 等,平均为 7.7 年 (σ=8.4)。教师全都有学士学位, 1/3 的教师在综合 性大学获得了学士学位,其他教师中大多数在州立学院和师范学院获得了学 士学位。
一个访问该校的人发现,像儿童一样,教师多半是引人注目和友善的。
把教书作为唯一职业的只有几个人;大多数教师渴望讨论教育哲学、他们的 教学技巧、他们学生的宝贵之处与局限。因此,许多教师应该说是忠诚于教 育的。
研究程序 现在让我们来看看在奥克学校使用的研究计划,这个计划基本上是仿照
第四章中所描述的动物研究。在那些研究里,我们观察到,那些据称遗传上
处于劣势的动物向主试作出的是劣等的表现。另一方面,主试相信遗传上处 于优势的动物作出的是优异的表现。如果动物像主试所期望的那样变得“更 加聪明”,那么,看来可以合乎情理地认为,儿童可能像教师所期望的那样 变得更加聪明。
如果被试是动物,据说我们能够把极普通的老鼠特别饲养得聪明或迟 钝。但是这种办法不能运用于奥克学校,必须以其他某种方式来形成期望。
再者,由于那些据称是迟钝的动物看上去学得差,所以,伦理上的要求是: 只能按更有社会效用的方向——提高——形成期望,而不能期望任何儿童有 更坏的表现。
该实验的另一个要求是,在实验开始前要有衡量学校所有儿童理智能力 的某种测度。这样一种测度必然就像用来测量实验组与控制组儿童的增量的 一把尺子。一种常用而且在方法论上站得住脚的程序是:不进行预测、只是 随机地把一些被试分配到实验组,把另一些被试分到控制组,希望两组的机 遇在开始时是相等的。但是,正如波林(E.G.Boring,待出版)指出的,我 们从来就不能有十足的把握说,这样组成的两个组确实首先就是相等的。
这项实验可以把以下两个方面结合起来:一方面在全校范围进行智力预 测,另一方面则为形成有利于奥克学校某些儿童的智力增长的期望提供一种 似乎可信的依据。
哈佛习得变化测验
1964 年春,对秋季可能返校的奥克学校的全体儿童进行了“哈佛习得变 化测验”(Harvard Test of Inflected Acquisition)。这意味着,幼儿园 和除六年级以外的各个年级的儿童都参加了测验。六年级儿童准备进初级中 学,秋季不来上学了。该测验据称可以预测学业的“大发展”或“激增”。 在第一次测验举行前几个月,向每位教师发了一份研究说明书的复印件,内 容如下。
成为本站VIP会员VIP会员登录,
若未注册,请点击免费注册VIP 成为本站会员.
版权声明:本站所有电子书均来自互联网。如果您发现有任何侵犯您权益的情况,请立即和我们联系,我们会及时作相关处理。