习得变化研究
(哈佛-国家科学基金会)
所有儿童的学业进步都表现出上升、平缓和下降的现象。哈佛进行的这项研究得到 了国家科学基金会的资助,它所感兴趣的是那些学业进步异常“激增”的儿童。这些“激 增”能够而且的确发生在学业和理智活动的任何一个层次。如果这些“激增”发生在学业 不太好的儿童中,结果就通称为“迟来的增长”。
作为我们研究的一部分,我们进一步验证一项测验,这个测验预言儿童在不远的将 来会显示出一个转折点或“激增”的可能性。这个测验将在贵校实施,它将使我们预言哪 些少年最可能显示出学业上的“激增”。我们可能发现在这个测验中 20%(近似值)得 分最高的儿童处在学习活动的各个不同层次。
预言变化或“激增”测验的编制还不能够预言 20%得分最高者中每一个儿童都会表 现出“大发展”或“激增”的效应。但是 20%得分最高的儿童将在下一年或更短时间内 的学习中表现出比其余 80%的儿童更显著的变化或激增。
由于这些测验的实验性质,测验编制的基本原则不允许我们同家长或儿童本人讨论 这个测验或测验分数。本研究结束后,参加研究的各个学区即将获得研究结果。 说明书还规定了测验的日期为 1964 年 5 月、1965 年 1 月、1965 年 5 月,
但未提及原定于 1966 年 5 月进行的追踪测验。 在奥克学校进行测验的表面理由是最后检核这项测验的效度,即已经得
到充分确认的效度。实际上,“哈佛习得变化测验”是一种标准化的、相对 地非言语的智力测验,即弗拉纳根(Flanagan)的一般能力测验(TOGA)。 使用弗拉纳根的一般能力测验的理由如下。首先,这个测验看起来不像
平常在奥克学校使用的任何智力测验,而且教师不可能在其他地方看到过或 听说过这种测验。其次,像大多数这类测验一样,它是对小组实施的测验, 这是出于对所计划的两千多项测验的考虑而定的一个根本要求。①第三,它是 一种完全同类型的测验,因为规定给儿童的任务类型对于小学这一阶段的各 年龄都是相似的。最后,而且也许是在有大量会两种语言的学生的以下层社 会儿童为主的学校中使用弗拉纳根一般能力测验的最重要的理由,即一般能 力测验“旨在提供基本学习能力的测度”(Flanagan, 1960, p. 6),基 本学习能力并不很明显地依赖于读写算这类在学校获得的技能。
小学各个年级使用的一般能力测验有三种形式,分别是为幼儿园至二年 级、二至四年级和四至六年级这三个层次设计的。在幼儿园至二年级这个层 次,由任课教师对所有幼儿园与一年级班的儿童作预测;在二至四年级层次, 对二三年级进行预测;在四至六年级层次,对四五年级实施预测。下一个学 年的复测用的是面向全体儿童的相同水平的测验,这样我们就会期望得到某 种练习效应。然而,练习效应不会对实验组与控制组儿童产生不同影响。我 们还应该记得,在相继的几年中,儿童必须有更好的学习成绩才能保持其 IQ 分数,因为随着儿童年龄的增大,必须提高他们的学习成绩才能保住已有的 位置。
预测两年之后,对儿童又进行复测。这时,那些预测时在上幼儿园、二
年级和四年级的儿童又接受相同的一般能力测验,而那些在一年级和三年级 的儿童则参加比原来高一层次的测验。参加预测的五年级儿童在两年后就不 参加复测,因为他们已是七年级学生,不再在奥克学校了。
无论在哪一个层次,一般能力测验都由两个相对独立的分测验组成,一
个分测验测言语能力,另一个分测验测推理能力。言语分测验题目旨在测量 知识、词汇和概念的水平。下面是幼儿园至二年级层次的一个言语测验题的 例子:一套茄克服、一朵花、一个信封、一个苹果和一玻璃杯水的图片,要 儿童用彩笔圈出“能吃的东西”。尽管对这类测验题的回答取决于儿童是否 能够理解英语,但他们不必像在许多其他智力测验中那样用英语讲、读和写。 推理分测验题目旨在测验理解关系和形成概念的能力。每个题目有 5 幅 抽象线条画,其中有一幅与其他 4 幅有某点不同,并要求学生指出不同之处, 下面是幼儿园至二年级层次上的这样一个题目的例子:4 个四方形和 1 个圆 形,要求学生用彩笔划掉这个圆形。在我们的样本中,推理分测验与言语分 测验分数之间的相关为+0.42,弗拉纳根(1960)在 10 项研究中获得的相关
中位数是+0.43。
两个分测验的实施有重大差异。言语题目大都是大声念给儿童听的,教 师在教室走廊前后频繁走动,看儿童是否都翻到了试卷中正确的页码上。推 理题目由儿童自己作答,但是两个例子例外,这两个例子在学生开始答卷前 由教师在班上作为范例来解答。推理分测验也是在规定时间内进行的。总之, 在实施言语分测验期间的师生交互作用比在实施推理分测验期间多得多。这
① 这种情况的后勤问题要求进行小组测验,而且人们普遍感到,只有后勤问题才能证明进行小组测验是合
适的。然而,可能还有一些更确实的理由赞成采用主考与考生之间个人交互作用较少的小组测验。例如, 当控制主考期望的无意影响变得重要时,第四章中描述的证据表明,小组测验可以比个别测验提供更好的 保护措施。在主考向小组读出指导语期间,主考很难对不同的考生作十分不同的朗读。也许主考更难不以 十分不同的方式对待他的受到个别教育的考生。
一事实我们后面将有机会提到。
智力增长评定
智力增长被界说为儿童的预测 IQ 与后测 IQ 之差。这个基础实验的目的 是要表明,教师特别抱有有利期望的那些儿童是否会比其余的或控制组的儿 童有更大的智力增长。基础后测在实验开始(如下所述)后 8 个月、预测后
1 年进行。 另外还进行两次复测。其一为预测后两年的追踪测验,目的在于了解在
教师有利期望有些影响的情形中,这些影响是否持续至少一年。知道是否持 续是重要的,因为在任何变化实验中,人们都要知道变化是否只是昙花一现。 此外,由于在这个实验中教师是变化的动因,所以重要的是要知道,即使在 儿童离开他们的变化动因而由另一位未曾对任何儿童抱有特别期望的教师来 施教后,任何来自期望的增量是否会保持下来。
另一次复测在基础后测之前而不是在基础后测之后实施。这次复测在第 一学期末进行,介于实施实验性变化计划与基础后测之间。这种初步复测的 目的是要了解,如果这种变化计划产生一些影响,那么,这些影响是在实验 那一年的早期还是晚期产生的。这是很有用的信息,因为它可能表明有利期 望(如果有的话)的益处在这一年中是否逐渐增加了,是否在这一年中没有 进一步变化的情况下发展很快,或者是否表现出一种年初没有任何变化的孕 育效应,随后则是有利期望益处真正的“迟来的增长”。
这一初步的复测与基础后测由持有利期望的任课教师实施,追踪测验也
由任课教师实施,但是这些任课教师是新教师,是儿童升级后的教师,他们 不知道上一学年哪些儿童是实验组的,哪些儿童是控制组的。在理论上说, 如果前任教师告诉了他们,他们就可以知道这些情况。但事实上他们不知道。 尽管前任教师通常都会告诉继任教师接任班级的情况,但前任教师没有一个 告诉他们的继任者班上哪些儿童是实验组的,哪些是控制组的。的确,这种 证据表明,前任教师不可能告诉这些情况,因为他们自己也不知道。对教师 的一次记忆测验表明,他们不能准确回忆,甚至不能从一大串姓名中准确选 出他们自己的学生中被选入实验组的名单。
在参加预测的 500 多名儿童中,参加第一年复测的不到 400 人,部分原
因是有转入他校的学生,部分原因是复测期间有生病的学生。在两年追踪测 验中,参加的儿童不到 300 人,部分出于相同的原因,部分因为参加预测的 整个五年级那时已离开奥克学校进初级中学了。只有那些有预测 IQ 又至少有 一个复测 IQ 的儿童才可以说是参加了这项实验。
复测并未向教师如实说明是复测,而只是说这种测验旨在进一步预示智 力增长。
尽管教师实施了这些测验,但他们不对测验评分。所有测验——预测、 初步复测、后测、追踪测验——都评分两次,而且由助理研究人员独立评分, 他们并不知道哪些儿童是控制组的,哪些儿童是下面所界说的智力变化实验 计划的对象。
智力变化计划
1964 年夏末,对各班已进行了预测。就在教师接任新班级之前,奥克学 校中 20%的儿童被认定是学业上的“激增者”。表明这种认定似乎合理的背 景情况在上一学年的春季就已确定了。现在的任务实际上是着手实施智力变 化计划。
该计划的实施从分发 18 张名单开始。每张名单发给一至六各新年级的教 师以及每个年级的快、中、慢轨班的教师。每个教师得到的名单上都列有 1
到 9 名儿童的姓名,她班上的这些儿童被说成是在奥克学校中属“哈佛习得 变化测验”得分最高的 20%之列。这些名单包括学校儿童中所有属于这 20
%之列的儿童,但是,如果每个教师不知道自己班上的儿童列在这份名单上 的确切数字或百分比,则会感到似乎更为可信。①作为给予他们名单的一个理 由,只是告诉教师,他们可能觉得知道哪些儿童即将“有大发展”是很有趣 的。同时也告诫他们,不要和学生或学生家长讨论测验的结果。
20%子样本的“特殊儿童”的姓名从随机排列的名册中选出。有智力增 长标记的儿童与未作标记的控制组儿童之间的差异只存在于教师的心目之 中。
① 出于相同理由,在每位教师的名单上男孩和女孩的比例允许变动的范围是,最低为所指定儿童的 40%,
最高为所指定儿童的 60%。
第七章 富有魔力的加拉太儿童
本章要回答的基本问题是,在一年或不到一年的时间中,那些被期望有 较大智力增长的儿童,是否会比没有指定的控制组儿童有更大的智力增长。 还有四个重要的附带问题。如果教师的有利期望对儿童的智力发展有益,那 么,哪些儿童从中得益更大:
1.是低年级儿童还是高年级儿童?
2.是快轨、中轨还是慢轨的儿童?
3.是这一性别,而不是另一性别的儿童?
4.是少数民族群体还是非少数民族群体的儿童?
主要变量
年龄
我们文化的民间知识、人类发展的当前理论,特别是心理分析理论以及 发展心理学家、实验心理学家和生态学家的工作一致认为,年龄是决定有机 体能够在多大程度上得以形成、塑造或影响的一个重要因素(Scott,1962)。 一般来说,有机体愈年轻,对社会影响的敏感程度就被认为愈大。科芬
(Coffin,1941)在其经典性的专题论文中断言,易受影响性从婴儿到 7 至
9 岁逐渐增加,而在 7 至 9 岁以后减少。最近,在一篇总结对儿童产生明显 社会影响的证据的文章中,史蒂文森(Stevenson,1965)指出,5 岁儿童的 易受影响性大于 12 岁儿童的易受影响性,这是与科芬的总结相一致的研究结 果。科芬和史蒂文森写作的文章讨论明显社会影响的多于教师预言之微妙的 无意影响,但是,一种更微妙的无意影响因素的影响过程是否也表明年幼儿 童更易受影响,这还是很有趣的问题,值得研究。
能力
我们还感兴趣的是,了解这三轨儿童在他们从教师的有利期望中得益的 程度上是否有所不同。然而,就能力来说,文献材料对我们了解能力方面的 情况并没有多少帮助。史蒂文森(1965)指出,易受社会影响性这一点可能 不太依赖儿童的智力状况,而且我们知道这三轨在平均 IQ 上有很大不同。桑 代克(Thorndike,1966)最近研讨了智力增量,他说,最初的智力状况与智 力状况的变化之间只有中等程度的相关。在本研究中,无论如何,我们感兴 趣的与其说是增量本身,不如说是“特殊”儿童可能表现超出“普通”未被 指定儿童的增量。简言之,我们感兴趣的是各轨在可能发现的期望益处的程 度上的差异,但我们几乎不知道期望什么。这个问题由于下面的事实变得更 复杂了:我们感兴趣的两个变量——性别和少数民族群体身份——和分轨不 是没有关系的。在上一章里我们看到,男孩往往过分集中于慢轨,女孩则往 往过分集中在快轨;奥克学校的少数民族群体,墨西哥人血统的儿童,往往 过分集中在慢轨,很少有在快轨的。
性别
对社会影响过程更敏感的是男孩还是女孩,这取决于影响者是男性还是
女性(Stevenson,1965)。由于奥克学校教师中绝大多数是女性,我们最感 兴趣的是对女性影响者的研究所得出的结果。史蒂文森(1965)总结到,这 些研究结果表明,男孩对社会影响更敏感。然而,如同在儿童年龄情形中一 样,所使用的社会影响过程既不是无意的,也不是十分微妙的。教师期望的 影响可能两者兼有。
少数民族群体身份
我们对少数民族群体身份变量感兴趣的理由无需证明。有关处境不利儿 童的研究文献很多都集中在少数民族群体儿童身上,“处境不利者”几乎就 意味着“少数民族群体”。探讨处境不利的最著名的出版物之一是《少数民 族聚居区的青年》。如果期望益处真的发生,我们特别感兴趣的就是,期望 给少数民族群体儿童的益处是胜于还是逊于非少数民族群体儿童的益处。
在奥克学校,少数民族群体儿童是墨西哥血统的人。然而,在本研究中, 少数民族群体儿童的界说比简单地确定姓名是否为墨西哥人姓名更严格。要 称得上是“少数民族群体儿童”,则儿童本人或者其双亲必须来自墨西哥, 必须在家里讲西班牙语,必须对儿童实施过某些程序的管理。这些程序与另 一研究有关(Jacobson,1966),包括用西班牙语实施 IQ 测验、阅读能力测 验和为儿童本人照像。在墨西哥血统的少数民族群体儿童这个样本内,每个 儿童像“墨西哥人”的程度各不相同。一个与奥克学校或奥克学校儿童没有 任何关系的十人教师小组,根据“儿童有多像墨西哥人”对每张照片作等第 评定。对儿童“实际上”像墨西哥人的程度的确定,是十位教师平均的等第 评定。这些等第评定是很可信的。奥克学校的教师对这些相同儿童的平均等 第评定,和与奥克学校无关的鉴定人的等第评定有 0.97 的相关。
智力增长
各年级的期望益处
表 7-l 的底行表明奥克学校的总结果。在实验的这一年中,没有指定的 控制组儿童的 IQ 增进了 8 分以上,而实验组儿童即特殊儿童的 IQ 增进了 12 分以上。这种增量的差异可归因于 100 次中大约 2 次的机遇(F=6. 35)。
①
① 对实验的设计和分析的更加技术性方面感兴趣的读者将认识到,我们的陈述仿效的是多因素方差分析计
划,兴趣主要集中在实验处理的主要效果上,亦即各年级的实验处理、各轨的实验处理、各性别的实验处 理和少数民族群体身份的实验处理的双向交互作用上。另外还计算了各轨各性别的实验处理、各年级各性 别的实验处理以及各性别的少数民族群体身份的实验处理的三向交互作用。所有其他可能的三向的和更高 级的交互作用得出了一个或更多的样本容量为零的单位或者得出几个样本容量为 N 的单位,但是,由于样 本容量太小,以致即使这样的分析在理论上是可能的,也削弱了对结果的信任。 在所有双向和三向分析中, 每个单位有不等的或不成比例的样本容量 N,而且运用了沃克与列夫(Walker and Lev,1953)的近似解法。 鉴于所有双向交互作用是直接计算出来的,而且也是在一种或多种三因素方差分析中估计出来的,所以应
表 7-1 和图 7-1 的其余部分表明了每个年级两组儿童各自的 IQ 增量。我 们发现,从六年级到一年级期望益处逐年递增;年级与期望益处量之间的相 关(r=-0.86)在 0.03 的水平上是显著的。交互作用效应或在不同年级有 显著的较大期望益处的可能性在 0.07 的水平上(F=2.13)是显著的。(然 而,交互作用对差异的排列并不敏感,这也就是说,p=0.07 是保守数字)
表 7-1 一年后各个年级的实验组与控制组儿童总体 IQ 的平均增量
年级 控制组 实验组 期望益处
级
图 7 - 16 个年级总体 IQ 的增量
在一二年级,教师预言的效应是引人注目的。表 7-1 表明了这一点,表
7-2 和图 7-2 也表明了这一点。在表 7-2 和图 7-2 里,我们看到了一二年 级实验组与控制组儿童取得不同增量的百分比。在这些年级中,大约每隔四 个控制组,儿童 IQ 增加 20 分或更多,但在特殊儿童中,差不多每隔一个儿 童就增加了 20 分以上。
该指出的是,无论什么时候讨论简单的交互作用,F 检验都是基于双向分析而不是三向分析之上,因为双
向分析的每单位较大的样本容量 N 提供了较稳定的估计。然而,当一特定的双向交互作用成了某三向交互 作用的一部分时,原文中表明了这一事实,而且对双向交互作用的解释也作了相应的修正。实验处理的主 要效果当然是在每个方差分析中求得的,而且与 F 检验相联系的 p 值介于 0.05 与 0.002 之间。当我们把班 级作为取样单位(N=17)考虑时,我们发现,在可加以比较的 17 个班的 11 个班中(一个班因疏忽没有 参加推理 IQ 的后测),实验组儿童的总体 IQ 的增量多于控制组儿童。与符号检验、魏尔柯克松配对符号 秩次检验以及相关平均数的 t 检验相联系的单尾 p 值分别为 0.17、0.06 和 0.03。附录表 A-7 提供了所要 的数据,表 A-1 到表 A-6 提供所有班级内在两种实验条件中预测和后测的总体 IQ、言语 IQ、推理 IQ 的 算术平均数、样本容量和标准差。
表 7-2 一二年级总体 IQ 至少增进 10 、 20 或 30 分的百分比
IQ 至少
控制组
实验组
单尾差异 p
增进
N = 95
N = 19
10 分 a
49 %
79 %
0.02
20 分 b
19 %
47 %
0.01
30 分
5 %
21 %
0.04
a 包括增进 20 、 30 或更多分的儿童。
b 包括增进 30 或更多分的儿童。
图 7-2 一二年级学生总体 IQ 增进 10 分、20 分或 30 分的百分比
迄今,我们只是谈了有利期望对总体 IQ 的影响,但弗拉纳根的一般能力 测验分别得出了理智活动的言语和推理领域的 IQ。这些 IQ 彼此很不相同, 所以给出各自的结果并不多余。就言语 IQ 而言,全校控制组儿童增加了不到
8 分,特殊儿童增加将近 10 分,这个差异可能很容易是因机遇造成的。交互
作用项并不很显著(p<O.15),我们不能断言这些年级的期望益处大于那些 年级。但我们现在的确对一二年级学生有特殊的兴趣,这种兴趣并不妨碍我 们详细了解那里所发生的情况。在那些混合年级中,控制组儿童的言语 IQ 增进 4.5 分,而特殊儿童确切地增加了 10 分以上或 14.5 分。如果我们可以
做 t 检验(即便交互作用效应不显著),我们会发现,t=2.24,单尾 P<0.02。
就三至六年级而言,控制组的增量比实验组多 1.6 分,这个差异几乎没 有显著意义。表 7-3 概括了这些结果。①
表 7 - 3 一年后一至二与三至六年级实验组 与控制组儿童言语 IQ 的平均增量
年级 控制组 实验组 期望益处
N
增量
N
增量
IQ 分
单尾 P < 0.05 a
一至二
95
+ 4.5
19
+ 14.5
+ 10.0
0.02
三至六
174
+ 9.6
49
+ 8.0
-1.6
合计
269
+ 7.79
68
+ 9.85
+ 2.06
a
均方等于 316.40 。
① 如果把班级作为取样单位(N=18),我们发现,在 18 个班的 12 个班中,实验组儿童的言语 IQ 增量大
于控制组儿童。与符号检验、魏尔柯克松检验和 t 检验相联系的单尾 P 值分别为 0.12、0.23 和 0.25。附录
表 A-8 提供所要的数据,并表明,一个班中出现了明显的反向,那就是控制组儿童的增量多于实验组儿童 的增量。在提供奥克学校实验的结果中,运用了单尾检验来预测差异。严格遵循单向检验逻辑,并不会使 我们考虑诸如附录表 A-8 中显示的这类预料之外的结果。不过,我们提供了非预期结果的双尾 P 值,使得 那些喜欢完全使用双尾检验的人和那些必得把所有已知单尾 P 值加一倍的人感到方便。
如表 7-4 所示,有利期望的益处更清楚地表现在推理 IQ 上。就整个学
校而言,有利期望的益处是推理 IQ 净增 7 分(F=6.98),而
表 7 - 4 一年后一至二年级和三至六年级实验组 与控制组儿童推理 IQ 的平均增量
年级 控制组 实验组 期望益处
N 增量 N 增量 IQ 分 单尾 P < 0.05 a
一至二
95
+ 27.0 (-)
19
+ 39.6 (+)
+ 12.7
0.03
三至六
160
+ 9.1 (-)
46
+ 15.9 (+)
+ 6.9
0.06
合计
255
+ 15.73
65
+ 22.86
+ 7.13
0.005
a
均方等于 666. 58 。
六年级在期望得益程度上没有显著的差异。①这又是年幼儿童获益最多。
虽然我们并不特别对控制组的 IQ 增量感兴趣,但看来的确值得注意的是,甚 至控制组的年幼儿童在推理 IQ 上也有这样大的增量。表 7-1 表明,控制组 儿童的总体 IQ 有大幅度的增进,而且不只是年幼儿童,我们原来期望练习效 应在这个年龄最为显著。这一问题尚无定论(我们将在下一章中再回到这个 问题上来),但可以说,实验对儿童是有益的,即便儿童处于无处理的控制 组也得益。
各轨与各性别的期望益处
没有统计检验表明三轨在得益于教师有利预言的程度上有任何差异。这 是就总体 IQ、言语 IQ 和推理 IQ 而言。当整个学校在总体 IQ 与推理 IQ 上 受益时,所有三轨都受益;当整个学校的受益不多时,像在言语 IQ 中,没有 一轨表现很多受益。就所有三种 IQ 测度而言,中轨即较一般的儿童在被期望 有智力增长时往往受益最大,但这种差异很可能因机遇造成。
在总体 IQ 上,被期望有智力激增的女孩得到的益处略胜于男孩。但要了
解真正的情况,我们必须查看男孩和女孩在两类 IQ 上获得的期望益处。表 7
-5 表明了实验组与控制组的男孩和女孩在所有三类 IQ 上的增量。在言语 IQ 中,表现出期望益处的是男孩(交互作用 F=2.13,P= 0.16);在推理 IQ 中,表现出益处的是女孩,而且益处很大(交互作用 F=9.27,P=0.003)。 为什么会是这样,还不清楚。在预测中,男孩的言语 IQ 高于女孩(4.4 分), 女孩的推理 IQ 高于男孩(8.5 分)。显然,每组从教师预言中得益较多的是 在他们已稍占优势的理智活动领域。①
① 如把班级作为取样单位(N=17)考虑,我们发现 17 个班中有 15 个班产生了有利期望的益处。与符号、
魏尔柯克松和 t 检验相联系的单尾 P 值分别是 0.001、 0.003 和 0.003。附录表 A-9 给出了必要的数据。 言语 IQ 与推理 IQ 中表现出来的期望益处(表 A-8 与 A-9)之比较表明,在 17 个班的 14 个班中,推
理 IQ 中表现出来的益处大于言语 IQ。与符号、魏尔柯克松和 t 检验相联系的双尾 P 值分别是<0.02、<
0.05、<0.20。
① 这一脚注将有助于阐明自然的复杂性和行为研究者不可自满的需要。与朱迪·埃文斯(Judy Evans)一道
总体 IQ
表 7 - 5 一年后实验组与控制组的男女儿童 在三种 IQ 分数上的平均增量
控制组 实验组 期望益处
N 增量 N 增量 IQ 分 单尾 P < 0.06
+ 12.5 + 2.9
+ 12.0 + 4.7 0.04
男孩 136 + 8.4 (-) 34 + 13.9 (+) + 5.6 0.06
女孩
133
+ 7.2
34
+ 5.8
- 1.4
推理 IQ
男孩
127
+ 19.2
32
+ 15.3
- 3.9
女孩
128
+ 12.3
33
+ 30.2
+ 17.9
0.00002
前面已提到过,期望益处并不取决于安置在三轨中的哪一轨。当我们分
别考察三轨中男孩和女孩的期望益处时,这一结论就得修正。只是在推理 IQ 上,教师期望在统计上有显著的影响(三向交互作用 F=3.47,P<0.04)。
表 7-6 表明了三轨中每一轨的实验组男女儿童在推理 IQ增量上超出控制组
男女儿童的量。我们已经知道,在推理 IQ 上,女孩的期望益处更大,而且从
表 7-6 中我们看到,在中轨即比较一般的儿童轨,情况更是这样。
进行的一项研究得出的初步结果恰恰相反,而且具有同等显著的概率水平。埃文斯在中西部一个小镇的两
所小学中重复了与在奥克学校所做的相同的基础实验。奥克学校的学生来自下层阶级社区,而这两所小学 的学生来自一个富裕的中产阶级社区。奥克学校的学生总体包括很大一部分少数民族群体成员,而这两所 中西部小学则没有。奥克学校的平均预测总体 IQ 是 98,而这两所中西部小学的平均预测总体 IQ 为 105。 在把“特殊”儿童名单给教师后 8 个月,进行复测,这两所小学的研究结果十分相似,这些结果可以合理 地并在一道。结果发现,无论是男孩还是女孩,在总体 IQ 或言语 IQ 上都没有表现出期望益处。然而,在 推理 IQ 上,结果与在奥克学校发现的情况相反。在这两所小学中,受益于教师有利期望的是男孩。那些 被期望会有大发展的学生的 IQ 增进了 16 分以上,而控制组男孩的 IQ 的增量不到 9 分。在女孩中,控制组 儿童的 IQ 增进了大约 15 分,而实验组女孩的 IQ 只增进了 5 分多(交互作用 F=9.10,P<0.003)。在这 两所小学中,正如在奥克学校一样,男孩的预测言语 IQ 高于女孩,而女孩的预测推理 IQ 高于男孩。所以, 在这些中产阶级学校中,如果说每一性别的儿童都在他们稍占优势的领域从教师有利的期望中受益最多, 这是不正确的。在撰写本书时,对这两项研究中出现的这种戏剧性的而且统计上十分显著的不一致一时还
难以作出解释(P=0.00004)。但现在我们确实知道,奥克学校的结果像所有行为实验的结果一样,没有 普遍性。
表 7-6 一年后实验组男女儿童的推理 IQ 增量超出控制组男女儿童的量
轨
男孩
女孩
快
- 2.6
+ 9.1
中
- 12.0
+ 42.0a
慢
- 0.3
+ 12.5
合计
- 3.9
+ 17.9
a = 0.00003 ,单尾。
我们还知道,女孩过多地集中在快轨。这些是聪明的女孩,对她们的期
望已经很多。奥克学校的慢轨的女孩往往相对地很迟钝,而且我们知道,只 有极少数女孩安置在慢轨,她们才是对奥克学校教师的真正挑战。中轨女孩 极少说及,教师往往发现她们兴味索然;对她们智力原有的期望既不像快轨 那么有利,也不像在慢轨中那么十分不利和有挑战性。也许导致更大的收益 增量是在给予教师对这些儿童的有利期望时,而不是给予教师对其他轨的女 孩的期望时。这是对一般轨中教师的有利期望对女孩的智力增长有较大影响 的一种可能的解释。为什么增长在推理 IQ 上突出,还不清楚,但我们的确 知道,就这一实验中的女孩而言,当教师预言有益处时,这些益处往往发生 在理智活动的推理领域。
学生的性别证明是使三轨中所发现的期望益处复杂化的一个因素。与四
个高段年级的年龄较大的儿童相对比,性别还使在一二年级的年幼儿童中发 现的期望益处量复杂化了。表 7-7 表明了实验组儿童的 IQ 增量超过控制组儿 童增量的分数。这些期望益处分数分别表明了高低年级段男女儿童在三个 IQ 测度的每一个测度的情况。就总体 IQ 而言,尽管低段年级的“特殊”男孩的 确因被期望有智力上的增长而得益,低年级女孩的 IQ 因有利期望而获得的增 量却将近是男孩的三倍(三向交互作用 F=2.96,P=0.09)。就言语 IQ 而 言,无论是哪个年级,男女儿童在得益于有利期望的量上没有差异(三向交 互作用 F<1),尽管如我们早些时候所了解的,低段年级男女儿童得到的帮 助多于三至六年级的儿童。在推理 IQ 上,不同年级的男女儿童表现出十分不 同的期望益处量。高年级的男孩成绩较好,与低年级女孩形成对照,当女孩 被期望学得更好时,她们的成绩果然较好(三向交互作用 F=8.14,P<
0.005)。这种效应大都是由于一二年级实验组的女孩非常的表现所致,她们
的 IQ 增量比一二年级控制组女孩的增量高 40 多分。
总体IQ
表 7-7 一年后两个年级层次实验组男女儿童在三 个 IQ 分数增量上超出控制组男女儿童的量
男孩 女孩
一至二年级
+ 6.1
+ 17.1 b
三至六年级
+ 2.3
- 0.1
言语IQ
一至二年级
+ 10.8a
+ 9.5
三至六年级
+ 2.8
- 5.8
推理IQ
一至二年级
- 10.7
+ 40.4 c
三至六年级
+ 3.6
+ 10.0a
a p < 0.05 ,单尾(或 0.10 ,双尾)。
b p < 0.0002 ,单尾。
c p < 0.00002 ,单尾。
总结我们涉及学生性别这一因素的有点复杂的研究结果,我们可以最简
单地说,当被期望有某种未加规定的大发展时,女孩在理智活动的推理领域 增长更多,男孩则在言语领域增长更多。而且,这些增量更可能显著地发生 在低年级。低年级对作出预言的教师的无意影响的敏感性较大,这并不特别 令人惊奇。所有各方面的证据往往表明,对影响过程的各种形式更加敏感的 是年幼儿童。抱有利期望的教师的影响可能并不是那么十分不同。为什么当 期望有智力上的增量时,男孩在言语 IQ 上增进较多,而女孩在推理 IQ 上增 进更多?这不容易解释得清楚。我们在前面的确提到了这种可能性:儿童在 他们往往首先就稍占优势的那些理智活动领域得益于模糊的教师期望较多。 奥克学校的男孩在预测言语 IQ 上高出女孩 4 分以上,女孩则在预测推理 IQ 上高出男孩 8 分以上。
少数民族群体身份的期望益处
在总体 IQ、言语 IQ,尤其是在推理 IQ 上,少数民族群体儿童比其他儿 童更得益于有利期望,尽管这种差异在统计上并不显著。
每一个墨西哥血统的儿童的期望益处的量等于其 IQ 增量与其所在班中 控制组儿童的 IQ 增量之差。①然后,把得出的期望益处的量与儿童面部的“墨
① 每个班级中的所有控制组儿童都被用作比较的依据,而不仅仅是用墨西哥血统的儿童作比较的依据。这
样做是为了得出一个更准确的控制组增量的估计数。在一些班级中,墨西哥血统的儿童太少了。在控制组 儿童中,墨西哥血统的儿童与非墨西哥血统的儿童的 IQ 增量之间有高的等级相关,在 15 个可作比较的班
西哥人特征”关联起来。表 7-8 表明用总体 IQ、言语 IQ 和推理 IQ 来限定期 望益处时在墨西哥血统的男女儿童中获得的相关。在总体 IQ 和推理 IQ 上, 那些看来更像墨西哥人的墨西哥血统的男孩比看来不大像墨西哥人的墨西哥 血统的男孩更得益于教师的有利期望。这些研究结果还没有清楚的解释,但 我们可以推测,教师实验前对看上去更像墨西哥人的男孩的理智成绩的期望 可能最低,这些儿童可能因教师心目中有较有利的期望而获得最大增量。
表 7-8 一年后墨西哥人的面部特征与 有利期望的益处之间的相关
男孩 女孩 总体
N
r
N
r
N
r
总体 IQ
7
+ 0.70a
9
- 0.14
16
+ 0.27
言语 IQ
7
+ 0.54
10
- 0.11
17
+ 0.21
推理 IQ 7 + 0.75d
a P = 0.08 ,双尾。
d P = 0.05 ,双尾。
讨论
我们详细描述了这项实验的结果,这些结果提供的进一步证据表明,一 个人对另一个人行为的期望可以充当一种自我实现的预言。当教师期望某些 儿童表现出较大的智力发展时,这些儿童果然表现出较大的智力发展。就实 验的基础年份而言,自我实现的预言主要在低年级很明显;要确定为什么会 这样是困难的。人们提出了许多解释,但是这些解释并不是互不相容的。
第一种解释认为,年幼儿童一般被认为是更可塑的、不大定型的、更易
变化的、更易受关键期影响的(Scott,1962)。于是,仅仅因为年幼儿童比 年长儿童更易变化,我们所做实验的实验条件对年幼儿童就更有效。(应该 回想得起,我们这里所说的变化是指相对于控制组变化的变化。表 7-1 表明, 甚至五年级儿童在 IQ 上也能发生显著的变化,但是五年级实验组儿童的变化 并不比控制组儿童的变化大。)
第二种解释是,某一学校内的年幼儿童在学校里得到的充分确认的声望 不大。因此,告诉教师年幼儿童将表现出智力增长,教师感到比较可信。教 师可能根据儿童的声望非常“了解”某个年龄较大的儿童,因而不大容易仅 根据别人的说法就相信这个儿童智力上会有所增长。
第三种解释在某种意义上是前两种解释的综合。它认为,年幼儿童表现 出与教师期望相联系的较大的增量,不是因为他们必然是更可塑的,而是因 为教师相信他们是更可塑的。
级中,相关为+0.74(p <0.003)。而所有儿童的 IQ 增量与纯粹墨西哥血统儿童的 IQ 增量之间的对应相
关为+0.90(p <0.001)。
第四种解释认为,年幼儿童更敏感于而且更易受教师借以传递期望的特 定过程的影响。根据这种解释,如果教师相信儿童能够获得智力增量,则教 师可能以相同的方式对所有年级的儿童作出反应。但也许只是年幼儿童的成 绩受教师对他们说的某些特殊东西的影响,受教师对那些期望有较大智力增 长的儿童的说话的特殊方式、一举一动的方式的影响。
第五种解释认为,教师期望的影响在低年级更有力,这不是因为与儿童 年龄相联系的任何差异,而是因为与一些有关的取样的“误差”相联系的差 异所致。因此,低年级儿童的家庭可能与高年级儿童的家庭有彻底的不同。 第六种解释也认为,归因于教师期望的年幼儿童的较大的 IQ 增量,是取 样“误差”的结果,但这次误差不在儿童的取样而在教师的取样。情况可能 是在各种不同的人口统计、智力和个性变量上,年幼儿童的教师与年长儿童 的教师可能十分不同,以致教师可能(1)更相信“特殊”儿童方面的信息,
或者(2)已是向儿童传递对他们成绩的期望的更有效的传递者。 有某种证据表明,奥克学校的低年级教师确实与高年级教师不同。两位
很熟悉全体教师的行政人员根据教师的总效能对各个教师作了等第评定。这 两位行政人员的等第评定很一致(r=+0.88),而且尽管有许多例外,低年 级教师都被这两位行政人员判定为更有效的教师(效能与所教的年级之间的 平均相关 r=-0.57,p<0.02)。
只有年幼儿童一年后得益于教师的有利期望,这一研究结果才有助于我
们更好地理解克利福德·皮特(1956)和查尔斯·弗劳尔斯(1966)(见第 五章)这两位实验者的研究结果。我们记得,皮特把他五年级男孩的样本划 分为三个组。在一个组,把人为地加了 10 分之后的男孩的 IQ 分数告诉教师; 在另一个组,把减少了 10 分之后的男孩的 IQ 分数告诉教师;在第三组,把 男孩的实际 IQ 分数告诉教师。皮特发现,在学年末,教师得知有关他们学生
IQ 的虚假信息对学生的学业成绩没有任何影响。
我们自己研究的结果表明,一年后,五年级学生可能没有表现出教师期 望的效应,尽管一二年级学生表现出了教师期望的效应。然而,皮特的研究 与我们自己的研究在许多方面大不相同,难以直接比较。例如,皮特没有复 测儿童的 IQ 本身,而只是复测了学业成绩。也许更为重要的事实是,皮特所 选的教师在知道学生 IQ 分数前近两个月就认识了他们的学生。教师有了一段 很长的时间足以对学生成绩形成实际的期望,这种期望比增减 IQ 分数引起的 期望更为有力。
弗劳尔斯实验的未能确定的结果与我们自己得出的数据也不能直接加以
比较。弗劳尔斯的学生是年龄大的儿童(七年级学生),而且每个儿童都受 教于许多不同的教师,而不仅仅是一个教师。也许教师期望的效应由于分配 在许多教师身上而被冲淡了。就弗劳尔斯的研究而论,我们也必须记住,人 为地标明为更聪明的班级所配备的教师与配给控制组的教师是不同的。所 以,控制组与实验组之间的任何差异都可能是由于配给各班教师的素质之差 异造成的。
一打富有魔力的儿童
实验研究、定量研究、行为研究常常付出的一个代价是,没有直接意识 到其行为被研究的那些人。为便于我们确定和描述人这个要素以及奥克学校
实验的定量测量单位,让我们略为详细地描述奥克学校儿童的学校行为。在 教师对其智力抱有利期望的儿童中选出 12 个儿童(男女各半)分别加以描 述。
由于教师有利期望的效应只是在一二年级显著,所以,要描述的年幼儿 童都选自这两个年级。在所选择的儿童中,每一性别都包括了两个一年后总
体 IQ 有最大增量的儿童,两个增量中等的儿童,和两个增量最低的儿童。标 明每一个儿童的预测 IQ、后测 IQ 与增进分数,以及儿童在实验这一年是一 年级还是在二年级。描述本身根据的是对每个儿童的个人了解和学校记录, 姓名当然是虚构的而且改变了某些细节以确保匿名性。
最高增量
马里奥 预测 IQ:133 后测 IQ:202
IQ 增量:+69 年级:2
马里奥是位高个、英俊的白肤金发蓝眼的意大利人和北欧人的后裔。他 是两个男孩中的老大,父亲是半熟练的产业工人,母亲是打字员。马里奥和 弟弟在白天由他们只会讲意大利语的祖母照管。自马里奥进入奥克学校幼儿 园以来,全家就一直住在同一幢房屋中。
在一年级,马里奥没有学业上的问题,但在二年级初,他在掌握词汇和
朗读上遇到了困难,他写的印刷字体中有许多字母被写反了。到第二年末(这 一年他被指定为“有大发展的学生”),他的阅读技能有了改进。他的三年 级教师发现,他在作文中很好地表达了自己的思想。他还开始接受言语治疗, 以克服从前没有注意到的缺陷。在他升到四年级时,对他的评语是,他是一 个认真负责、一丝不苟的学生,不应强迫他学得更快。三年级期间注意到他 有点坐不住。在三年级,教师并不知道他是个“特殊”儿童,所以很容易作 出这样的推测:他相对地较少受到挑战,因而变得比较厌烦。这种推测是可 以成立的,因为在某种历史上说,我们对每一个儿童都了解很多,但同时这 种推测又有助于阐明历史重建的冒险性。我们永远不会知道这种推测是否有 价值。
家长会议记录表明,当告诉马里奥的家长马里奥在二年级初有阅读问题
时,他们便努力在晚上帮助他。家长对他的学业进步表现出兴趣和关注。当 他所在班级演出由他创作和导演的一个简短的独幕剧时,他母亲请假去观看 了演出。
马里奥不苟言笑,是个严肃的男孩。他与班上同学友好相处,从未有被 叫到办公室去受训。他看上去沉着冷静和成熟。
自从一年级以来,马里奥一直在高能力组(快轨),而且显然将继续留 在高能力组。
何塞 预测 IQ:61 后测 IQ:106
IQ 增量:+ 45 年级:1
何塞是个漂亮的墨西哥血统的男孩,讲话带点西班牙口音。他的父亲是 熟练的铸造工人,母亲是肉类包装工人。父母都出生在墨西哥。何塞的母亲 参加了工作,这在该社区的墨西哥人家庭中是不多见的。何塞只有一个弟弟,
这也是不多见的。一位讲西班牙语的大妈是他们婴儿时的临时保姆。自何塞 上奥克学校的幼儿园以来,全家就一直住在两幢房屋中。
何塞因幼儿园教师的建议进了一年级的低能力组,二年级还是在低能力 组,但是到三年级时他将进中等能力组。
何塞的一年级教师发现他渴望学习。就在这年他被指定为“有大发展的 学生”。他取得了良好的进步,但起点低,所以还得进一步努力。他的二年 级教师说,他注意力集中、谦恭和友好。他想在二年级尽最大的努力去学习。 家长会议记录表明一年级没有举行过家长会议。在二年级,何塞的母亲 希望他能升到中等能力组。在他升到三年级时,对他所作的评语指出,他对 阅读表现出了很大的兴趣。他母亲晚上听他朗读。在二年级结束前三个月他
开始阅读一本二年级读物,并将在三年级中班继续读这本书。 何塞有点孤僻,但看来没有社交问题。他看上去文静和安稳。他从没有
被叫到办公室受训斥。 玛丽亚 预测 IQ:88
后测 IQ:128
IQ 增量:+40 年级:1
玛丽亚是个活泼的小女孩,白肤金发蓝眼。墨西哥祖籍的儿童有她这样
浅淡肤色的不多见。她不讲西班牙语但听得懂家庭中的简单用语。她走起路 来像跳舞,而且在她走动时,小巧的金耳环亮光闪闪。她家有五个小孩,她 排行第四,是家中最迷人的孩子。她父亲是位仓库保管员,母亲是家庭主妇。 自她上奥克学校幼儿园起,全家就一直住在同一幢房子中。
玛丽亚因幼儿园教师的建议进了一年级中班。在一年级开始时(在一年
级她被指定为一位潜在的有大发展的学生),教师发现她是位细心、认真负 责的学生。她很明显具有非同寻常的艺术才能,教师向她母亲建议,进专门 的艺术班对她是恰当的。教师在一年级结束时写的评语指出,该儿童除算术 以外,其他所有学科都学得不错。她卓越的艺术才能得到了注意。在升级时, 她被建议进了二年级高能力组。
二年级的进步开始时很一般。阅读理解能力似乎有点不行。二年级末,
玛丽亚的阅读能力大大提高了。她的算术也学得很不错,而且她的学习总的 提高很快。
家长会议记录表明,家长对玛丽亚的进步很感兴趣,而且对她在二年级
进入高能力组很满意。当她在二年级遇到麻烦时,母亲答应在家里帮助她提 高阅读能力。
玛丽亚不调皮,但不能认为她羞怯。她的艺术作品很受成人的表扬,这 样年幼的儿童有这样的艺术作品是异常好的。在课间休息时,她主要与比她 大一岁的姐姐玩耍。家庭关系似乎密切。
维奥莱 预测 IQ:60 后测 IQ:97
IQ 增量:+ 37 年级:1
维奥莱是个削瘦、结实、顽皮的小姑娘。她有一对黑黑的小眼睛,头发 剪得像男孩,因为她的头发卷得无法梳理。她的祖先是法国人和葡萄牙人, 但家人只讲英语。维奥莱在 6 个孩子中排行第五,他们大多上奥克学校。自
维奥莱上幼儿园以来,全家就一直住在同一幢房子中。她父亲是屠夫,母亲 是家庭主妇。父亲因婚姻冲突不时外出。每当吵架时,她父亲就来到学校, 诉说他的问题并每日检查孩子们的上学情况。当他是全家之一员时,他常常 去孩子们的教室看看。他对孩子的兴趣不时给学校工作人员增添麻烦。例如, 维奥莱得到了父亲强有力的鼓励要勇于进取,她在运动场上像只小老虎。此 外,她的语言时常与一个小女孩的身分不相称。她常常因好斗或对任课教师 与游戏课教师的对抗性行为而被送到办公室挨训。
维奥莱开始是在一年级低班,二年级时仍将在低班,而且三年级仍将在 低班。她的一年级教师评论到,维奥莱注意力分散、爱吵闹、不听话,但当 她注意力集中时,所作反应良好。在一年级,她就被指定为潜在的成绩激增 者。二年级教师批评了她在不能为所欲为时所表现的那种闷闷不乐的态度。 在二年级初,教师评论到,她对阅读没有兴趣,但她努力的话还是能够学好 的。在二年级末,教师对她的评语是,她在尽最大努力搞好阅读,在艺术上 她是一个有能力、富有创造性的儿童。
维奥莱在课堂里和在运动场上都有情绪和行为方面的问题。她与其他儿 童的关系不很好。她在学校与比她大一岁的姐姐的关系从密切保护转为相当 任性的对抗行动,如咬、抓、踢。她对学校工作人员的态度有点受她父亲的 影响。她父亲常常在教室和办公室说奥克学校教师应对他两个孩子的学业成 绩不佳负责。她母亲很少到学校去。她看上去文静、顺从,而且有点羞怯。 维奥莱的父亲说,他的妻子既不会读也不会写,他的孩子一定是继承了这些 素质。对学校工作人员来说,她父亲是一位十分有趣但又十分使人恼怒的人 物。维奥莱似乎在步其父亲而非其母亲的后尘。
中等增量
康斯坦丁 预测 IQ:116 后测 IQ:137
IQ 增量:+21
年级:1 康斯坦丁是个瘦小、温和、逗人喜爱的男孩,他的每一位教师都很喜欢
他。他祖籍希腊,懂希腊语。自上奥克学校以来,他就与父母住在同一幢房
屋中。他父亲是半熟练工人,母亲是熟练教师。他是独生子。 教师在一年级头几个月所作的记录表明,康斯坦丁在技能方面表现很不
错。他喜欢独处。这年他被指定为潜在的有大发展的学生。圣诞节后,他从
中等水平跃至一年级的高水平。他的新教师评论到,他在各方面都学得很好, 而且对转入高水平很适应。他依然是个“孤独者”,课间休息时他喜欢与教 师谈话而不是玩。
他的二年级教师发现,康斯坦丁很有音乐禀赋。他在阅读上进步很大。 家长会议记录表明,康斯坦丁的父母没有出席一年级会议。二年级会议 记录指出,他母亲答应带他去图书馆,但却要求教师鼓励他多参加体育活动。 康斯坦丁喜欢与成人交往。他不大喜欢同其他儿童打闹或放肆玩耍。他
有点胆怯,但当他感到有被人接受的自信时,他可以无拘无束地谈话。 凯西 预测 IQ:105
后测 IQ:125
IQ 增量:+20 年级:2
凯西是位很羞怯、发育快的瘦长的女孩。她脸上长有雀斑,有一双蓝眼 和一头松软的长发。凯西还没有发育完全。她在家里的三个女孩中是老大, 父亲是消防队员,母亲是家庭主妇。自从她在一年级的学期中间进入奥克学 校以来(当时她在高能力组),全家就一直住在两幢房屋中。
教师的评语指出,凯西在家有点娇生惯养,据说她讨厌多种食物。她的 一年级教师发现她注意力不集中和幼稚。在二年级(在这一年级她被指定为 潜在的成绩激增者),教师注意到她怕羞,但也注意到她的自信心在逐渐增 强。二年级开始时,凯西表现出缺乏算术理解力。到年末,她的算术有了改 进。凯西对她所阅读的东西不大理解。三年级教师注意到,她在算术、书法 和理解上仍然有些问题。
家长会议记录指出,凯西的父亲每次都出席了会议。他显然最渴望她在 学校中取得成功,因为他自己在学校中没有取得成功。他承认他对她没有耐 心,所以帮助她做家庭作业的是她母亲。学校一直要求她父亲在她完成了作 业时予以表扬,而不要因为她“慢吞吞”就批评她。
凯西很害羞。与她打招呼时她会满脸通红,向她笑时她会低头盯着自己 的鞋。然而,她与同伴没有社交方面的问题。羞怯似乎只在同成年人打交道 时才有。由于她父亲就凯西明显害怕选修课教师拜访了校长,故办公室里的 人都知道了她。由于这个儿童显然是因成人的注意而苦恼,所以要了解她是 很困难的。
贝齐 预测 IQ:95
后测 IQ:113
IQ 增量:+18 年级:1
贝齐是个顽皮、爱挑剔的小女孩,有双黑眼睛和长长的棕发。她有两个
姐姐和几个异父弟妹。她和姐姐最近才被继父收养。她们用他的姓,因为他 们不想要一个与其母亲和弟妹们不同的姓。贝齐自上奥克学校幼儿园以来就 一直住在同一幢房屋中。她的继父是管理人员,母亲是家庭主妇。
贝齐因幼儿园教师的建议进了一年级高能力班。她的一年级教师在年初
注意到(这一年她被指定为潜在的有大发展的学生),她是个认真发奋的学 生,并正在取得令人满意的进步。她的二年级教师发现她做起事来太快。贝 齐对科学有强烈的兴趣。二年级末的评语说,她很能干,但需要鼓励,否则 她就会松懈下来。
家长会议记录指出,贝齐的母亲对她的进步很感兴趣。她帮孩子改进学
习习惯,当孩子有了改进时她就十分高兴。贝齐是个欢快的孩子,不关心学 校,亲切而友好。她没有纪律上的问题。她所关心的看来主要是社交方面的 事情。
托尼 预测 IQ:109 后测 IQ:123
IQ 增量:+ 14 年级:2
托尼是个黑眼睛、胖乎乎的小男孩,门牙很大,脸颊红润,面带微笑。 托尼在家里的两个孩子中排行最小。许多人都会说他的父母和姐姐“漂亮”, 托尼也的确很帅。自进奥克学校幼儿园以来,他一直住在同一幢房屋中。他 父亲在制造业工作,母亲是家庭主妇。在一起生活的还有一位讲意大利语的
祖母。
托尼因幼儿园教师的建议上了一年级高能力班,而且以后一直在高能力 班。他的一年级教师发现他是一个极守规矩的儿童,他的词汇量异常地大。 一年级他常常哭鼻子。在二年级(这年他被指定为潜在的成绩激增者),他 的自我控制能力增强了,尽管他仍旧寻求教师的表扬和指导。教师在二年级 末的记录中指出,托尼在家和在学校都缺乏责任感。在三年级,他的学习习 惯看上去很差。他完成布置的作业有困难。
家长会议记录表明,他的父亲不要托尼在家里帮助干“妇人的家务活”。 这位年轻人很可爱但没有责任感。他的成绩中等偏下,但他的潜力显然 没有充分发挥出来。他似乎在学校感到安全,并且比在家里显得更加成熟。
最低增量
路易丝 预测 IQ:101 后测 IQ:114
IQ 增量:+13 年级:2
路易丝是位白肤金发碧眼而又严肃的高个女孩,她显得异常成熟。就她 的态度和责任感看,她不像儿童,她很可靠。自上奥克学校幼儿园以后,路 易丝、弟弟和他们的父母住在一幢公寓里,直到她二年级末举家迁离该镇。 她父亲是宇航技术专家,母亲是家庭主妇。
幼儿园教师建议她上了一年级高水平班。在二年级,她还是在高水平班,
并在这一年被指定为潜在的有大发展的学生。 有关路易丝的一些学校记录被送到了新学校,所以在奥克学校找不到教
师对她的评语。不过,办公室人员都知道她,她经常被办公室雇作信使。办
公室人员发现她可靠、勤奋、严肃,而且讨人喜欢。她不苟言笑,总是忙于 生活事务。当然,她的成绩是优异的。路易丝可能认为没有任何东西是不令 人满意的。
帕特里夏 预测 IQ:89
后测 IQ:90
IQ 增量:+1 年级:2
帕特里夏是个短脸型、个高、体重的儿童。她爱笑,性情开朗,常常咯
咯地发笑。她在家里 4 个女孩当中排行最小。自她上奥克学校幼儿园以来, 全家一直住在同一幢房屋中。她父亲是推销员,母亲是出纳兼侍应员。
在帕特里夏的学校记录中几乎没有教师的评语。一二年级时,她在中等 水平组,但在二年级时她的成绩明显地超出了平均水平,所以在三年级时她 升到了高水平组。在二年级,她被指定为潜在的成绩激增者。
家长会议记录也很缺乏,这也许是因为帕特里夏母亲工作繁忙无法出席 会议,或者也许是因为她母亲不关心,这种情况一直到帕特里夏上三年级时 举行的电话会议才改变。那时,她母亲得到通知,帕特里夏学习有点马虎, 尽管她总的进步是令人满意的。
帕特里夏没有表现出特别问题——学业的、个人的或社交方面的。她给 人的印象是快乐和适应能力强。
道格拉斯 预测 IQ:111 后测 IQ:107
IQ 增量:-4 年级:2
道格拉斯是位黑皮肤、高个、瘦细的男孩,他总是收拾得漂漂亮亮。他
有 4 个姐姐和 1 个弟弟。自他入奥克学校幼儿园以来,全家就一直住在同一 幢房屋中。他父亲在家干个体经营,别人不知道他父亲的身份,他母亲是秘 书。
道格拉斯显得十分害怕一年级和二年级的教师。在第一年中期,由于他 在一年级的良好成绩而从低水平组进入中等水平组。整个二年级和三年级他 都在中等水平组。在二年级时,他被指定为潜在的有大发展的学生。教师的 评语是,他做事粗心,作业草率。
家长-教师会议记录表明,道格拉斯的母亲总是出席了会议。当他在二年 级时,她就担心也许他进不了中等水平组。看来她对他的进步很满意,并且 从不对他施加压力。
道格拉斯是位离群索居、沉默寡言的儿童。他与同伴友好相处,但不参 加富有挑衅性的游戏。办公室人员对道格拉斯的了解还不如对他母亲的了 解。
胡安 预测 IQ:123 后测 IQ:117
IQ 增量:-6
年级:2 胡安是个绿眼睛、瘦小的黑男孩,他有语言方面的缺陷,但不大明显。
自入奥克学校幼儿园以来,他就与父母亲、妹妹和弟弟住在同一幢公寓。胡
安的父亲是技术工人,母亲是家庭主妇。胡安是葡萄牙人和墨西哥人的后裔, 但在家里只讲英语。
按照教师的评语,胡安自入校起就一直是模范儿童。在一年级,他显得
有点胆怯,但不久就胆壮了。二三年级教师发现他的学业不错,表现出色。 在二年级时,他被指定为潜在成绩激增者。作为一个小男孩,他异常整洁和 细心。他显然不满于纠正他的语言,但在其他方面,他能很好地遵循学校的 各项要求。
家长-教师会议记录表明,胡安的母亲对他显著的进步感到高兴。她所关
注的是,他仍在上口语班,而口语班可能使他形成了急躁的情绪。 胡安是个追求完美的小家伙。他的教师发现他是个好孩子,但并不特别
惹人喜爱。他在学校里似乎没有充分表现出他的“个性”,这是值得注意的,
因为他的弟弟富有魅力和感染力,受到教师的广泛喜爱。胡安始终在高水平 组,而且可能继续在快轨。
一些感想
这些儿童大概可以代表奥克学校的儿童。12 个儿童中,有些首先就很聪 明,有些则不很聪明。1/3 的儿童懂一点外语。有几个人是非盎格鲁撒克逊 人。他们来自大小不一的家庭。其中有两个儿童显然可以被说成是教育处境 不利者,而且这两个人的智力增量最高。尽管所作的叙述简短,但还是产生 了一些感想。
使用个案履历、传记和轶事来检验科学假设通常不是最有用,但它们在
形成这些科学假设时却特别有用。例如,在前面的叙述中,给我们印象很深 的是贯穿于那些从教师的有利期望中得益最多的儿童的经历之中的两条线。 他们的父母似乎对他们的学业进步特别有兴趣,①而且,这些儿童常常被描述 为外表极有吸引力的儿童。我们不是要检验这些假设,而是要更清楚地系统 阐述这些假设,对 12 个儿童中的每一个儿童,都根据其父母对他们的学业感 兴趣的程度以及根据他们外表的吸引力作出等第评定。这些等第评定是由很 了解儿童的本书作者之一作出的。评定者对每个儿童表现出来的 IQ 增量的大 致了解,可能影响等第评定。然而,对这类告诫的考虑,看来在形成未来要 加以检验的假设中不如在对假设的实际检验中重要。
这 12 个儿童中 IQ 增量与家长兴趣的相关是+0.40,IQ 增量与外表吸引 力的相关是+0.48,这些变量之间的相关则为+0.43。这几个相关中没有一 个甚至在 0.10 的水平上具有显著的统计意义。当家长的兴趣与外表吸引力的 等第加在一起并重新作等第评定时,这一新结合的变量与 IQ 增量的相关达+
0.62(P<O.04,双尾)。按这种结合的变量,等第评定最高的 6 个儿童的
IQ 平均比等第评定最低的 6 个儿童多增进 20 分以上。然而,这 6 个等第评 定最低的儿童的 IQ 仍然比一二年级的一般的控制组儿童多增进了 7 分以上。 所有儿童而不只是那些被期望有特殊增长的儿童,在家长对他们的学业 比较感兴趣而且他们的外表又比较有吸引力时,智力增进是否就更多,了解 这一点是很有趣的。大概在较早年级,这样一种结合既是最有帮助的,而且 也是最可能发生的。儿童有吸引力的外表和家长的兴趣不可能年年都有显著 的变化。要是有的话,有吸引力的外表与家长的兴趣可能从入学的第一天就
表现出来了。
① 布鲁科弗、艾里克森、哈梅切克、乔伊纳、莱佩里、帕特森与托马斯最近的一项研究(Brookover,Eriekson,
Hamacheek, Joiner, Lepere, Patterson,and Thomas , 1966)表明,父母对他们孩子的学业和能力的兴 趣的增强可以显著提高儿童的学业成绩。
第八章 教师的评定
现在看来,教师的有利期望可能是造成他们学生 IQ 增量的原因,而且在 低年级这些增量可能十分显著。但是,一个提高了的 IQ,甚至一个有显著提 高的 IQ 并不保证该 IQ 的拥有者会在比进行 IQ 测验的情境更“真实”的情境 中表现出他获得的益处。对学校中的儿童来说,没有比课堂情境本身更“真 实”的情境了。所以,我们想知道,归因于教师有利期望的 IQ 增量,是否也 反映在可以更加直接观察到的特殊儿童的课堂行为之中。理想地说,应雇用 独立的观察者来记录学生的课堂行为,但在奥克学校实验中不可能采用这种 方法。
所以,我们对儿童课堂行为的观察必须依赖教师本人对儿童的学业成绩 和对儿童的一般课堂行为的评定。用教师的评定作为儿童方面信息的来源, 有利有弊。一方面,丰富的教育研究传统表明,教师在评定学生的智力和个 人适应上往往是不准确的。另一方面,在编制甚至最复杂的智力和个人适应 测验中,对学生的“真实”能力和适应的一个常用的界定,是教师对这些品 质的评定。这是不难理解的,因为没有一个成人像教师那样了解儿童的课堂 行为。
本研究中所面临的专门问题是,教师对学生课堂行为的观察可能受实验
中形成的期望的影响。教师可能会把更理想的行为归于特殊儿童,即使特殊 儿童的实际课堂行为与控制组儿童的行为没有什么不同。这是光环效应的实 质,而且我们从前面描述过的卡恩(1966)的研究中得知,教师的期望可能 歪曲他们对学生成绩的评定。根据本研究还无法确证教师的评定是否受光环 效应的影响,但即使受到影响,教师评定的生态学效度(ecolopical validity)或“真实性”并没有被削弱。光环效应也发生在现实生活中,教 师对学生有成见的或者无成见的评价,对学生学业上和非学业上的未来都是 举足轻重的。在谈及教师的评定之前,我们应该记得,尽管我们知道那些被 期望智力上会有更多增量的儿童确实比控制组儿童的增量多,但教师并不知 道这一事实。如果教师带着“光环”观察,那么,据说是大有发展的儿童的 智力确实增长了,这种了解至少没有强化他们心目中的光环。
学业成绩 所有教师平常都要对他们学生的学业成绩作出评定,而且他们通常用字
母等级来表示其评定并把它们记录在成绩卡上。奥克学校用“A”、“B”、
“C”和“D”表示及格等第,用“U”表示不及格等第。所有儿童在每次的成 绩卡上都记有下列科目的等第:阅读、算术、语言、书法、社会常识、科学、 卫生、体育、工艺美术和音乐。此外,在三到六年级对拼写评等第,而在一 二年级不评等第。
在对被期望有智力增长的儿童的课堂学业成绩与控制组儿童的学业成绩 进行比较时,所用的分析方法与比较 IQ 增量时所用的方法相同。奥克学校的 每一个儿童无论是在控制组还是在实验组,1964 年春季学期的期终成绩卡等 第都被当作“预测”,1965 年春季学期的期终成绩卡等第被当作“后测”。 然后把字母等第换算为整数,4 分代表“A”等,0 分代表“U”等。再用后测 分数减去预测分数得出增高分数,然后,正如在 IQ 情形一样,对特殊儿童的
增量与控制组儿童的增量进行统计比较。
就整个学校而论,11 门学校科目只在一门科目中,特殊儿童与控制组儿 童的积分点增量之间有显著差异。这一科目就是阅读。被期望有较大智力增 量的儿童表现出较大的增量。
各年级的期望益处
整个学校的结果见表 8-1 的底行。①我们将看到,只是在把学校作为一 个整体来考虑时,效果才是小的。表 8-1 的其余部分(和图
表 8 - 1 6 个年级中每一年级的实验组与控制 组一年后在阅读等第上的平均增量
年 级 控制组 实验组 期望益处
N
增量
N
增量
积分点
单尾 p < 0.05a
1
49
+ 0.16
7
+ 0.71
+ 0.55
0.03
2
39
+ 0.23
7
+ 0.71
+ 0.48
0.05
3
26
- 0.27
13
+ 0.15
+ 0.42
0.04
4
47
- 0.49
12
- 0.42
+ 0.07
5
41
- 0.44
11
- 0.46
- 0.02
6
47
+ 0.17
12
+ 0.25
+ 0.08
合计
249
- 0.09
62
+ 0.08
+ 0.17
0.05
a 各班级实验处理的均方等于 0.484 。
8-1)表明了 6 个年级的两组儿童的阅读积分点的增量情况。正如在 IQ 情形
中一样,我们发现从六年级到一年级期望益处是增加的,年级与期望益处量 之间的相关(r=-0.91)在 0.02 的水平上是显著的。①这个相关很接近于
IQ 中期望益处与年级水平的相关(r=-0.86)。某个年级的 IQ 增量得益于
有利期望愈多,在阅读增量上也得益于有利期望愈多(r=+0.74,p<0.05, 单尾)。看来特别有趣的是,阅读分数上的期望益处很类似于 IQ 分数上的期 望益处,因为 IQ 测验是经过特别选择的,参加 IQ 测验对阅读能力没有要求。 在其余的 10 门科目中,还有一门学科在不同年级表现出相同形式的期望益
① 这种统计分析与上一章所描述的方式相同,即双向与三向方差分析。表 8-1 所示阅读等第增量之总差异
的 p 值,是基于总 t 之上的。然而,实验处理的主要效果的 F 值,是在所有方差分析中求得,与各 F 值相 联系的 p 值在 0.23 与 0.005 区域内,双层 p 的中数值为 0.04。 把班级作为取样单位来考虑(N=17,缺一 个班的成绩),我们发现,在 17 个班的 14 个班中,实验组儿童阅读分数的增量多于控制组儿童。与符号、 魏尔柯克松和 t 检验相联系的单尾 p 值分别为 0.006、0.002 和 0.002。即使考虑到阅读是达到 p <0.10 水平 的唯一科目这一事实,获得的这些阅读分数的 p 值看来也太低,不能证明我们把它们归因于机遇是正确的。 如果 11 门科目是独立的,事实上它们不是独立的(后侧等第间的平均相关是+0.47),一般说来我们就可 以期望偶然发现一个 p <0.09,这个所期望的 p 值大约比以班级为取样单位时获得的 p 值大 10 倍。
① 两种处理与六个年级间的交互作用不显著(F<1)。
处。这门科目是算术,整个学校在算术科目中没有表现出与教师有利期望相 联系的显著益处。不过,低年级特殊儿童在算术成绩上的增量大于控制组儿 童的增量,但后者在高年级获得的增量较大。在算术中,年级与期望益处的 相关为-0.87(p<0.03,双尾)。某年级在算术成绩的增量上得益愈多,在
IQ 增量上受益就愈多(r=+0.90,p<0.01,单尾),在阅读成绩的增量上 得益也愈多(r=+0.89,p<0.01,单尾)。似乎相当清楚的是,在至少这 两门科目——两门最重要的科目中,年幼儿童由于被期望有智力上的增长而 得益较多。
当估计的是总体 IQ 方面的期望益处时,最低两个年级的受益最大。当估 计的是阅读分数方面的期望益处时,最低两个年级受益也最大,但三年级也 获得了差不多同样大的益处。
各轨与各性别的期望益处
相对于控制组儿童获得的阅读成绩的增量而言,在奥克学校的三轨中, 被指定为有增长的儿童的阅读成绩的增量各不相同(交互作用 F=2.49, p
=0.09)。表 8-2 表明,快轨儿童在阅读分数上没有因教师的有利期望而受 益,而中轨儿童和程度再降低一点的慢轨儿童,在教师期望他们有智力增长 时得益很多。我们记得,当讨论涉及 IQ 增量方面的期望益处时,受益最多的 也是中轨的特殊儿童,尽管他们的所得益处在统计上显然不如其他两轨的特 殊儿童所表现出的期望益处。
表 8 - 2 三轨中各轨实验组与控制组的儿童 一年后阅读等第的平均增量
轨 控制组 实验组 期望益处
N
增量
N
增量
积分点
单尾 p<0.05
快
99
- 0.09
27
- 0.15
- 0.06
中
68
- 0.31
17
+ 0.18
+ 0.49
0.07
慢
82
+ 0.09
18
+ 0.33
+ 0.24
成为本站VIP会员VIP会员登录,
若未注册,请点击免费注册VIP 成为本站会员.
版权声明:本站所有电子书均来自互联网。如果您发现有任何侵犯您权益的情况,请立即和我们联系,我们会及时作相关处理。