点转到内部心理过程上去了。图 1-3(参见上页)用模型的方式表示行为主 义和认知主义的区别。在 70 年代,曾任美国心理学会主席的麦基奇
(W.J.Mckeachie,1921~)在一篇报告中说,心理学是什么,这一概念已发 生改变,在詹姆斯的经典教科书里,把心理学定义为“对意识状态的描述和 解释”,后来改为“研究行为的科学”,今天我们的定义又改变了,心理学 又回到意识上来了。但是,更多的教科书和心理学家把心理学定义为研究行 为和心理过程的科学。这就既包括外观的、可观察的动作,又包括内部的心 理活动。在研究方法上,行为主义强调严格的实验方法,排斥一切主观经验 的报告,认知心理学则既注重实验室研究、又重视主观经验的报告。目前, 认知心理学已经成为心理学中的一个重要潮流。可以这样说,心理实验方法 发展的第二阶段,前期主要受到行为主义的影响,后期主要受到认知心理学 的影响。
从以上心理学实验发展的历史我们可以看出,由于在心理学中采用了实 验法,才有了对心理现象进行客观研究的手段,才能从对心理现象的一般哲 学推论,进入到具体心理过程及其物质基础的分析研究,从而能越来越深入 地揭示各种心理活动的规律,大大丰富了心理科学。从某种意义上说,正是 因为实验心理学和心理物理法的诞生和发展,才使心理学完全从哲学中分离 出来,成为一门独立的科学。
实验方法的建立,特别是从 20 世纪 50 年代以来,心理学已广泛应用了
现代科学和工程技术的最新成就。近年来,随着科学技术的日益发展,国际 上的一些新技术、新概念和新方法已被引进心理学领域中,如控制论、信息 论、微电子技术、分子生物学、数理分析等,使心理学的实验研究水平有了 显著的提高。心理学家从信息加工的角度去看待知觉、学习、记忆及思维等 心理过程。心理学与邻近学科有了越来越多的共同语言,从而更有利于其发 展。这使我们认识到,心理学应注意从邻近学科中汲取有益成果,这样才有 助于逐步揭示心理现象的奥秘。
实验方法的应用,使心理学的发展大为加快。从心理学实验方法的建立
到现在才一百多年,而心理学的发展却大大超过以往许多世纪。虽然科学的 心理学不能归结为实验心理学,实验方法也不是心理学研究的唯一方法。但 是,任何当代心理学的教科书都以大量的篇幅证明,现代心理学中的大量事 实大都来自先前的实验研究,心理学实验的诞生和发展有力地说明了实验方 法是揭露心理和行为的规律的重要途径和手段。就以武德沃斯
(RobertSessions Woodworth,1869~1962)等所著的《实验心理学》一书
中所列举的参考文献来说,1938 年的第一版列举了 1770 项,到 1955 年的第 二版就列举了 2480 项,其中有 50%是旧版中未曾引用过的。1971 年的第三 版的参考文献目录长达 100 页,不下于 4000 项,其中 80%以上是旧版未曾 引用过的。它所引用的资料主要来源于美国的材料,主要也只是涉及心理学 基础领域的实验研究。
一位心理学工作者可以对心理学的任一领域或任一分支进行特别研究, 可以专门从事儿童心理、教育心理、医学心理、或知觉心理、思维心理,以 至社会心理的研究。但是,如果他想成为一个真正严格的、科学的心理工作 者,他就必须要很好地掌握实验心理学的研究内容和方法,了解应当如何科 学地考察心理和行为的规律。
实验研究和任何一种研究方法一样,有它一定的局限性。这是因为实验
研究是在一定控制条件下进行的,实验结果有时会与现实生活中人们的心理 活动不完全一样。这种现象的发生在科学研究中并不少见,更不是不能解决 的。只要研究课题来自实际,研究结果又不断到社会实际中去检验;同时, 在研究过程中又不仅仅注意心理活动的单因素的实验研究,还注意多因素的 交互作用的研究,那么,其研究结果是会与现实生活相一致的。
综上所述,综观心理学研究的历史,可以这样说,实验法是心理学的主 要研究方法,实验心理学的诞生意味着科学心理学的建立。它是使心理学成 为一门独立科学的基石。当然,它也不是心理学的唯一的研究方法,它和观 察法(observation method)、临床法(clinical method)、问卷法(question- naire method)等研究方法相辅相成,构成完整的心理学方法学。
本 章 实 验
一、自变量和因变量的确定
(一)目的:
(1)通过动作学习的过程了解心理实验中确定自变量和因变量的方法;
(2)学习使用触棒迷津。
(二)材料:触棒迷津、小棒、遮眼罩、秒表、记录纸。
(三)程序:
(1)三人一组,被试者带上遮眼罩,用小棒走迷津(实验前被试者勿看 迷津,也勿用手触摸迷津)。主试者对被试者的指示语必须这样说明:“在 排除视觉的条件下,尽快地学会用小棒走迷津,中间不要停顿,要积极运用 动觉、记忆和思维,争取早些学会”。主试者把小棒放在迷津的入口处,然 后让被试者用优势手拿住小棒,手臂悬空。
(2)被试者手执小棒静侯。主试者在每次开始前 2 秒钟,先发出“预备” 口令,主试者再说“开始”时,被试者才用小棒走动。在发出“开始”口令 的同时,主试者开动秒手表。
(3)被试者在走迷津的过程中,凡进入盲巷一次就算出错一次,主试者 记下错误次数。
(4)当被试者的小棒进入迷津终点,主试者立刻说“到了”,同时停秒
表,记录走一遍迷津所用的时间(秒)。再做下一次的准备工作。
(5)学习遍数因被试者而异,均以连续三次不出错为学会的标准。
(6)若被试者在学习途中感到疲劳,可在某次走到终点后休息几分钟。
(四)结果:将每次走迷津所用的时间和错误次数列成表格(见下页)。
本实验记录用纸
自
变
因 量 变
量
学 习 遍 数
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
?
所需时间
(秒)
错误次数
(次)
注:学习遍数因被试者而异,均以连续三次不出错为学会的标准,学习
遍数超过 15 次者可自行加行。
(五)讨论:
(1)本实验中自变量是什么?为什么在实验前要对所用的自变量提出一 个操作上的定义?
(2)本实验用什么作因变量的指标?它的作用是什么?
(3)本实验控制了那些变量?
二、自变量的范围和间距
(一)目的:通过对皮肤两点阈的测定,学习确定心理实验中变量范围
和间距的方法。
(二)材料:两点阈量规、遮眼罩、记录纸。
(三)程序:
(1)主试者选定被试者的左手背(A 区)与前臂背面为测量区,前臂背 面又分为二个区(B、C 区),本试验取 A、C 两个区。测量前,在各区内标 上蓝印或划出圆圈,刺激在圈内进行。
(2)在使用两点阈量规时,必须垂直接触皮肤,对两个尖点施力均匀, 接触时间不超过 2 秒钟,先在自己手上练习几次,再在被试者的非测验区练 习几次。
(3)实验序列的长度和起点,可根据初步测验后确定,大致在 7~15 毫米的范围内取 5 个点,每步变化在 1 毫米左右。每种间距做 20 次,顺序随 机安排。
本实验记录用纸一
刺激代号相对应的实际刺激值
代号
1
2
3
4
5
?
刺激值(m)
(4)每隔 100 次,休息 5 分钟。被试者有时产生一种持久的两点后象(即
使只有一点或距离很近的两点刺激,也有感到两点的印象),此时应给予休 息,使其恢复两点的标准。每隔数十次,可插入一次一点刺激,测验被试者 是否有这种后象。
(5)主试者对被试者的指示语必须这样说明:“在排除视觉的条件下,
当被试者感觉到是两点时说‘二’;当被试者感觉到一点时说‘一’;当被 试者不能确定感觉到的是几点时说‘不’”。
本实验记录用纸二
被试者反应记录表
(6)主试者在每次刺激前先发出预备信号:“注意”。在被试者作出反 应后,要记录下来。
(7)在全部测量完毕后,在记录中挑出有“不”的序列,再重复那些序 列,获得确定的判断。
(四)结果:分别求出左手 A 区和 C 区的两点阈限,并对两均数的差别 进行考验。
(五)讨论:
(1)说明身体部位不同,触觉有差异,两点阈值从一个侧面揭示了触觉 感受性的大小。
(2)如果要测定皮肤某部位的两点阈限,自变量的范围和间距应如何安 排?
本章摘要
1.实验心理学就是在实验控制条件下对心理和行为进行研究工作的心理 学。这一心理学分支是以研究方法来定义的。也就是说,只要是用实验法来 研究的心理学问题,都可以包括在实验心理学的范围内。
2.实验是一种控制的观察,与自然的或偶然的观察不同,实验是实验者 人为地使现象发生,对产生现象的情景或影响现象的条件加以操纵、变化与 控制的观察。
3.实验具有三个明显的特征:实验者掌握有主动权;实验具有可核对性、 或验证性;实验者可以系统地变化条件,观察因这些条件的变化而引起的现 象上的变化。
4.变量是指在数量上或者质量上可以改变的事物的属性。在心理学的实 验中,研究者必须考虑三类变量:(1)已知的、对有机体反应发生影响的变 量,叫作自变量,它是由实验者操作、掌握的变量;(2)由操纵自变量而引 起被试者的某种特定的反应,叫因变量,它是由实验者观察或记录的变量;
(3)在实验中应保持恒定的变量,叫控制变量。
5.心理实验的对象统称为被试者,包括人和动物。在实验中,特别是在 以人为被试者的实验中,处理好实验者(即主试者)与被试者的关系是实验 取得成功的一个重要条件。
6.额外变量(即控制变量)是使实验结果发生混淆的主要根源。对额外
变量的控制常用的方法有:排除法、恒定法、匹配法、随机化法、抵消平衡 法和统计控制法。
7.实验效度是指实验方法达到实验目的的程度。换言之,实验效度就是
实验结果符合客观实际的程度。实验效度主要包括内部效度和外部效度。
8.实验的程序是实验的进程,它是指实验在各个阶段应做的事。心理学 实验通常遵循的基本程序是:(1)课题的确定;(2)被试者的选择;(3) 实验因素的控制;(4)实验资料的收集、分析和综合;(5)撰写实验报告。
9.课题的确定是科学研究的第一步,研究课题的来源通常有四个方面:
实际的需要,理论,个人的经验,过去的研究与文献。
10.心理学实验的被试者是多种多样的。有正常人,也有疾病患者;有各 种年龄阶段的人,也有动物。不同的实验对象,通常要求有不同的实验操作。
11.操作定义的提出,受到心理学家们的欢迎。在心理学上,对一个心理 现象根据测定其程序下的定义称之为操作定义。
12.一个完整的实验报告必须包括以下几项内容:摘要、引言、方法、结 果、讨论、参考文献及附录。
13.实验心理学的发展,大约经历了两个阶段。从 18 世纪中叶到 19 世纪 中叶是心理实验的第一阶段,也可说是实验心理学的准备阶段。在这一阶段 具有以下特点:应用的方法类似于某些简单的物理学和生理学的实验法;研 究的问题只限于某些简单心理现象的量的测量;被试者的陈述带有十分初级 的性质。
14.心理实验发展的第二阶段始于 19 世纪 60 年代,一直延续到今天。开 始阶段是与冯特的工作相联系的,这一阶段也可称为实验心理学的诞生、传 播和发展阶段。心理实验发展的第二阶段,前期主要受到行为主义的影响; 后期主要受到认知心理学的影响。
15.综观心理学研究的历史,可以这样说,实验法是心理学的主要研究方 法。实验心理学的诞生意味着科学心理学的建立,它是使心理学成为一门独 立科学的基石。当然,它也不是心理学的唯一的研究方法,它和观察法、临 床法、问卷法等方法相辅相成,构成完整的心理学方法学。
建议参考资料
1.王甦等(1993):当代心理学研究。北京市:北京大学出版社。
2.杨治良(1988):心理物理学。兰州市:甘肃人民出版社。
3.张春兴(1991):现代心理学。台北市:东华书局(繁体字版)。上 海市:上海人民出社(1994)(简体字版)。
4.波林(高觉敷译,1981):实验心理学史。上海市:商务印书馆。
5.黄希庭(主编)(1988):心理实验指导。北京市:人民教育出版社。
6.Atkinson,R.C.et al.(1988).Stevens’handbook of experimental psy-chology (2nd ed). New York: A Wiley-Interscience Publication.
7.Kantowitz , B.H. ,& Roediger , H.L. ( 1984 ) .Experimental
psychology(2nd ed.).New York:West Publishing Co.
第二章 实验设计
本章内容细目
第一节 实验设计的基本类型
一、被试者内设计 46
(一)实验前后设计
(二)定时系列设计
(三)抵消实验条件的设计 二、被试者间设计 51
(一)随机组设计
(二)配对组设计 三、混合设计 56
第二节 多变量实验技术
一、多自变量实验的优点 58 二、多因素实验设计 63 三、拉丁方设计 65
第三节 实验数据的统计分析
一、统计表和统计图 66
(一)统计表
(二)统计图 二、实验数据的初步整理 73
(一)偶然误差与系统误差
(二)集中量
(三)差异量 三、显著性检验 82
(一)显著性检验的含义
(二) t 检验
(三)F 检验
(四)X2 检验
本章摘要建议 参考资料
前面谈到,心理学是一门实验科学。为了完成好一个实验,并使其在方 法上能站得住脚,必须首先做好实验设计,这是实验成功的关键。一个好的 实验设计能够用最少的人力、物力来获得最多和最有效的实验数据以达到最 佳的实验目的。否则,如果实验设计不当、对非实验条件控制不严、实验方 法和程序安排不合理,即使实验的规模较大、实验次数较多,但是所得到的 实验数据却不能为最初所提出的问题提供合理的答案,达不到原来的实验目 的。这样的实验设计不是好的设计。
一个良好的实验设计是实验研究能够作出成果的重要因素,实验设计是
整个实验研究的重要组成部分。有人以为只有实验终了得出数据之后再考虑 统计处理,这样想法是片面的。事实上,只有在实验开始之前就有精心的实 验设计,才能事半而功倍。心理是一种复杂的现象,它跟自然现象和社会现 象一样,也有着自己本身的规律性。实验就是揭示这些规律性。但心理科学 的实验设计要比其他科学更为困难,这是因为无论是实验对象,还是环境条 件,反应测定都要受到很大的限制。因此,掌握好实验设计技术也就更加重 要。科学的探索要求不断地发展自己的手段和方法,也就是要不断地创造出 新的“工具”。这些新的方法和“工具”,理所当然地能反映在实验设计之 中。历史事实表明,方法上的创新能使我们产生意想不到的效果。
顾名思义,实验设计就是对实验的设计。在长期的科学实验中,科学工 作者已经总结出一些在实验设计时所必须遵守的共同原则、具体的实验方法 和技术上应注意的细节。本章内容主要讨论下面六个问题:
1.何谓实验设计,它有哪些基本类型。
2.多自变量实验设计有哪些优点。
3.统计表有何功能。
4.统计图有何功能。
5.标准差的主要用途有哪些。
6.什么叫显著性检验?在使用显著性检验时应注意什么。
第一节 实验设计的基本类型
实验设计(experimental design)乃是进行科学实验前做的具体计划。 它主要是控制实验条件和安排实验程序的计划。它的目的在于找出实验条件 和实验结果之间的关系,做出正确的结论,来检验解决问题的假设。心理实 验设计的内容包括:刺激变量(或刺激变项)(stimulus variable)的确定 及其呈现的方式,反应变量(或反应变项)(response variable)的指标及 其测量方法,对一切有关变量(或变项)(variable)的控制措施,确定被 试者人数和选择被试者的方法,拟定主试在实验开始前对被试者要说的指示 语,规定实验次数,安排实验程序,规定使用仪器的型号,处理实验数据的 方法等等。实验设计要对实验结果有预见性,要保证严格按照实验设计进行 才能取得有效的实验数据。
每一个实验设计都必须回答三个基本问题:(1)实验采用多少自变量? 例如在一个阅读速度的研究中取“照明强度”为自变量。(2)各自变量内又 采用多少处理水平?例如照明强度又分为强、中、弱等处理水平。(3)在各 自变量和各处理水平中用相同的被试者,还是用不同的被试者?根据这三个 条件的组合,就可构成许多不同类型的实验设计。
一般根据对上述三个问题的回答,就可把实验设计的类型大体上分为三
种:被试者内设计、被试者间设计以及同时包括被试者内与被试者间的混合 设计(mixed design)。
被试者如果在自变量发生变化的所有情况下接受实验,则是被试者内设
计。例如,自变量是照明强度,假如有强、中、弱等三种照度供操纵;因变 量是观测一个在标准条件下视角为一分的 C 型视标的距离。采用被试者内设 计时,同一被试者需要在三种照明条件下都接受测试。
如被试者只接受多个自变量情况中的一个,即不同的被试者接受不同自
变量的处理,这类设计便是被试者间设计。在上例中,如实验者令一组被试 者在强照度条件下测试,令另一组被试者接受中等照度条件下的测试,令第 三组被试者接受弱照度条件下的测试,如此类推,直到各组都分别接受某一 种照度条件下的测试。这种实验设计就是被试者间设计。
为什么在被试者内设计和被试者间设计中,实验都可以同时操作两个或
两个以上的自变量呢?乍看之下,这种处理似乎违背了实验法“单一变量” 的原则。其实,由于实验者采用了统计方法,可以通过平衡多变量的关系, 通过控制其他一些自变量,使某一阶段变化特性显露出来,这一问题就迎刃 而解了。因此,可以说统计技术是实验设计的基础。
所谓混合设计,是指在一项实验中,有些自变量是被试者内的,而有些 自变量是被试者间的。例如,一个被试者接受甲变量的每一种情况,但只接 受乙变量的一种情况。根据被试者内设计和被试者间设计的特征,这时的甲 变量是被试者内自变量,乙变量则是被试者间自变量了。这类实验设计即是 混合设计。
一、被试者内设计
被试者内设计 (或受试者内设计、单组实验设计) ( within- subjectsdesign)是每个被试者须接受自变量的所有情况的处理。其基本原 理是:每个被试者参与所有的实验处理,然后比较相同被试者在不同处理下 的行为变化。这种实验设计下的同一被试者既为实验组提供数据,也为控制
组提供数据。因此,被试者内设计无需另找控制组的被试者。 在实验研究中,如果实验者主要想研究每一个被试者对实验处理所引起
的行为上的变化,一般可考虑采用被试者内设计。被试者内设计又可分为三 种子类型:
(一)实验前后设计
实验前后设计(experimental before-after design)是指在实验条件 处理前对被试者进行观测的结果与实验条件处理后所做的同样观测的结果加 以对比的设计。也就是说,这种设计类型是实验(处理)前后的比较设计。 我们可用表 2-1 来表示这种设计的模式。
实验(处理)前、后设计,具有二个优点:(1)能较明显地检查出实验 处理的效果如何。因为在这种实验中,前、后被试者是同一的,如果能够控 制好无关变量的话,那么实验处理前后的差异,就是实验处理的结果。(2)
表 2-1 实验前与实验后设计模式
组数
前观测
处理
后观测
1
Y1
X
Y2
说明:Y1 表示实验处理前对被试者观测所得值
Y2 表示实验处理后对被试者观测所得值
X 表示实验条件处理 对被试者的需要量较少,一组被试者当二组被试者用,无须再增设被试
者控制组。不仅效率提高了,而且被试者变量也得到了较好的控制。
然而,我们应该看到不足之处。各类被试者内设计的共同缺点是,这类 设计需要每个被试者在实验中花费很多时间。通常一个被试者被要求执行几 项任务,这势必会产生疲劳,影响实验结果。而前、后设计还有二个不足之 处:(1)由于前、后两次观测之间存在时间间隔,这就会带来外来影响。一 般来说,前、后间隔时间愈长,则影响就愈大。反之,如果前、后两次观测 时间很接近,倒可以认为这是实验处理引起的行为差异。(2)容易产生顺序 误差。即前面的观测影响后面观测的结果,从而影响实验结果。例如实验中 第一次观测会产生学习、疲劳、情绪等效应,从而影响第二次观测的结果。
(二)定时系列设计
定时系列设计(time serial design)是指实验处理前对一组被试者作 一系列的定时重复观测,然后实施实验处理。再对被试者作一系列的定时重 复观测,分析自变量(实验处理)对因变量的关系。定时系列设计可以看作 是前、后设计的扩展形式。定时系列设计,一般先分别求出实验处理前和实 验处理后的平均数,也有分别取众数或中数的。我们用表 2-2 来表示这种设 计的模式。
表 2-2 定时系列设计模式
组数
前观测
处理
后观测
1
Y1a 、 Y1b 、 Y1c
X
Y2a 、 Y2b 、 Y2c
说明:Y1a、Y1b、Y1c 分别表示实验处理前之观测值
Y2a、Y2b、Y2c 分别表示实验处理后之观测值
X 表示实验条件处理 定时系列设计除了具有上述前、后设计的二个优点之外,还具有以下二
个优点:(1)降低由于一次观测而得到被试者不正常行为的机率。实验处理 前和实验处理后分别对每一位被试者作一系列测定,这就能降低只作一次观 测而得到不正确结果的机率。(2)提供测量过程中的信息。无论是在实验处 理前,或是在实验处理后,均对被试者进行一系列的观测,这样就可以使我 们看出发展趋向。
但是,问题还具有两面性,定时系列设计的这些优点,也加重了前、后 设计所存在的弱势:(1)由于更多次的观测,势必延长实验时间,从而会有 更多的外来影响。(2)也正是更多次的观测,更易引起顺序误差,更易导致 练习、疲劳、紧张或厌烦等效应,影响实验结果。
(三)抵消实验条件的设计
抵消实验条件的设计(reversal experimental condition design)是 指抵消实验过程中无关变量的一种设计。前面讲到,有些无关变量在某些实 验情况下既不能被消除,又不能保持恒定。例如,单组实验往往由于前一处 理影响后一处理的效果,产生顺序误差。为了抵消顺序误差,最简单的方法 就是用 ABBA 的排列顺序来安排实验顺序。其模式可用表 2-3 表示。
从表 2-3 中可见,首先给被试者作第一种处理(XA)和第一种处理后的
观测(Y2a),其次作第二种处理(XB)和处理后的第二次观测(Y2b),再重
复第二种、最后重复第一种的处理和观测。整个实验程序的安排,就是抵消 实验条件的设计的基本形式。
这里不妨举一个例子。有甲乙两种操作方式,我们要比较这两种操作方
式哪一种更正确,更快些。我们知道,以人作为被试者的实验,在不同时间 所得结果必然有所不同,甚至同一人以同一操作方式作一系列实验,要使其 中两次结果完全相同也是一件不容易的事。定时系列规则是解决此类问题的 方法之一。但是定时系列规则不能消除和顺序有关的实验误差。
表 2-3 抵消实验条件设计的模式
处 理
XA
XB
XB
XA
后观测
Y2a
Y2b
Y2c
Y2d
为了消除这类影响,方法之一就是使用抵消实验条件的设计。本例就可
用表 2-4 表示其模式。
表 2-4 抵消实验条件设计的实例
处理
操作方式甲
操作方式乙
操作方式乙
操作方式甲
结果
试验一之观测值
试验二之观测值
试验三之观测值
试验四之观测值
这种实验设计在处理 XA 的情况下得到两个数值,在处理 XB 的情况下也得
到两个数值。统计时就通过分别求平均数后,加以比较。这样的实验设计, 既安排了二种操作方式在程序上的均等,同时又提供了估计随机误差的可能
性。
抵消实验条件的设计具有三个明显的优点:(1)能较好地控制被试者变 量,这是单组实验设计的共同优点。单组实验设计不但比两组实验设计用的 被试者数量少,而且由于两种实验条件使用同一被试者,从而较好地控制了 实验变量。(2)能较好地控制顺序误差。在心理实验中有许多变量与时间有 关,例如学习、练习、迁移、挫折、疲劳等等。这些变量特别需要用这类实 验设计来消除顺序误差。如果一半被试者所作的顺序为 ABBA,另一半被试者 所作的顺序为 BAAB,那就抵消得更彻底。(3)时间上比较经济。这类实验 一般观测次数不多,上面操作方式甲乙的比较,也只要通过四次观测就能完 成某一被试者的实验。因此,被试者较易配合,以顺利完成实验,同时也排 除了某一些实验误差。
抵消实验条件设计虽有上述优点,但也有其局限性。主要有两点:(1) 反应变量在时间维度(轴)上的关系是线性时才能使用。抵消实验条件的设 计的前提条件是反应变量在时间维度(轴)上的关系是线性关系。例如单纯 的前影响作用,无论是从试验一到试验二,还是从试验三到试验四,都是后 者受前者的影响。但是,当这些变量的实际效果与行为效果的关系是非线性 时,则采用这类设计也不能达到抵消实验的顺序误差的目的。(2)对有些实 验不适用。例如用两种学习方法学习同一实验材料就不适用。若一定要用这 种设计,就必须改用同一被试用两种学习方法,学习两种难度相等的不同材 料,才能消除练习误差,同时还应用相同的计量单位,否则无法进行比较。 以上我们介绍了三类单组实验设计,清楚了这些设计所具有的优点。在心理 实验中确实有不少运用这种设计方法达到较好效果的例子。例如:杨治良等
(1979)曾用单组实验前后设计,对痛的成分进行心理学研究。采用这种设
计的出发点是愿接受痛刺激的被试者不可多得,为了弥补单组实验和被试者 数量较少的不足,实验采用单组实验前后设计。在这样的设计中,被试者变 量能得到较好的控制,因为能消除由被试差异引起的误差,从而对自变量的 效果作出更精确的估计。同时,为尽可能减少单组实验中的被试者在实验中 花费很多时间,实验采用了心理量表法记分,通过被试者一次反应,记录较 多的反应指标,而这些指标之间又存在着很大的一致性(见表 2-5)。从表
2-5 可见,众多的生理和心理指标增加了对照程度,在一定程度上弥补了被
试者较少的缺陷。
表 2-5 痛反应量表
极
拒
大
相当于各级刺激的强度为被试的平均值(采自杨治良,1979)
应看到单组实验设计有其局限性,同时,正如前面所述,对有些实验不 适用。单组实验设计在不能避免某种系统误差时,就要用被试者间设计或混 合设计来完善实验设计。
二、被试者间设计
被试者内设计要求每一个被试者接受所有自变量处理,关键是如何安排 各处理的先后次序。被试者间设计(或组间法)(between-subjects design) 是要求每个被试者(组)只接受一个自变量处理,对另一被试者(组)进行 另一种处理,故又称这种设计为独立组设计 (independent - groups design)。这种设计的主要问题是如何决定哪一个被试者(组)接受哪一个 实验处理。若有两种以上的处理,有多少种处理就采用多少个被试者(组)。 被试者间设计或独立组设计有两类设计技术:随机组设计和配对组设计。
(一)随机组设计
随机组设计(或随机分组设计)(random-groups design)是将被试者 随机地分配在不同的组内接受不同的自变量处理。这一假设是将被试者随机 分配到不同的组,若对各组用一样的课题,在相同的条件下进行测量,其结 果就成为相等组(或等组)(equivalent groups),则它们的成绩在统计上 应是相等的。换句话说,假设各组在与实验课题有关的特性上(如年龄、智 力、性格特征等)没有差别(在统计允许的限度以内),而实验结果却出现 了差别,这差别就是由于处理的不同而引起的。
从统计理论来讲,特别是从抽样理论来说,此设计的各被试者样本(随 机组)在未受不同的实验处理前,他们的作业平均数在统计上是没有显著差
异的,如果有,也仅仅是抽样变动。各自样本的平均数 X 都是总体平均数μ 的无偏估计值。换言之,各随机组在未经受不同处理之前是相等的(在统计 允许的限度以内)。若这些随机组经受不同的实验处理后,经 t 检验和 F 检 验后发现作业的平均数有显著性差异,那么这些差别是实验处理的不同引起 的。各实验处理的平均数不是来自总体的平均数μ,而是来自各实验处理总 体μ1,μ2,??,μk。这就是根据随机理论所作的逻辑推理。
怎样才能做到随机分组呢?常用的方法有两种:同时分配法和次第分配 法。这两种方法各有其特点,可择宜采用。
1.同时分配法同时分配的条件是,被试者同时等候,而实验者可随意调 派其中任何一个被试者。同时分配法通常有三种技术。
(1)抽签法:先将所有被试者编号,记入纸片,每一纸片号码代表一个 被试者,然后将纸片放入容器内搅匀,按组抽取。若要将 40 个被试者分为四 组时,第一次抽 10 片,代表第一组,第二次也抽 10 片,代表第二组,依次 类推。假定 40 个被试者中有 16 个女生,则每组应各有 4 名女生。所以可以
在 16 名女生中先随机选 4 名,再在 24 名男生中随机选 6 名,归入第一组, 依次类推。
(2)笔划法:若要将 40 个被试者分为四组时,首先将被试者依其姓氏 笔划数进行次序排列,再查随机数表每一数列的第一位数,只取第一个数为
1、2、3、和 4 的数字,分别归属四个组,各查 10 个,共查满 40 个以后,按
姓氏笔划先后对入 1、2、3、4 所表示的组别。用此法时只要注意在查第一位 数为 1、2、3、4 的随机数时各查 10 个即可。
(3)报数法:若要将 40 个被试者分为四组时,采用类似于体育课上的
报数,假定被试者都坐在教室内,实验者令其从第一排报数,报 1 的被试者 都被分在第一组、报 2 的被试者都分在第二组,依此类推,只是要注意原有 顺序的影响。若每排报数的方向随机改变,例如用 1234,4321,2341 等不同 的顺序报数,则随机分组的效果将更好。
2.次第分配法 次第分配法的条件是,由于实验持续时间较长或其他原
因,实验者知道有一群被试者,但不知道究竟那位被试者什么时间会来,只 能根据预先拟好的原则进行分派,而且当实验结束时,各组要符合随机组的 要求。这里介绍两种技术。
(1)简便法:按被试者出现在实验的先后分派,第一名属第一组,第二
名属第二组,第三名属第三组,依此类推等。这有点像同时分配法中的第三 例。一般而言,使用本法能满足随机的条件,然而它取决于被试者报到的次 序是否符合随机原则。
(2)区内随机法:为了避免被试者非随机出现的可能性,可按照被试者 来到实验室的先后,使用区内随机次序分派被试者归属各组。例如,可根据 随机数表来分配被试者。
随机组设计有优点也有缺点。其优点是:(1)用随机分配被试者的方法 可控制两组被试者变量的差异,分组方法简单可行。(2)由于对每一被试者 只作一次观测,可消除某些实验误差,如消除学习误差的影响。这种设计的 缺点是:(1)分成等组的方法仍欠精密。(2)若两组在不同时期观测,就 有可能插入实验以外的偶发事件,影响因变量的观测结果。
(二)配对组设计
配对组设计(或对等组设计)(matched-groups design)是随机组设
计的一种逻辑扩展。配对组设计的目的是使各组的特性更加相同。这种设计 可控制组内变异和组间变异。在心理学研究中常常会遇到某些变量,特别是 机体内部的变量,例如智力、态度??。它们对实验变量(自变量),例如 对教材、教法等来说是额外的、无关的,而对因变量来说却是有关的。因此, 它们是共变量。共变量若不受到实验控制,则进行 F 检验时作为实验误差的 组内误差往往就不合理地扩大了。配对组设计就能解决此类问题。这一设计 要求把共变量分成几个等级,经过测量,然后把具有同一等级特征的 K 个被 试者加以配对,此时,每一个配对组便是一个层级。配对组的 K 个被试者每 人只接受一种实验处理,至于谁应接受哪一种实验处理,则用随机分派的方 法来决定。表 2-6 乃是配对组设计的基本模式。
表 2-6 配对组设计的基本模式
(采自杨治良、乐竟泓,1990)
在表 2-6 上,每一等级的每一处理只是观察一个被试者的做法,有时所 观察的基本单位不是一个被试者,而是一个团体或一个子集合。
配对法常有两个步骤:第一,令所有被试者做“共同作业”,即接受预 备测验,获得作业分数;第二,根据作业分数形成配对组。
第一步:共同作业
共同作业(common task)亦称为先检验(或前测)(pretest)。配对 组设计的优劣完全依赖实验作业是否与共同作业有高度的相关。先检验与实 验作业的相关越高,组间差异越小,则接受不同处理后的实验结果越能反映 实验处理的差异。先检验作业有两种:一种是和实验作业有高度相关的其他 作业;另一种是利用被试实验作业的初期表现。通常,同一作业两个阶段的 行为表现是相关的。很多学习实验以智力测验为配对分组的依据,但在不能
找出和实验作业相关的作业时,对有些无练习效应的实验可使用实验练习的 成绩作配对依据。
第二步:配对分组
配对分组(matched groups)乃是取得先检验测试分数后,再用两种方 法形成配对组。
方法一:将被试者按先检验作业分数的高低排列(见表 2-7)。现设有 三种自变量处理(情况),将前三个被试者依区内随机方式派到 A、B、C 三 组,接着将后三个被试者如法分配,直到分配完毕。从表 2-8 可以看到,
表 2-7 30 名被试者先检验分数的高低排列表
被试者
分数
被试者
分数
被试者
分数
1
75
11
40
21
27
2
65
12
39
22
25
3
64
13
37
23
21
4
63
14
37
24
19
5
60
15
34
25
19
6
45
16
32
26
16
7
45
17
31
27
15
8
42
18
30
28
13
9
41
19
30
29
10
10
41
20
30
30
2
(采自杨治良、乐竟泓,1990)
按这种方法分配的各组在平均数和标准差上都很接近。 方法二:取先检验分数中相同或非常接近的,以三人为一单位,然后按
区内随机法逐次分派到 A、B、C 各组。每三个被试者的分数接近的程度完全
是任意的,如表 2-9 的分派限定三个被试者分数差落入γ≤4 的范围内。因 为有了这样的限制,超过标准的被试者被剔除。如表中每组被试者只有 8 人, 各组分数相差甚微。
表 2-8 30 名被试者按方法—配对分组的结果
说明:X为平均数,S为标准差(采自杨治良、乐竟泓,1990)
表 2-9 30 名被试者按方法二配对分组的结果
被试者 分组
1
2
3
4
5
6
7
8
X
S
A B C
63
64
65
45
45
42
41
41
40
37
39
37
34
31
32
30
30
30
19
21
19
13
15
16
35.6
35.8
35.1
15.7
15.2
15.3
(采自杨治良、乐竟泓,1990)
二种方法相比,方法二中各被试者的平均值比方法一更相近,但由于有 随机分配的程序因素参与其中,只比较平均数还不能说明问题,应再比较所 分各组的标准差。若被试者在方法二中的标准差比在方法一中的更接近,这 就有力地说明了方法二的各组较为接近,而根据方法二的处理,各组的标准 差总会小一些。
配对组设计的作用在于控制组内变异与组间变异。它的优点是在实验处 理之前,就把组间变异缩到最小和要求两组组内变异比单独的随机分配更接 近相等。因此,这种设计能对被试者个别差异给予很多的控制,小型实验用 配对设计,其效果比用随机分组的效果更为显着。但这种设计的缺点是,实 验者因分配被试者而大大增加其工作量。
三、混合设计
混合设计(mixed design)乃是在一个实验中同时采用两种基本设计的 实验设计。它要求一个自变量用一种设计处理,如被试者内设计处理,而另 一个自变量用不同种类的设计处理,如被试者间设计处理。这时,实际上是 在进行两个实验。如果某个实验要求处理三个自变量,可按同样的原理对三 个自变量采用不同的设计。注意,这里谈及的三个自变量不同于一个自变量 的同类的三种水平。这里举一个例子,若将实验限定在两个自变量的范围以 内,在最简单的双变量实验设计(2×2)中,每个自变量在二种水平(A 变
量有 A1、A2,B 变量有 B1、B2)上的混合设计有如下几种可能:
1.表 2-10 中的 1、6、11、16 组是非混合设计,而 2、5 组代表同种混 合设计,3、9 组也代表同种混合设计,等等。真正的混合设计有十二组。其 实只要用对角线的一半编号组就可以说明问题,真正的混合组有二个六组, 要么是 2、3、4、7、8、12,要么是 5、9、10、13、14、15。这两个六组只 在接受处理的方向上不同,而接受处理的内容基本一致。
2.现再以 2 组为例,展开随机组和配对组 2×2 混合设计。步骤一:将全
部被试者分成二个随机组,一组接受变量 A1,另一组接受 A2;步骤二:将 A1
组被试者分解为二个配对组(G1、G2),将 A2 组也分解为配对
表 2-10 混合设计—例
自变量 A
随机组
匹配组
不完全的被 试者内设计
完全的被 试者内设计
自 变 量 B
随机组
1
2 △
3*
4
匹配组
5 △
6
7
8
不完全的被 试者内设计
9 *
10
11
12
完全的被 试者内设计
13
14
15
16
说明:表中数字编号是任意的,△和*代表同种混合。
(采自杨治良、乐竟泓,1990) 组(G'1、G'2);步骤三:A1 组中的两个配对组接受变量 B1 情况;另一组接
受 B2 情况,在 A2 组中的二个配对小组也分别接受变量的 B1、B2 情况。上述
情况可归纳为表 2-11。
3.再以 9 组为例,第一部是构成两个随机组,一组是接受变量 A1 情况,
另一组接受 A2 情况。另一变项 B 的二个情况 B1、B2 以任何方式给 A 变项的二
组中所有的被试者,构成被试者间和被试者内混合设计,从而把全部被试者 的材料总合起来的时候,渐近误差将被抵消。
2×2 实验仅是混合设计的简要形式,若有需要,完全可以实现 2×4、3
×3、3×6 等等的设计。例如,作 2×4 的随机组与被试者内混合设计可用表
2-12 的矩阵来表示,表中的数据是假想观察值。在决定一个实验是否用混 合设计时,我们有必要在两种水平考虑:首先看看所涉及的有效变量是
表 2-11 2×2 混合设计
自变量 B
自 变 量
A
B1
B2
A1
G1
接受
G2
接受
A2
G
接受
G2
接受
(采自杨治良、乐竟泓,1990)
表 2-12 2×4 混合设计
自 变 量 B
Σ X
B1
B2
B3
B4
自 变 量
A
A1
S1
0
0
5
3
8
S2
3
1
5
4
13
S3
4
3
6
2
15
A2
S4
4
2
7
8
21
S5
5
4
6
6
21
S6
7
5
8
9
29
Σ X
6/S
23
15
37
32
ΣΣ X=107
(采自杨治良,乐竟泓,1990)
否要求特殊设计,如指导语变量要求被试者间设计;在这一点上没问题时, 就得从方便、经济和注意统计正确性的角度作进一步的考虑。
第二节 多变量实验技术
在上一节中,我们讨论了实验设计的基本类型,在以人或动物为研究对 象的心理学实验中,首先要解决的问题是:实验处理中用了相同的被试者还 是用了不同的被试者。根据这一原则,上一节中我们讨论了被试者内设计、 被试者间设计和混合设计。尽管这样的分类也穷尽了各种实验,但在心理学 实验中,大多数比较重要的实验都是多自变量实验。所以在这一节里,我们 对多自变量的实验设计作进一步介绍。
一、多自变量实验的优点
多自变量(或多自变项)(multiple independent variable)是指在一 个实验中包含有两个或两个以上的自变量。它不是指同一自变量的多个水 平。在心理学的刊物上较少发现只用一个自变量的实验研究报告。一个复杂 的心理现象很少是单一刺激因素决定的,往往是多因素的结果。例如,想研 究不同的教学效果,可能有教学方法的影响,也可能有教师水平的影响,还 有学生自身水平的影响等。这种教学效果,实际上是受多因素交互影响的结 果,要使实验更接近实际,就应采取多因素,即多自变量的实验设计。典型 的实验是同时操纵两到四个自变量。
那么为什么在心理学实验中在较多的情况下要采用多自变量实验呢?这
是因为多自变量实验具有三个明显的优点:
1.效率高 有两个自变量的实验要比分别做两个只有单一自变量的实验 效率要高,也就是说事半功倍,花同样的时间,做了一倍,甚至二倍、三倍 的工作。
2.实验控制较好 做一个实验时某些控制变量比进行两个实验时更易于
控制和恒定。如被试者条件是一样的,同一个被试者,同样的身心状况。再 如时间条件也是一样的,日期相同、时间相同。其他条件就更不用说了,如 相同的外界环境、相同的温度、相同的湿度等等。这就在很大程度上排除了 许多实验误差,减少了实验污染。
3.实验结果更有价值 有多种自变量的实验所得的结果,由于在多种情
况下都证明是确实的,这样就比多个单独实验所概括的结果更有价值。例如, 我们想要知道两种奖励办法中哪一种促进了中学生学习体育。第一种奖励办 法是对正确完成规定的运动项目的学生给予物质奖励;第二种是给予提前下 课,即每正确完成一个规定的运动项目允许学生提前下课,哪种更好些需要 用实验证实。而且,在把它作为一项中学的规定之前,我们还应把这两种办 法放到语文、数学等课程中去实验。在这里,不同课程的被试者是第二个自 变量。显然,把奖励办法与不同的课程这两个自变量结合在一项实验中,要 比进行两个连续的单自变量的实验为好。特别是,当一个自变量产生的效果 在第二个自变量的每一水平上不一样时,交互作用(interaction)就发生了。 在有交互作用的情况下,分别讨论每一自变量的效应就不够了。因为一个自 变量的效应依赖于另一个自变量的水平。这里,我们举个例子。杨治良等人
(1981)做了一个实验,目的是想了解年龄对再认能力的影响。第一个自变 量是年龄,这里我们选取初中生年龄组和大学生年龄组。第二个自变量是实 验材料,这里我们选取具体实物图形组和词组两个组。因变量取再认能力 d' 作指标(信号检测论方法用于再认实验,采用 d'作为再认能力的指标)这个 实验的方法是采用再认法,把被试者识记过的材料和没有识记过的材料混在
一起,要求被试者把两种材料区分开来。实验结果如图 2-1 所示(见下页)。 从图 2-1 可见:第一,在哪个实验条件下,初中生的再认能力较强;第 二,对具体图画的材料,再认能力较强。然而,此图是将两个变量(年龄大 小和材料性质)分开绘制的。在左图,初中生的再认能力指标中,既包括了
对具体图画的材料,又包括了对词的材料。大学生的情况也是一样。 如果把同样一个实验结果,换另一种方式绘图(如图 2-2),我们就可
以看到,实际情况并非这样简单。图 2-2 将两个变量画在一起,显示了交互 作用的发生。它告诉我们:第一,在此实验条件下,再认能力较低的情况仅 仅是在以具体图画作材料的大学生组发生;第二,无论是对具体图画材料, 还是词材料,初中学生都表现出较高的再认能力,比较图 2-1 和图 2-2,我 们看到了区别。具体地说,大学生对词材料的再认能力,在二张图上有不同 的分析。图 2-2 能明确指出一个自变量的各水平受到另一个自变量水平的不 同影响的交互作用就代表了这种不同的影响。
为更进一步分析多自变量的优越性,我们也可以设想,两个自变量没有 显出交互作用。图 2-3 就是虚构的情况。从图 2-3 上可以看到,任何一 个自变量的效果对于另一个自变量的两个水平来说都是相同的。也就是说, 第一,初中学生总是表现出较高的再认能力,不论实验材料是图画还是词。 第二,对于图画材料,不管是初中学生还是大学生都表现出较高的再认能力。 这就是图 2-3 说明的问题。平行线意味着没有交互作用的发生。
实验的实际情况并不是这样。实际情况如图 2-2 所示,再认能力的高低
既依赖于年龄大小,也依赖于实验材料;一个自变量的效应依赖于另一个自 变量水平。
上述三种情况的图解分析揭示了多自变量实验能揭示变量间是否存在着
交互作用。这是单自变量实验所不能完成的,我们想象这个实验是分两部分 进行的。第一部分实验中,只有年龄大小被当作唯一的自变量。那么,实验 材料就成了控制变量。我们知道,控制变量在实验过程保持恒定。如果选择 的是图画作实验材料,实验结果将表明,初中学生比大学生表现出较高的再 认能力。但是,实验者将不会知道,如果用词作材料会产生什么结果?在第 二部分实验中,只有实验材料被当作唯一的自变量。年龄大小就成了控制变 量。若用初中生做被试者,将揭示出不同的结果。我们可以看到,实验虽然 做了两个,但得到的信息反而比一个双自变量实验少。二个单自变量实验所 获得的信息反而比一个双自变量实验少。
图 2-2 是实际的实验结果,它表明了交互作用。一个自变量的效果依
赖于另一个自变量的水平。具体地说:第一,若用词作材料,初中生和大学 生的年龄因素对再认能力的影响较少;第二,若用图画作材料,初中生和大 学生的年龄因素对再认能力的影响较大;第三,若用初中生作被试者,实验 材料的因素关系不大;第四,若用大学生作被试者,实验材料的因素关系就 很大。这里我们不难发现,一个双自变量实验实际上等于四个单自变量的实 验,而且还要看单自变量实验是否做得好。
综上所述,当一个自变量的水平受到另一个自变量水平的不同影响时, 交互作用就发生了。在有交互作用的情况下,分别讨论每一个自变量的效应 就不够了,因为一个自变量的效应依赖于另一个自变量的水平,因而在实验 结果的分析讨论中,除了对单独因素的分析之外,还必须分析讨论出现交互 作用的原因和后果。
多自变量的实验是效率高、价值高的实验。在这些实验中,每一种因变 量的测量至少能提供两个变量信息,从而有可能研究变量之间所有可能发生 的交互影响。在实验中自变量数目增加时,能发生交互影响的数目也迅速增 加。两个自变量只有一个交互作用影响的可能。用三个自变量(自变量 A、B、 C)就有四种交互作用影响的可能,如 AB、AC、BC、ABC 四种。假定每一自 变量有两个水平,三种自变量的交互影响由四条线生动地表现出来;两条表 示变量 B、两条表示变量 C,与横坐标变量 A 起交互作用,见图 2-4,它们的 交互作用由四条非平行线表示出来。
二、多因素实验设计
多因素实验设计(multifactors experimental design)是指在同一个 实验里可以同时观测两个或两个以上的自变量的影响,以及自变量与自变量 交互作用的效果的实验设计。它与上述所讨论的只用一个自变量的实验设计 是不同的。包括 Xa 和 Xb 两个自变量的设计,叫做双向(或二向)析因设计,
简写为 A×B 因素设计。包括 Xa、Xb 和 Xc 三个自变量的设计叫作三向析因设
计,简写为 A×B×C 因素设计。在因素设计中,每个因素(自变量)又可以 包括几个水平。若两个自变量 Xa 和 Xb 各有两个水平,则可称为 2×2 设计; 若自变量 Xa 有两个水平,Xb 有三个水平,则称为 2×3 设计。例如,有人想 研究大学生对红、绿、黄三种灯光的反应是否与灯光的强度有关,在这项实 验中,A 代表灯光强度,是一种因素(自变量 Xa),包括强和弱两种水平; B 代表灯光频率,是另一个因素(自变量 Xb),包括红、绿、黄三种水平。这 种二向析因设计就是 2×3 因素设计。若它还想同时研究反应时是否有性别差 别,则 C 代表性别(自变量 Xc),分男女两个水平。这种三向析因设计就是
2×3×2 因素设计。当然也可以有多于三个因素的设计。不过,因素多,解 释结果的困难就大,交互作用也就多,因而研究者一般是将研究限于 2 至 4 个变量。在析因设计中,研究者要操作的实验处理的个数就是各自变量的水 平个数的乘积。例如,在一项二因素实验设计中,设 A 因素有 p 个水平,B 因素有 q 个水平,则研究者就应操作 p×q 个实验处理。在确定了实验中所要 操作的实验处理后,就要决定怎样分配被试者了。下面我们举一个研究实例。 杨治良等人(1993)在研究汉字内隐记忆的实验研究中,通过四个 2×2
×2 方差设计实验,试图寻找汉字认知范畴里内隐记忆存在的条件。此方差
设计的三个因素为:(1)A 因素,即注意程度因素,分目标字和非目标字两 个水平;(2)B 因素,分直接测量和间接测量两个水平,直接测量为再认判 断任务,间接测量则是汉字偏好判断任务;(3)C 因素,即时程因素,分单 元一和单元二两个水平,参见图 2-5。结果发现了内隐记忆存在的三个必要 条件是:非目标汉字、汉字的整体加工和偏好判断任务。此例说明了,正是 这些多因素实验设计,才发现了汉字内隐记忆存在的条件。
多因素实验设计可以概括成某一个基本形式。假设实验因子有 A、B 这两 个, A 因子有三个水平, B 因子有四个水平,那么就有 3×4=12 种组合, 每一个组合称作一种处理,现随机抽取被试者 1、2、3、??24,共 24 个分
别安排在各种处理中接受实验,实验设计列表如表 2-13。
表 2-13 多因子设计表
实验因子
B 因子
B1
B2
B3
B4
A 因 子
A1
1,2
3,4
5,6
7,8
A2
1,10
11,12
13,14
15,16
A3
17,18
19,20
21,22
23,24
(采自杨治良、乐竟泓, 1990)
实验所得的数据,可表明哪种处理(即水平的结合)效果比较好。但到 底多种处理的效果是否有显著差别,还要作进一步的统计检验。
三、拉丁方设计
拉丁方设计(或拉丁方格设计)(Latin-square design)是多变量实 验设计中一种较为常用的设计方案。心理实验中采用循环法平衡实验顺序对 实验结果的影响,就使实验顺序、被试者差异都作为一个自变量来处理。只 要是实验中自变量的个数(因素)与实验处理水平数相同,而且这些自变量 之间没有交互作用的存在时,都可采用拉丁方设计方案。这里对于这些因素 之间没有交互作用的假设是很重要的。否则,若按没有交互作用的统计方法 处理实验结果,只能是准实验设计。此设计的基本模式如表 2-14。
表 2-14 拉丁方设计
被 试 者
实验顺序
B1
B2
B3
C1
A1
A2
A3
C2
A2
A3
A1
C3
A3
A1
A2
(采自金志成,1991)
表 2-14 中 A1、A2、A3 为实验处理的三个水平。C1、C2、C3 是被试者的
三种不同类型,存在个体差异,被试者可为一人,也可为多人。对于这种拉 丁方设计的实验结果,可用独立样本拉丁方变异数分析法,可分析出被试者 间、实验顺序间、实验处理间的差异情形。就是说实验顺序、被试者差异对 实验结果的影响都可分析出来。
假如,被试者是随机抽取的,且随机分派,并保证各组被试者相等。这
时的结果分析可用相关样本拉丁方分析法来处理。可分析出被试者内的顺序
(B 因素)、处理(A 因素)及部分 A×B 的交互作用。 拉丁方设计能够抵消实验中因实验顺序、被试者差异等造成的无关变量
效果,因此在心理实验中经常被应用。随着数理统计的发展,多因素设计的 方案越来越多,多因素的实验设计执行起来很费劲,被试者的数量要多,结 果的统计处理也较复杂,因此,选用哪一种实验设计,要因地制宜,以做到 恰到好处。
第三节 实验数据的统计分析
一、统计表和统计图
在心理学实验研究中,一般都是先获得一大堆原始数据和观测材料,虽 然这些数据乍看起来十分凌乱,但它们却是实验所获得的最宝贵的财富。实 验做完以后的分析和立论,都将以这些数据为基础。因此,为使实验获得成 功,数据的整理十分重要。在数据整理的过程中,第一步是对数据的特点和 种类加以分析,绘制出简单的统计图和统计表。统计图和统计表的一个共同 优点在于一目了然,它所表示的信息容易被人们理解和接受。有人曾给予一 个不甚恰当的比喻,如果文字的信息量是“1”,那么统计表的信息量就是 “10”,统计图的信息量则是“100”。艾宾浩斯(Ebbinghaus Hermann,1850~
1909)著名的遗忘曲线就是用一个统计图概述了他实验的全貌。下面我们分 别来介绍统计表和统计图的制作方法。
(一)统计表
1.统计表的功能和结构 在心理学研究报告中免不了要用几张统计表。这 是因为,统计表(statistical table)是对被研究的心理现象和过程的数字 资料加以合理叙述的形式。它在叙述统计资料方面有着重要的作用,有人称 之为统计的速记。设计良好的统计表使统计资料表现得充分、明显而又深刻、 有力,可以避免冗长的叙述。统计表由标题、横行和纵栏、数字资料等要素 组成。统计表的构造一般包括如下几个项目:
(1)序号:序号就是表的编号,要写在表的上方,表题的左方。序号一
般以在文章中出现的先后顺序编列。
(2)名称:又称表题,是一个表的名称,应写在表的上方序号之后。表 题的用语要简洁扼要,使人一望可知表的内容。如果用语过简,可在下面附 加说明,但这种情况不宜多用。
(3)标目:又分横标目和纵标目。横行标目写在表的左方;纵列标目写
在表的上方,分别说明横行和纵栏的内容。
(4)数字:数字是统计表的语言,又称统计指标。它占据统计表的大部 分空间,书写一定要整齐,位数要上下对齐,小数点后缺位的要补零,缺数 字的项要用“—”符号表示,不能空白。
(5)表注:写于表的下方。它不是统计表的必要组成部分。如果需要可
对标目补充说明。数据性质、数据来源、附记等都可作为表注的内容,文字 可长可短,参见表 2-15。
表 2-15 29 名被试康复治疗前后体重差别阈值的变化
康复治疗 差别阈限(克)
前 175 ± 37.8*
后 84.4 ± 35.2
为了使统计表能对所研究的心理现象以鲜明的数字叙述,制表时应注意
以下几点:
(1)每一张统计表都必须有名称,统计表的各种标题,特别是表题的表 达,应十分确切明了。内容应紧凑而富有表现力,避免过分庞大和琐碎。
(2)表的各纵列之间要用线条隔开,表的两个纵线可以省去,上下两边
须有横线,标目与数字之间、数字和总计之间、两个总标目之间都须用线条 隔开。表的上下二横线条要粗些。
(3)表中各栏,通常是根据由局部到全部的原则编列的。
(4)统计表应有计量单位名称。计量单位名称,通常加用圆括号并置于 表头的右上方,或者置于标题或标目的下面。
2.统计表的种类 统计表可以以形式及内容的不同来作为分类标志,将其 划分成不同的类型。不同类型的统计表的具体功能不同。下面简述几种常用 统计表:
(1)简单表:只列出调查名称、地址时序或统计指标名称的统计表。例 如表 2-15。
(2)复合表:统计分组的标志有两个或两个以上的表。若只有两个分组 指标的称两项表;若分组指标有三个的称为三项表,依此类推。表 2-16 就 是一个复合表,且分类的标目有五个:间隔时间、实验数、节省百分数、节 省百分数的中数、中数机误。
表 2-16 不同时间间隔后的记忆成绩
间隔时间
实验数
节省百分数的范围
节省百分数的中数
中数机误
1/3 小时
1 小时
8 - 9 小时
24 小时
6 天
31 天
12
16
12
26
26
26
45
45 — 64
34 — 54
28 — 48
15 — 46
12 — 46
3 — 40
7 — 44
58.2
44.2
35.8
33.7
27.8
25.4
21.1
1
1
1
1.2
1.4
1.3
0.8
(采自 Ebbinghaus, 1885)
表 2-16 就是艾宾浩斯(Ebbinghaus, 1885) 实验研究的主要结果,这个统计表集中了他对 1,300 个字表,反复测定
了学习和回忆间隔时间的长短同遗忘的关系,分类统计而成。有了这个表,
他就可以绘制成著名的遗忘曲线(forgetting curve)(见 70 页图 2-6)。
(二)统计图
为了写好实验报告,还需要利用统计图来表明心理现象的数量关系,这 样就不需要作很多解释就可以让读者看懂。统计图有明显的优点,它不仅对 统计资料和实验结果做出具体、明确的表达,易为读者所理解和获得深刻印 象,而且由于统计图的表现生动活泼、醒目动人,具有很强的说服力。所以 统计图是分析统计资料的重要工具,也是实验报告的重要内容。通过作图, 可帮助我们揭示心理规律。
但是统计图也有不足之处,它不能获得确切数字,如果作图不当反而会 掩盖事实真相,因而我们不能用统计图来代替统计表。在论文中,常将统计 图和统计表一并列出。下面我们分别来讨论统计图的功用、结构和种类。
1.统计图的功用和结构 统计图(statistical figure)乃是依据数字资 料,应用点、线、面、体、色彩等来绘制成整齐而又规律、简明而又数量化 的图形。统计图在数据整理中占有很重要的地位。一图知万言,一张简单的
图形,就可以把一大堆数据中有用信息概括地表现出来。 统计图一般多采用直角坐标系,横坐标用来表示事物的组成或自变量
X,纵坐标常用来表示事物出现的次数或因变量 Y,除直角坐标外还有角度坐 标等。
2.统计图的结构与制图要点
(1)图号及图题:统计图的名称为图题。图题的文字应简要,只要求能 扼要地叙述统计图的内容,使人一见就能知道图所要显示的是何事、何物, 发生于何时、何地。图号是图的序号,图题与图号一般写在图的下方。图题 的字体应是图中所用文字中最大的,但也不能过大,要与整个图形的大小相 称,一般与图目文字的顺序一致,从左至右书写,放在居中的位置上。
(2)图目:是写在图形基线上的各种不同类别、名称,或时间、空间的 统计数量,即坐标上所有的各种单位名称。在统计图的横坐标和纵坐标上都 要用一定的距离表示各种单位,这些单位称为图尺,有算术单位,亦有对数 单位,百分单位等等,这要根据资料的情况加以选用,图尺分点要清楚,整 个图尺大小要包括所有的数据值,如果数据值大小相差悬殊,图尺可用断尺 或对数法,进行技术处理,减少图幅,增强图形效果。
(3)图形:是图的主要部分,图形曲线要清晰,一般除图形线外,应尽 量避免书写文字。为表示不同的结果,要用不同的图形线以示区别,各种图 形线的含义用文字标明,选图中或图外一适当位置表示,目的是使整个图和 谐美观且醒目。
(4)图注:凡图形或其局部或某一点,需要借助文字或数字加以补充说
明的,均称为图注。图注部分的文字要少,印刷字型一般要小,它可以帮助 读者理解图形所示资料,提高统计图的使用价值,却又不破坏图的协调性。 此外,一个图形要使用各种线条,这些线条因在图中的位置不同而有不 同的名称,如图形基线(横坐标)、尺度线(纵坐标)、指导线、边框线等。
3.统计图的种类 常用的统计图有曲线图、条形图、直方图、点图、圆形
图等等。通常表示事物各组成部分的构成情况的资料可用圆形图;频数分布 资料可用直方图;资料内容各个独立者可用直条图;表示事物数量发展过程 的连续性资料可用曲线图;表示两种事物的相关性的趋势可用点图。下面我 们分别介绍这几种图。
(1)曲线图:适用于连续性资料,表示事物数量在时间上的发展变动情
况。因为借助于连续曲线,能够最恰当地描绘出心理现象在时间上的不断变 化过程,见图 2-6。
绘制曲线图时,以横轴尺度表示时间、年龄等等,纵轴表示频数。纵、 横轴尺度必须等距或有一定规则。纵轴尺度一般要从零开始,图线应按实际 数字绘制,切勿任意描改为光滑曲线。若有几根曲线,应用不同形式的线条
(实线、断线、点线等)区别开来,并用文字说明。 对数尺度曲线图是动态曲线图的一种特殊图式。图形的一轴制订出对数
尺度,另一轴则按原样。图 2-7 是一个以分计的对数时间作横轴尺度,这样, 我们从短短的横轴上看到了二年时间内的发展趋势,同时还看到了与相对量 有关的绝对量的大致变动情况。
(2)条形图:以相同宽度的条形长短来比较图形指标的大小,它是比较 图中最常用的图形。条形图绘制方法简单,同时形式明确,图示效果好。绘 图时,须先绘制一水平线作为条形的共同基线,依此基线为起点所绘制的条
形的长度,视图示的指标数值的大小而定。因此,必须定出一个比例尺度, 作为绘制条形图的依据,同时各个条形的宽度要相等,各(组)条形间要有 相当的间隙。
图 2-8 就是条形图。条形图有好几种。以同一水平线为基线的纵式条形 图,也可制作成横式条形图。
(3)圆形图:一般用来表示事物各组成部分的构成情况。以一个圆的总 面积代表总数,把面积按比例分成若干部分,以圆心角的角度大小来表示各 组成部分的数量(如百分比)。代表圆面积中 1%面积的扇形有 3.6 度的弧, 各扇形面积中要标明百分数,并加文字说明。图 2-9 是一种表示被试来源的 圆形图。不过一般被试来源用不着作图,作了图就有强调被试构成成分的含
义。
(4)点图:表示两种事物相关性的趋势多采用点图。图的纵轴尺度和横 轴尺度代表一种变量值的大小。习惯上自变量(X)的尺度放在横轴,因变量
(Y)的尺度放在纵轴。不论纵轴、横轴的尺度都不必从零点起。在自变量与 因变量的交叉点绘一个点,我们依据点的情况可以推测两种事物的相关情 况。参见图 2-10。
二、实验数据的初步整理
心理学研究的结果一般都有数量记录,这些原始的数字材料往往是复杂 而分散的,使人读了难得要领。因此必须经过分析整理,把材料有系统地组 织起来。经统计处理能使复杂的材料变得简单扼要,把事实要点表示出来。 下面我们从统计学的角度,概括地介绍如何对实验所得的大量原始资料进行 科学的加工整理。
使用图表概括大量实验结果,这仅仅是对数据整理的第一步。实验所得
资料只是表明每个个体的详细资料,为了能够反映综合特征,集中量和差异 量是两个特别重要的参数。在次数分布上有两个重要特征:即重心位置和分 布范围。用一定量数概括、规定重心位置的数字叫集中量,而用一定量数概 括、规定分布范围的数字叫差异量。在介绍集中量和差异量之前,我们先讨 论有关误差的问题。
(一)偶然误差与系统误差
大家都有这样的经验,无论实验做得多么精密,获得的观测数据总不完 全一致,表现为数据的波动。产生数据波动的原因是因为有许多偶然因素影 响着实验结果。
1.偶然误差 偶然误差(fortuitous error)或机误(chance error)
是指实验中无法控制的偶然因素所引起的误差。例如测量仪器的灵敏度的有 限性。又如,在有些测量中并未把温度、湿度看成影响因素,但是,温度和 湿度时刻都在变化,这些都是偶然因素。无数的偶然因素影响着实验或观测 结果,使得测出的数据范围绕真值有一些上下波动。
例如,用天平称某物体的重量,进行 10 次观测得到 10 个数据,记在表
2-17 的第二列(栏)。
如果此物体重量的真值为 a=150.6 克,表 2-17 中第三列(栏)记下的是 各观测值与真值之差。
设:a 为某变量的真值,X1,X2,??,Xi 为其各次的观测值,则数 Xi-a
(i=1,2,3,??,n)叫做 Xi 的偶然误差。
表 2-17 10 次观测所得的原始数据
序号
观测值 X (克)
Xi-a (偶然误差)
1
2
3
4
5
6
7
8
9
10
150.68
150.53
150.54
150.66
150.62
150.57
150.56
150.53
150.61
150.58
0.08
-0.07
-0.06
0.06
0.02
-0.03
-0.04
-0.07
0.01
-0.02
(采自华东师大数学系,1980)
从表 2-17 第三列看出偶然误差可正可负,可大可小,因为它是由无法控 制的偶然因素引起的。
2.系统误差 有时在实验中还会出现另一种类型的误差,它的观测值不 是分散在真值的两侧,而是有方向性和系统性的。所有重复实验的观测值大 部分都会比真值偏高、或者偏低,其原因是存在有系统误差
(systematicerror)。产生系统误差的原因有很多,如上例中可有仪器的故
障,有时也要考虑实验环境如照明、温度、压力、湿度的变化对实验结果的 影响,这时照明、温度、压力、湿度的变化就不能视为偶然因素了,而是系 统误差因素。另外,在心理实验中,观测者本身的一些因素(如位置、练习、 疲劳、时间等),也能产生系统误差。排除系统误差是实验成败的关键。
(二)集中量
对数据的概括了解,在统计学上常由二种量数来表示:一为表示集中趋 势(central tendency)的集中量(或集中量数)(measure of central ten- dency);一为表示离中趋势(variation)的差异量(measure of variation)。 常用的集中量有平均数、中数和众数。下面我们分别进行讨论。
1.平均数 一个物理量的真值是客观存在的,通常我们无法知道它的真
值,而是通过测量或实验观测算出它的近似值。平均数(mean)或称算术平 均数(mathematic mean)就是把一组数据加起来再用次数去除。它是刻画数 据集中位置的极为重要的数。因此,平均数有两个意义:(1)对一组数据获 得一个总的印象;(2)将此组数据和另一组数据进行比较。平均数是一个主 要量数。平均数用符号 M 表示,其计算公式为:
ΣX
M ? [ 公式 2 ? 1]
n
X:每一个度量 Σ:总和 n:度量的总次数
假如所测原始数据较多,可以进行归组计算,则求平均数的公式为
ΣfX′
M ? [公式 2 ? 2]
n
f:每组的次数
X':各组的均数
2.中数 中数(或中位数、中点数)(median,简称 Mdn)常用符号 Md
表示。中数是在按大小顺序排列的一组数据中,占中间位置的那个数。这个 数可能是数据中的某一个,也可能不是原有数。中数是集中量数的一种,它 能描述一组数据的典型情况,其特点是极少受极端数据影响。
单列数据的中数的计算方法十分简单。如果个数为奇数,则取序列为第
(n+1)/2 的那个数据为中数。如果数据为偶数,则取序列为第(n/2)或第
(n/2+1)这二个数的平均数为中数。例如有下列八个数,大小排列为: 3,
5, 6,9, 10, 11, 13, 16。序列为 n/2(即第 4 个数)的数为 9;序 列为 n/2+1(即第 5 个数)的数为 10,则中数为第 4 个和第 5 个二个数的平 均数,即(9+10)/2=9.5。
假如数据较多,也可以进行归组计算。则求中数的公式为:
(1 / 2×n ? F)×i
成为本站VIP会员VIP会员登录,
若未注册,请点击免费注册VIP 成为本站会员.
版权声明:本站所有电子书均来自互联网。如果您发现有任何侵犯您权益的情况,请立即和我们联系,我们会及时作相关处理。