与众不同的心理学-第19节
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
力对两者相关的影响,本身无疑也在理论及实践方面具有很显
然的重大意义。
两位安德森教授就曾经通过检验其他假设能否解释同一组
研究数据的方法,验证了一个关于暴力具有地区差异的理论
(Anderson & Anderson ; 1996)。他们所使用的方法是偏相
关。曾经有研究数据显示美国南部的暴力犯罪率要高于北部各
州。两位安德森对这个高温假设(
heat hypothesis )进行了验
证,这一假设认为南部地区所以有较高的暴力事件是因为
〃令人不舒适的高温导致了人们的攻击性动机和(有时候)
攻击行为的增多〃
(p。740)。找到一个城市平均温度与其犯
第五章相关和因果。
127 。
罪率之间有相关,并不稀奇,这很容易做到,许多人都报告
了这一结果。然而,当他们发现即使将像失业率、人均收
人、贫困率、教育状况、人口数量、人口平均年龄及其他
几个可以是第三变量的因素都加以控制之后,温度与暴力犯罪
之间的相关仍然显著。这就使得高温假设理论的可信度大大提
高了。
方向性问
如果我们可以通过操纵变量来顺理成章地推断因果关系,
就没有理由要像上面说的那样转弯抹角地靠分析相关系数来推
论。但是很让人苦恼的是,一且涉及到心理学的问题,我们经
常都必须靠相关系数来做进一步的分析。并且在心理学知识J才
解决社会问题越发重要的今天,这种依赖相关分析的趋势越加严
重。教育心理学里一个广为人知的例子可以很好地说明这一点。
人类对阅读进行科学研究大概始于
100年前。从那时起,
研究者就发现眼动型式(
eye movement patterns )与阅读能力
之间存在相关,阅读能力差的人在阅读文字时眼动没有规律,
并经常回扫(从右到左)和凝视(停下不动)。基于这一
相关,一些教育学家认为缺乏眼动技巧是导致阅读困难的原
因。于是,许多眼动训练项目开始开展,并且很快地应用于
小学的教学中。这些教学项目都是在还没有弄清楚这两个有相
关的变量到底哪一个是因,哪→个是果的情况下,就早已被
激活施用了。
而今天我们已经很清楚,人们从这…个相关所推论出的,
。 128 。与〃众〃不同的心理学
由眼动到阅读能力的因果关系,恰恰与实际情况呈相反的方
向。无规律的眼动不会导致阅读困难(Ol
son
& Forsberg ;
1993; Rayner ; 1998);而是阅读速度慢、理解困难导致
了元规律的眼动!小孩子在识字水平和理解力提高的过程中,
眼动会逐步趋于有规律。相反地,训练孩子的眼动不会提高
他们的阅读水平。
最近十几年,研究者已经清楚地发现,词语解码及语音加
工时所出现的语言问题才是阅读困难的根源所在
(Rayner,
Foorman ; Perfetti ; Pesetsky ; & Seidenberg ; 2001 ; 2002;
Shaywitz ; 1996; Stanovich ; 2000),而很少发现是由于不
良的眼动型式导致阅读能力丧失的例子(
01son & Forsberg ;
1993 ; Share & Stanovich ; 1995)。但是如果你现在到那些
中等或以上规模的学校地下储藏室里去仔细找一找的话,你一
定会找到→个盖满灰尘的眼动训练仪,到如今,这些仪器已成
为浪费公物的样板。这全是由于人们习惯把一个相关当作是因
果关系所造成的恶果。
另一个有些相似的例子曾在第…章中讨论过。在教育社会
工作领域里,曾一度流行认为学业成绩低、滥用毒品、少女
怀孕及其他许多问题行为是由低自尊造成的
(Dawes,
1994;
Kahne ; 1996)。这个因果关系的方向似乎是理所当然的:低
自尊导致问题行为;高自尊导致优秀的学业成绩及其他成就。
因此在这一因果推论的激发下,各类提升自尊的训练项目应运
而生。但是这里存在的问题与〃眼动〃的例子一样:这个
因果关系的结论仅仅是从两个变量的相关关系中推衍出来的
(并且,在这里相关值非常小,请见
Kahne,
1996)。如今
第五章相关和因果。
129 。
已经得到证实,即便是自尊与学业成绩存在因果关系,其方
向却极可能与前面的推论正相反:在学校(以及生活中其他
方面)的优秀表现导致了高自尊
(Baumeister,
1999;
Ruggiero ; 2000 j Stout ; 2000)。
我们前面的讨论主要是围绕着两变量的相关常常涉及的两
类问题:第一类叫做方向性问题,〃眼动〃和〃自尊〃的
例子可以说明,当变量
A与
B有相关时,在下结论这一相关
是由
A导致
B之前,必须想到这种因果关系的方向很可能是相
反的。也就是说,很可能是由于
B的变化而引起了
A的变化。
第二类问题是第三变量问题,糙皮病(和烤面包机与生育控
以及私立学校与学业成绩)的例子可以说明,两变量之间
的相关或许不能告诉我们任何一方是另一方的因或果,很可能
只是由于两个变量均与第三变量有相关而导致的。
选择偏差
在有一些情况,虚假相关存在的可能性是很高的。那就
是当选择偏差出现的可能性很高的时候。所谓选择偏差就是
指:某些人与某些环境存在着一种关系,是由于具有某些特
定生理、行为、心理特征的人会选择生活在具有某一特定的
环境居住。因此,选择偏差造成环境特征与行为及生理特征
之间的虚假相关。
下面通过一个例子来看看选择偏差是如何产生虚假相关
的。请你很快地告诉我们美国哪一个州,由呼吸道疾病导致
死亡的人数最多。这个问题的答案当然是亚利桑那州咿!为什
。 130 。与〃众〃不同的心理学
么呢?亚利桑那州的空气不是已经净化得很好吗?难道说洛杉
矶的废气浓烟会扩散到那么远的亚利桑那州吗?凤凰城的郊区
环境已经变得那么差了吗?不可能,绝对不可能!别急,让
我们好好想想:或许亚利桑那州的空气也很清新,或许只是
有呼吸道疾病的人喜欢移居到那里,然后就在那里去世。
呀!这样想就对了。这让我们注意到,如果一不留意,就很
可能被呼吸道疾病与死亡人数的相关所误导,以为是亚利桑那
州的空气是致命的。
然而,选择偏差有时很难被发现,它们经常会被人们所
忽略,特别是像自尊的例子那样,当我们心中早已存在一个
特定方向的因果联系的想法时。这时,即使是再聪明的头
,诱人的相关系数和心中的预设偏见也会联合起来把我们蒙
骗
O下面是一些具体的事例。
有关美国教育质量这一问题在过去20年里人们一直争论不
休。在这一问题的辩论中,我们可以看到考虑选择因素的重
要性。当时,大量的统计数据曾一股脑地涌向大众,但是却
没有给他们提个醒儿,警告他们要避免由相关数据去推论因果
关系,因为相关数据内含有大量的具有误导性的选择偏差。
在整个争论过程中,许多带有政治目的的教育评论家一再
试图提供有关教育质量与教师工资水平及班级大小规模没有关系
的证据,尽管已有许多研究表明后两个变量对前者都很重要
( Ehrenberg ; Brewer ; Gamoran & Williams ; 2001; Finn &
Achi1les ; 1999)。他们提到的证据当中,有一个是对
50个州
的学生之学业能力测验
(scholastic
aptitude test ; SAT)结果
所做的分析。数据显示测验的平均分数的确与教师工资和教育
第五章相关和因果。
131 。
支出的联系很小。即使有联系也与人们所期望的方向正相反。
一些教师平均工资高的州,学生测验成绩的平均分很低;而有
些教师平均工资低的州,学生的测验得分却很高。但是,在
这个研究中,只有那些想考大学的高中生才参与了这次测验,
这就使我们看到选择偏差导致虚假相关是有多容易。
从测验中,我们看到密西西比州的学生在
SAT(学业能
力测验)上的得分要高于加利福尼亚州的学生
(Powell
&
Steelman ; 1996; Taube & Linden ; 1989),并且差异还相
当大,密州比加州的平均分要高出
100分之多。由于密西西
比州的教师工资是全国最低的。所以这就成了那些极力要求削
减教师工资的保守派人士提供了一个庆祝的理由。但是,密
西西比州的学校是否真的比加利福尼亚州的学校好呢?再者,
是不是前者的整体教育状况都比后者好呢?当然不是。几乎所
有其他的客观指标都显示加利福尼亚州的学校要更胜一筹
(Powell & Steelman ; 1996)。如果真是如此,又如何解释
SAT的结果呢?
答案就在于选择因素。不同于许多要求全州教育系统之所有
学生都要参加的标准化测验,
SAT由于不是所有高中生都→定要
参加的测验,因而存在选择偏差(
Powell & Steelman ; 1996 ;
Taube & Linden ; 1989; Wainer ; 1989)。只有那些认为自己
有希望进人大学的学生才参加这项测验。这个因素是导致了各州
测验的平均分数存在差异的部分原因,同样也解释了为什么一些
教育实力最强的州在学业能力测验中平均分偏低的现象。
选择因素以两种途径作用于各州的
SAT分数。首先,→
些州立大学人学的要求是看美国大学入学考试(
American col
。 132 。与〃众〃不同的心理学
lege testing ; ACT)的分数,而不是
SAT分数。因此,在
这些州参加
SAT考试的学生都是想到其他州读书的学生,而能
够去外地读书的学生往往家庭条件比较好、学业能力也高于该
州平均水平。这就是为什么会出现密西西比州与加利福尼亚州
的差异情况:在密西西比州只有
4%的高中生参加
SAT,而
加利弗尼亚州的数字则是
47%
(Powell & Steelman ; 1996)。
第二个选择因素则微妙得多。在一些教育系统发达的州,
许多学生喜欢读完高中以后继续读大学深造,所以在这些州
中,很高比例的学生包括相当一部分能力稍差的学生也都参加
了
SAT。而在一些辍学率高、教育质量较差的州,只有较少
的学生想读大学,因此,这些州最终参加
SAT的学生仅仅是
最有能力上大学的那群人。这样一来,当然是这些州
SAT的
平均分要高于那些报考比例大的州。
错用
SAT分数也提供了一个机会让我们看到,当公众缺乏
本书所传授的基本方法和统计思想训练时,要想、纠正误用统计
是何等的困难。在
1983年这本书的初版中,我就以
SAT分数
为例来解释选择偏差。
10多年后,在
1994年的第四版中我又
讨论了一位印度教授鲍威尔
(Powell)的一篇关于分析保守派
政治专栏作家威尔
(George
Will )的文章。如你所料,
Will
在他的文章中声称由于高
SAT分数的州教育投资并不高,所以
他反对在教育中拨款太多
(Will,
1993)。然而,鲍威尔指
出,那几个被单独列出的所谓分数特别高的州:爱阿华州、
北达科他州、南达科他州、犹他州和明尼苏达州,其
SAT的
参加率分别仅为:
5%、
6%、
7%、
4%和
10%;相反地,
全美国有超过
40%的高中毕业生参加了
SAT测试。因为在这
第五章相关和因果。
133 。
些州中,公立学校所需的人学测试为
ACT测试,只有那些计
划去其他州学习,而且〃通常是到声誉很好的私立学校〃去
读书的学生才参加
SAT测试(
Powell ; 1993 ; p。 352)。相
反地,在被威尔点名为
SAT得分低而教育消费高的新泽西州
中,却有
769毛的高中毕业生参加
SAT测试。显然,北达科
他和南达科他州参加
SAT测试的学生,与有
3/4的学生参加了
这项测试的新泽西州的学生相比是更是〃拔尖〃的一群。
在《教育研究者
(Educational
Researcher )》杂志上,
心理测量学家霍华德·韦纳(
Howard Wainer )曾分析了
1993
年
6月
22日发表在华尔街日报上刚一厢义旱。叫町、,目〃'。。=一
个由美国传统基金会所做的研究。这个基金会是一个带有较强
烈社会政治理念色彩的智囊团,反对在教育上技人太多的经
费,他们的证据是,(对了,想必你已经猜到了
)SAT分
数较低的州在教育中的投资反而较多。好在,韦纳的文章不
仅解释了是选择偏差导致了这一结果,它还让我们看到,当
把→个测验(全国教育进展评估,或称
NAEP)施于具有代
表性的样