12小时mba教程-第23节
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
说,即要保证随机抽选的样本,对所有有选举权的人组成的总体具有代表性。
个相反的典型例子是:在预测 1948年美国总统大选结果时,由于选取了不具
有代表性的样本,导致偏差增大,致使预测失败。实际上,在那次大选中,
真正当选的是杜鲁门,而预测的却是戴维。
检验的有效性和可靠性
检验的有效性是指对所要研究的变量能准确地加以度量;检验的可靠性
是指在多次检验中,同样的结果能反复出现。而有的时候,检验的结果可能
无效并且不可靠。更危险的情况却是结果表明出可靠性,但实际上却是无效
的。例如,由于社会文化等方向的影响,一些研究人员设计出对妇女地位不
公平的问卷,即使某项关于妇女的调查结果反复出现(表现出其可靠性),但
它却是无效的,因为从一开始它就有偏差,无法做到准确度量。
本章中所列举的检验方法,有助于我们分析数据并得出结论。这些检验
都有量化的标准,如 t 值用于t 一检验(t—test),F 用于变化。一般数理统
计书后都附有统计检验值表。用计算结果和检验值进行比较,可以得到有用
的结论。例如,我们可能会得出结论说,所检验的某种关系非常强或者很显
著,这个结果在某种程度上证实了我们的假设。
但是,检验的结果落在什么范围内才算是可靠的呢?换句专业术语说就
是:误差界限或置信区间是什么?误差界限和置信区间通常用概率值来表
示,有三种形式:
P≤0。01,表明某结果出现的可能性不少于99%,其误差不超过1%;
P≤0。05,表明出现某结果的可能性不少于 95%,其误差不会 1 超过 5
%;
P≤0。1,表明出现某结果的可能性不少于90%,其误差不会超过10。
选择哪种置信区间要视情况而定。例如,对探索性研究和关键性、决定
性的研究,可能选取不同的置信区间。如果实际一些的话,前者用P≤0。05;
后者用P≤0。01。(如果我们想提高置信度、降低误差限,就必须抽取较大的
样本,而这样做很可能会既不经济又费时间)。相反,如果你是一个挑剔的消
费者,去小贩那里买东西,你所选择的置信区间,就要用 P≤0。01,而不是
用P≤0。05 了。因为前者更符合你挑剔的目的。
频率分布
在进行数据分析时,我们感兴趣的是数据(观察值)集中或者离散、相似
或者差异的程度。数据的波动程度是指数据的离散度,可以用图形来表示,
即图形分布。
… Page 137…
图形分布大致可分为三类:
(1)对称分布(正态分布)
对称分布的图形如钟形(见图 6—1)。大多数观察值落在图形的中部,其
他的均匀分布在两边。例如人的身材,过于矮小和过于高大的人,在整个人
群中所占的比例极小;较为矮小和较高大的人占较大的比例;而中等身材的
人占最大的比例。所以,我们说,人的身材的比例分布基本上属于对称分布。
(2)偏斜分布
偏斜分布的图形如图 6—2所示。它是指大多数观察值分布在一边(或说
聚集在一边),而较少数处于另一边。它又有两种形态:一种是如图6—2
(a)所示的向下偏斜;另一种是图 6—2(b)所示的向上偏斜。例如,假定
两个群均以图6—2 的横轴代表收入水平,收入水平从低到高排列,假设两群
体中所拿最低收入相同,最高收入也相同。纵轴代表拿某种收入人数的话,
那么就可以看出,图 6—2(b)所代表的群体;比 6—2(a)所代表的群体要富
裕。
(3)双峰分布
这种图形的形状像驼峰,见图 6—3。它表明观察值形成为两个集中区
域。例如某班级考试的成绩,得较低分数和较高分数的人都较多,只有少数
人得中等分数,所以形成双峰分布。
… Page 138…
三、最主要的统计度量方法
总体中观察值的分布状况,可以用分布图很好地表现出来。另外还有一
些测度方法可以反映观察值的分布信息,它们包括:
集中趋势的度量
(1)平均值
平均值是所有观察值的和与观察值个数的比值。例如有 7个销售商(观察
值个数为 7),他们在6 月份各自销售的产品数量为1、9、10、12、13、17、
17,那么6 月份平均每人销售产品数为
1+9+10+12+13+17+17 79
= = 11。28(个)
7 7
如果我们是销售商的管理者,就会用他们 6 月份的平均人销售量同以前
的月份相比,看看是否具有某种趋势。平均销售量比总销售额更能反映销售
能力和盈利能力。因为有时销售总额高,并不表明销售人员干得好,而可能
是因为增加了销售人员的缘故。如果明年六月有 14个销售人员,比今年六月
多 1倍,而总销售额只比今年增长 50%,尽管销售收入增加了,但其盈利能
力实际却在下降。这说明有时平均值比总值更能反映问题的实质。但平均值
极易受极端值的影响。
(2)中位数
将所有观察值由低到高排序,处于中间位置的观察值即为中位数。中位
数是位置平均数,它把整个序列分成两半:一半比它小;另一半比它大。对
N+1
于奇数个观察值,中位数所在位置是 (N为观察值总数);对于偶数个观
2
察值,中位数的值等于中间位置两个观察值的平均值。如上例中,7 个销售
7+1
商销量的中位数所在位置是 =4,即销售1:2 个为中位数(1、9、10、
2
〔12〕、13、17、17——译者注)。
中位数的优点是不受极端值的影响。在上例中,有一个人6 月份仅销出
1件产品,远低于其他 6 人,属于极端值。中位数只考察观察值的位置,只
要中间项不变,其前后各项数值虽有变化,但中位数不变。所以,中位数同
平均值相比,掩盖了存在个人销量极低(即极端值——译者注)的事实。
究竟用平均值还是中位数作为平均数,视情况而定。如在上例中,一个
勇于迸取的管理者,在给销售人员下指标时,一般会倾向于选择使用中位数。
相反,如果那个销售人员不是销出 1件,而是销出35件产品,则管理者在他
给上司的报告中,就愿意使用平均值,以表明他所领导的部门的突出业绩。
因为此时,中位数仍是12个,而平均值则为:
35+ 9 + 10+ 12 + 13+ 17 + 17 113
= =16。6(个)
7 7
(3)众数
… Page 139…
众数是指在所有观察值中,出现次数最多的那个观察值。例如,在 7个
销售人员的销售记录中,17 出现了两次,则 17就是众数(1,9,10,12,13,
〔17〕, 〔17〕。如果观察值数列中各值皆不相同,也就没有众数。
众数有助于确定需优先考虑的事物和今后需加努力的重点。在市场战略
决策中经常要使用它。例如,为了最有效地利用有限的资金,皮鞋厂在生产
皮鞋时,需要了解各种尺码鞋的需求量,以决定生产什么尺码及生产的数量,
这时,就需要用众数,而不是平均值。
集中趋势需采用何种平均数度量,要视现象的分布及特点而定。
离散趋势的度量
(1)极差
极差是最粗略的离散程度度量方法,是指观察值中最大值与最小值之
差。我们仍用前述销售人员的例子,最大、最小销量分别是 17和 1,则极差
为 17-1=16。
极差是计量离差的简便方法,它由两个极端值来决定,所以容易受到极
端值变化的影响,而与中间数值的分布无关。因而它不能充分地反映现象的
实际差异。
(2)标准差
标准差是计量离散趋势最重要、也是最常用的指标。它反映了各个观察
值偏离平均值的程度。其计算公式为:
A(X … x )2
标准差 =
N
式中:x =平均值
X=实际观察值
N=观察对象的个数
此公式用于计算总体标准差,在计算随机样本的标准差时,公式中要以
N—1来代替N,这样,样本标准差才是总体标准差的无偏估计。
标准差计算示例(1)
我们仍用前面的例子,共有 7个销售商,各人销量分别为:1,9, 10,
12,13,17,17,平均值为11。28。那么标准差的计算过程如下表6—1所示。
表 6—1
… Page 140…
2
x x
(X) ( ) (X… )
第一位销售商卖了 1件产品 1…11。28 =…10。28 平方后= 105。68
二 9 9…11。28 =…2。28 平方后= 5。2
三 10 10…11。28 =…1。28 平方后= 1。64
四 12 12…11。28 =0。72 平方后= 0。52?
五 13 13…11。28 =1。72 平方后= 2。96
六 17 17…11。28 =5。72 平方后= 32。72
七 17 17…11。28 =5。72 平方后= 32。72
N— 7 181。44
A(X … x)2 181。44
= = 25。92 = 5。09
N 7
经过上述计算,标准差为5。09。
一般来说。计算标准差比较复杂,在数据很多的情况下,没有人用手工
计算。在所有MBA 教程中的数学公式,都可用计算机计算,你只要输入原始
数据就行了。
中心极限定理
为评价标准差指标的价值,我们首先应当了解它在中心极限定理中的意
义。(中心极限定理:对于任意一个平均数为μ标准差为σ的总体进行随机抽
样时,随着样本量 N 的增大,样本平均数x 就趋向子正态分布,其平均数为
x ,山标准差为σ/ n 。中心极限定理说明无论是从正态分布总体,还是从
非正态分布总体中抽样,只要样本容易足够大,其样本平均数也趋向正态分
布——译者注)请记住以下的叙述:
(1)无论任何分布(正态的或是其他的),其样本平均值都非常接近总体平
均值。
(2)为了对总体有代表性,样本量至少为30。
(3)在所有观察对象中(见图 6—4):
34%落在平均值上方第一个 “部分”内;
34%落在平均值下方第一个 “部分”内;
13%落在平均值上方第二个 “部分”内;
13%落在平均值下方第二个 “部分”内;
3%落在平均值上方第三个 “部分”内;
3%落在平均值下方第三个 “部分”内。
(4)上面所指的 “部分”,就是标准差。
如果你是一位经理,管理着 100位销售人员,