第三章 数据描述的综合指标

140
第第第 第第第第第第第第第 第第第 第第第第第第第第第 第第第第 第第第 第第第第 第第第 第第第第 第第第 第第第第 第第第 第第第第第

description

第三章 数据描述的综合指标. 第一节 总量指标. 第二节 相对指标. 第三节 平均指标. 第四节 变异指标. 第五节 偏态与峰度. 第一节 总量指标. 一、总量指标概述. 反映现象总体规模或水平的综合指标,即 数量指标 ,也称为 绝对数 。. (一)总量指标. (二)总量指标的意义. 是反映一个国家的国情和国力,一个地区或一个单位人力、物力、财力的基本数据,是认识社会经济现象的起点;. 是计算其它综合指标的基础,相对指标和平均指标一般是由两个有联系的总量指标对比而形成的。. - PowerPoint PPT Presentation

Transcript of 第三章 数据描述的综合指标

Page 1: 第三章  数据描述的综合指标

第三章 数据描述的综合指标第三章 数据描述的综合指标

第一节 总量指标

第二节 相对指标

第三节 平均指标

第四节 变异指标

第五节 偏态与峰度

Page 2: 第三章  数据描述的综合指标

第一节 总量指标

反映现象总体规模或水平的综反映现象总体规模或水平的综合指标,即合指标,即数量指标数量指标,也称为,也称为绝对数绝对数。。

一、总量指标概述一、总量指标概述一、总量指标概述一、总量指标概述

是反映一个国家的国情和国力,一个地是反映一个国家的国情和国力,一个地区或一个单位人力、物力、财力的基本数区或一个单位人力、物力、财力的基本数据,是认识社会经济现象的起点;据,是认识社会经济现象的起点;

(一)总量指标(一)总量指标(一)总量指标(一)总量指标

(二)总量指标的意义(二)总量指标的意义(二)总量指标的意义(二)总量指标的意义

Page 3: 第三章  数据描述的综合指标

是计算其它综合指标的基础,相对指标是计算其它综合指标的基础,相对指标和平均指标一般是由两个有联系的总量指和平均指标一般是由两个有联系的总量指标对比而形成的。标对比而形成的。是加强社会经济管理,平衡供求关系,是加强社会经济管理,平衡供求关系,保证国民经济协调发展,全面提高社会经保证国民经济协调发展,全面提高社会经济效益的重要工具。是实现宏观经济调控济效益的重要工具。是实现宏观经济调控和企业经营管理的基本指标。和企业经营管理的基本指标。

二、总量指标的分类二、总量指标的分类二、总量指标的分类二、总量指标的分类(一)按时间特征分类(一)按时间特征分类(一)按时间特征分类(一)按时间特征分类

按反映的按反映的时间状况时间状况不同分为:不同分为:

时期指标时期指标时点指标时点指标

Page 4: 第三章  数据描述的综合指标

1.1. 时点指标时点指标 表明现象总体在某一时刻(瞬间表明现象总体在某一时刻(瞬间)的数量状况,)的数量状况,如如在某一时点的在某一时点的总人口数总人口数

不具有可加性、数值大小与时期长短没不具有可加性、数值大小与时期长短没有直接关系、由有直接关系、由一次性登记调查得到一次性登记调查得到

2.2. 时期指标时期指标 表明现象总体在一段时期内发展过表明现象总体在一段时期内发展过程的总量,程的总量,如如在某一段时期内的出在某一段时期内的出生人数、死亡人数生人数、死亡人数

具有可加性、数值大小与时期长短有具有可加性、数值大小与时期长短有直接关系、需直接关系、需要连续登记汇总要连续登记汇总

Page 5: 第三章  数据描述的综合指标

出生人数

人口总数

死亡人数

t1 时段 t2 时段 t3 时段 t

关于一个人口总体的总量指标

时期指标

时点指标

Page 6: 第三章  数据描述的综合指标

(二)按计量单位分类(二)按计量单位分类(二)按计量单位分类(二)按计量单位分类

按按计量单位计量单位不同分为不同分为::

实物指标实物指标价值指标价值指标劳动指标劳动指标

1. 1. 实物量指标实物量指标 是根据总体的属性和特征,采用是根据总体的属性和特征,采用实物单位作为度量标准的总量指实物单位作为度量标准的总量指标。标。如 如 某地区一年的粮食总产量某地区一年的粮食总产量

2. 2. 价值量指标价值量指标 是用货币单位计量的产品和劳务是用货币单位计量的产品和劳务的数量。的数量。如 如 商品零售额商品零售额

3. 3. 劳动量指标劳动量指标 是以劳动时间为单位计算的产品是以劳动时间为单位计算的产品产量或完成的工作量。产量或完成的工作量。

Page 7: 第三章  数据描述的综合指标

实物单位实物单位自然单位自然单位

度量衡单位度量衡单位标准实物单位标准实物单位

价值单位价值单位劳动单位劳动单位

多个单位的结合运用:多个单位的结合运用:复合单位复合单位双重单位多重单位多重单位

(如:人(如:人 ·· 次、吨次、吨 ·· 公里)公里)(如:人(如:人 // 平方公里)平方公里)(如:艘(如:艘 // 吨吨 // 千瓦)千瓦)

适用范围

综合能力

差差

强强

大大

小小

如:台、件如:台、件如:米、平方米如:米、平方米如:标准吨如:标准吨

如:工日、工时如:工日、工时如:元如:元

Page 8: 第三章  数据描述的综合指标

公顷 人 辆

计量单位

单一单位

复合单位:工时、吨公里等

自然单位:个、台等

度量衡单位:吨等

Page 9: 第三章  数据描述的综合指标

总体标志总量总体标志总量总体单位总数总体单位总数按反映的按反映的总体内容总体内容

不同分为:不同分为:

(三)按内容分类(三)按内容分类(三)按内容分类(三)按内容分类

2.2. 总体标志总量总体标志总量

1.1. 总体单位总数总体单位总数

一个总体中只有一个单位总数,但可以有多一个总体中只有一个单位总数,但可以有多个标志总量,它们由总体单位的数量标志值个标志总量,它们由总体单位的数量标志值汇总而来。汇总而来。

总体单位某一数量标志的标总体单位某一数量标志的标志值总和志值总和

总体所包含的总体单位的数量总体所包含的总体单位的数量

Page 10: 第三章  数据描述的综合指标

第二节 相对指标

甲企业

乙企业

利润总额

资金占用

资金利润率

500万元

5000万元

3000万元

40000万元

16.7%

12.5%

比较两厂经济效益比较两厂经济效益

不可比不可比 不可比不可比 可比

Page 11: 第三章  数据描述的综合指标

一、相对指标概述一、相对指标概述一、相对指标概述一、相对指标概述指两个有联系的统计数据之间指两个有联系的统计数据之间的比值,用来反映某些相关事的比值,用来反映某些相关事物之间数量关联程度的综合指物之间数量关联程度的综合指标;也称为标;也称为相对数相对数。。

(一)相对指标(一)相对指标(一)相对指标(一)相对指标

可使不能直接对比的现象找到共同的比可使不能直接对比的现象找到共同的比较基础;较基础;

(二)相对指标的作用(二)相对指标的作用(二)相对指标的作用(二)相对指标的作用

可综合的表明有关现象之间的联系程度可综合的表明有关现象之间的联系程度,反映事物发展变化的趋势;,反映事物发展变化的趋势;

Page 12: 第三章  数据描述的综合指标

是宏观调控与微观考核的重要依据。是宏观调控与微观考核的重要依据。

无名数无名数

复名数复名数

用倍数、系数、成数、﹪、‰等表示用倍数、系数、成数、﹪、‰等表示

用用双重计量单位双重计量单位表示的复名数表示的复名数

二、相对指标的计量单位二、相对指标的计量单位二、相对指标的计量单位二、相对指标的计量单位

倍数与成数应当用整数的形式来表述倍数与成数应当用整数的形式来表述55 倍、倍、 33 成、近成、近 77 成成

3.253.25 倍、倍、 8.68.6 成成

分母分母为为 11

分母为分母为1.001.00

分母分母为为 1010

分母分母为为 1010

00

分母为分母为10001000

Page 13: 第三章  数据描述的综合指标

总人数 30人

男生人数 20 人

女生人数 10 人

男生比重为 2/3

女生比重为 1/3

男女比例为 2:1

总量指标

非总量指标

相对指标 

Page 14: 第三章  数据描述的综合指标

三、相对指标的种类三、相对指标的种类三、相对指标的种类三、相对指标的种类

结构相对数结构相对数结构相对数结构相对数

比例相对数比例相对数比例相对数比例相对数

强度相对数强度相对数强度相对数强度相对数

计划完成程度计划完成程度相对数相对数

计划完成程度计划完成程度相对数相对数

比较相对数比较相对数比较相对数比较相对数

动态相对数动态相对数动态相对数动态相对数

Page 15: 第三章  数据描述的综合指标

﹪总体全部数值总体部分数值

相对数结构

100

例:我国某年国民收入使用额为例:我国某年国民收入使用额为 1971519715 亿元,其中消亿元,其中消费额为费额为 1294512945 亿元,积累额为亿元,积累额为 67706770 亿元。则亿元。则

﹪﹪使用额的比率

积累额占国民收入

﹪﹪使用额的比率

消费额占国民收入

3.3410019715

6770

7.6510019715

12945

说说明明

⒈⒈ 为无名数,分子与分母属于同一总体; 为无名数,分子与分母属于同一总体; ⒉⒉ 同一总体各组的结构相对数之和为同一总体各组的结构相对数之和为 11 ;;⒊⒊ 用来分析现象总体的内部构成状况。用来分析现象总体的内部构成状况。

(一)结构相对数(一)结构相对数(一)结构相对数(一)结构相对数

Page 16: 第三章  数据描述的综合指标

﹪该项指标计划任务数某项指标实际完成数

相对数计划完成程度

100

直接应用上述公式直接应用上述公式A.A. 计划任务数表现为绝对数时计划任务数表现为绝对数时

(二)计划完成相对数(二)计划完成相对数(二)计划完成相对数(二)计划完成相对数

例例 11 :己知某厂:己知某厂 20002000 年的计划产品产量为年的计划产品产量为 1010 万吨,万吨,实际产量为实际产量为 1212 万号。则:万号。则:

﹪﹪程度

计划完成120100

10

12

Page 17: 第三章  数据描述的综合指标

﹪百分数

降低提高

计划

百分数降低提高

实际

﹪计划为上年的百分数实际为上年的百分数

相对数计划完成程度

100

1

1

100

B. B. 计划任务数表现为相对数时计划任务数表现为相对数时

例例 22 :己知某厂:己知某厂 20002000 年的计划规定产品产量要比上年的计划规定产品产量要比上年实际提高年实际提高 5﹪5﹪而实际提高了而实际提高了 7﹪7﹪。则。则

﹪﹪﹪﹪

程度计划完成

95.9810051

61

例例 33 :己知某厂:己知某厂 20002000 年的计划规定产品成本比上年年的计划规定产品成本比上年降低降低 5%5% ,实际降低提高,实际降低提高 6﹪6﹪。则。则

﹪﹪﹪﹪

程度计划完成

9.10110051

71

即实际比计划单位成本下降了 1.05%.

Page 18: 第三章  数据描述的综合指标

百分点百分点 相当于百分数的计量单位,一个相当于百分数的计量单位,一个百分点就指百分点就指 1﹪1﹪ 。。

100

百分比

降低提高

计划百分比降低提高

实际

的百分点降低提高

实际比计划多

上例中,实际比计划多提高的百分点为上例中,实际比计划多提高的百分点为(( 7 --5﹪ ﹪7 --5﹪ ﹪)) ×100=2×100=2 (个百分点)(个百分点)

实际工作中常用实际工作中常用,但并不是相对,但并不是相对

数数

Page 19: 第三章  数据描述的综合指标

另一总体同项指标数值某一总体某项指标数值

相对数比较

例:某年某地区甲、乙两个公司商品销售额分别为例:某年某地区甲、乙两个公司商品销售额分别为 5.45.4亿元和亿元和 3.63.6 亿元。则亿元。则

5.16.3

4.5

是乙公司的倍数甲公司商品销售额

⒈⒈ 为无名数,一般用百分数和倍数表示; 为无名数,一般用百分数和倍数表示; ⒉ 反映同类现象数值在同一时间不同总体之⒉ 反映同类现象数值在同一时间不同总体之间的对比关系。 间的对比关系。 3. 3.

用来说明现象发展的不均衡程度。 用来说明现象发展的不均衡程度。

说说明明

(三)比较相对数(三)比较相对数(三)比较相对数(三)比较相对数

Page 20: 第三章  数据描述的综合指标

﹪总体中另一部分数值总体中某一部分数值

相对数比例

100

例:我国某年国民收入使用额为例:我国某年国民收入使用额为 1971519715 亿元,其中亿元,其中消费额为消费额为 1294512945 亿元,积累额为亿元,积累额为 67706770 亿元。则亿元。则

﹪或﹪的比率

积累额与消费额52.512:1

33

17100

12945

6770

⒈⒈ 为无名数,可用百分数或一比几或几比几表示为无名数,可用百分数或一比几或几比几表示;;⒉⒉ 用来反映组与组之间的联系程度或比例关系。用来反映组与组之间的联系程度或比例关系。

说说明明

(四)比例相对数(四)比例相对数(四)比例相对数(四)比例相对数

Page 21: 第三章  数据描述的综合指标

的总量指标数值另一有联系但性质不同某一总量指标数值

相对数强度

例:某年某地区年平均人口数为例:某年某地区年平均人口数为 100100 万人,在该万人,在该年度内出生的人口数为年度内出生的人口数为 86008600 人。则该地区人。则该地区

‰‰出生率人口

6.81000101

86006

一般用﹪、‰表示。其特点是分子一般用﹪、‰表示。其特点是分子来源于分母,但分母并不是分子的来源于分母,但分母并不是分子的总体,二者所反映现象数量的时间总体,二者所反映现象数量的时间状况不同。状况不同。

1 、无名数的

强度相对数

1 、无名数的

强度相对数

(五)强度相对数(五)强度相对数(五)强度相对数(五)强度相对数

Page 22: 第三章  数据描述的综合指标

例:某地区某年末现有总人口为例:某地区某年末现有总人口为 100100 万人,医院万人,医院床位总数为床位总数为 2470024700 张。则该地区张。则该地区

千人张千人张

的医院床位数每千人口拥有

7.241000

24700

张人负担的人口数每所医院床位

5.4024700

101 6

(正指标)(正指标)

(逆指标)(逆指标)

为用双重计量单位表示的复名数,反为用双重计量单位表示的复名数,反映的是一种依存性的比例关系或协调映的是一种依存性的比例关系或协调关系,可用来 反映经济效益、经济关系,可用来 反映经济效益、经济实力、现象的密集程度等。实力、现象的密集程度等。

2 、有名数的强度相对数2 、有名数的强度相对数

Page 23: 第三章  数据描述的综合指标

﹪该指标基期数值某指标报告期数值

相对数动态

100

是同一指标在不同时间上的是同一指标在不同时间上的对比,又称为发展速度。对比,又称为发展速度。

动态相对数动态相对数

⒈⒈ 为无名数; 为无名数; ⒉⒉ 用来反映现象的水平在时间上的变动程度用来反映现象的水平在时间上的变动程度。。

说说明明

(六)动态相对数(六)动态相对数(六)动态相对数(六)动态相对数

Page 24: 第三章  数据描述的综合指标

正确选择对比的基础;正确选择对比的基础;指标对比要有可比性;指标对比要有可比性;相对指标要与总量指标结合运用;相对指标要与总量指标结合运用;多种相对指标结合运用。多种相对指标结合运用。

使用相对指标应注意的问题使用相对指标应注意的问题

案例:书价上涨案例:书价上涨

Page 25: 第三章  数据描述的综合指标

正确选择对比基础正确选择对比基础 本单位历史水平本单位历史水平本行业(全国)平本行业(全国)平均(先进)水平均(先进)水平

经济效益指数= 某经济效益指标实际值该经济效益指标标准值

价格定基指数= 某期价格水平某固定基期的价格水平

经济发展、价格水平经济发展、价格水平均较为正常的时期均较为正常的时期

Page 26: 第三章  数据描述的综合指标

注意指标间的可比性注意指标间的可比性

2010 年的工业总产值(当年价格)

1980 年的工业总产值(当年价格)

2010 年中国的国民收入(人民币元)2010 年美国的国民收入(美元)

案例:美国海军案例:美国海军

Page 27: 第三章  数据描述的综合指标

相对指标抽象掉了具体的数量差异相对指标抽象掉了具体的数量差异 ::1:2=50% 10000:20000=50%1:2=50% 10000:20000=50%

19981998 年相对于年相对于 19971997 年,美国的年,美国的 GDPGDP增长速度为增长速度为 3.93.9 %%,同期中国,同期中国 GDPGDP增增长速度为长速度为 7.87.8 %%,恰好为美国的,恰好为美国的 22 倍倍;;但根据同期汇率(但根据同期汇率( 11美元兑换美元兑换 8.38.3 元人元人民币),民币), 19981998 年中国年中国 GDPGDP 总量约合总量约合96719671 亿美元,约相当于同期美国亿美元,约相当于同期美国 GDPGDP总量总量 8427284272 亿美元的亿美元的 1/91/9 。。

相对指标应当结合总量指标使用相对指标应当结合总量指标使用

案例:案例: 1/31/3 女生女生

Page 28: 第三章  数据描述的综合指标

结构相对数比例相对数比较相对数动态相对数

计划完成相对数强度相对数

(部分与总体关系)(部分与总体关系)(部分与部分关系)(部分与部分关系)(横向对比关系)(横向对比关系)(纵向对比关系)(纵向对比关系)(实际与计划关系)(实际与计划关系)(关联指标间关系)(关联指标间关系)

多种相对指标应当结合运用多种相对指标应当结合运用

案例:航空公司案例:航空公司投诉量

Page 29: 第三章  数据描述的综合指标

人口性别比为 1.03 : 1

19991999 年末我国共有年末我国共有总人口总人口 12.612.6 亿人,其亿人,其

中男性人口为中男性人口为 6.46.4 亿,亿,女性人口为女性人口为 6.26.2 亿。亿。

19991999 年末我国共有年末我国共有总人口总人口 12.612.6 亿人,其亿人,其

中男性人口为中男性人口为 6.46.4 亿,亿,女性人口为女性人口为 6.26.2 亿。亿。

男性人口的比重为 50.8﹪

比 1980 年末的9.9 亿人增加

了 28﹪

人口密度是美国的 4.5 倍

人口密度为130 人 / 平方公里

人口出生率为 15.23‰

女性人口的比重为 49.2﹪

Page 30: 第三章  数据描述的综合指标

第三节 平均指标第三节 平均指标

指总体中各单位的次数分布从两边向指总体中各单位的次数分布从两边向中间集中的趋势,中间集中的趋势,用用平均指标平均指标来反映来反映。。

集中趋势集中趋势集中趋势集中趋势

又称平均数,是又称平均数,是反映社会经济现反映社会经济现象总体各单位某象总体各单位某一数量标志在一一数量标志在一定时间、地点和定时间、地点和条条件下所达到的件下所达到的一般水平的综合一般水平的综合指标。 指标。

平均指标

数值平均数

位置平均数

算术平均数调和平均数几何平均数

中位数

众数

Page 31: 第三章  数据描述的综合指标

总体单位总数总体标志总量

平均数算术

基本形式:基本形式:

总产量总成本

平均成本

职工人数工资总额

平均工资

例:例:

直接承担

※ ※ 注意区分算术平均数与强度相对数注意区分算术平均数与强度相对数

一、算术平均数一、算术平均数一、算术平均数一、算术平均数

Page 32: 第三章  数据描述的综合指标

STAT

VAR00001

14

12

10

8

6

4

2

0

Std. Dev = 4.86

Mean = 163.3

N = 83.00

算术平均数

150

155

160

165

170

175

180

83名女生的身高

变量一般水平、代表性数值

分布的集中趋势、中心数值

算术平均数

Page 33: 第三章  数据描述的综合指标

算术平均数 =总体标志总量总体单位总数

设数据集 ),,,( 121 NNi xxxxx

数据个数 N

x

N

xx

简单算术平均数

Page 34: 第三章  数据描述的综合指标

简单算术平均数简单算术平均数 ——适用于总体资料未经分组整理、尚为原始资料的情况

N

X

N

XXXX

N

ii

N

121

式中: 为算术平均数式中: 为算术平均数 ; ; 为总体单位总数为总体单位总数; 为第; 为第 ii 个单位的标志值。个单位的标志值。iX

NX

(一)简单算术平均数(一)简单算术平均数(一)简单算术平均数(一)简单算术平均数

Page 35: 第三章  数据描述的综合指标

解:平均每人日销售额为:解:平均每人日销售额为:

元5585

27905

440750480600520

N

XX

某售货小组某售货小组 55个人,某天的销售额个人,某天的销售额分别为分别为 520520元、元、 600600元、元、 480480元、元、750750元、元、 440440元,则元,则

【例】【例】

Page 36: 第三章  数据描述的综合指标

加权算术平均数加权算术平均数 ————适用于总体资料经过适用于总体资料经过分组整理形成变量数列且分组整理形成变量数列且每组单元数不同时的情况每组单元数不同时的情况

m

ii

m

iii

m

mm

f

fX

fff

fXfXfXX

1

1

21

2211

式中: 为算术平均数式中: 为算术平均数 ; ; 为第 组的次数为第 组的次数; 为组数; 为第 组的标志值或组中值。; 为组数; 为第 组的标志值或组中值。

X

iXif i

m i

(二)算术平均数(二)算术平均数(二)算术平均数(二)算术平均数

Page 37: 第三章  数据描述的综合指标

【例】【例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:

日产量(件) 工人人数(人)

10

11

12

13

14

70

100

380

150

100

合计 800

X f

计算该企业该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。

Page 38: 第三章  数据描述的综合指标

件)(1375.12800

9710

10070

100147010

1

1

m

ii

m

iii

f

fXX

解:解:

若上述资料为组距数列,则应取各组的若上述资料为组距数列,则应取各组的组组中值中值作为该组的代表值用于计算;此时求作为该组的代表值用于计算;此时求得的算术平均数只是其真值的得的算术平均数只是其真值的近似值近似值。。

说说明明说说明明

Page 39: 第三章  数据描述的综合指标

m

ii

m

iii

f

fXX

1

1

分析分析::

成绩(分)人数(人)

甲班 乙班 丙班60 39 1 50

100 1 39 50

平均成绩(分) 61 99 80

起到权衡轻起到权衡轻重的作用重的作用

决定平均数决定平均数的变动范围的变动范围

Page 40: 第三章  数据描述的综合指标

表现为次数、频数、单位数;即表现为次数、频数、单位数;即公式 中的公式 中的 fXfX f

表现为频率、比重;即公式表现为频率、比重;即公式中的中的

f

fXfXfX ff

指变量数列中各组标志值出现的次指变量数列中各组标志值出现的次数,是变量值的承担者,反映了各数,是变量值的承担者,反映了各组的标志值对平均数的影响程度组的标志值对平均数的影响程度

权数权数权数权数

绝对权数绝对权数

相对权数相对权数

Page 41: 第三章  数据描述的综合指标

2 3 4 5 6 7 81 9

权数与加权5

9

987654321

x

625.48

97654321

x

2 3 4 5 6 7 81 9

Page 42: 第三章  数据描述的综合指标

权数与加权

2 3 4 5 6 7 81 9

Page 43: 第三章  数据描述的综合指标

权数与加权

23

45

67

8

1

9

Page 44: 第三章  数据描述的综合指标

权数与加权

2 3 4 5 6 7 81 9

24.421

191817263554432221

x

Page 45: 第三章  数据描述的综合指标

权数与加权

2 3 4 5 6 7 81 9

24.421

191817263554432221

x

算术平均数的计算取决于变量值和权数的共同作用:

变量值决定平均数的范围;

权数则决定平均数的位置

Page 46: 第三章  数据描述的综合指标

性质⒈ 对每一变量给以相同的改变量A,则平均数也有改变量 A:

(三)算术平均数的基本性质(三)算术平均数的基本性质(三)算术平均数的基本性质(三)算术平均数的基本性质

性质⒉ 对每一变量改变同一倍数,则平均数也改变同一倍数:

Page 47: 第三章  数据描述的综合指标

性质 3. 对每一权数都改变同一倍数,则平均数不变:

性质 4. 所有变量与平均数的离差代数和等于零:

Page 48: 第三章  数据描述的综合指标

离差的概念离差的概念离差的概念离差的概念

1x

2x

3x

4x

5x

6x

1

2

3

4

5

6

7

8

5x-1 -1-2

1

3

0)1(13)2(01)( xx

16)1(13)2(01)( 2222222 xx

Page 49: 第三章  数据描述的综合指标

【例】 设设 X=X= (( 22 ,, 44 ,, 66 ,, 88 ),则其调),则其调和平均数可由定义计算如下:和平均数可由定义计算如下:

⒉⒉再求算术平均数:再求算术平均数: 481

61

41

21

⒈⒈求各标志值的倒数 : , , ,求各标志值的倒数 : , , ,2

1

4

1

6

1

8

1

⒊⒊再求倒数:再求倒数:

81

61

41

21

4

是总体各单位标志值倒数的算术平是总体各单位标志值倒数的算术平均数的倒数,又叫均数的倒数,又叫倒数平均数倒数平均数

调和平均数调和平均数调和平均数调和平均数

二、调和平均数二、调和平均数二、调和平均数二、调和平均数

Page 50: 第三章  数据描述的综合指标

简单调和平均数简单调和平均数 ——适用于总体资料未经分组整理、尚为原始资料的情况

X

m

XXX

mX

m

H 1111

21

式中: 为调和平均数式中: 为调和平均数 ; ; 为变量值 为变量值 的个数; 为第 个变量值。的个数; 为第 个变量值。i

iXm

HX

(一)简单调和平均数(一)简单调和平均数(一)简单调和平均数(一)简单调和平均数

Page 51: 第三章  数据描述的综合指标

加权调和平均数加权调和平均数 ——适用于总体资料经过分组整理形成变量数列的情况

式中: 为第 组的变量值; 为第 式中: 为第 组的变量值; 为第 组的标志总量。组的标志总量。

imiX ii

mX

m

Xm

Xm

Xm

mmmX

m

m

mH

1

2

2

1

1

21

(二)加权调和平均数(二)加权调和平均数(二)加权调和平均数(二)加权调和平均数

Page 52: 第三章  数据描述的综合指标

————当己知各组变量值和标志总量时,当己知各组变量值和标志总量时,作为算术平均数的变形使用。若已知分作为算术平均数的变形使用。若已知分组资料的各组变量值及各组的权数时,组资料的各组变量值及各组的权数时,直接用加权算术平均数的公式。直接用加权算术平均数的公式。

因为:因为:

Xf

Xf

XfX

Xf

mX

mXXfm H

1

1,则设

(三)调和平均数与算术平均数的关系(三)调和平均数与算术平均数的关系(三)调和平均数与算术平均数的关系(三)调和平均数与算术平均数的关系

Page 53: 第三章  数据描述的综合指标

f

xfx

x 、 f 为已知

若只知 x 和 xf ,而 f 未知,则不能使用加权算术平均方式,只能使用其变形即加权调和平均方式。

xfx

xfx

1

苹果 单价 购买量 总金额 品种 (元)(公斤) (元)

红富士 2 3 6青香蕉 1.8 5 9

x f xf

875.153

58.132

x

875.1

8.19

26

96

x

Page 54: 第三章  数据描述的综合指标

日产量(件)日产量(件) 各组工人日总产量各组工人日总产量(件)(件)

1010

1111

1212

1313

1414

700700

11001100

45604560

19501950

14001400

合计合计 97109710

【例】【例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:

计算该企业该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。

X m

Page 55: 第三章  数据描述的综合指标

件1375.12800

971014

140010700

97101

mX

mX H

即该企业该日全部工人的平均日产量为即该企业该日全部工人的平均日产量为 112.13752.1375 件。件。

解解

Page 56: 第三章  数据描述的综合指标

是是 NN 项变量值连乘积的开项变量值连乘积的开 NN 次次方根。方根。是是 NN 项变量值连乘积的开项变量值连乘积的开 NN 次次方根。方根。

几何平均数几何平均数几何平均数几何平均数

用于计算现象的平均比率或平均速度用于计算现象的平均比率或平均速度应用:应用:

各个比率或速度的连乘积等于总比率或各个比率或速度的连乘积等于总比率或总速度;总速度;相乘的各个比率或速度不为零或负值。相乘的各个比率或速度不为零或负值。

应用的前提条件:应用的前提条件:

三、几何平均数三、几何平均数三、几何平均数三、几何平均数

Page 57: 第三章  数据描述的综合指标

比值比值的平均数的计算方法的平均数的计算方法比值比值的平均数的计算方法的平均数的计算方法

由于比值(由于比值(平均数或相对数平均数或相对数)不能直接相)不能直接相加,求解比值的平均数时,需将其还原为加,求解比值的平均数时,需将其还原为构成比值的分子、分母原值总计进行对比构成比值的分子、分母原值总计进行对比

设比值设比值i

ii f

mX 分子变量分子变量

分母变量分母变量

则有:则有: miX

mffXm

i

iiiii ,,2,1,,

《统计学》第四章 统计特征值

Page 58: 第三章  数据描述的综合指标

mX

m

f

Xf

f

mX

1

己知 ,己知 ,采用基本平采用基本平

均数公式均数公式

fm、 己知 ,己知 ,采用加权算术采用加权算术

平均数公式平均数公式

fX、 己知 ,己知 ,采用加权调和平采用加权调和平

均数公式均数公式

mX、

比值比值i

ii f

mX

《统计学》第四章 统计特征值

比值比值的平均数的计算方法的平均数的计算方法比值比值的平均数的计算方法的平均数的计算方法

Page 59: 第三章  数据描述的综合指标

【例【例 AA 】】某季度某工业公司某季度某工业公司 1818 个工业企个工业企业产值计划完成情况如下:业产值计划完成情况如下:计划完成程度计划完成程度

(﹪)(﹪)组中值组中值

(﹪)(﹪)企业数企业数(个)(个)

计划产值计划产值(万元)(万元)

9090以下以下9090~~ 100100

100100~~ 110110

110110以上以上

8585

9595

105105

115115

22

33

1010

33

800800

25002500

1720017200

44004400

合计合计 —— 1818 2490024900

计算该公司该季度的平均计划完成程度。计算该公司该季度的平均计划完成程度。

《统计学》第四章 统计特征值

比值比值的平均数的计算方法的平均数的计算方法比值比值的平均数的计算方法的平均数的计算方法

Page 60: 第三章  数据描述的综合指标

【例【例 AA 】】某季度某工业公司某季度某工业公司 1818 个工业企个工业企业产值计划完成情况如下:业产值计划完成情况如下:计划完成程度计划完成程度

(﹪)(﹪)组中值组中值

(﹪)(﹪)企业数企业数(个)(个)

计划产值计划产值(万元)(万元)

9090以下以下9090~~ 100100

100100~~ 110110

110110以上以上

8585

9595

105105

115115

22

33

1010

33

800800

25002500

1720017200

44004400

合计合计 —— 1818 2490024900

计算该公司该季度的平均计划完成程度。计算该公司该季度的平均计划完成程度。

f

mX

计划产值实际产值

程度计划完成

分析:分析:

X

f

应采用加权算术平均数公式计算应采用加权算术平均数公式计算

﹪12.10524900

26175

4400800

440015.180085.0

f

XfX

《统计学》第四章 统计特征值比值比值的平均数的计算方法的平均数的计算方法比值比值的平均数的计算方法的平均数的计算方法

Page 61: 第三章  数据描述的综合指标

【例【例 BB 】】某季度某工业公司某季度某工业公司 1818 个工业企业产个工业企业产值计划完成情况如下(按计划完成程度分组)值计划完成情况如下(按计划完成程度分组):: 组别组别 企业数企业数

(个)(个)计划产值计划产值

(万元)(万元)实际产值实际产值

(万元)(万元)11

22

33

44

22

33

1010

33

800800

25002500

1720017200

44004400

680680

23752375

1806018060

50605060

合计合计 1818 2490024900 2617526175

计算该公司该季度的平均计划完成程度。计算该公司该季度的平均计划完成程度。

《统计学》第四章 统计特征值

比值比值的平均数的计算方法的平均数的计算方法比值比值的平均数的计算方法的平均数的计算方法

Page 62: 第三章  数据描述的综合指标

【例【例 BB 】】某季度某工业公司某季度某工业公司 1818 个工业企业产个工业企业产值计划完成情况如下(按计划完成程度分组)值计划完成情况如下(按计划完成程度分组):: 组别组别 企业数企业数

(个)(个)计划产值计划产值

(万元)(万元)实际产值实际产值

(万元)(万元)11

22

33

44

22

33

1010

33

800800

25002500

1720017200

44004400

680680

23752375

1806018060

50605060

合计合计 1818 2490024900 2617526175

计算该公司该季度的平均计划完成程度。计算该公司该季度的平均计划完成程度。

求解比值的平均数的方法求解比值的平均数的方法求解比值的平均数的方法求解比值的平均数的方法 f

mX

计划产值实际产值

程度计划完成

分析:分析:

f

m

应采用平均数的基本公式计算应采用平均数的基本公式计算

﹪12.10524900

26175

f

mX

《统计学》第四章 统计特征值

Page 63: 第三章  数据描述的综合指标

简单几何平均数简单几何平均数————适用于总体资料未经分组整适用于总体资料未经分组整

理尚为原始资料的情况理尚为原始资料的情况

式中: 为几何平均数式中: 为几何平均数 ; ; 为变量值的为变量值的个数; 为第 个变量值。个数; 为第 个变量值。iiX

NGX

NNNG XXXXX 21

(一)简单几何平均数(一)简单几何平均数(一)简单几何平均数(一)简单几何平均数

Page 64: 第三章  数据描述的综合指标

【例】【例】某流水生产线有前后衔接的五道工序某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为。某日各工序产品的合格率分别为 95﹪95﹪ 、、 992﹪2﹪ 、、 90﹪90﹪ 、、 85﹪85﹪ 、、 80﹪80﹪ ,求整个流水,求整个流水生产线产品的平均合格率。生产线产品的平均合格率。分析:分析:设最初投产设最初投产 100A100A 个单位 ,则个单位 ,则第一道工序的合格品为第一道工序的合格品为 100A×0.95100A×0.95 ;;第二道工序的合格品为第二道工序的合格品为(( 100A×0.95100A×0.95 )) ×0.92×0.92;; …… ……第五道工序的合格品为第五道工序的合格品为(( 100A×0.95×0.92×0.90×0.85100A×0.95×0.92×0.90×0.85 )) ×0.80×0.80 ;;

Page 65: 第三章  数据描述的综合指标

因该流水线的最终合格品即为第五道工序因该流水线的最终合格品即为第五道工序的合格品, 故该流水线总的合格品应为 的合格品, 故该流水线总的合格品应为 100A×0.95×0.92×0.90×0.85×0.80100A×0.95×0.92×0.90×0.85×0.80 ;;则该流水线产品总的合格率为:则该流水线产品总的合格率为:

80.085.090.092.095.0100A

80.085.090.092.00.95100A

总产品总合格品

即即该流水线总的合格率等于各工序合格率的该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需连乘积,符合几何平均数的适用条件,故需采用几何平均法计算采用几何平均法计算。。

Page 66: 第三章  数据描述的综合指标

因该流水线的最终合格品即为第五道工序因该流水线的最终合格品即为第五道工序的合格品, 故该流水线总的合格品应为 的合格品, 故该流水线总的合格品应为 100A×0.95×0.92×0.90×0.85×0.80100A×0.95×0.92×0.90×0.85×0.80 ;;则该流水线产品总的合格率为:则该流水线产品总的合格率为:

80.085.090.092.095.0100A

80.085.090.092.00.95100A

总产品总合格品

即即该流水线总的合格率等于各工序合格率的该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需连乘积,符合几何平均数的适用条件,故需采用几何平均法计算采用几何平均法计算。。

﹪24.885349.0

80.085.090.092.095.05

5

GX解解::

Page 67: 第三章  数据描述的综合指标

思考思考思考思考

若上题中不是由五道连续作业的工序若上题中不是由五道连续作业的工序组成的流水生产线,而是五个组成的流水生产线,而是五个独立作独立作业的车间业的车间,且各车间的合格率同前,,且各车间的合格率同前,又假定各车间的产量相等均为又假定各车间的产量相等均为 100100 件件,求该企业的平均合格率。,求该企业的平均合格率。

Page 68: 第三章  数据描述的综合指标

因各车间彼此独立作业,所以有因各车间彼此独立作业,所以有 第一车间的合格品为:第一车间的合格品为: 100×0.95100×0.95 ;; 第二车间的合格品为:第二车间的合格品为: 100×0.92100×0.92 ;; …… …… 第五车间的合格品为:第五车间的合格品为: 100×0.80100×0.80 。。则该企业全部合格品应为各车间合格品的则该企业全部合格品应为各车间合格品的总和,即总和,即总合格品总合格品 =100×0.95+……+100×0.80=100×0.95+……+100×0.80

分析:分析:

Page 69: 第三章  数据描述的综合指标

不再符合几何平均数的适用条件,需按照不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。又因为求解比值的平均数的方法计算。又因为

﹪4.88500

442

100100

10080.010095.0

f

XfX

f

mX

产品合格品

合格率

应采用加权算术平均数公式计算,即应采用加权算术平均数公式计算,即

Page 70: 第三章  数据描述的综合指标

加权几何平均数加权几何平均数————适用于总体资料经过分组整适用于总体资料经过分组整

理形成变量数列的情况理形成变量数列的情况

式中: 为几何平均数式中: 为几何平均数 ; ; 为第 组的次数为第 组的次数; 为组数; 为第 组的标志值或组中值; 为组数; 为第 组的标志值或组中值

。。

GX

iXif i

m i

m

ii

i

m

ii

mf m

i

fi

ff

mff

G XXXXX 11 21

121

(二)加权几何平均数(二)加权几何平均数(二)加权几何平均数(二)加权几何平均数

Page 71: 第三章  数据描述的综合指标

【例】【例】某金融机构以复利计息。近某金融机构以复利计息。近 1212 年来的年来的年利率有年利率有 44 年为年为 3﹪3﹪ ,, 22 年为年为 5﹪5﹪ ,, 22 年为年为 88﹪﹪,, 33 年为年为 10﹪10﹪,, 11 年为年为 15﹪15﹪。求平均年利。求平均年利率。率。

设本金为设本金为 VV ,则至各年末的本利和应为:,则至各年末的本利和应为:第第 11 年末的本利和为:年末的本利和为: ﹪31V

﹪﹪ 3131 V第第 22 年末的本利和为:年末的本利和为:……… ……………… ………

﹪﹪﹪﹪﹪ 151101815131 3224 V

第第 1212 年末的本利和为:年末的本利和为:

分析:分析:第 2 年的计息基础

第 12 年的计息基

Page 72: 第三章  数据描述的综合指标

15.010.05130.01

V

15.010.05130.01V

24

24

本金

总的本利和则该笔本金则该笔本金 1212 年总的本利率为:年总的本利率为:

即即 1212 年总本利率等于各年本利率的连乘积年总本利率等于各年本利率的连乘积,符合,符合几何平均数的适用条件,故计算平均年本利率应采几何平均数的适用条件,故计算平均年本利率应采用几何平均法。用几何平均法。

﹪﹪平均年利率

85.6185.1061

85.1062154.2

15.0105.0103.0112

124 24

G

G

X

X 解解::

Page 73: 第三章  数据描述的综合指标

思思考考思思考考

若上题中不是按复利而是按若上题中不是按复利而是按单利单利计息计息,且各年的利率与上相同,,且各年的利率与上相同,求平均年利率。求平均年利率。

分分析析

第第 11 年末的应得利息年末的应得利息为为:

03.0V

第第 22 年末的应得利息年末的应得利息为为:

03.0V

第第 1212 年末的应得利息年末的应得利息为:为:

15.0V

…… ………… ……

设本金为设本金为 VV ,则各年末应得利息为:,则各年末应得利息为:

Page 74: 第三章  数据描述的综合指标

则该笔本金则该笔本金 1212 年应得的利息总和为:年应得的利息总和为:=V=V (( 0.03×4+0.05×2+……+0.15×10.03×4+0.05×2+……+0.15×1 ))

这里的利息率或本利率不再符合几何这里的利息率或本利率不再符合几何平均数的适用条件,需按照求解比值的平平均数的适用条件,需按照求解比值的平均数的方法计算。因为均数的方法计算。因为

f

mX

本金利息

利息率 假定本金为 V

Page 75: 第三章  数据描述的综合指标

所以,应采用加权算术平均数公式计算平所以,应采用加权算术平均数公式计算平均年利息率,即:均年利息率,即:

﹪92.612

83.0

14

115.0403.0

V

V

VV

VV

f

XfX

解:解:

(比较:按复利计息时的平均年利率为(比较:按复利计息时的平均年利率为 6.85﹪6.85﹪ ))

Page 76: 第三章  数据描述的综合指标

是否为比率或速度

各个比率或速度的连乘积是否等于总比

率或总速度是否为

其他比值

f f

G

NG

XX

XX

是是否否

否否

是是 否否 是是 几何平均法

f

XfX

N

XX

算术平均法

mX

m

f

Xf

f

mX

1

求解比值的平均数的方法

数值平均数计算数值平均数计算公式的选用顺序公式的选用顺序 指标指标指标指标

Page 77: 第三章  数据描述的综合指标

指总体中出现次数最多的变量值,指总体中出现次数最多的变量值,用 表示用 表示 ,, 它不受极端数值的影响它不受极端数值的影响,用来说明总体中大多数单位所达,用来说明总体中大多数单位所达到的一般水平。到的一般水平。

指总体中出现次数最多的变量值,指总体中出现次数最多的变量值,用 表示用 表示 ,, 它不受极端数值的影响它不受极端数值的影响,用来说明总体中大多数单位所达,用来说明总体中大多数单位所达到的一般水平。到的一般水平。

0M(一)(一)众数众数

(一)(一)众数众数

四、位置平均数四、位置平均数四、位置平均数四、位置平均数

解: 人 均 收 入解: 人 均 收 入出 现 次 数最多出 现 次 数最多的是的是 10801080 ,由,由此众数为此众数为

MMoo == 10801080 元元。。

例:在某城市中随机抽取例:在某城市中随机抽取 99 个个家庭,调查得到每个家庭的人家庭,调查得到每个家庭的人均月收入数据如下(单位元)均月收入数据如下(单位元),计算人均月收入的众数。,计算人均月收入的众数。10801080    750750    10801080    10801080   850850    960960    20002000    12501250    11630630

1 、原始数据的众数的确定。

Page 78: 第三章  数据描述的综合指标

日产量日产量(件)(件)

工人人数工人人数(人)(人)

10101111121213131414

7070100100380380150150100100

合计合计 800800

【例【例 AA 】】已知已知某企业某日工人的日产量资料如下某企业某日工人的日产量资料如下 ::

0M

计算该企业该日全部工人日产量的众数。计算该企业该日全部工人日产量的众数。

2 、单项数列的众数的确定。

Page 79: 第三章  数据描述的综合指标

相邻两组的频数相等时,众数组相邻两组的频数相等时,众数组的组中值即为众数的组中值即为众数

相邻两组的频数相等时,众数组相邻两组的频数相等时,众数组的组中值即为众数的组中值即为众数

MMooMMoo 相邻两组的频数不相等时,众相邻两组的频数不相等时,众数采用下列近似公式计算数采用下列近似公式计算

MMooMMoo

MMooMMoo

i

21

1o dd

dLM

idd

dUM

21

2o

上限公式:

下限公式:

步骤:步骤: (1)(1) 首先确定众数所在的首先确定众数所在的组组

3 、组距数列的众数的确定

(2)(2) 利用相应公式计算众数利用相应公式计算众数

Page 80: 第三章  数据描述的综合指标

身高 人数 比重 ( CM ) (人) (%) 150-155 3 3.61 155-160 11 13.25 160-165 34 40.96 165-170 24 28.92 170 以上 11 13.25 总计 83 100

某年级 83名女生身高资料2

ULM o

概约众数:众数所在组的组中值,在本例为 162.5cm

idd

dLM o

21

1

48.16351023

23160

oM

Page 81: 第三章  数据描述的综合指标

【例【例 BB 】】某车间某车间 5050 名工人月产量的资料如下名工人月产量的资料如下::月产量(件) 工人人数(人) 向上累计次数

(人)200以下

200~ 400400~ 600600以上

37

328

3104250

合计 50 —

计算该车间工人月产量的众数。计算该车间工人月产量的众数。

X f

件5002

UL

M oi

dd

dLM o

21

1

件5022002425

25400

oM

概约众数:众数所在组的组中值,在本例为 500件

Page 82: 第三章  数据描述的综合指标

当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数;当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者无众数,后者为双众数或多众数,也等于没有众数)

44 、众数的原理及应用、众数的原理及应用

Page 83: 第三章  数据描述的综合指标

出生

1981.01980.01979.01978.01977.01976.01975.0

160

140

120

100

80

60

40

20

0

没有突出地集中在某个年份

413413名学生出生时间分布直方图名学生出生时间分布直方图

(无众数)

Page 84: 第三章  数据描述的综合指标

192.5190.5

188.5186.5

184.5182.5

180.5178.5

176.5

174.5172.5

170.5168.5

166.5164.5

162.5160.5

158.5156.5

154.5152.5

150.5148.5

60

50

40

30

20

10

0

413413名学生的身高分布直方图名学生的身高分布直方图

(双众数)

当数据分布呈现出双众数或多众数时,可以断定这些数据来源于不同的总体。

出现了两个明显的分布中心

Page 85: 第三章  数据描述的综合指标

将总体各单位标志值按大小顺序排将总体各单位标志值按大小顺序排列后,指处于数列中间位置的标志列后,指处于数列中间位置的标志值,用 表示值,用 表示

将总体各单位标志值按大小顺序排将总体各单位标志值按大小顺序排列后,指处于数列中间位置的标志列后,指处于数列中间位置的标志值,用 表示值,用 表示eM

(二)(二)中位数中位数(二)(二)中位数中位数

不受极端数值的影响不受极端数值的影响,在总体标志值差异很大,在总体标志值差异很大时,具有较强的代表性。时,具有较强的代表性。

11 、中位数的作用:、中位数的作用:

中位数把标志值数列分为两个部分 ,一部分标志值小于或等于它 , 另一部分标志值大于或等于它 .

Page 86: 第三章  数据描述的综合指标

22 、中位数的确定、中位数的确定22 、中位数的确定、中位数的确定

(1) (1) 未分组数据中位数的确定未分组数据中位数的确定(1) (1) 未分组数据中位数的确定未分组数据中位数的确定

为偶数时当

为奇数时当

nxx

nx

Mnn

n

e

122

21

2

1

为偶数时当

为奇数时当

nxx

nx

Mnn

n

e

122

21

2

1

设一组资料有 n 个数值从小到大排列 x1 ,x2 ,…xn

,处在数列的中点位置的数值,就是中位数,记作:MeMe 。。

Page 87: 第三章  数据描述的综合指标

• 原始数据 : 24 22 21 26 20

• 排 序 : 20 21 22 24 26

• 位 置 : 1 2 3 4 5

中位数 中位数 2222

32

15

2

1

n位置 3

2

15

2

1

n位置

例:例:例:例:

Page 88: 第三章  数据描述的综合指标

• 原始数据 : 10 5 9 12 6 8

• 排 序 : 5 6 8 9 10 12

• 位 置 : 1 2 3 4 5 6

位置位置 n+n+1122

6+16+122

3.53.5

中位数中位数 8 + 98 + 922

8.58.5

例:例:例:例:

Page 89: 第三章  数据描述的综合指标

中位数的位次为:中位数的位次为: 32

15

2

1

N

即第即第 33 个单位的标志值就是中位数个单位的标志值就是中位数 元520eM

【例】【例】某售货小组某售货小组 55 个人,某天的销售额按个人,某天的销售额按从小到大的顺序排列为从小到大的顺序排列为 440440 元、元、 480480 元、元、 525200 元、元、 600600 元、元、 750750 元,则元,则

Page 90: 第三章  数据描述的综合指标

中位数的位次为中位数的位次为 5.32

16

2

1

N

中位数应为第中位数应为第 33 和第和第 44 个单位标志值的算术个单位标志值的算术平均数,即平均数,即

元5602

600520

eM

【例】【例】若上述售货小组为若上述售货小组为 66 个人,某天的销个人,某天的销售额按从小到大的顺序排列为售额按从小到大的顺序排列为 440440 元、元、 480480元、元、 520520 元、元、 600600 元、元、 750750 元、元、 760760 元,元,则则

Page 91: 第三章  数据描述的综合指标

【例】【例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件) 工人人数(人) 向上累计次数

(人)1011121314

70100380150100

70170550700800

合计 800 —

X f

计算该企业该日全部工人日产量的中位数。计算该企业该日全部工人日产量的中位数。

中位数的位次:5.400

2

1800

eM

(2) (2) 单项数列中单项数列中位数的确定位数的确定(2) (2) 单项数列中单项数列中位数的确定位数的确定

Page 92: 第三章  数据描述的综合指标

共 个单位2 f

共 个单位2 f

共 个单位1mS 共 个单位1mSL U

中位数组中位数组组距为 h

共 个单位mf

假定该组内的单假定该组内的单位呈均匀分布位呈均匀分布

共有单位数 共有单位数

12 mS

f

中位数下限公式为中位数下限公式为

hf

Sf

LMm

m

e

12

该段长度应为 该段长度应为

hf

Sf

m

m

12

(3)(3) 组距数列中位数的确定组距数列中位数的确定(3)(3) 组距数列中位数的确定组距数列中位数的确定

Page 93: 第三章  数据描述的综合指标

【例】【例】某车间某车间 5050 名工人月产量的资料如下:名工人月产量的资料如下:

月产量(件) 工人人数(人) 向上累计次数(人)

200以下200~ 400400~ 600600以上

37

328

3104250

合计 50 —

计算该车间工人月产量的中位数。计算该车间工人月产量的中位数。

X f

hf

Sf

LMm

m

e

12

件75.49340060032

102

50

400

eM

Page 94: 第三章  数据描述的综合指标

a. 中位数一定存在;

b. 中位数与算术平均数相近;

c. 中位数不受极端值影响,只受中间位置标志值的影响;

d. 变量值与中位数离差绝对值之和最小。

( 4 )中位数的作用及用法

Page 95: 第三章  数据描述的综合指标

变量值     3   4   5   5   6   9   10中位数          5平均值    6与中位数离差 -2 -1 0 0 1 4 5与平均数离差 -3 -2 -1 -1 0 3 4

绝对数值之和 13 14

变量值与中位数离差绝对值之和最小。

Page 96: 第三章  数据描述的综合指标

(三)中位数、众数和算术平均数的关系(三)中位数、众数和算术平均数的关系(三)中位数、众数和算术平均数的关系(三)中位数、众数和算术平均数的关系

c.c. 左偏分布左偏分布c.c. 左偏分布左偏分布

均值均值 <<均值均值 << 中位数中位数 <<中位数中位数 <<

众数众数众数众数

b.b. 右偏分布右偏分布b.b. 右偏分布右偏分布

众数众数 <<众数众数 <<

中位数中位数 <<中位数中位数 << 均值均值均值均值

11 、运用中位数、众数、算术平均数的数量关系、运用中位数、众数、算术平均数的数量关系判断总体分布特征。判断总体分布特征。

a.a. 对称分布对称分布a.a. 对称分布对称分布

均值均值均值均值 = = = = 中位数中位数中位数中位数 = = = = 众数众数众数众数

Page 97: 第三章  数据描述的综合指标

22 、利用位置平均数与算术平均数的关系进行推、利用位置平均数与算术平均数的关系进行推算。算。

若分布偏斜程度不大,算术平均数、中若分布偏斜程度不大,算术平均数、中位数、众数存在一定的比例关系,即:位数、众数存在一定的比例关系,即:

)(2 eoe MxMM

xMM eo 23 3

2xMM o

e

2

3 oe MMx

由此可推出以下三个公式:由此可推出以下三个公式:

Page 98: 第三章  数据描述的综合指标

(四)分位数(四)分位数(四)分位数(四)分位数

11 、四分位数 、四分位数 11 、四分位数 、四分位数

将总体各单位标志值按大小顺序将总体各单位标志值按大小顺序排列后,用三个点或三个数值将排列后,用三个点或三个数值将数列分成四个等份,这三个点数列分成四个等份,这三个点 Q1、 Q2 和和 Q3 所分别对应的数值称所分别对应的数值称为四分位数。为四分位数。

将总体各单位标志值按大小顺序将总体各单位标志值按大小顺序排列后,用三个点或三个数值将排列后,用三个点或三个数值将数列分成四个等份,这三个点数列分成四个等份,这三个点 Q1、 Q2 和和 Q3 所分别对应的数值称所分别对应的数值称为四分位数。为四分位数。

处于 25% 和 75% 位置上的值 Q1 和 Q3称为(下、上)四分位数

QQ11 QQ22 QQ33

25%25%25%25% 25%25%25%25% 25%25%25%25% 25%25%25%25%

Page 99: 第三章  数据描述的综合指标

未分组数据:未分组数据:下四分位数下四分位数 ((QQ11)) 位置 位置 ==

n+n+11

44

上四分位数上四分位数 ((QQ33)) 位置 位置 ==3(3(n+n+1)1)

44

组距分组数据:组距分组数据:下四分位数下四分位数 ((QQ11)) 位置 位置 ==

nn

44

上四分位数上四分位数 ((QQ33)) 位置 位置 ==3n3n

44

四分位数位置的确定 四分位数位置的确定 四分位数位置的确定 四分位数位置的确定

Page 100: 第三章  数据描述的综合指标

• 原始数据 : 23 21 30 32 28 25 26

• 排 序 : 21 23 25 26 28 30 32

• 位 置 : 1 2 3 4 5 6 7

QQ11= 23= 23 QQ33= 30= 30

7+7+11QQ11 位置 位置 ==

44==

44= 2= 2

QQ33 位置 位置 ==3(3(n+n+1)1)

44

3(73(7++1)1)

44 == = 6= 6

n+1n+1

【例】【例】

Page 101: 第三章  数据描述的综合指标

22 、十分位数 、十分位数 22 、十分位数 、十分位数

将总体各单位标志值按大小顺序将总体各单位标志值按大小顺序排列后,用九个数值将数列分成排列后,用九个数值将数列分成十等份,这九个点所对应单元的十等份,这九个点所对应单元的标志值称为十分位数。标志值称为十分位数。

将总体各单位标志值按大小顺序将总体各单位标志值按大小顺序排列后,用九个数值将数列分成排列后,用九个数值将数列分成十等份,这九个点所对应单元的十等份,这九个点所对应单元的标志值称为十分位数。标志值称为十分位数。

未分组数据:未分组数据:

十分位数十分位数 DD11 的位置 的位置 ==n+n+11

1010

十分位数十分位数 DD22 的位置 的位置 ==2(2(n+n+1)1)

1010

十分位数位置的确定 十分位数位置的确定 十分位数位置的确定 十分位数位置的确定

十分位数十分位数 DD99 的位置 的位置 ==9(9(n+n+1)1)

1010

…… ………… ……

Page 102: 第三章  数据描述的综合指标

第四节 变异指标

(一)变异(一)变异指标的概念指标的概念(一)变异(一)变异指标的概念指标的概念

统计上用来反映总体各单位标志值之间差异程度和平均数的代表程度的综合指标,也称做标志变动度。

平均指标是一个代表性数值,它反映总体各单位某一数量标志的一般水平,而把总体各单位之间的差异抽象化了。但总体各单位之间的差异是客观存在的,这种差异也是统计总体的重要特征之一。因此,要全面反映一个总体的特征,还必须测定总体各单位之间差异程度。

一、变异指标概述一、变异指标概述一、变异指标概述一、变异指标概述

Page 103: 第三章  数据描述的综合指标

1 、可以揭示数据分布的离中趋势;

2 、是衡量均值代表性高低的尺度;

(二)变异指标的作用(二)变异指标的作用(二)变异指标的作用(二)变异指标的作用

3 、可以反映社会经济活动过程的均衡性和稳定性

Page 104: 第三章  数据描述的综合指标

测定标志变异度的绝对量指标(与原变量值名数相同)

测定标志变异度的相对量指标(表现为无名数)

全距全距系数系数全距全距系数系数

平均差平均差系数系数

平均差平均差系数系数

标准差标准差系数系数

标准差标准差系数系数

二、标志变异指标的种类二、标志变异指标的种类二、标志变异指标的种类二、标志变异指标的种类

极差极差极差极差 平均差平均差平均差平均差 标准差标准差标准差标准差分位差分位差分位差分位差

Page 105: 第三章  数据描述的综合指标

minmax XXR

指所研究的数据中,最大值与最小值之差,又称全距。1. 1. 极差极差1. 1. 极差极差

最大变量值或最最大变量值或最高组上限或开口高组上限或开口组假定上限组假定上限

最小变量值或最最小变量值或最低组下限或开口低组下限或开口组假定下限组假定下限

【例【例 AA 】】某售货小组某售货小组 55 人某天的销售额分别人某天的销售额分别为为 440440 元、元、 480480 元、元、 520520 元、元、 600600 元、元、 750750元,则元,则 元310440750minmax XXR

Page 106: 第三章  数据描述的综合指标

【例【例 BB 】】某季度某工业公司某季度某工业公司 1818个个工业企业产值计划完成情况如下:工业企业产值计划完成情况如下:

计划完成程度计划完成程度(﹪)(﹪)

组中值组中值(﹪)(﹪)

企业数企业数(个)(个)

计划产值计划产值(万元)(万元)

9090以下以下9090~~ 100100

100100~~ 110110

110110以上以上

8585

9595

105105

115115

22

33

1010

33

800800

25002500

1720017200

44004400

合计合计 —— 1818 2490024900

计算该公司该季度计划完成程度的全距。计算该公司该季度计划完成程度的全距。

X f

解:4080120

109010110minmax

XXR

Page 107: 第三章  数据描述的综合指标

优点优点 :: 计算计算方法简单、易懂;方法简单、易懂;缺点缺点 ::易受极端数值的影响,不易受极端数值的影响,不能全面反映所有标志值差异大小及能全面反映所有标志值差异大小及分布状况,准确程度差分布状况,准确程度差

往往应用于生产过程的质量控制中往往应用于生产过程的质量控制中往往应用于生产过程的质量控制中往往应用于生产过程的质量控制中

极差的特点极差的特点极差的特点极差的特点

Page 108: 第三章  数据描述的综合指标

是从变量数列中剔除了最大和最小的部分极端值之后,对剩下来的单元计算的极差称为分位差。常用的分位差为四分位差。即:

2. 2. 分位差分位差2. 2. 分位差分位差

213 QQ

QD

排除了少数极端值对分布变异范围排除了少数极端值对分布变异范围的异常影响;的异常影响; 分为程度越高,分位差排除的极端分为程度越高,分位差排除的极端值的比例就越小。值的比例就越小。

分位差的特点分位差的特点分位差的特点分位差的特点

Page 109: 第三章  数据描述的综合指标

N

XX

N

XXXXDA

N

ii

N

11

⑴ ⑴ 简单平均差简单平均差——适用于未分组资料——适用于未分组资料

是各个数据与其算术平均数的离差绝对值的算术平均数,用 A.D 表示

3. 3. 平均差平均差3. 3. 平均差平均差

计算公式:计算公式:

总体算术平均数

总体单位总数

第 个单位的变量值

i

Page 110: 第三章  数据描述的综合指标

【例【例 AA 】】某售货小组某售货小组 55 个人,某天的销售额个人,某天的销售额分别为分别为 440440 元、元、 480480 元、元、 520520 元、元、 600600 元、元、750750 元,求该售货小组销售额的平均差。元,求该售货小组销售额的平均差。解:解:

元6.935

4685

5587505584401

N

XXDA

N

ii

元5585

2790

5

750600520480440

X

即该售货小组即该售货小组 55 个人销售额的平均差为个人销售额的平均差为 93.693.6元元

Page 111: 第三章  数据描述的综合指标

m

ii

m

iii

m

mm

f

fXX

ff

fXXfXXDA

1

1

1

11

⑵ ⑵ 加权平均差加权平均差——适用于分组资料——适用于分组资料

总体算术平均数

第 组变量值出现的次数

i第 组的变量值或组中值

i

Page 112: 第三章  数据描述的综合指标

【例【例 BB 】】计算下表中某公司职工月工资的平均计算下表中某公司职工月工资的平均差差 月工资

(元)组中值(元) 职工人数(人)

300以下300~ 400400~ 500500~ 600600~ 700700~ 800800~ 900900以上

250350450550650750850950

2083143824563052377820

合计 — 2000

X f

Page 113: 第三章  数据描述的综合指标

元95.5222000

1045900

2000

20950208250

X

元95.1382000

6.2778932000

2095.52295020895.522250

1

f

fXXDA

m

ii

解:解:

即该公司职工月工资的平均差为即该公司职工月工资的平均差为 138.95138.95 元元

Page 114: 第三章  数据描述的综合指标

优点优点 :: 不易受极端数值的影响,能综合不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;反映全部单位标志值的实际差异程度;缺点缺点 :: 用绝对值的形式消除各标志值与用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。作数学处理和参与统计分析运算。

平均差的特点平均差的特点平均差的特点平均差的特点

一般情况下都是通过计算另一种标志一般情况下都是通过计算另一种标志变异指标——标准差,来反映总体内变异指标——标准差,来反映总体内部各单位标志值的差异状况部各单位标志值的差异状况

一般情况下都是通过计算另一种标志一般情况下都是通过计算另一种标志变异指标——标准差,来反映总体内变异指标——标准差,来反映总体内部各单位标志值的差异状况部各单位标志值的差异状况

Page 115: 第三章  数据描述的综合指标

N

XXN

ii

2

1

⑴ 简单标准差——适用于未分组资料——适用于未分组资料

是各个数据与其算术平均数的离差平方的算术平均数的开平方根,用 来表示;标准差的平方又叫作方差,用 来表示。

2

4. 4. 标准差标准差4. 4. 标准差标准差

计算公式:计算公式:

总体单位总数

第 个单位的变量值

i 总体算术平均数

Page 116: 第三章  数据描述的综合指标

【例【例 AA 】】某售货小组某售货小组 55 个人,某天的销售额个人,某天的销售额分别为分别为 440440 元、元、 480480 元、元、 520520 元、元、 600600 元、元、 775050 元,求该售货小组销售额的标准差。元,求该售货小组销售额的标准差。解解::

元5585

2790

5

750600520480440

X

(比较:其销售额的平均差为(比较:其销售额的平均差为 93.693.6 元)元)

元62.1095

60080

5

558750558440 22

2

1

N

XXN

ii

即该售货小组销售额的标准差为即该售货小组销售额的标准差为 109.62109.62 元。元。

Page 117: 第三章  数据描述的综合指标

⑵ ⑵ 加权标准差加权标准差——适用于分组资——适用于分组资料料

m

ii

i

m

ii

f

fXX

1

2

1

总体算术平均数

第 组变量值出现的次数

i第 组的变量值或组中值

i

Page 118: 第三章  数据描述的综合指标

【例【例 BB 】】计算下表中某公司职工月工资的标准差计算下表中某公司职工月工资的标准差。。 月工资(元) 组中值(元) 职工人数(人)

300以下300~ 400400~ 500500~ 600600~ 700700~ 800800~ 900900以上

250350450550650750850950

2083143824563052377820

合计 — 2000

X f

Page 119: 第三章  数据描述的综合指标

元95.5222000

1045900

2000

20950208250

X

解解::

元9.1672000

01.56386595

2000

2095.52295020895.522250 22

(比较:其工资的平均差为(比较:其工资的平均差为 138.95138.95 元)元)即该公司职工月工资的标准差为即该公司职工月工资的标准差为 167.9167.9 元。元。

Page 120: 第三章  数据描述的综合指标

由同一资料计算的标准差的结果一般要略大于平均差。由同一资料计算的标准差的结果一般要略大于平均差。证明:当证明:当 a,b,c≥0a,b,c≥0 时,有 时,有

由同一资料计算的标准差的结果一般要略大于平均差。由同一资料计算的标准差的结果一般要略大于平均差。证明:当证明:当 a,b,c≥0a,b,c≥0 时,有 时,有

33

222 cbacba

标准差的特点标准差的特点标准差的特点标准差的特点

不易受极端数值的影响,能综合反映全不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数数离差的正负值问题,可方便地用于数学处理和统计分析运算学处理和统计分析运算 ..

Page 121: 第三章  数据描述的综合指标

22 XX

22

N

X

N

X

22

f

Xf

f

fX

简单标准差简单标准差简单标准差简单标准差

加权标准差加权标准差加权标准差加权标准差

标准差的简捷计算标准差的简捷计算标准差的简捷计算标准差的简捷计算

避免离差平方和计算过程的出现避免离差平方和计算过程的出现目的目的 ::

变量值平方的平均数

变量值平均数的平方

Page 122: 第三章  数据描述的综合指标

平均差与标准差的大小不仅与数据的离平均差与标准差的大小不仅与数据的离差状况有关,而且与变量值的平均水平差状况有关,而且与变量值的平均水平有关,故当两个总体的平均数不等就不有关,故当两个总体的平均数不等就不能用其来度量变量值的离散程度及平均能用其来度量变量值的离散程度及平均数的代表性;数的代表性; 平均差与标准差受计量单位、研究对平均差与标准差受计量单位、研究对象的影响,故不同对象、不同单位的平象的影响,故不同对象、不同单位的平均差或标准差之间没有可比性均差或标准差之间没有可比性 ..

平均差与标准差的局限平均差与标准差的局限平均差与标准差的局限平均差与标准差的局限

Page 123: 第三章  数据描述的综合指标

kg500大象 kg5.0免子kgx 3500大象 kgx 5.2免子

可比

变异系数指标变异系数指标

Page 124: 第三章  数据描述的综合指标

身高的差异水平: cm

体重的差异水平: kg

用变异系数可以相互比较

身高

身高

x

体重

体重

x

可比

Page 125: 第三章  数据描述的综合指标

平均差系数平均差系数平均差系数平均差系数

标准差系数标准差系数标准差系数标准差系数

﹪100

X

DAV DA

﹪100X

V

5. 5. 离散系数离散系数5. 5. 离散系数离散系数

用来对比不同水平的同类现象,特别是用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小不同类现象总体平均数代表性的大小 ::————标准差系数小的总体,其平均数的标准差系数小的总体,其平均数的代表性大;反之,亦然。代表性大;反之,亦然。

应用应用 ::

各种变指标与其算术平均数之比。一般用 V 表示。

Page 126: 第三章  数据描述的综合指标

【例】【例】某年级一、二两班某门课的平均成绩分某年级一、二两班某门课的平均成绩分别为别为 8282 分和分和 7676 分,其成绩的标准差分别为分,其成绩的标准差分别为 15.15.66 分和分和 14.814.8 分,比较两班平均成绩代表性的大分,比较两班平均成绩代表性的大小。小。解解:: ﹪﹪﹪ 02.19100

82

6.15100

1

11

XV

一班成绩的标准差系数为:一班成绩的标准差系数为:

二班成绩的标准差系数为:二班成绩的标准差系数为:﹪﹪﹪ 47.19100

76

8.14100

2

22

XV

因为 ,所以一班平均成绩的代因为 ,所以一班平均成绩的代表性比二班大。表性比二班大。

21 VV

Page 127: 第三章  数据描述的综合指标

第五节 偏态与峰度

一、偏态及一、偏态及其测定其测定

一、偏态及一、偏态及其测定其测定

指分布数列的不对称性。

非对称的,偏斜的分布

对称的、高度适中的分布

既偏斜又低平的分布

Page 128: 第三章  数据描述的综合指标

偏态系数小于 0 ,平均数在众数之左,是一种左偏分布,又称负偏。

左偏分布左偏分布

偏态系数大于 0 ,平均数在众数之右,是一种右偏分布,又称为正偏。

右偏分布右偏分布

(一)皮尔逊偏态测定法(一)皮尔逊偏态测定法(一)皮尔逊偏态测定法(一)皮尔逊偏态测定法 Pearson偏态系数是根据众数、中位数与均值各自的性质,通过比较众数或中位数与均值来衡量偏斜度的。

Page 129: 第三章  数据描述的综合指标

)M-x(SK )M-x3(SK o

pe

p 或

皮尔逊偏态系数计算公式皮尔逊偏态系数计算公式皮尔逊偏态系数计算公式皮尔逊偏态系数计算公式

其中:其中: SKSKPP——皮尔逊偏态测定值;皮尔逊偏态测定值; MMo o ——众数;众数; σσ——标准差;标准差;

其中:其中: SKSKPP——皮尔逊偏态测定值;皮尔逊偏态测定值; MMo o ——众数;众数; σσ——标准差;标准差;. -3≤SK. -3≤SKPP≤3≤3 ,其绝对值越大表示偏斜程度越大,其绝对值越大表示偏斜程度越大反之,表示偏斜程度越小。反之,表示偏斜程度越小。. . 偏态系数偏态系数 =0=0 为对称分布为对称分布.. 偏态系数偏态系数 > 0> 0 为右偏分布为右偏分布.. 偏态系数偏态系数 < 0< 0 为左偏分布为左偏分布

. -3≤SK. -3≤SKPP≤3≤3 ,其绝对值越大表示偏斜程度越大,其绝对值越大表示偏斜程度越大反之,表示偏斜程度越小。反之,表示偏斜程度越小。. . 偏态系数偏态系数 =0=0 为对称分布为对称分布.. 偏态系数偏态系数 > 0> 0 为右偏分布为右偏分布.. 偏态系数偏态系数 < 0< 0 为左偏分布为左偏分布

Page 130: 第三章  数据描述的综合指标

【例】【例】对下表给出的某公司员工月工资数据,计对下表给出的某公司员工月工资数据,计算偏态系数算偏态系数 SKSKPP 。。

月工资 x(元)

职工人数(人)

80010001200150020002500

48

151364

合计 50

f

Page 131: 第三章  数据描述的综合指标

解:解:

由此可知,此公司员工月工资数据由此可知,此公司员工月工资数据分布略微向右偏斜,或称正偏态。分布略微向右偏斜,或称正偏态。

所以,偏态系数 所以,偏态系数 SKSKPP== 47.095.456

12001414

因为 , 因为 , , M, Moo=1200=12001414x 95.456

Page 132: 第三章  数据描述的综合指标

13

31p

2SK

QQ

MQQ e

鲍雷偏态系数计算公式鲍雷偏态系数计算公式鲍雷偏态系数计算公式鲍雷偏态系数计算公式

其中:其中: SKSKPP— — 鲍雷偏态测定值; 鲍雷偏态测定值; -1≤SK-1≤SKPP≤1≤1

MMe e —— 中位数;中位数; Q Q i i —— 四分位数的第四分位数的第 ii 个值个值 ((ii=1,2,3)=1,2,3) ;;

其中:其中: SKSKPP— — 鲍雷偏态测定值; 鲍雷偏态测定值; -1≤SK-1≤SKPP≤1≤1

MMe e —— 中位数;中位数; Q Q i i —— 四分位数的第四分位数的第 ii 个值个值 ((ii=1,2,3)=1,2,3) ;;

(二)鲍雷((二)鲍雷( BowLeyBowLey )偏态测定)偏态测定法法

(二)鲍雷((二)鲍雷( BowLeyBowLey )偏态测定)偏态测定法法 鲍雷偏态系数是利用四分位数的关系来测定偏态的一

种方法。

Page 133: 第三章  数据描述的综合指标

动差法偏度的计算:

3

3

33

)(

f

fxx

SK

一阶中心矩衡为零,偶数阶中心矩为正数,奇数阶中心矩可以反映分布偏度。

三阶中心矩有计量单位,不便于比较,故用具有相同单位的 3 相除,去掉单位

(三)动差法测定偏态系数(三)动差法测定偏态系数(三)动差法测定偏态系数(三)动差法测定偏态系数

Page 134: 第三章  数据描述的综合指标

二、峰度及二、峰度及其测定其测定

二、峰度及二、峰度及其测定其测定

峰度指数据分布图形的尖峰程度。

扁平分布扁平分布

尖峰分布尖峰分布

与标准正态分布比较与标准正态分布比较

Page 135: 第三章  数据描述的综合指标

  峰度( qurtosis ):描述数据分布峰态的指标,也是度量数据分布集中程度的指标。

β

4

4

44

)(

f

fxx

其中:其中: ββ— — 峰度系数; 峰度系数; ϭϭ —— 标准差;标准差; υυ44—— 四阶中心矩;四阶中心矩;

其中:其中: ββ— — 峰度系数; 峰度系数; ϭϭ —— 标准差;标准差; υυ44—— 四阶中心矩;四阶中心矩;

           

344

在正态分布情况下:

因此有:

344

344

高峰态

低峰态

Page 136: 第三章  数据描述的综合指标

-4 -3 -2 -1 0 1 2 3 4

4kg2kg 作用力

力臂  统计动差(矩):利用力的动差来反映数据分布特征的指标。它以次数 f 为作用力,以变量x 为力臂,并以总次数为单位计算平均动差。

      kaxE )( 称为随机变量 x

对 a 的 k 阶矩(动差)。

f

fax k)(

f

fxk

f

fxx k)(

令 a=0,则称为 k 阶原点矩 k令 a= ,则称为 k 阶中心矩 k

x

常用的矩:

xf

xf

1

22

2

)(

f

fxx

Page 137: 第三章  数据描述的综合指标

数值 1 2 3 4 5 6 7 8 9 合计

1 组次数

0 0 3 4 4 4 3 0 0 18

2 组次数

0 1 1 3 8 3 1 1 0 18

3 组次数

1 0 0 0 16 0 0 0 1 18

【例】【例】对下表给出的数据,分别计算峰度系数。对下表给出的数据,分别计算峰度系数。

Page 138: 第三章  数据描述的综合指标

三组资料的平均数都是 5 ,标准差都是 1.33 ,偏态系数都是 0 ,将三组资料绘制成图,如下图:

解:

0246810121416

0 2 4 6 8 10

Page 139: 第三章  数据描述的综合指标

把上表代入公式计算,得到第一组的四级动差(四阶中心矩)为

85.1)33.1/(78.5

78.5

)57(3)56(4)55(4)54(4)53(3

444

444444

m

m

同样方法可得 2 组资料之 ; 55.3,11.114 m

第 3 组资料之

09.9,44.284 m

结果大于 3 ,说明分布比正态分布尖锐,结果小于 3则表示相对于正态分布平坦的分布。

Page 140: 第三章  数据描述的综合指标

1. 数据分布扁平程度的测度; 2. 峰度系数 =3, 扁平程度适中; 3. 峰态系数 <3, 为扁平分布; 4. 峰态系数 >3, 为尖峰分布;; 5 . 当方差不变时,峰度值越大, 数据会更向均值靠拢,从而分 布曲线的峰度就越高越窄。6 . 不同方差总体间比较峰度无意义。

1. 数据分布扁平程度的测度; 2. 峰度系数 =3, 扁平程度适中; 3. 峰态系数 <3, 为扁平分布; 4. 峰态系数 >3, 为尖峰分布;; 5 . 当方差不变时,峰度值越大, 数据会更向均值靠拢,从而分 布曲线的峰度就越高越窄。6 . 不同方差总体间比较峰度无意义。

峰度系数的总结峰度系数的总结 ::峰度系数的总结峰度系数的总结 ::