第 11 章统计决策

统计学统计学STATISTICSSTATISTICS

11 - 11 - 11

第第 1111 章统计决策章统计决策

11.1 11.1 统计决策的基本概念统计决策的基本概念11.2 11.2 完全不确定型决策完全不确定型决策11.3 11.3 一般风险型决策一般风险型决策11.4 11.4 贝叶斯决策贝叶斯决策


11 - 11 - 22

学习目标学习目标

1.1. 统计决策的基本概念、基本工具和基本步骤；统计决策的基本概念、基本工具和基本步骤；2.2. 完全不确定决策的基本准则及其使用场合；完全不确定决策的基本准则及其使用场合；3.3. 风险型决策的基本准则及其应用；风险型决策的基本准则及其应用；4.4. 贝叶斯决策的概念；贝叶斯决策的概念；5.5. 后验概率计算与后验分析；后验概率计算与后验分析；6.6. 完全信息价值与补充信息价值的概念及其应用。完全信息价值与补充信息价值的概念及其应用。

11 - 11 - 33


11 - 11 - 33

11.1 11.1 统计决策的基本概念统计决策的基本概念

一、什么是统计决策一、什么是统计决策二、统计决策的基本步骤二、统计决策的基本步骤三、收益矩阵表三、收益矩阵表


11 - 11 - 44

什么是统计决策什么是统计决策

狭义的统计决策方法是一种研究非对抗型狭义的统计决策方法是一种研究非对抗型和非确定型决策问题的科学的定量分析方和非确定型决策问题的科学的定量分析方法。法。


11 - 11 - 55

统计决策的基本步骤统计决策的基本步骤

（一）确定决策目标（一）确定决策目标决策目标是在一定条件制约下，决策者希望达到的结果。决策目标是在一定条件制约下，决策者希望达到的结果。

反映决策目标的变量，称为目标变量。反映决策目标的变量，称为目标变量。（二）拟定备选方案（二）拟定备选方案备选方案是决策者可以调控的因素，备选方案中所调控的备选方案是决策者可以调控的因素，备选方案中所调控的

变量称为行动变量。所有备选方案的集合称为行动空间。变量称为行动变量。所有备选方案的集合称为行动空间。（三）列出自然状态（三）列出自然状态自然状态是指实施行动方案时，可能面临的客观条件。所自然状态是指实施行动方案时，可能面临的客观条件。所

有可能出现的状态的集合称为状态空间，而相应的各种状有可能出现的状态的集合称为状态空间，而相应的各种状态可能出现的概率的集合称为状态空间的概率分布。态可能出现的概率的集合称为状态空间的概率分布。

（四）选择“最佳”或“满意”的方案（四）选择“最佳”或“满意”的方案（五）实施方案（五）实施方案


11 - 11 - 66

收益矩阵表收益矩阵表

表表 11-1 11-1 收益矩阵表收益矩阵表状态 θ1 θ2 … θn

概率 P1 P2 … Pn

方案

a1 q11 q12 … q1n

a2 q21 q22 … q2n

… … … … …

am qm1 qm2 … qmn


11 - 11 - 77

收益矩阵的元素收益矩阵的元素 qqijij 反映在状态反映在状态 θθjj 下，采用下，采用行动方案行动方案 aaii 得到的收益值。这里所说的收得到的收益值。这里所说的收益是广义收益指标。收益是行动方案和自益是广义收益指标。收益是行动方案和自然状态的函数，可用下式表示：然状态的函数，可用下式表示：

qqijij ＝＝ Q (Q (aaii ,, θ θjj ) ) i =1,2,…,m; j=1,2,…ni =1,2,…,m; j=1,2,…n

11 - 11 - 88


11 - 11 - 88

11.2 11.2 完全不确定型决策完全不确定型决策

一、完全不确定型决策的准则一、完全不确定型决策的准则二、各种准则的特点和适用场合二、各种准则的特点和适用场合


11 - 11 - 99

完全不确定型决策的准则完全不确定型决策的准则

（一）最大的最大收益值准则（一）最大的最大收益值准则在决策时，先选出各种状态下每个方案的在决策时，先选出各种状态下每个方案的

最大收益值，然后再从中选择最大者，并最大收益值，然后再从中选择最大者，并以其相对应的方案作为所要选择的方案。以其相对应的方案作为所要选择的方案。

（二）最大的最小收益值准则（二）最大的最小收益值准则在决策时，先选出各种状态下每个方案的在决策时，先选出各种状态下每个方案的

最小收益值，然后再从中选择最大者，并最小收益值，然后再从中选择最大者，并以其相对应的方案作为所要选择的方案。以其相对应的方案作为所要选择的方案。


11 - 11 - 1010

（三）最小的最大后悔值准则（三）最小的最大后悔值准则后悔值是由于决策失误而造成的最大可能的收益值与后悔值是由于决策失误而造成的最大可能的收益值与

实际收益值之差。方案实际收益值之差。方案 aaii 在状态在状态 θθjj 下的后悔值，可按下的后悔值，可按下式计算：下式计算：

rrijij ＝＝ max Q (max Q (aaii ,,θθjj ) ) －－ qqijij

式中，式中， max Q (max Q (aaii ,,θθjj )) 是在第是在第 j j 种状态下，正确决策有种状态下，正确决策有可能得到的最大收益，可能得到的最大收益， qqijij 是收益矩阵的元素。显而易是收益矩阵的元素。显而易见，见， rrijij≥0 ≥0 。最小的最大后悔值准则主张：应在求出后。最小的最大后悔值准则主张：应在求出后悔矩阵的基础上，先选出各种状态下每个方案的最大悔矩阵的基础上，先选出各种状态下每个方案的最大后悔值，然后再从中选择最小者，并以其相对应的方后悔值，然后再从中选择最小者，并以其相对应的方案作为所要选择的方案。案作为所要选择的方案。


11 - 11 - 1111

（四）折衷准则（四）折衷准则该准则主张根据经验和判断确定一个乐该准则主张根据经验和判断确定一个乐

观系数观系数 αα （（ 0≤0≤αα≤1≤1 ），以），以 αα 和和 11 －－ αα 分分别作为最大收益值和最小收益值的权数，别作为最大收益值和最小收益值的权数，计算各方案的期望收益值计算各方案的期望收益值 E(Q(E(Q(aaii))))

E(Q(E(Q(aaii)) =)) =αα{ { qqijij } +(1} +(1 －－ αα) {) {qqijij } }

并以期望收益值最大的方案作为所要选并以期望收益值最大的方案作为所要选择的方案。择的方案。


11 - 11 - 1212

（五）等可能性准则（五）等可能性准则该准则假定各种状态可能出现的概率相该准则假定各种状态可能出现的概率相

同同 ,, 在此基础上求各方案收益的期望值，在此基础上求各方案收益的期望值，并以期望收益值最大的方案作为所要选并以期望收益值最大的方案作为所要选择的方案。择的方案。


11 - 11 - 1313

各种准则的特点和适用场合各种准则的特点和适用场合

最大的最大收益值准则一般只有在客观情况确实很乐观，最大的最大收益值准则一般只有在客观情况确实很乐观，或者即使决策失误，也完全可以承受损失的场合才采用。或者即使决策失误，也完全可以承受损失的场合才采用。

最大的最小收益值准适用于对未来的状态非常没有把握，最大的最小收益值准适用于对未来的状态非常没有把握，或者难以承受决策失误损失的场合。或者难以承受决策失误损失的场合。

最小的最大后悔值准则适用于不愿放过较大的获利机会，最小的最大后悔值准则适用于不愿放过较大的获利机会，同时又对可能出现的损失有一定承受力的场合。同时又对可能出现的损失有一定承受力的场合。

折衷准则和等可能性准则都是以各种方案的收益的期望值折衷准则和等可能性准则都是以各种方案的收益的期望值作为选择方案的标准。折衷准则事实上是假定未来可能发作为选择方案的标准。折衷准则事实上是假定未来可能发生的状态只有两种：即最理想状态和最不理想状态。前者生的状态只有两种：即最理想状态和最不理想状态。前者发生的概率是发生的概率是 αα ，后者发生的概率是（，后者发生的概率是（ 11 －－ αα ）。当）。当 αα＝＝ 11 时，该准则等价于乐观准则，而当时，该准则等价于乐观准则，而当 αα ＝＝ 00 时，该准时，该准则等价于悲观准则。则等价于悲观准则。

11 - 11 - 1414


11 - 11 - 1414

11.311.3 一般风险型决策一般风险型决策

一、然状态概率分布的估计一、然状态概率分布的估计二、风险型决策的准则二、风险型决策的准则三、利用决策树进行风险型决策三、利用决策树进行风险型决策


11 - 11 - 1515

自然状态概率分布的估计自然状态概率分布的估计

客观概率是一般意义上的概率，通常是由客观概率是一般意义上的概率，通常是由自然状态的历史资料推算或按照随机实验自然状态的历史资料推算或按照随机实验的结果计算出来的。的结果计算出来的。

主观概率是决策者基于自身的学识和经验主观概率是决策者基于自身的学识和经验作出的对某一事件发生可能性的主观判断。作出的对某一事件发生可能性的主观判断。


11 - 11 - 1616

风险型决策的准则风险型决策的准则

（一）期望值准则（一）期望值准则以各方案收益的期望值的大小为依据，以各方案收益的期望值的大小为依据，

来选择合适的方案。来选择合适的方案。E(Q(E(Q(aaii)))) ＝＝ (i =1,2,---,m)(i =1,2,---,m)

式中，式中， E(Q(E(Q(aaii)))) 是是 ii 方案的收益的期望值，方案的收益的期望值，是是 ii 方案在出现方案在出现 jj 状态时的收益值；是状态时的收益值；是 jj状态出现的概率。状态出现的概率。

,1

n

i j jj

q P


11 - 11 - 1717

（二）变异系数准则（二）变异系数准则在期望值达到一定数额的前提下，以变异在期望值达到一定数额的前提下，以变异

系数较低的方案作为所要选择的方案。系数较低的方案作为所要选择的方案。方差方差 Var(Var(aaii)) 和变异系数和变异系数 VV 的计算公式如下：的计算公式如下：

Var(Var(aaii) =E(Q() =E(Q(aaii)))) ＝＝ (i =1,2,…,m)(i =1,2,…,m)

VVii ＝＝ (i =1,2,…,m)(i =1,2,…,m)

2

,1

E(Q(ai))n

i j jj

q p

( )

E(Q(ai))iVar a


11 - 11 - 1818

（三）最大可能准则（三）最大可能准则在最可能状态下，可实现最大收益值的方案为最佳方案。在最可能状态下，可实现最大收益值的方案为最佳方案。最大可能准则是将风险条件下的决策问题，简化为确定条最大可能准则是将风险条件下的决策问题，简化为确定条件下的决策问题。只有当最可能状态的发生概率明显大于件下的决策问题。只有当最可能状态的发生概率明显大于其他状态时，应用该准则才能取得较好的效果。其他状态时，应用该准则才能取得较好的效果。

（四）满意准则（四）满意准则利用这一准则进行决策，首先要给出一个满意水平。然后，利用这一准则进行决策，首先要给出一个满意水平。然后，将各种方案在不同状态下的收益值与目标值相比较，并以将各种方案在不同状态下的收益值与目标值相比较，并以收益值不低于目标值的累积概率为最大的方案作为所要选收益值不低于目标值的累积概率为最大的方案作为所要选择的方案。利用该准则的决策结果，与满意水平的高低有择的方案。利用该准则的决策结果，与满意水平的高低有很大关系。很大关系。


11 - 11 - 1919

利用决策树进行风险型决策利用决策树进行风险型决策

决策树是是一种将决策问题模型化的树形决策树是是一种将决策问题模型化的树形图。决策树由决策点、方案枝、机会点、图。决策树由决策点、方案枝、机会点、概率枝和结果点组成。利用决策树对方案概率枝和结果点组成。利用决策树对方案进行比较和选择，一般采用逆向分析法，进行比较和选择，一般采用逆向分析法，即从树形结构的末端的条件结果开始，从即从树形结构的末端的条件结果开始，从后向前逐步分析。后向前逐步分析。

决策树比较适用于求解复杂的多阶段决策决策树比较适用于求解复杂的多阶段决策问题。问题。


11 - 11 - 2020

图图 11-2 11-2 例例 11-911-9 的决策树图的决策树图

11 - 11 - 2121


11 - 11 - 2121

11.4 11.4 贝叶斯决策贝叶斯决策

一、什么是贝叶斯决策一、什么是贝叶斯决策二、贝叶斯公式与后验概率的估计二、贝叶斯公式与后验概率的估计三、先验分析与后验分析三、先验分析与后验分析四、完全信息价值与补充信息价值四、完全信息价值与补充信息价值五、后验预分析五、后验预分析


11 - 11 - 2222

什么是贝叶斯决策什么是贝叶斯决策

贝叶斯决策，是利用补充信息根据贝叶斯贝叶斯决策，是利用补充信息根据贝叶斯公式来估计后验概率，并在此基础上对备公式来估计后验概率，并在此基础上对备选方案进行评价的一种决策方法。选方案进行评价的一种决策方法。


11 - 11 - 2323

贝叶斯公式与后验概率的估计贝叶斯公式与后验概率的估计

设某种状态设某种状态 θθjj 的先验概率为的先验概率为 PP((θθjj)) ，通过调，通过调查获得的补充信息为查获得的补充信息为 eekk , ,θθjj 给定时给定时 eekk 的条的条件概率为，则在给定信息件概率为，则在给定信息 eekk 的条件下的条件下 ,,θθjj 的的条件概率即后验概率可用以下公式计算条件概率即后验概率可用以下公式计算

1

( ) ( / )( / )

( ) ( / )

j k jj k n

j k jj

P P eP e

P P e


11 - 11 - 2424

先验分析与后验分析先验分析与后验分析

先验分析是利用先验概率进行决策，而后先验分析是利用先验概率进行决策，而后验分析是利用后验概率作为选择与判断合验分析是利用后验概率作为选择与判断合适方案的依据。一般来说，只要补充信息适方案的依据。一般来说，只要补充信息是准确的，则后验分析的结论更为可靠。是准确的，则后验分析的结论更为可靠。


11 - 11 - 2525

完全信息价值与补充信息价值完全信息价值与补充信息价值

完全信息，是指在对某一问题进行决策时，完全信息，是指在对某一问题进行决策时，对于所有可能出现的状态都可以提供完全对于所有可能出现的状态都可以提供完全确切的情报。完全信息的价值，可以由掌确切的情报。完全信息的价值，可以由掌握完全信息前后，所采取的不同行动方案握完全信息前后，所采取的不同行动方案的收益值的差额来表示。用收益值差额的的收益值的差额来表示。用收益值差额的期望值来综合反映完全信息的价值。期望值来综合反映完全信息的价值。


11 - 11 - 2626

其计算公式如下：其计算公式如下： EVPI EVPI ＝＝ E[ Q(E[ Q(aaii,,θθjj )-)- Q( Q(aa*,*,θθjj ))]]

＝＝ [ Q([ Q(aaii,,θθjj )-)- Q( Q(aa**,,θθjj )) (11.16)(11.16)

上式中，上式中， EVPIEVPI 是完全信息价值的期望值，是完全信息价值的期望值， Q(Q(aaii,,

θθjj )) 表示各方案在状态表示各方案在状态 θθjj 下的最大收益值，下的最大收益值， Q(Q(aa**,,

θθjj )) 表示先验分析中的最佳方案在状态表示先验分析中的最佳方案在状态 θθjj 下的收下的收益值。益值。 EVPIEVPI越大表明通过收集补充信息使决策越大表明通过收集补充信息使决策效益提高的余地越大。同时，它也代表了为取得效益提高的余地越大。同时，它也代表了为取得该项情报可付出的代价的上限。该项情报可付出的代价的上限。

iMax

iMax

1

( )n

jj

P


11 - 11 - 2727

补充信息补充信息 eekk 的价值的价值 VAIVAI 的计算公式如下：的计算公式如下： VAIVAI （（ eekk ）） = = 先验先验 EVPIEVPI- - 后验后验 EVPIEVPI （（ eekk ）） (11.17)(11.17)

上式中，先验上式中，先验 EVPIEVPI 是根据状态的先验概是根据状态的先验概率计算的完全信息价值的期望值，后验率计算的完全信息价值的期望值，后验 EEVPI(VPI(eekk)) 是在了解补充信息是在了解补充信息 eekk 后，利用根据后，利用根据该信息修正的后验概率计算的完全信息价该信息修正的后验概率计算的完全信息价值的期望值。值的期望值。


11 - 11 - 2828

VAI(VAI(eekk)) 的取值与的取值与 eekk 有关。为了综合反映有关。为了综合反映补充信息的价值，还需要计算补充信息价补充信息的价值，还需要计算补充信息价值的期望值值的期望值EVAI = E[VAI(EVAI = E[VAI(eekk)])]

= = E[VAI(= = E[VAI(eekk)])]

= =

1

( ) ( )T

k kk

VAI e P e

1

( ) ( )T

k kk

VAI e P e


11 - 11 - 2929

上式中，上式中， P(P(eekk)) 是是 eekk 出现的概率。出现的概率。

P(P(eekk)) ＝＝；； (11.19)(11.19)

EVAIEVAI 是判断收集补充信息是否有利的标准。在是判断收集补充信息是否有利的标准。在收集补充信息之前，应将收集补充信息之前，应将 EVAIEVAI 与收集补充信息与收集补充信息的费用加以比较，只有当收集补充信息的费用小的费用加以比较，只有当收集补充信息的费用小于于 EVAIEVAI 时，平均来看，收集补充信息才有利可时，平均来看，收集补充信息才有利可图。图。

1

( ) ( / )n

j k jj

P P e

1

( ) 1T

kk

P e ＝


11 - 11 - 3030

后验预分析后验预分析

在正式进行补充信息的调查之前，需要先在正式进行补充信息的调查之前，需要先估算完全信息价值的期望值和补充信息价估算完全信息价值的期望值和补充信息价值的期望值，将其与收集补充信息所需的值的期望值，将其与收集补充信息所需的费用和收益相对比，就是否值得进一步收费用和收益相对比，就是否值得进一步收集补充信息的问题作出判断，并选择最佳集补充信息的问题作出判断，并选择最佳的收集补充信息的方案。这一环节被称为的收集补充信息的方案。这一环节被称为后验预分析。后验预分析。

第 11 章统计决策

Documents

Transcript of 第 11 章统计决策

第 11 章 统计决策

Documents

Transcript of 第 11 章 统计决策

第 11 章统计决策

Transcript of 第 11 章统计决策