Introdu˘c~ao a teoria da decis~ao - ime.unicamp.brlaurarifo/aulas/mi686/apostila.pdf ·...

Universidade Estadual de Campinas

Introducao a teoria da decisao

Conceitos basicos

Prof. Laura L. R. Rifo

- 2o semestre, 2014 -

Conteudo

1 Introducao 1

1.1 Tomada de decisao como uma escolha entre acoes . . . . . . . . . . . . . 2

1.2 O papel da incerteza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3 O modelo para a tomada de decisao . . . . . . . . . . . . . . . . . . . . 6

1.4 Plano do curso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2 Medida numerica para incerteza 9

2.1 Mensuracao da incerteza atraves de um padrao . . . . . . . . . . . . . . 11

Quao bom e o seu chute em probabilidade? . . . . . . . . . . . . . . . . 14

2.2 Mensuracao da incerteza atraves de uma regra de escore . . . . . . . . . 16

A regra de escore como auxılio na atribuicao de uma probabilidade . . . 17

2.3 Atribuindo probabilidade com um seguro . . . . . . . . . . . . . . . . . 19

3 Leis da probabilidade 21

3.1 Coerencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.2 Extensao da conversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.3 Regra de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

3.4 Paradoxo de Simpson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.5 Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3.6 Dutch book . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4 Medida numerica para consequencias 31

4.1 As consequencias de uma decisao . . . . . . . . . . . . . . . . . . . . . . 31

4.2 Um exemplo de incoerencia . . . . . . . . . . . . . . . . . . . . . . . . . 34

ii Conteudo

5 A utilidade do dinheiro 37

5.1 Incoerencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

5.2 A utilidade e crescente e limitada . . . . . . . . . . . . . . . . . . . . . . 39

5.3 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

5.4 Consequencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

Aversao ao risco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

Premio de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

Aversao ao risco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

6 Teorema de Bayes 45

6.1 Informacao e teoria de decisao . . . . . . . . . . . . . . . . . . . . . . . . 45

6.2 Erros dos dois tipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

6.3 Amostragem de atributos . . . . . . . . . . . . . . . . . . . . . . . . . . 48

6.4 Probabilidades vagas ou precisas . . . . . . . . . . . . . . . . . . . . . . 50

7 O valor da informacao 53

7.1 Informacao perfeita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

7.2 Valor esperado da informacao perfeita . . . . . . . . . . . . . . . . . . . 55

7.3 Perdas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

7.4 Informacao perfeita com uma utilidade qualquer . . . . . . . . . . . . . 58

7.5 Valor esperado da informacao parcial . . . . . . . . . . . . . . . . . . . . 60

7.6 Aplicacao em amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . 64

8 Arvores de decisao 65

8.1 Exemplo (petroleira) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

9 Atribuicao de probabilidades e utilidades 73

9.1 Atribuicao de probabilidades . . . . . . . . . . . . . . . . . . . . . . . . 73

Probabilidades pequenas . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

9.2 Atribuicao de utilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

9.3 Consideracoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

Conteudo iii

9.4 Minimax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

Minimax com perdas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

Capıtulo 1

Introducao

Nesta parte do curso, veremos os conceitos gerais abordados em problemas de tomada

de decisao: incerteza, consequencias, informacao. Estas notas estao fortemente baseadas

nos livros classicos de Lindley [2] e Pratt et al. [3].

Pretendemos estudar como as decisoes sobre o curso de acao a seguir devem ser tomadas.

Todos devemos tomar decisoes todos os dias, a maioria triviais: qual blusa usar, o que

almocar na cantina, etc. No entanto, podemos facilmente imaginar situacoes em que este

processo nao e tao trivial, referentes as proximas eleicoes, a uma proposta de casamento,

a um novo emprego ou bolsa, a compra de uma casa, nas quais as consequencias precisam

ser bem pensadas antes de chegar a uma conclusao.

As vezes, nossas decisoes podem afetar nossos colegas, e nao apenas a nos mesmos ou

nossas famılias, como as de alguem em um cargo de chefia; ou afetar uma populacao

inteira, como as de alguem em um cargo importante do governo. Todos estamos ligados

a processos de tomada de decisao, seja como agentes decisorios, seja afetados pelas suas

consequencias.

Um dos objetivos deste curso e apresentar aspectos comuns a tomada de decisao em

diversos ambitos. A escolha de uma acao, como atividade humana, e dependente da

personalidade do indivıduo que a fara, e neste aspecto tem um forte elemento pessoal,

subjetivo no processo. No entanto, e possıvel tirar proveito de um olhar mais distante

ou abstrato em algumas situacoes; ha partes em um processo de decisao passıveis de um

estudo analıtico e sistematico. Por exemplo, o gerente de uma empresa usa a informacao

dada por seus contadores.

Nao veremos neste curso nenhum algoritmo para indicar o curso de acao correto em um

dado problema. Apenas pretendemos mostrar algumas linhas gerais para auxiliar uma

2 Introducao

tomada de decisao sensata e que permitem quebrar um problema de decisao complexo

em partes menores (e mais simples) cuja analise pode ser combinada para chegar a uma

solucao para o problema completo.

Observando tomadas de decisao racionais e outras, com resultados insatisfatorios, po-

demos deduzir algumas regras que devem ser seguidas para assegurar a coerencia de

uma decisao. A forma mais simples de obter esta coerencia e desenvolvendo padroes de

comparacao adequados.

Imagine um predio, grande e complicado, e concentre-se apenas em suas dimensoes,

sem se importar com o uso dele nem com as pessoas que o habitam; pense apenas

nos comprimentos das salas, portas, moveis, etc. O predio devem manter uma certa

consistencia em suas dimensoes: a janela nao pode ser mais alta que a parede, por

exemplo. Mas no lugar de comparar as duas medicoes, o arquiteto compara cada uma

delas com um padrao, como o metro.

Ao tomar uma decisao tambem temos padroes de comparacao para cada uma das par-

tes componentes do problema geral. Estes padroes nos permitirao desenvolver o que

chamamos de tomada de decisao coerente.

A abordagem que daremos e prescritiva, nao descritiva. Ou seja, nao estudaremos

como as decisoes sao tomadas na sociedade moderna (se bem que com as ferramentas

que veremos poderıamos descrever que o ser humano e em geral incoerente). Nossa

abordagem pretende prescrever bons metodos que deveriam ser usados ao selecionar um

curso de acao. Tambem pretende ser normativa: fazer o estudo logico da escolha entre

decisoes do ponto de vista puramente matematico e dizer como uma pessoa deveria se

comportar. Esta analise normativa entrega o fundamento logico sobre o qual os metodos

praticos e operacionais podem se basear.

1.1 Tomada de decisao como uma escolha entre acoes

Uma pessoa enfrenta um problema de decisao sempre que existir uma escolha de pelo

menos dois cursos de acao. Se voce tem uma unica blusa para usar, nao ha o que decidir.

A primeira coisa a fazer em uma situacao de decisao e considerar quais sao todas as

possıveis acoes. Tipicamente, nao e aconselhavel incluir uma decisao e sua negacao

como a segunda decisao possıvel. Por exemplo, se voce estiver considerando ir ao teatro

em um certo dia, o problema de ir ou nao ir ao teatro nao e um problema de decisao

bem colocado. A decisao de nao ir, na verdade, envolve diversas decisoes possıveis: ficar

Tomada de decisao como uma escolha entre acoes 3

em casa assistindo TV, ficar estudando, ler um livro, namorar, etc. O problema deve,

portanto, ser colocado considerando estes outros cursos de acao.

Este aspecto e muito aplicavel, mas tambem provavelmente esquecido em muitas decisoes

importantes. Por exemplo, ha alguns anos, em meu condomınio foi votada a construcao

de uma nova guarita. O fundo de reserva do condomınio era insuficiente e havia portanto

a necessidade de arrecadar um fundo adicional para a obra, no valor previsto incialmente

de 160 mil reais. A decisao foi votada e aprovada por maioria. Esta foi uma decisao

de gastar 160 mil reais na construcao de uma guarita, sem considerar outros usos dessa

quantidade de dinheiro que poderiam ter sido mais uteis para o condomınio. E como

decidir ir ao teatro sem considerar as demais alternativas.

Muitas decisoes importantes do governo frequentemente parecem, a nos cidadaos co-

muns, ser tomadas sem considerar outras possibilidades, se bem que deveria ser uma

das obrigacoes da oposicao chamar a atencao para elas, antes de serem votadas.

Assim, em qualquer problema de decisao, devemos fazer inicialmente uma lista de todas

as alternativas razoaveis de acoes possıves. Por exemplo, um comerciante ao ter que de-

cidir quantos itens comprar de seu fornecedor poderia fazer um pedido variando de 0 ate

a capacidade de sua loja. Estas sao apenas as possibilidades imediatas. Frequentemente,

nao podemos ter certeza de que alguma possibilidade atraente nao foi omitida: sempre

existe a chance de que alguem imaginativo apareca com uma opcao nao considerada

pelo agente decisor. Uma parte do sucesso de um bom tomador de decisao e sua habili-

dade em propor novas ideias, mais do que a habilidade de selecionar de uma lista. Para

desenvolver este fator humano nao ha conselho cientıfico que possa ser oferecido neste

curso. Quando conseguimos fazer uma lista razoavelmente completa das possibilidades,

dizemos que ela e uma lista exaustiva.

E tambem conveniente estabelecer que apenas uma das decisoes dessa lista pode ser

tomada. Escolher de um cardapio, por exemplo, nao satisfaz esta condicao, pois po-

derıamos pedir entrada e sobremesa. Mas a escolha da sobremesa satisfaz (usualmente).

Uma lista com esta propriedade e facil de construir a partir de qualquer lista, pegando

todos os pares ou ternas, ou outras ordenacoes, que poderiam ser escolhidas exclusi-

vamente, ou sequencialmente: primeiro a entrada, depois o prato principal, depois a

sobremesa.

Uma lista com esta propriedade e dita uma lista de decisoes exclusivas.

As decisoes que consideraremos sao ambas, exclusivas e exaustivas: uma delas deve ser

tomada, e no maximo uma delas pode ser tomada.

4 Introducao

Podemos descrever os elementos desta lista com uma linguagem neutra: decisao 1,

decisao 2, etc, e denota-los simplesmente por d1, d2, . . . , dm, para m cursos de acao

(assumiremos m finito).

1.2 O papel da incerteza

A selecao de um unico item em uma lista, que seja melhor em algum sentido, como um

curso de acao a seguir, e, em princıpio, simples, se tivermos uma informacao completa.

Por exemplo, o comerciante anterior nao teria nenhuma dificuldade em fazer o pedido

se soubesse exatamente quantos itens ele vendera antes da entrega seguinte. A escolha

no cardapio poderia ser facilitada se tivermos informacao sobre a qualidade de cada

opcao (”hoje recomendamos o salmao: ele foi pescado ontem”e uma informacao tıpica

e valiosa).

Ao tomarmos uma decisao em um contexto onde todos os possıveis fatores importan-

tes sao completamente conhecidos (com certeza), os motivos que poderiam justificar

uma decisao errada sao um planejamento descuidado ou dificuldades computacionais ou

tecnicas. No entanto, quando o contexto envolve situacao de incerteza a respeito de

alguns dos fatores, nao e possıvel afirmar de antemao qual e a decisao (mais) correta.

Sob situacoes de incerteza, o agente decisor e obrigado a apostar, esperando ganhar,

sabendo que poderia perder.

Se a dificuldade de uma decisao estiver nas incertezas da situacao, entao estas incertezas

devem ser consideradas no estudo, conjuntamente com as decisoes em si.

Sobre o comerciante, por exemplo, suponha que m e a capacidade de armazenamento da

loja e, por simplicidade, que no momento da compra, ele nao tem nenhum item. Assim,

podemos denotar por di a decisao de comprar i itens, i = 1, . . . ,m. Denotemos por J o

total de itens que ele vendera antes da ordem seguinte, e suponhamos que 1 ≤ J ≤ m.

Se o comerciante soubesse que ele vendera J = j itens entao ele tomaria a decisao dj .

Como ele nao sabe, ele poderia usar sua experiencia anterior para ter uma ideia do

valor de J . Por exemplo, ele poderia ter quase certeza de que J ≥ 2, mas achar pouco

provavel vender mais que 25. E esta incerteza que devemos ser capazes de incluir em

nossa analise.

Chamamos evento qualquer ocorrencia ou acontecimento. Um evento sobre o qual temos

a informacao de se ele ocorreu (ou ocorrera) ou nao e chamado um evento certo. Caso

contrario, o chamamos evento incerto. Assim, o evento de que a loja esta vazia e certo,

e o de que ele vendera 4 itens e incerto.

O papel da incerteza 5

Denotemos por θj o evento que o comerciante vendera exatamente j itens. Assim, temos

m tais eventos (incertos). Note que estes eventos, assim como as decisoes, tambem sao

exclusivos e exaustivos.

Nem sempre e simples enumerar os eventos incertos envolvidos em um problema. Por

exemplo, suponha que voce esta em Vina del Mar, no Chile, e gostaria de ir para a cidade

de Mendoza, na Argentina, durante o mes de agosto, no meio do inverno. Suponha que

voce tem duas opcoes: d1, ir de carro ou d2, ir de aviao. A incerteza entra no problema

porque voce nao sabe se a estrada estara fechada por causa da neve, evento que acontece

nesta epoca, as vezes por algumas horas ate por alguns dias. O clima na costa e muito

diferente do da cordilheira, de modo que e irrelevante olhar pela janela para ver o tempo;

alem disso, a previsao do tempo costuma falhar. O que voce deve fazer?

Uma analise simples sugere que existem dois eventos incertos: θ1, a estrada estara

fechada, e θ2, ela estara aberta. Estes eventos sao claramente exaustivos e exclusivos.

Mas, pensando melhor, voce percebe que eles nao refletem adequadamente os eventos

incertos do problema. Suponha que a estrada esta aberta, mas a visibilidade e ruim ou

a estrada estara com gelo, de modo que voce deveria dirigir lentamente e com cuidado,

levando bastante tempo para chegar. Por outro lado, se a estrada estiver aberta e

o tempo ensolarado, o passeio sera muito agradavel e com uma vista linda. Assim,

poderıamos ter tres eventos incertos: θ1, a estrada estara fechada, θ2, ela estara aberta

e o tempo ruim, e θ3, ela estara aberta e o tempo ensolarado. Mas pensando mais um

pouco, poderia haver outras possibilidades, como uma pane ou acidente com o carro,

suficientemente serio para estragar o passeio. O acidente tambem poderia ocorrer com

o aviao. Voce poderia achar que isto e menos provavel, mas poderia haver um atraso

grande que levasse voce a perder a reserva no hotel em Mendoza, o que ja e bem mais

provavel.

Todas estas consideracoes sugerem abrir o leque para mais eventos incertos, que dificil-

mente serao todos listados. (Faca sua propria lista de eventos para este exemplo.)

Um ponto importante ao definir os eventos incertos que serao considerados e que eles

devem cobrir todas as contingencias possıveis de afetar a tomada de decisao, tais como

acidentes no carro ou atrasos no aviao. Por outro lado, eventos irrelevantes, como a mare

esta alta ou baixa, podem ser omitidos: eles sao irrelevantes porque nao influenciam a

escolha do carro ou do aviao.

Estes eventos podem ser escritos de maneira exclusiva e exaustiva, de modo que um, e

apenas um, deles ocorrera.

Assim como no caso da lista de decisoes possıveis, aqui tambem ha espaco para a sub-

6 Introducao

jetividade: alguem poderia considerar relevante um evento que outra pessoa esqueceu

ou desconsiderou. A capacidade de julgar a relevancia dos fatores e uma habilidade

importante ao tomar decisoes.

1.3 O modelo para a tomada de decisao

Em resumo, consideraremos uma lista d1, . . . , dm de decisoes exclusivas e exaustivas, e

uma lista θ1, . . . , θn de eventos incertos exclusivos e exaustivos. O nosso problema e

selecionar um unico item da primeira lista, sem saber qual elemento da segunda lista

ocorrera.

Este e o modelo basico que usaremos em nossa discussao de tomada de decisao.

Ele poderia ser considerado simples demais, por ignorar certas caracterısticas de um

problema de decisao tıpico; ou complicado demais, por ser frequentemente impossıvel

considerar todas as decisoes e todos os eventos incertos. E sempre difıcil julgar se um

modelo e adequado ou nao. No entanto, em um problema de decisao complicado, o

simples fato de tentar fazer estas duas listas pode ser bastante esclarecedor.

Perceber que tomar uma decisao envolve uma comparacao entre alternativas, e assim

levando a considera-las, ja e em si um avanco. Perceber que e necessario considerar as

incertezas que podem afetar o problema faz com que vejamos os resultados de nossa

tomada de decisao menos descuidadamente. (Ainda mais: se voce resolver desistir

do curso e ficar apenas com esta primeira aula, seus procedimentos de decisao ja serao

melhorados.) Pensar seriamente nas listas d1, . . . , dm e θ1, . . . , θn pode ser muito eficiente

para entender o problema.

Como exercıcio intelectual, pegue o jornal de hoje e veja um dos muitos exemplos de

tomada de decisao que aparecem nele, aplicando a analise que vimos aqui (mesmo que

a reportagem nao entregue suficientes detalhes, conhecidos pelos agentes decisorios).

Outro exercıcio interessante: considere algum momento de sua vida em que teve que

tomar uma decisao importante, e faca a lista das opcoes de acao que voce tinha e dos

eventos incertos na epoca; analise as consequencias de cada decisao em cada um destes

eventos incertos; perceba quais foram seus mecanismos para reduzir a incerteza destes

eventos, ou seja, como voce juntou informacao sobre estes eventos. Depois desta analise,

e sem considerar as consequencias que voce conhece hoje, voce tomaria a mesma decisao?

Plano do curso 7

1.4 Plano do curso

O primeiro dos elementos que analisaremos e o conceito de eventos incertos. Veremos

como a incerteza pode ser descrita numericamente em termos de probabilidade, cujas

leis nos permitem assegurar a coerencia.

Um curso de acao leva a consequencias, o que nos leva a desenvolver uma segunda

escala numerica para descrever o seu merito: resultados desejaveis tem um alto valor, e

indesejaveis, um baixo valor. Esta medida de merito e chamada utilidade. Veremos as

condicoes que ela deve satisfazer para, novamente, garantir a coerencia.

Estes dois conceitos numericos, de probabilidade e de utilidade, formam uma utilidade

esperada. O resultado principal deste curso pode ser expressado na ideia de que uma

decisao deve ser tomada maximizando a utilidade esperada.

A reacao natural de alguem que deve tomar uma decisao em uma situacao de incerteza

e tentar diminuir o grau de incerteza, conseguindo mais informacao. Veremos tambem

como incorporar informacao adicional na analise de um problema. O resultado basico

aqui e a regra de Bayes. Mesmo se a informacao for dada, ela tem algum custo, e neste

ponto queremos saber quanto custa a informacao, ou melhor, quanto deverıamos pagar

por uma informacao.

Exercıcio 1. Um cardapio de almoco contem apenas dois itens: um prato com carne

e um com peixe. Voce pensa que cada um pode ser ou bom ou ruim. Liste os eventos

incertos exclusivos e as decisoes exclusivas. Voce tambem poderia considerar outra de-

cisao: ir embora e comer em outro lugar. Voce tambem poderia considerar que outro

evento relevante e o que tem de comida para o jantar em sua casa: suponha de novo que

pode ser ou carne ou peixe. Repita o exercıcio. Suponha que voce decide que se a carne

estiver boa, voce almocara isso, independentemente do que tem para jantar. Mostre que

nao sao necessarios mais que 5 eventos incertos.

Exercıcio 2. Um gerente de uma empresa de transportes tem que comprar novos ca-

minhoes. Existem apenas dois tipos disponıveis: de 5 toneladas ou de 10 toneladas, e

ele precisa de uma capacidade total de 30 toneladas. Ele afirma portanto que tem duas

decisoes possıveis: d1, comprar 6 caminhoes mais leves, ou d2, comprar 3 dos mais

pesados. Esta lista e razoavelmente exaustiva? Se nao, faca uma.

Exercıcio 3. Uma empresa pode produzir unidades de tres tipos, A, B, C. O trabalho

de um dia produz tres lotes. Todas as unidades produzidas em cada um dos lotes sao

do mesmo tipo. O gerente de producao deve dizer no comeco do dia quais unidades

8 Introducao

serao produzidas em cada lote. Se somente a producao total do dia importar, e nao se

um certo tipo foi produzido no primeiro lote ou em qualquer outro, liste suas decisoes

exclusivas e exaustivas. Se a demanda de um dia qualquer por cada um dos tipo e zero

ou igual a producao de dois lotes, liste os possıveis eventos incertos do problema. Se ao

comeco do dia, nao ha nenhum item de tipo A armazenado, ha um lote de tipo B e dois

de tipo C, considere o merito de algumas das decisoes possıveis do gerente.

Exercıcio 4. Um paciente tem uma de quatro doencas possıveis, θ1, θ2, θ3, θ4. O seu

medico tem tres tratamentos possıveis, t1, t2, t3. Ele pode aplicar qualquer tratamento

e, se falhar, aplicar outro, e se ambos falharem, aplicar um terceiro. A eficacia esta

descrita na seguinte tabela, onde 1 significa efetivo e 0, ineficaz. Enumere as possıveis

θ1 θ2 θ3 θ4

t1 1 0 1 1

t2 0 1 0 1

t3 0 1 1 0

sequencias de tratamentos (ou seja, de decisoes) que o medico pode seguir.

Capıtulo 2

Medida numerica para incerteza

Como vimos, um problema de decisao pode ser abordado construindo duas listas: a das

decisoes di e a dos eventos incertos θj . Neste capıtulo, nos dedicaremos ao estudo dos

eventos incertos.

Nos exemplos mencionados, vimos alguns eventos incertos: a estrada esta fechada, cho-

vera hoje, o comerciante vendera 10 itens antes da proxima compra, etc, etc, etc. Esta-

mos rodeados de incertezas: a lista nao acaba.

Mas mesmo que eventos sejam incertos, no sentido de que nao sabemos se eles sao

verdadeiros ou falsos, ou se eles ocorrerao ou nao, alguns eventos sao mais provaveis de

ocorrer que outros.

E mais provavel obter cara no lancamento equilibrado de uma moeda balanceada do

que o evento de que voce morra neste ano. O comerciante pode achar que vendera em

torno de 10 itens no proximo perıodo, e que vender menos que 2 ou mais que 25 e pouco

usual. Em portugues, temos diversas palavras que descrevem esta incerteza: verossımil,

provavel, crıvel, plausıvel, possıvel, chance, razao de chances, etc. Nosso objetivo e

descrever a incerteza de um evento da forma mais simples que conhecemos para ordenar

coisas: com numeros.

Faremos isto de modo que quanto maior o numero atribuıdo, mais provavel e que o

evento ocorra: assim, o evento de que sejam vendidos 10 itens deve ter um valor maior

que 2 ou 25 itens, talvez 0.2 para o primeiro e somente 0.01 para qualquer um dos outros

dois.

Poderia ser objetado que e absurdo supor que todos os eventos incertos podem ter

sua incerteza medida e reduzida a um numero, ja que alguns sao muito complicados ou

envolvem aspectos emocionais, etc. No entanto, a medicao em numero, se for conseguida,

10 Medida numerica para incerteza

abre diversas possibilidades de analise, de modo que vale a pena tenta-la. Do mesmo

modo que para outros valores numericos, como a realizacao de mensuracoes fısicas, a

obtencao pode ser complicada na pratica, mas a ideia e simples.

Por exemplo, um demografo usa dados estatısticos sobre a populacao (numeros, idade,

salario, etc) e, a partir destes, constroi dados atuariais, como a expectativa de vida

dos diversos grupos. Considere o seu caso especıfico: voce nao sabe quando voce vai

morrer, mas em uma tabela de vida voce poderia encontrar sua expectativa de vida

baseado no grupo ao qual voce pertence, por exemplo, homem, branco, com idade entre

20 e 30 anos. Estes numeros sao muito considerados por companhias de seguro que,

de fato, apostam sobre sua morte (mesmo que nao usem esta linguagem de casa de

apostas). As condicoes do seu seguro, o premio ou o pagamento do seguro quando

a morte acontece, por exemplo, dependem das tabelas atuariais sobre expectativa de

vida. Todas as decisoes de uma companhia de seguros se baseiam em eventos incertos

(a perda de um bem material, morte ou acidente), e a mensuracao feita em dinheiro que

a companhia usa e parcialmente uma mensuracao da incerteza do evento.

Assim, poderıamos dizer que a Porto Seguro, por exemplo, e um aparelho de medicao

da incerteza. No entanto, nao e um bom aparelho, pois os valores cobrados envolvem

outros fatores, alem da incerteza: o dinheiro, obviamente, mas, mais importante ainda,

a percepcao sobre o valor do dinheiro tanto da seguradora quanto do cliente. Isto sera

discutido com mais detalhe quando estudarmos utilidade.

Continuamos com o problema: como medir a incerteza de um evento?

Poderıamos pensar em dividir os evento em dois tipos: eventos repetıveis e eventos

nao-repetıveis. Deste modo, poderıamos pensar em atribuir um valor para a incerteza

do evento repetıvel que esteja relacionado com a sua ocorrencia, ao repetir a situacao

diversas vezes essencialmente sob condicoes similares. Chamamos este tipo de evento de

evento estatıstico.

Sob este ponto de vista, um jogo de azar, por exemplo, envolve tipicamente eventos

estatısticos: a obtencao de um as ao lancar um dado ou selecionar uma carta de um

baralho. Do mesmo modo, para um atuario, a morte e tambem um evento estatıstico,

dado que ele considera uma grande populacao e o evento ocorre sempre que morre

alguem.

E no exemplo da viagem pela cordilheira: que a estrada esteja fechada e um evento

estatıstico?

Poderıamos, por exemplo, obter o registro meteorologico historico da regiao, nos ultimos

anos, para calcular uma probabilidade estatıstica (no sentido de frequencia) de que

Mensuracao da incerteza atraves de um padrao 11

a estrada esteja fechada, e assim considerar o evento como estatıstico. No entanto,

suponha que as autoridades locais recentemente fizeram melhorias na estrada, adquirindo

um novo equipamento para desbloquear a neve. Neste caso, observe que a probabilidade

estatıstica obtida deixa de ser valida, mesmo que o evento nao tenha mudado. O evento

e estatıstico ou nao? A melhoria feita pelas autoridades nao muda o evento; ela apenas

altera a relevancia dos dados climatologicos para o evento.

Mesmo um evento considerado estatıstico por um observador pode nao ser considerado

assim por outro. Por exemplo, para o atuario, a morte de um indivıduo da populacao

e um evento estatıstico, mas se esse indivıduo for voce, claramente, o evento nao tem

nada de repetıvel. Mesmo para o atuario, o evento poderia deixar de ser estatıstico se

ele decidir calcular a expectativa de vida de alguem especıfico, por exemplo, a minha: o

atuario poderia me alocar no grupo de mulheres, brancas com idade acima de ?, onde

haverıamos varias de nos. Mas ele poderia continuar restringindo o grupo: nao fumantes,

casada, universitaria, pratica esportes, idade de morte de meus pais e avos, alimentacao,

origem etnica, regiao onde mora, etc, etc, etc, ate sobrar apenas eu.

Finalmente, nesta classificacao, resta a ambiguidade do que significa ser ”repetıvel”.

Por exemplo, uma pessoa lanca uma moeda tres vezes obtendo cara apenas no ultimo

lancamento. O que deveria ser repetido: os tres lancamentos ou lancamentos ate obter

cara por primeira vez? Voce poderia achar que esta pergunta e irrelevante, no entanto,

ela esta na raiz de uma grande controversia em estatıstica.

Usaremos a nocao de probabilidade para lidar com estes eventos individuais, nao re-

petıveis. Uma vantagem desta abordagem e que ela pode ser usada sempre, mesmo com

eventos considerados estatısticos. Alem disso, o agente decisor esta quase sempre ligado

a eventos particulares que aparecem quando uma unica decisao deve ser tomada, nao

com uma sequencia de decisoes.

2.1 Mensuracao da incerteza atraves de um padrao

Qualquer mensuracao e feita com relacao a um padrao. O comprimento e descrito

em termos do comprimento de onda da luz amarela de sodio; o tempo, em termos da

oscilacao de um cristal. Qual pode ser um padrao para a incerteza?

Observe tambem que estes padroes nao sao usados na pratica: voce nao mede o compri-

mento de uma mesa usando uma luz de sodio, mas sim com uma fita metrica ou similar.

Ao medir a incerteza tambem nao usaremos o padrao para fins praticos, mas ele servira

para definir e estabelecer as regras que a incerteza deve obedecer.


Para construir um padrao, consideraremos uma urna contendo 100 bolas tao similares

quanto possıvel, exceto que algumas sao brancas e outras pretas. Uma bola sera extraıda

da urna de tal maneira que voce considere que cada uma das 100 bolas tem a mesma

chance de ser extraıda. Considere o evento incerto B de que a bola extraıda e branca.

A incerteza depende, portanto, de quantas bolas brancas ha na urna.

Se tivermos b bolas brancas (e portanto 100− b bolas pretas), a probabilidade do evento

B e definida como b/100 ou b%. Este o padrao que sera usado para todos os eventos

incertos, ou melhor, o conjunto de padroes para diferentes valores de b, variando de 0

ate 100.

Por exemplo, consideremos o evento E de que chovera amanha em Barao Geraldo, e

suponha que voce recebera um pequeno premio se o evento ocorrer, sem nenhum tipo

de perda caso nao chova. Agora suponha que voce recebera o mesmo premio se uma

bola branca for sorteada da urna nas condicoes que descrevemos acima. Ou seja, temos

dois jogos, um relacionado ao evento E, chuva, e o outro a B, bola branca, ambos com

o mesmo tipo de premiacao.

Se voce puder optar por apenas um dos jogos, qual voce prefere? Claramente, isto

depende da quantidade de bolas brancas na urna.

Se nao houver nenhuma bola branca, e melhor apostar na chuva; no outro extremo, se

so houver bolas brancas, a urna e melhor. Em geral, quanto mais bolas brancas houver

na urna, melhor ela e, neste contexto. Daqui podemos concluir que deve existir um

numero, digamos b, tal que voce e indiferente entre os dois jogos: se houver b+ 1 bolas,

a urna e melhor, e se houver b− 1, ela e pior.

Como os dois jogos sao agora equivalentes em todos os aspectos, dizemos que a proba-

bilidade do evento E e tambem b%. O valor de b e simplesmente o numero que deixa

voce indiferente entre os dois jogos.

Obs: o termo “aposta” nao e usado aqui como usualmente, em termos de apostas

em corridas ou jogos de azar, etc, mas sim refletindo sua opiniao ou informacao na

ocorrencia de um evento. Todos nos estamos sempre expostos a eventos incertos como

“chover amanha”, e devemos agir em face dessa incerteza - faremos o churrasco na

piscina? Neste sentido, todos nos fazemos apostas todos os dias, e este e o significado

atribuıdo.

O premio, neste caso, nao precisa ser ganho; ele apenas e considerado. O conceito

essencial e a acao em face da incerteza: como voce age ao escolher entre os eventos B

e E? (O total de bolas igual a 100 foi dado por simplicidade, mas qualquer total N

poderia ter sido usado.)


No exemplo da chuva, em algum momento (depois de amanha) saberemos se o evento

E ocorreu ou nao; no entanto, para outros eventos, e possıvel que nao tenhamos essa

informacao disponıvel.

Observe tambem que esta definicao de probabilidade, atraves de um padrao, nao usa

repeticao e e nao-estatıstica: a bola e extraıda uma unica vez (depois disso, tanto a urna

quanto as bolas poderiam ser destruıdas). Ela e resultado de um exercıcio mental, e nao

de uma realizacao fısica do ato de extrair uma bolinha da urna.

Em particular, a probabilidade derivada com referencia a um padrao depende de voce,

da pessoa que esta fazendo o julgamento sobre as bolas serem igualmente provaveis de

serem extraıdas, e sobre o merito relativo entre os dois jogos.

Dizemos que a probabilidade e pessoal (subjetiva): depende da pessoa que esta julgando

os experimentos. Ela reflete a relacao entre a pessoa e o mundo em que ela esta e no qual

ela pensa. Duas pessoas diferentes podem perfeitamente ter probabilidades diferentes

para o mesmo evento.

Esta diferenca pode ser justificada considerando a diferenca entre as informacoes que

cada pessao tem a respeito do evento; ou seja, se duas pessoas tiverem a mesma in-

formacao, elas deveriam concordar sobre a probabilidade. Neste sentido, ha tentativas

de definir probabilidades impessoais para um evento E, isto e, probabilidades que deve-

riam ser consensuais com base na mesma informacao (teoria objetivista).

Um ponto importante nesta discussao e saber como a probabilidade muda com a in-

formacao.

Para uma pessoa com uma informacao H (de historia) sobre um evento E, poderıamos

denotar corretamente a probabilidade dessa pessoa para o evento E por p(E | H). Para

facilitar a notacao, quando nao houver necessidade de ser tao correta, denotaremos esta

probabilidade simplesmente por p.

Ao comparar um evento qualquer E com um evento B relacionado com bolas em uma

urna, estamos fazendo implicitamente uma suposicao de coerencia nesta comparacao.

Isto significa que se tivermos tres eventos, E1, E2, E3, tais que E1 e mais provavel que

E2 e E2 mais provavel que E3, entao E1 deve ser mais provavel que E3. (Faca a prova

deste fato usando o padrao.) Esta ultima comparacao e dita ser coerente com as outras

duas.

Se esta suposicao falhasse, poderıamos ter a seguinte situacao: uma pessoa acha que E1

e mais provavel que E2 e que E2 e mais provavel que E3, mas que E3 e mais provavel

que E1. Suponha que ela recebe um premio se E3 ocorrer, e que nao recebe nada em


caso contrario. Entao, pela segunda comparacao, ela poderia preferir deixar a aposta

em funcao de E2: ela pagaria uma certa quantidade de dinheiro para ter E3 trocado

por E2. O mesmo argumento para a primeira comparacao levaria a concluir que ela

pagaria uma certa quantidade de dinheiro para ter E2 trocado por E1. Finalmente,

pela terceira comparacao, ela pagaria novamente para ter E1 trocado por E3. Ela esta

de volta a aposta inicial e com menos dinheiro do que no comeco. Este ciclo poderia

se repetir novamente, de modo que a pessoa incoerente vire uma maquina perpetua de

fazer dinheiro.

Daqui que somente comparacoes coerentes fazem sentido.

A coerencia e a base para a analise de tomadas de decisao: nao pretendemos afirmar

se uma comparacao e correta ou errada, mas sim se um conjunto de comparacoes e

coerente ou nao. Do mesmo modo, nao diremos se uma decisao e correta, mas sim se

ela e coerente.

A teoria de decisao trata da relacao entre eventos e decisoes, e esta relacao e defi-

nida de maneira precisa e nao arbitraria. Esta abordagem e ao mesmo tempo muito

liberal e muito restritiva: liberal no sentido em que permite uma ampla gama de pre-

ferencias, e restritiva no sentido em que estas preferencias devem obedecer certas regras

(de coerencia). Os erros ao tomar decisoes ocorrem porque estas regras sao violadas.

Quao bom e o seu chute em probabilidade?

Consideremos um evento E, uma informacao H e uma probabilidade para E conhecendo

H, p(E | H) ou simplesmente p.

Por exemplo, se E e o evento de obter cara no lancamento de uma moeda, voce poderia

pensar que p = 0.5; para o evento de que a Franca tem territorio maior que e Espanha,

voce poderia ter p = 0.3.

Em termos praticos, o que significa que esta probabilidade esteja correta?

Esta pergunta faz sentido quando falamos do comprimento de uma janela. Como pode-

mos responde-la para um evento?

Uma resposta aceitavel, pelo menos para alguns eventos, pode ser construıda da seguinte

forma: como um evento e verdadeiro ou falso, podemos dizer que uma mensuracao de

sua incerteza e boa se ela atribui probabilidade grande para um evento incerto, que

resulta ser verdadeiro, e se atribui probabilidade pequena para um evento que resulta

ser falso. Isto funciona sempre que pudermos verificar a veracidade de um evento.


Consideremos os seguintes exemplos, para testar o seu julgamento sobre a veracidade

de cada afirmacao. Cada evento tem uma alternativa, de modo que uma das duas

afirmacoes esta correta com certeza.

1. O compositor Michael Haydn foi o pai (irmao) de Joseph Haydn, o compositor

mais famoso.

2. Claret e o nome ingles para o vinho de Bordeaux (Burgundy).

3. Charlotte (Emily) Bronte escreveu Jane Eyre.

4. O hino nacional mais antigo e o da Gra-Bretanha (Franca).

5. A viola moderna tem 5 (4) cordas.

6. Zambia e o nome atual da antiga Rodesia do Norte (do Sul).

7. Roma, na Italia, esta mais ao sul (norte) que Washington DC, nos Estados Unidos.

8. O perigeu e o ponto mais afastado (proximo) da terra na orbita de um satelite

artificial.

9. Nos anos 70, a producao mundial de trigo foi em torno de 5 (9) bilhoes de toneis.

10. A Goodyear (Firestone) foi quem criou o processo de vulcanizacao que tornou

possıvel o uso comercial da borracha.

O exercıcio consiste em atribuir uma probabilidade para os eventos sem parenteses. Se

voce souber que uma afirmacao e correta, entao voce deveria atribuir probabilidade 1; se

voce souber que uma afirmacao e errada, a probabilidade atribuıda deveria ser 0. Para

as demais, sua probabilidade deveria ser um numero entre 0 e 1. Faca o seu melhor

chute.

Depois de comparar sua probabilidade p com a resposta correta, voce deveria se sentir

bem se atribuiu valores altos para eventos corretos, e pequenos para eventos falsos. No

extremo, voce achara que cometeu um erro feio se atribuiu probabilidade 1 para um

evento falso: voce pensou que ele era verdadeiro, mas na verdade ele era falso. Da

mesma forma se p = 0 para um evento verdadeiro.

Menos extremo, p = 0.8 para um evento verdadeiro fara voce se sentir melhor que

p = 0.6. Quao melhor?


2.2 Mensuracao da incerteza atraves de uma regra de es-

core

Uma forma de responder esta pergunta e usando uma regra de escore (scoring rule).

Esta e uma regra que atribui uma nota a cada valor p dependendo de se o evento e

verdadeiro ou falso. Esta nota mede a qualidade da mensuracao p.

Veremos um caso particular, a regra de escore quadratica, definida por (1 − p)2 se o

evento for verdadeiro e por p2, se for falso.

Este escore pode ser visto como uma penalizacao, quanto menor o escore melhor foi seu

julgamento.

E usual multiplicar o escore por 100 e ignorar os decimais. Assim, considere um evento

que posteriormente resulta ser verdadeiro. O valor p = 1 significa que voce estava correto

em pensar que ele era verdadeiro, sem incorrer em uma penalizacao. O valor p = 0.9,

significando que voce tinha quase certeza de que o evento era verdadeiro, tem um escore

pequeno (1−0.9)2 = 0.01 ou, multiplicando por 100, igual a 1. Um valor menor, p = 0.7,

tem escore 9, e a opiniao de que ele tinha a mesma probabilidade de ser verdadeiro ou

falso, p = 0.5, tem um escore maior de 25. Pensar que ele era falso, p = 0, tem o escore

mais alto igual a 100.

A Tabela 2.1 entrega os escores quadraticos para diversos valores de p, em ambos os

casos, de evento certo ou falso.

probabilidade 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

evento verdadeiro 100 81 64 49 36 25 16 9 4 1 0

evento falso 0 1 4 9 16 25 36 49 64 81 100

Tabela 2.1: Regra de escore quadratica.

Usando os valores da tabela, calcule seu escore para cada afirmacao e some os valores.

Como voce se saiu?

Isto depende de dois aspectos: sua habilidade em expressar sua incerteza numericamente,

e de quanto voce sabe. Uma pessoa com mais conhecimento e boa memoria de se sair

melhor que alguem com pouco conhecimento do assunto.

Para ter uma ideia do que e um escore razoavel, vejamos os casos extremos.

Se todas as respostas forem conhecidas e todas estiverem corretas, o escore total obtido e

0; se todas estiverem erradas, ha uma penalidade de 1000. Estes sao os limites. Suponha

que todas as opcoes sao indiferentes para voce, ou que o exercıcio e ridıculo; voce pode

Mensuracao da incerteza atraves de uma regra de escore 17

entao fazer duas coisas: atribuir p = 0.5 para cada afirmacao, ou chutar, colocando

p = 1 para as que voce chuta como verdadeiras, e p = 0 para as outras. O primeiro

procedimento da escore 25 para cada afirmacao, com escore total igual a 250. O segundo

da escore 0 ou 100 para cada evento e, se metade estiver correta (suposicao razoavel ao

chutar), o escore total e 500.

Imediatamente podemos perceber que atribuir p = 0.5 e uma estrategia muito melhor,

com metade do escore obtido com chutar.

Assim, ao fazer o exercıcio, voce nao deveria ter um escore maior que 250, dado que

voce tem alguma informacao sobre os eventos.

Analisando os escores individuais, podemos perceber o que a regra quadratica esta fa-

zendo.

Se um evento for verdadeiro, um valor de p acima de 0.5 dara um escore modesto; sao os

valores pequenos de p que darao a maior contribuicao. Assim, p = 0.7 da 9, mas p = 0.3

da 49.

A razao para nao selecionar valores extremos de p, proximos de 0 ou de 1, e que eles

resultam em penalidades tambem extremas se a verdade nao estiver na direcao do que

voce pensava. Alguem que tenha muita confianca em sua propria opiniao, mas que

estiver errado, tera um enorme 100 se atribuir p = 1, mas somente 81, uma reducao de

19, se atribuir p = 0.9. Inversamente, se ele estiver correto, a reducao no escore que ele

obtem quando p vai de 0.9 para 1, e de apenas 1. Em outras palavras, vale a pena ser

cauteloso.

Por outro lado, ser cauteloso demais tambem nao e interessante. Considere alguem que

pensa que o evento e verdadeiro mas nao tem certeza absoluta, atribuindo p = 0.6. Se

ele estiver correto, seu escore sera 16, mas poderia ter sido reduzido quase pela metade,

para 9, se ele tivesse atribuıdo p = 0.7.

Uma pessoa informada, com pouca confianca, dara valores proximos de p = 0.5 na

direcao correta. Seu escore poderia ser reduzido se ela se afastasse ainda mais de 1/2.

Uma pessoa confiante ira para os extremos de p, o que sera bom se sua confianca for

justificada, mas sera um fracasso se nao.

A regra de escore como auxılio na atribuicao de uma probabilidade

Levando em conta a analise anterior, tente agora as proximas perguntas. Possivelmente

seu escore melhorara nesta segunda tentativa, a menos que estas questoes sejam mais

difıceis para voce, por exemplo.


1. Johann Strauss o jovem (o velho) escreveu a valsa Danubio Azul.

2. Hock e o nome ingles para alguns vinhos da Alsacia (Alemanha).

3. “The golden bough”, O ramo de ouro, foi escrito por James Frazer (Henry James).

4. A batata foi introduzida na Europa proveniente da China (America).

5. O oboe moderno tem uma palheta simples (dupla).

6. Guiana e o nome atual da Guiana Britanica (Holandesa).

7. Santiago do Chile esta a oeste (leste) de Nova York, USA.

8. A temperatura media da superfıcie de Venus e em torno de 450oC (250oC).

9. Em torno de 22% (15%) da populacao mundial e muculmana.

10. O primeiro processo economico para fazer aco foi criado por Bessemer (Kelly).

A regra quadratica foi usada nos Estados Unidos no treinamento de previsores do clima.

O evento considerado e “chovera amanha” em um certo lugar, e ao preditor e pedida sua

probabilidade. Este procedimento se repete por um mes ou mais, registrando o escore

quadratico total. Quanto melhor o meteorologista, menor seu escore. O treinamento

se reflete nas previsoes entregues na televisao, que frequentemente sao da forma “a

probabilidade de chuva para amanha e de 85%”, significando p = 0.85. O treinamento

seria ainda melhor porque as pessoas nem sempre entendem o que significa probabilidade;

conta-se de um deles que disse que isto significava que choveria em 85% da area coberta

pela emissora de TV.

No Brasil, assim como em varios outros paıses, a ideia de probabilidade lamentavelmente

nao e usada, e a previsao do tempo e tipicamente entregue em termos vagos do tipo “ha

possibilidades de pancadas de chuva isoladas”, ou “amanha chovera em toda a regiao”.

O costume de fazer afirmacoes como “vai chover” quando na verdade a situacao e de

incerteza apenas alimenta a ignorancia das pessoas com respeito ao conceito de proba-

bilidade. O habito de substituir a incerteza por assercoes definitivas reflete o profundo

desconforto com a incerteza e o desejo de sentir que estamos no controle, sabendo o que

ira acontecer. Este habito e ensinado desde a escola, onde somos obrigados a escolher

a alternativa correta, no lugar de, por exemplo, colocar nossa probabilidade para cada

alternativa.

Atribuindo probabilidade com um seguro 19

Exercıcio 5. Considere o evento de obter face 5 ou 6 no lancamento de um dado equi-

librado. Para as estrategias abaixo, determine o escore quadratico medio obtido em 27

lancamentos do dado.

(a) para cada lancamento, a sua probabilidade e p = 0.3;

(b) em 1/3 dos lancamentos, sua probabilidade e p = 1 e no restante 2/3 dos lancamen-

tos, e p = 0;

(c) para cada lancamento, como voce nao sabe o que ira ocorrer, a sua probabilidade e

p = 0.5.

Defina outra estrategia, diferente das anteriore, e determine seu escore quadratico me-

dio.

2.3 Atribuindo probabilidade com um seguro

Considere um evento incerto E, que pode ou nao acontecer para voce. Pensemos em E

como um evento desastroso, ou seja, um que voce espera fortemente que nao aconteca.

(O argumento funciona igualmente bem se E for favoravel, apenas revertendo os sinais

das quantidades consideradas.) Por exemplo, E pode estar relacionado com a perda de

um bem valioso, como seu celular. Suponha que recupera-lo custaria para voce uma

quantidade c, se E acontecesse.

Se seu capital for C, ha duas possibilidades: ou E nao ocorre e seu capital permanece C,

ou E ocorre e seu capital fica C − c. Em qualquer um dos casos voces estara na mesma

situacao, exceto pela possıvel perda de capital; em particular, voce tera um celular.

Ao enfrentar uma possıvel perda de c, voce pode considerar contratar um seguro que

pagara c se o evento E ocorrer. Se o premio da apolice for m, aceitar o seguro significa

que seu capital certamente sera C −m, voce perca o celular ou nao, e a incerteza de E

desaparece.

A situacao pode ser descrita pela Tabela 2.2, onde EC denota o evento complementar a

E.

evento incerto E EC

resultado sem seguro C − c C

resultado com seguro C −m C −m

Tabela 2.2: Seguro contra E.

Tipicamente, m e muito menor que c. Agora, para premios suficientemente pequenos,

pagar o seguro sera atraente, enquanto que para premios grandes, seria melhor correr


o risco. Similarmente ao argumento ja usado para a urna, existe um unico valor de

m para o qual premios menores serao aceitaveis, e premios maiores, nao. Em outras

palavras, para este valor m de premio, contratar o seguro ou nao serao opcoes igualmente

atraentes.

Considere agora outra situacao. Suponha que seu capital e C − m, onde m e o valor

unico da paragrafo anterior, e que alguem oferece o seguinte jogo por uma aposta de

valor c−m: se uma bola preta for extraıda de uma urna (evento BC), voce ganhara m

(e seu valor apostado devolvido), caso contrario, voce perde o que apostou.

Assim, se B nao ocorrer, seu capital aumenta para C; se ocorrer, ele cai para C − c. A

Tabela 2.3 descreve esta situacao.

evento incerto B BC

resultado se aceitar a aposta C − c C

resultado se rejeitar a aposta C −m C −m

Tabela 2.3: Seguro contra E.

Se houver uma quantidade pequena b de bolas pretas na urna, voce aceitara a aposta;

para uma quantidade grande, voce rejeitara. Novamente, existe um unico valor de b tal

que, valores menores levarao a aceitar a aposta, e valores maiores, a rejeitar. Para tal

valor (que define a probabilidade de B), aceitar ou nao a aposta sao opcoes igualmente

atraentes.

Ao comparar as tabelas, vemos que as situacoes se a aposta e rejeitada ou se o seguro

e contratado sao identicas: um capital de C −m. Elas sao, respectivamente, tao atra-

entes quanto as situacoes se a aposta e aceita ou o risco se o seguro nao e contratado.

Consequentemente, o jogo e o risco de nao contratar o seguro sao igualmente atraentes.

A unica diferenca e que em um e o evento B quem determina o resultado, e no outro, e

o evento E.

Assim, a unica conclusao a qual podemos chegar e que E e B sao igualmente incertos,

e portanto sua probabilidade e a mesma para ambos, igual a b/100.

Resposta para as 10 questoes da primeira leva: F, T, T, T, F, T, F, F, F, T,

e da segunda leva: T, F, T, F, F, T, F, T, T, F.

Capıtulo 3

Leis da probabilidade

Vimos, no ultimo capıtulo, como descrever numericamente a incerteza que temos sobre

um evento, usando dois metodos: um padrao e uma regra de escore. Queremos agora

mostrar que os valores obtidos por estes metodos satisfazem certas regras.

Consideremos um evento E e sua probabilidade de E de acordo com sua informacao,

p(E).

Lei da convexidade 0 ≤ p(E) ≤ 1

Esta lei e imediata da construcao atraves de um padrao, ja que a proporcao de bolas na

urna e necessariamente um valor entre 0 e 1. No entanto, nao e tao obvia assim quando

usamos a construcao via regra de escore, e sua demonstracao expoe outro aspecto de

coerencia.

Mostraremos que e um absurdo escolher qualquer numero fora do intervalo [0,1]. Supo-

nha que, por exemplo, e selecionado p = 2. Se E for verdadeiro, a penalidade e (2− 1)2,

ou 100, e se for falso, o escore e 400. Quando p = 1, os respectivos escores sao 0 e

100. Em ambos os casos, o escore e reduzido, e portanto p = 1 e melhor que p = 2.

O mesmo argumento serve para qualquer valor de p maior do que 1, e, por simetria,

p = 0 e melhor do que qualquer valor menor. O mesmo nao ocorre para p entre 0 e 1,

onde mudar o valor de p, aumenta uma penalidade e diminui a outra. Portanto, so faz

sentido considerar 0 ≤ p ≤ 1.

Agora analisemos o princıpio anterior. Olhemos para a escolha de p como uma decisao.

Seja d2 a decisao de usar p = 2, e d1, a de usar p = 1. Entao o resultado de d2 quando

E for verdadeiro e pior que o de d1; o mesmo acontece quando E for falso; ou seja, d2 e

pior que d1 independentemente de E, e portanto d2 e pior que d1 quando E e incerto.

22 Leis da probabilidade

Isto e chamado o princıpio da coisa certa (the sure-thing principle): se d2 e pior que d1

quando E for verdadeiro e quando E for falso, entao e pior quando E e incerto.

Este e o segundo exemplo de coerencia entre tres julgamentos com respeito a d2 e d1:

um quando E e verdadeiro, um quando e falso, e um quando e incerto.

Lei da adicao Consideremos dois eventos, E1 e E2, exclusivos, e o evento que ocorre

se e somente se pelo menos um dos dois ocorrer, E1 ∪ E2.

Suponha que voce atribuiu as probabilidades p(E1 | H) e p(E2 | H), a partir da mesma

informacao. A lei da adicao diz que, neste caso,

p(E1 ∪ E2 | H) = p(E1 | H) + p(E2 | H) .

Assim, no exemplo da viagem entre Vina del Mar e Mendoza, seja E1 o evento de passar

pela fronteira (o caminho esta aberto) e nao ter acidente de carro, e E2 o evento de passar

pela fronteira (o caminho esta aberto) e ter um acidente de carro, para os quais voce

atribui probabilidades p(E1 | H) = 3/4 e p(E2 | H) = 1/20, com a mesma informacao.

Como ambos eventos sao exclusivos, entao para E1 ∪ E2, o evento de que o caminho

esteja aberto, voce deveria atribuir probabilidade 3/4 + 1/20 = 4/5.

Faca a prova desta lei, usando a construcao com o padrao, considerando uma urna com

N bolinhas, das quais b1 sao pretas, representando a probabilidade de E1, e b2 sao azuis,

por exemplo, representando a probabilidade de E2.

Um caso especial e quando E2 e a negacao de E1 = E. Como eles sao exclusivos e sua

uniao e certa de ocorrer, temos p(E) + p(EC) = 1.

A lei da adicao se aplica tambem a qualquer numero, n, de eventos exclusivos:

p(E1 ∪ E2 ∪ · · · ∪ En) = p(E1) + · · ·+ p(En) .

Uma consequencia imediata disto e que na lista de eventos incertos, exclusivos e exaus-

tivos, considerada no Capıtulo 1, θ1, . . . , θn, suas probabilidades devem somar 1.

Isto poderia nao ocorrer em uma primeira tentativa de atribuicao de probabilidade, de

modo que esta lei nos da outro exemplo de coerencia. Por exemplo, suponha que voce

esta analisando como voce poderia morrer (para decidir a cobertura de um seguro, por

exemplo); denotemos por θ1 ataque cardıaco, θ2 cancer, θ3 violencia, θ4 qualquer outra

causa nao violenta. Como estes eventos sao todos desagradaveis para voce, e possıvel

que suas probabilidades somem menos que 1; se assim for, a coerencia requer que alguma

delas seja mudada.

23

A prova desta lei usando a construcao por regra de escore passa novamente pelo princıpio

da coisa certa. Provaremos o caso especial de E e sua negacao EC .

Suponha que voce atribuiu o valor x a E, e y a EC . Entao seu escore total se E for

comprovado como verdadeiro sera a soma (x−1)2 +y2. Por outro lado, se E resultar ser

falso, seu escore total sera x2 + (y − 1)2. Se x e y nao somarem 1, considere a diferenca

1− (x+ y) e a metade deste valor, t, somando-o a x e a y, obtendo x+ t e y + t (cuja

soma agora e 1). Com estes novos valores, se E for verdadeiro, seu escore passa a ser

(x+ t− 1)2 + (y + t)2, que e menor que o anterior:

(x− 1)2 + y2 −((x+ t− 1)2 + (y + t)2

)= −2t(x+ y − 1 + t) = 2t2 > 0 .

O mesmo ocorre se E resultar ser falso. Assim, pelo princıpio da coisa certa, x+ y deve

ser igual a 1, que e a opcao com menor escore.

Lei do produto Considere dois eventos incertos E1 e E2, e o evento E1 ∩ E2 que

ocorre se e somente se ambos ocorrerem. Observe que se E1 e E2 forem exclusivos,

entao E1 ∩ E2 e impossıvel.

Se E1 e E2 nao forem exclusivos, entao nos poderıamos ser informados sobre sua

ocorrencia em ordem, digamos, primeiro sobre E1 e depois sobre E2.

Por exemplo, o comerciante poderia achar que suas vendas dependem de se o governo

facilita as condicoes sobre emprestimos ou nao. Denotemos por E1 o evento incerto

de que o governo facilita o emprestimo. Seja E2 o evento de que o comerciante vende

menos que quatro itens (que nao e exclusivo com E1). Pode acontecer que o governo

facilite o emprestimo e que o comerciante receba esta informacao. Ele entao ja nao esta

interessado em p(E2), mas sim em p(E2 | E1).

A lei do produto estabelece que

p(E1 ∩ E2) = p(E1) p(E2 | E1) .

Com o uso desta lei, vejamos como podemos atribuir a probabilidade ao evento da

estrada estar aberta e nao ter acidente de carro, no exemplo da viagem pela cordilheira.

Denotemos por E1 o evento de que a estrada esta aberta, e por E2, o evento de nao

ter um acidente de carro. Suponha que atribuımos p(E1) = 4/5, e que apos alguma

reflexao, atribuımos p(EC2 | E1) = 1/16 a probabilidade de ter algum tipo de acidente

de carro, se passarmos pela estrada aberta. Assim,

p(E1 ∩ E2) =4

5×(

1− 1

16

)=

3

4.


Exercıcio 6. Prove a lei do produto usando a construcao com a urna.

Exercıcio 7. Prove a lei do produto usando a construcao com regra de escore. Dica:

atribua valores x, y, z quaisquer aos tres eventos, e construa modificacoes neles que

minimizem o escore total para qualquer caso de verdade de E1 e E2.

Esta lei pode ser generalizada para n eventos, lembrando que o sımbolo · | E indica

informacao sobre a ocorrencia do evento E.

3.1 Coerencia

As leis de convexidade, da adicao e do produto sao leis basicas de probabilidade. Ne-

nhuma delas pode ser deduzida das outras duas, mas com as tres conseguimos provar

qualquer outro resultado em probabilidade. Em nossa construcao de probabilidade elas

sao provadas a partir dos conceitos simples com os quais fazemos nossa atribuicao, a

diferenca da construcao de Kolomogorov, onde elas sao consideradas como axiomas.

O ponto central disto e que, qualquer que seja a forma em que atribuımos probabilidade,

ela nao e arbitraria; ela deve satisfazer estas tres leis. Elas garantem que diversas

afirmacoes sobre incerteza sejam coerentes.

Em particular, quando encaramos o problema de atribuir probabilidades a diversos

eventos, nao e necessario atribuir probabilidade a todos eles, pois algumas podem ser

derivadas de outras, atraves destas leis: elas fazem parte deste aparelho para medir

incerteza.

Os demais resultados que veremos podem ser derivados destas leis basicas.

3.2 Extensao da conversa

Consideremos dois eventos E1 e E2 exclusivos e exaustivos, e A um evento qualquer;

entao

p(A) = p(A | E1)p(E1) + p(A | E2)p(E2) .

Este resultado pode ser estendido para qualquer numero de eventos E1, . . . En. Observe

que p(A) sera um valor entre p(A | E1) e p(A | E2).

Este resultado e util quando temos informacao parcial sobre a probabilidade de A em

termos de E1, . . . , En. Se, para um problema especıfico, voce achar que p(A) e mais

Extensao da conversa 25

simples de ser atribuıda diretamente, mesmo assim, a regra anterior deve ser satisfeita

quaisquer sejam os eventos exclusivos e exaustivos E1, . . . , En.

Vejamos o exemplo do comerciante a luz deste resultado. Sua decisao dependia da

quantidade de itens vendidos ate a compra seguinte: θ1, . . . , θm, que formam um conjunto

de eventos exclusivos e exaustivos. Suponha que ele quer saber se ele sera capaz de

cobrir seu saldo negativo no banco: denotemos por A este evento. Claramente, se

ele vender uma grande quantidade de itens, a chance de que A ocorra e grande, caso

contrario, a chance e pequena. Consequentemente, ele pode ser mais capaz de descrever

a probabilidade p(A | θj), para cada valor de j, do que p(A) diretamente.

O problema dos tres prisioneiros Este conhecido problema permite discutir a

nocao de coerencia em probabilidade.

Alan, Bernardo e Carlos estao na cadeia, impossibilitados de se comunicar entre si,

ou com quem quer que seja, exceto com o carcereiro. Alan sabe que dois deles serao

executados e o outro sera deixado livre, e depois de pensar no assunto, ele conclui que

nao ha nenhum motivo para acreditar que um deles tenha maior probabilidade que os

outros de ser deixado livre. Denotando por A o evento de que Alan e deixado livre, e

analogamente, para B e C, este raciocınio significa que p(A) = p(B) = p(C) = 1/3, na

opiniao de Alan.

Alan entao diz ao carcereiro: “Como um dos dois, Bernardo ou Carlos, com certeza sera

executado, voce nao estara me dando imformacao nenhuma sobre minhas chances de ficar

livre se voce me disser o nome de um deles, Bernardo ou Carlos, que sera executado.”

Aceitando este argumento, o carcereiro (honesto) diz “Bernardo sera executado”.

Entao Alan fica contente porque agora, ele ou Carlos serao deixados livres e, como antes,

ele nao tem razao para pensar que e mais provavel que seja Carlos, de modo que sua

chance agora e 1/2, nao 1/3, como antes.

Qual argumento esta correto, aquele que convenceu o carcereiro ou o que deixou Alan

contente?

Para analisar a situacao devemos comparar p(A) = 1/3 com p(A | b), onde b e a afirmacao

do carcereiro de que Bernardo sera executado. Pelo primeiro argumento, p(A | b) = 1/3

e b nao tem efeito nenhum; pelo segundo, p(A | b) = 1/2.

Sabemos que o carcereiro e honesto, ou seja, p(b | B) = 0 e p(b | C) = 1. O que nao e

claro e como devemos descrever p(b | A): se Alan fosse ser libertado, e portanto ambos

Bernardo e Carlos fossem ser executados, o carcereiro falaria da execucao de Bernardo


ou de Carlos? Denotemos esta probabilidade por p = p(b | A) e por x = p(A | b), a

quantidade de interesse.

Pela extensao da conversa,

p(b) = p(b | A)p(A) + p(b | B)p(B) + p(b | C)p(C) = p/3 + 0 + 1/3 = (1 + p)/3 .

Pela regra do produto

p(A ∩ b) = p(A | b)p(b) = x(1 + p)/3 ,

assim como

p(A ∩ b) = p(b | A)p(A) = p/3 .

Portanto, x = p/(1 + p).

Na conversa com o carcereiro, Alan arguiu que x = 1/3. Pela igualdade acima, isto

implicaria que p = p(b | A) = 1/2: se Alan fosse ser libertado, o carcereiro poderia dizer

igualmente Bernardo ou Carlos.

No entanto, ao ficar contente, Alan estava tomando x = 1/2, o que implica que p = p(b |A) = 1: ou seja, nas mesmas circunstancias acima, o carcereiro sempre diria Bernardo.

Assim, ambas atribuicoes, 1/3 e 1/2, sao coerentes, mas a primeira implica uma escolha

meio a meio do carcereiro para informar sobre os dois homens que serao executados,

enquanto que a segunda implica que, na opiniao de Alan, o carcereiro indicara Bernardo.

A essencia do problema, e a razao de sua ambiguidade, e a falha para estabelecer o que

o carcereiro dira se Alan for ser liberado. Se Alan se sente aliviado com a informacao do

carcereiro, entao esta reacao e razoavel e coerente se ele perceber que esta julgando que

o carcereiro dira Bernardo nesta circunstancia. Isto sera coerente, mas possivelmente

nao e o que a maioria de nos sentiria: a maioria optaria por p = 1/2 e consequentemente

x = 1/3, de modo que a informacao do carcereiro e, na verdade, irrelevante.

Observe como e possıvel atribuir probabilidades aparentemente razoaveis, p(A) = 1/3 e

p(A | b) = 1/2, mas entao, usando as regras de coerencia, calcular outra probabilidade,

p(b | A) = 1, que nao parece razoavel.

Para manter a coerencia, e necessario uma revisao nas atribuicoes originais, para fazer

com que todas as probabilidades estejam de acordo com nossa opiniao. As probabilidades

nao devem ser julgadas isoladamente, mas sim comparadas umas com as outras.

Regra de Bayes 27

3.3 Regra de Bayes

Sejam E e F dois eventos, com p(E) 6= 0; entao

p(F | E) = p(E | F )p(F )/p(E) .

A importancia deste resultado e que ele conecta duas probabilidades completamente

diferentes relacionadas aos mesmos dois eventos, p(E | F ) e p(F | E). No primeiro, F

faz parte da informacao e E e incerto, e no segundo os papeis sao trocados.

Ao ser usado em ciencia, F e alguma lei geral e E, um caso especial: assim, podemos

passar de uma afirmacao incerta sobre o caso especial p(E | F ) (que e frequentemente

facil) para uma sobre a lei geral p(F | E). Esta regra explica como podemos fazer

afirmacoes gerais com base em casos particulares.

Podemos reescrever a regra de Bayes, considerando tambem FC :

p(FC | E) = p(E | FC)p(FC)/p(E) e

e dividindo ambas igualdade para obter

p(F | E)

p(FC | E)=

p(E | F )

p(E | FC)

p(F )

p(FC).

A razao entre a probabilidade de um evento e seu complementar, nas mesmas cir-

cunstancias, e chamada razao de chances a favor do evento, e a denotaremos por r.

Assim, a igualdade anterior fica

r(F | E) =p(E | F )

p(E | FC)r(F ) .

Suponha qu F denota o evento incerto de que um acusado em um tribunal seja cul-

pado. A informacao inicial H (nao indicada na notacao) e toda a evidencia previa e o

conhecimento anterior do juri ou do juiz, que tem que se pronunciar sobre a culpa do

acusado.

A regra de Bayes permite obter a razao de chances a favor da culpa, em face de uma

nova informacao E, como o produto entre a razao original e o fator p(E | F )/p(E | FC).

Observer como as duas razoes se referem ao evento incerto da culpa, mas o fator se

refere ao evento incerto da evidencia: a probabilidade da evidencia se ele fosse culpado

pela mesma probabilidade se ele fosse inocente. Geralmente, para entender o signifi-

cado de qualquer evidencia, e preciso considerar quao provavel ela e sob uma suposicao

comparado com a outra. Ambas sao necessarias para uma avaliacao coerente.


3.4 Paradoxo de Simpson

Consideremos um ensaio clınico em que 40 pacientes sao alocados no tratamento T e

40, no grupo de controle (placebo, por exemplo) TC . Para cada paciente, foi registrado

posteriormente se ficou recuperado R, ou nao, RC . Suponha que os dados obtidos

sao os da Tabela 3.1, onde vemos evidencia de que o tratamento melhora a taxa de

recuperacao, passando de 40% para 50%, ou em termos de probabilidade, p(R | T ) = 0.5

e p(R | TC) = 0.4.

R RC total taxa de recuperacao

T 20 20 40 50%

TC 16 24 40 40%

Tabela 3.1: Resultado do ensaio clınico para todos os pacientes.

Suponha agora que os medicos tambem registraram o sexo dos pacientes do estudo, com

igual numero de homens e mulheres. Os resultados dos 40 homens estao na Tabela 3.2.


T 18 12 30 60%

TC 7 3 10 70%

Tabela 3.2: Resultado do ensaio clınico para os pacientes homens.

Veja que o tratamento foi prejudicial para os homens, reduzindo, no lugar de aumentar,

a taxa de recuperacao em 10%. Como o tratamento foi bom para o grupo, e ruim para

os homens, entao deve ter sido benefico para as mulheres, cujos resultados podem ser

obtidos subtraindo os resultados da Tabela 3.2 daqueles da Tabela 3.1, e aparecem na

Tabela 3.3.


T 2 8 10 20%

TC 9 21 30 30%

Tabela 3.3: Resultado do ensaio clınico para as pacientes mulheres.

No entanto, nao e isso o que acontece: para as mulheres, o tratamento tambem reduziu

a taxa em 10%.

Ou seja, o tratamento foi ruim para cada grupo, homens e mulheres, mas foi benefico

para todos juntos. Este e o paradoxo.

Veja que, se o estudo nao considerasse a informacao sobre o sexo, o tratamento seria

Independencia 29

veiculado como benefico; caso contrario, nao. A decisao, portanto, e afetada pelas

indicacoes contrarias do paradoxo.

Colocado de outra forma: se voce tivesse a disposicao apenas os dados totais, como voce

poderia saber que nao existe outro fator que reverte os resultados, transformando um

ganho de 10% em uma perda de 10%? Em nosso exemplo, foi sexo, mas poderia ter

sido tipo sanguıneo, modo de vida urbano ou rural, ou qualquer outra possibilidade que

pode nao ter sido considerada no estudo.

No exemplo, o paradoxo aparece pela seguinte razao: observe que o tratamento e muito

mais eficaz em homens do que em mulheres, e que ele foi predominantemente usado

com homens, enquanto que o placebo foi usado majoritariamente com mulheres (com

baixa taxa de recuperacao). Como resultado, o tratamento parecia ser melhor no grupo

completo. Dizemos que a variavel sexo e um fator de confusao para o tratamento.

Estas consideracoes mostram como o paradoxo pode ser evitado: qualquer tratamento

deve ser alocado aos pacientes de modo que nao haja confusao com qualquer outro fator.

Por exemplo, se tivessem sido alocados 20 homens e 20 mulheres ao tratamento, usando

as taxas das Tabelas 3.2 e 3.3, terıamos uma queda de 10% na taxa de recuperacao, e o

paradoxo nao apareceria.

Em termos de probabilidade, a Tabela 3.1 diz que p(R | T ) = 0.5 e p(R | TC) = 0.4; ja

as Tabelas 3.2 e 3.3 dizem que

p(R | T,H) = 0.6 , p(R | TC , H) = 0.7 , p(R | T,M) = 0.2 , p(R | TC ,M) = 0.3 .

Estendendo a conversa do tratamento e recuperacao para incluir o sexo,

p(R | T ) = p(R | T,H)p(H | T ) + p(R | T,M)p(M | T ) ,

e substituindo os valores conhecidos, obtemos

0.5 = 0.6p(H | T ) + 0.2(1− p(H | T ))

e

0.4 = 0.7p(H | TC) + 0.3(1− p(H | TC)) .

No exemplo, p(H | T ) = 0.75 e p(H | TC) = 0.25, valores muito diferentes entre si.

3.5 Independencia

Um evento E e independente de outros eventos se a probabilidade de E, p(E | H), fica

inalterada com qualquer informacao relativa a esses outros eventos. Um conjunto de

eventos e independente se isto for verdadeiro para cada evento no conjunto.


Em vista da natureza subjetiva de probabilidade, este e um julgamento da pessoa ou do

agente decisor, e o que pode ser independente para uma pessoa pode nao ser para outra.

Para dois eventos E1 e E2, a independencia significa

p(E1 | E2) = p(E1 | EC2 ) = p(E1) ,

e o correspondente resultado se trocarmos E1 com E2. Ou, em termos da lei do produto,

p(E1 ∩ E2) = p(E1)p(E2) ,

o que permite uma generalizacao imediata.

Exercıcio 8. Considere um dado balanceado com 4 faces (triangulares) com faces 110,

101, 011, 000. Seja Ei o evento de obter 1 na posicao i da face para baixo em um

lancamento do dado. Verifique a independencia entre os eventos dois a dois, e dos tres

juntos.

3.6 Dutch book

Retomando a lei da soma, suponha que voce seja incoerente e atribui p(E) = 0.2 e

p(EC) = 0.7, para um dado evento E.

De acordo com a primeira afirmacao (p(E) = 0.2), voce consideraria justo fazer a aposta:

receber um valor a para pagar 4a se E ocorrer. Similarmente, para p(EC) = 0.7, voce

receberia um valor b para pagar 3b/7 se EC ocorrer.

Suponha que ambas as apostas sao feitas por voce, com a = 2 e b = 7. Entao, se E

ocorrer, voce perde 8 do primeiro e ganha 7 do segundo, perdendo 1. Se E nao ocorrer,

voce ganha 2 do primeiro, e perde 3 do segundo, novamente perdendo 1.

Esta situacao incoerente, de combinar apostas que levam a perder dinheiro com certeza,

e chamada dutch book. Ela somente pode ser evitada estabelecendo probabilidades

coerentes.

Capıtulo 4

Medida numerica para

consequencias

4.1 As consequencias de uma decisao

Comecemos novamente com a lista d1, . . . , dm de possiveis decisoes, θ1, . . . , θn de eventos

incertos, e suas probabilidades p(θj).

Suponha que uma determinada decisao di e tomada e que o evento incerto θj ocorre.

Com esta combinacao, temos uma consequencia previsıvel, Cij .

Por exemplo, suponha que o gerente de uma fabrica de tecidos, que acabou de fabricar

um rolo de cortina e esta a ponto de vende-lo, deve decidir entre d1 inspecionar o item

a procura de defeitos ou d2 nao inspecionar. Supondo que ha dois eventos incertos, θ1

que o rolo nao tem defeitos, θ2 que ele tem pelo menos um defeito, podemos representar

as consequencias em uma tabela.

θ1: material bom θ2: material com defeito

d1: fazer a inspecao C11: cliente satisfeito C12: procurar um novo rolo bom

custo da inspecao custo da inspecao

cliente satisfeito

d2: nao fazer a inspecao C21: cliente satisfeito C22: reclamacao do cliente

substituicao por um rolo novo

Tabela 4.1: Tabela de decisao para o problema da inspecao.

Neste exemplo, uma possıvel ordem das consequencias, com a melhor primeiro, e:

C21, C11, C12, C22. Mas, por exemplo, se o custo da inspecao for muito alto, mas re-

solver o problema, se ele aparecer, for facil, entao C22 pode nao ser a pior consequencia.

32 Medida numerica para consequencias

Um fabricante de celulares pode tomar decisoes diferentes em termos da qualidade da

inspecao dependendo do cliente alvo para cada um de seus produtos: produtos mais

exclusivos podem ter uma inspecao mais apurada.

Novamente, ha espaco para incluir as preferencias pessoais entre as consequencias.

Mesmo assim, nao e imediatamente claro qual decisao deve ser tomada. Se θ1 for

verdadeiro, entao d2 e a melhor decisao; por outro lado, se θ2 for verdadeiro, entao d1 e

preferıvel.

Se o gerente atribuir probabilidades para estes dois eventos, o quadro pode ficar mais

claro. Por exemplo, se p(θ1) for quase 1, entao ele poderia escolher d1, e inversamente,

se p(θ1) for quase 0, entao ele poderia razoavelmente escolher d2. Ou seja, em algum

ponto a medida que p(θ1) decresce de 1 ate 0, o gerente possivelmente mudara de d1

para d2. Onde?

Do mesmo modo que foi feito para mensurar incerteza, nosso objetivo agora e usar um

padrao para atribuir valores que permitam comparar consequencias coerentemente.

Para isso usaremos duas consequencias de referencia: uma delas e melhor (ou nao pior)

que qualquer uma das consequencias da tabela relevante; e a outra e pior (ou nao melhor)

que todas as Cij .

Suporemos tambem que quaisquer duas consequencias podem sempre ser comparadas

no sentido de uma ser preferıvel que a outra, ou de elas serem igualmente desejaveis.

Esta comparacao deve ser coerente: se C1 for preferıvel a C2 e C2 preferıvel a C3, entao

C1 e preferıvel a C3.

Denotemos por C qualquer consequencia tal que nenhuma consequencia na tabela e pre-

ferıvel a ela. Similarmente, seja c qualquer consequencia tal que nenhuma consequencia

na tabela e pior que ela. Aqui, C e c poderiam ser consequencias da tabela (a melhor e

a pior), ou de fora da tabela.

Tomemos uma consequencia Cij , e consideremos o padrao de bolas em uma urna, com

U bolas brancas em um total de N . Selecione uma bola da urna: se for branca, suponha

que ocorre C, se for preta, ocorre c.

Em outras palavras, voce recebera C com probabilidade u = U/N , e c com probabilidade

complementar 1− u.

Daqui, se u = 1, este experimento e melhor que Cij , se u = 0, e pior. Portanto, deve

existir um valor de u para o qual voce e indiferente entre “C com probabilidade u” e Cij .

Este valor sera chamado a utilidade de Cij e denotado por u(Cij). Assim, os valores de

u refletem a relacao de ordem criada pelas preferencias.

As consequencias de uma decisao 33

Observe que esta utilidade e uma probabilidade (a probabilidade de obter a consequencia

mais desejada) e, portanto, obedece as regras de probabilidade vistas no capıtulo ante-

rior.

Podemos representar estes valores na mesma tabela anterior.

θ1: material bom θ2: material com defeito

d1: fazer a inspecao 0.9 0.5

d2: nao fazer a inspecao 1.0 0.0

probabilidades 0.8 0.2

Tabela 4.2: Tabela de decisao para o problema da inspecao, com as utilidades e proba-

bilidades.

Nesta tabela, consideramos C = C21 e c = C22, com utilidades respectivas 1.0 e 0.0.

Como C11 difere de C apenas pelo custo da inspecao, teve uma utilidade atribuıda igual

a 0.9: a inspecao resulta em uma perda de utilidade de 0.1. O mesmo raciocınio segue

a atribuicao da utilidade de C12.

Vejamos agora como combinar estes valores para determinar a melhor decisao. Para isso

pensaremos no resultado como sendo C ou c.

Suponha que tomamos a decisao di e que o evento incerto θj ocorre: a probabilidade de

obter C e

p(C | di, θj) = u(Cij) .

Entao, pela extensao da conversa,

p(C | di) = p(C | di, θ1)p(θ1) + · · ·+ p(C | di, θn)p(θn). =n∑

j=1

u(Cij)p(θj) .

Lembrando que se C nao ocorrer, o que vai ocorrer e c, podemos ver p(C | di) como

uma medida do merito de di.

Consequentemente, a melhor decisao e aquela com maior valor para esta probabili-

dade. Observe que esta conclusao e inevitavel se nos basearmos apenas na condicao de

coerencia para eventos e consequencias.

O valor p(C | di) e chamado utilidade esperada da decisao di, e sera denotado por u(di).

O procedimento anterior indica escolher a decisao com maior utilidade esperada.

No exemplo anterior, com os valores da Tabela 4.2, obtemos

u(d1) = 0.9× 0.8 + 0.5× 0.2 = 0.82 e

u(d2) = 1.0× 0.8 + 0.0× 0.2 = 0.80 .


Portanto, d1 e a melhor decisao (mas nao extraordinariamente melhor).

Em resumo, seguindo as leis basicas de coerencia, o procedimento recomendado ao tomar

uma decisao segue os passos:

1. listar as possıveis decisoes, d1, . . . , dm;

2. listar os eventos incertos, θ1, . . . , θn;

3. atribuir probabilidades a estes eventos, p(θ1), . . . , p(θn);

4. atribuir utilidades u(di, θj) as consequencias;

5. escolher a decisao com maior utilidade esperada, u(di).

4.2 Um exemplo de incoerencia

Lembrando do ditado: “mais vale um passaro na mao que dois voando”, consideremos

a consequencia Cij de receber 100 reais, e seja C um pouco maior, digamos 101 reais.

O que voce prefere: receber 100 reais com certeza ou receber 101 reais com probabilidade

p, para p < 1?

Algumas pessoas prefeririam receber 100 reais, mesmo que p seja grande (< 1), usando

o argumento de que preferem a certeza de receber 100 reais do que qualquer coisa

envolvendo o risco (mesmo pequeno) de nao ganhar nada, ja que o aumento no premio

de 100 para 101 e muito pequeno. Ou seja, estas pessoas preferem

(1) uma certeza de 100 reais, a

(2) uma chance p de 101 reais, contra 1 − p de nao ganhar nada, por maior que p seja

(menor que 1).

Portanto, elas deveriam preferir

(3) uma certeza de 101 reais, a

(4) uma chance p de 102 reais, contra 1− p de nao ganhar nada, para o mesmo valor de

p.

Suponha que modificamos (2) de modo que se o evento de chance p ocorrer, entao os

101 reais sao substituıdos por uma chance em 102 reais (alternativa (4)). Isto deixa

(2) ainda pior, porque os 102 reais somente serao ganhos se o evento ocorrer duas

vezes independentemente, o que ocorre com probabilidade p2. Consequentemente, (1) e

preferıvel a

(5) uma chance de p2 de 102 reais, contra 1− p2 de nao ganhar nada.

O mesmo argumento pode ser usado repetidas vezes para mostrar que (1) e preferıvel

(6) uma chance de p100 de 200 reais, contra 1− p100 de nao ganhar nada.

Um exemplo de incoerencia 35

Como p e arbitrario, podemos ter p100 tao proximo de 1 quanto quisermos. Por exemplo,

se a razao de chances em (2) fossem um milhao a 1, em (6) seriam 10 mil a 1. Ou seja,

por um pequeno risco, o valor recebido poderia ser dobrado.

Se a diferenca de 100 para 200 nao for suficiente, o argumento vale para 1000 reais com

probabilidade p900 (aproximadamente de mil para 1).

E neste ponto, poderıamos ter que (6) e preferıvel a (1), mostrando que o argumento

original e incoerente.

A forma de eliminar o problema e admitir que (2) e preferıvel a (1) para p suficientemente

proximo de 1.

Exercıcio 9. Em cada uma das seguintes situacoes, temos um jogo com varios premios

possıveis com suas probabilidades. Quanto voce esperaria ganhar em uma unica jogada

de cada jogo?

(i) premios: -1, 0, 1

probabilidades: 0.2, 0.5, 0.3

(ii) premios: 1, 2, 4, 8, 16, 32, 64

probab: 1/2, 1/4, 1/8, 1/16, 1/32, 1/64, 1/64

(iii) premios: -100, 5

probab: 0.01, 0.99

Exercıcio 10. Um agente decisor determinou suas utilidades e quer determinar a pro-

babilidade relevante p. Determine o valor de p para o qual as utilidades esperadas de d1

θ1 θ2

d1 0.6 0.8

d2 1.0 0.0

probabilidades p 1− p

e d2 sao iguais. Mostre entao que se alguem o convence de que p e menor que 1/2, ele

nao precisa mais considerar p e chega a uma decisao. Qual decisao?

Exercıcio 11. Um baralho de 9 cartas contem 2 ases, 3 reis e 4 valetes. Uma carta e

escolhida ao acaso, o jogador olha e pode ou (d1) pedir uma segunda carta do baralho

agora com 8 cartas, ou (d2) desistir de jogar. Se ele escolher d2, ele nao recebe nada.

Se ele escolher d1, entao os premios sao os seguintes: 2 ases ou 2 reis obtem 2 dolares,

2 valetes ou um as e um rei obtem 1 dolar, e qualquer outra combinacao perde 1 dolar.

Para cada possıvel primeira carta, encontre a escolha otima entre d1 e d2, e o valor

esperado do jogo. Se participar do jogo exige o pagamento de uma taxa de admissao,

qual taxa faria deste um jogo honesto?


Exercıcio 12. Considere o Exercıcio 4. Suponha que os tratamentos t1, t2, t3 custem

3, 2, 1, respectivamente, e que p(θ1) = 0.2, p(θ2) = 0.5, p(θ3) = 0.2, p(θ4) = 0.1. Com

base apenas nos custos, qual e a melhor decisao para o medico?

Capıtulo 5

A utilidade do dinheiro

Analisaremos neste capıtulo consequencias representadas em termos de ganhos ou perdas

em dinheiro: investimentos no mercado de acoes, seguro contra perda de bens materiais

etc.

Considere alguem que esta pensando em investir 500 dolares em uma pasta de acoes

por um perıodo de 3 meses. Ao fim desse perıodo, as acoes podem valer mais ou menos

do que o valor original gasto em sua compra. Suponha, por simplicidade, que ao fim

dos tres meses, as acoes podem ou ter subido para 600 dolares ou ter caıdo para 400.

Assim, temos dois eventos incertos: θ1, subir para 600; θ2, cair para 400. Com duas

possıveis decisoes: d1 investir ou d2 deixar os 500 dolares no banco, estamos na situacao

do capıtulo anterior, que pode ser representada pela Tabela 5.1, onde Crepresenta o

capital no instante da compra.

θ1: as acoes sobem θ2: as acoes caem

d1: investir C + 100 C − 100

d2: deixar no banco C C

Tabela 5.1: Resultados monetarios para o exemplo do investimento.

Analisemos, por exemplo, a consequencia de (d1, θ2), investimento seguido de uma queda.

A questao importante aqui e a comparacao entre perder 100 dolares e o resultado de

nao investir.

Para qualquer quantidade de capital x, denotemos por u(x) sua utilidade. No exemplo,

queremos c(C − 100), u(C), u(C + 100).

Daqui, observamos que a decisao de investir ou nao pode depender de C, o capital no

momento da decisao, o que e uma conclusao realista. Os montantes de capital serao

supostos sempre nao-negativos.

38 A utilidade do dinheiro

Nosso problema, entao, e definir a relacao entre um bem monetario, x, e sua utilidade.

No proximo exemplo, veremos porque precisamos desta funcao e de que forma podemos

por em pratica os princıpios de coerencia anteriores.

5.1 Incoerencia

Consideremos as seguintes quatro apostas:

I: perde 10, ganha 10

II: perde 10, ganha 20

III: perde 20, ganha 10

IV: perde 20, ganha 20,

onde os valores representam dolares. Dependendo de sua interpretacao de dolar, voce

pode reescalar este valores para cima ou para baixo.

Nao mencionamos nenhuma probabilidade nessas apostas. Antes de continuar, atribua

para cada aposta, o menor valor de p, a probabilidade de ganhar, que levaria voce a

aceitar a aposta. Ou seja, a aposta com este valor de p deve ser tao atraente quanto

rejeitar a aposta e preservar o seu estado atual; um valor menor, leva voce a rejeitar a

aposta, e um maior, o leva a acreditar que vale a pena.

Voce possivelmente escolheu o valor de pi para cada uma das apostas, separadamente.

Vejamos como esses valores coerem.

Suponha que voce atribuiu os valores: p1 = 0.6, p2 = 0.5, p3 = 0.8, p4 = 0.6, que sao

razoaveis, ja que II e a aposta mais favoravel e deveria ter o menor valor de p, III e a pior

e deveria ter o maior valor. No entanto, mostraremos que estes valores sao incoerentes.

Ao atribuir estes valores, voce considera que todos as apostas com estas probabilidades

sao igualmente preferıveis, ja que elas sao equivalente ao seu estado atual.

Consideremos agora uma mistura destas apostas, ou seja, selecionamos uma delas ao

acaso com probabilidades a1, a2, a3, a4.

Por exemplo, com a1 = a2 = 1/2 e a3 = a4 = 0, temos o equivalente a lancar uma moeda

para escolher entre I e II, ignorando III e IV. Como cada aposta, I e II, e equivalente ao

estado atual, entao a mistura tambem e.

Para o exemplo numerico, tomemos a mistura A: a1 = a3 = 0.3, a2 = 0.4, a4 = 0.

Com esta mistura, podemos ganhar 10 se forem escolhidos I ou II, ou ganhar 20 se for

escolhido III. Os possıveis valores de ganho e suas probabilidades aparecem na Tabela

5.2. A segunda linha e para a mistura B: a1 = 0.7, a2 = a4 = 0.15, a3 = 0.

A utilidade e crescente e limitada 39

mistura perde 20 perde 10 ganha 10 ganha 20

A 0.06 0.32 0.42 0.20

B 0.06 0.355 0.42 0.165

Tabela 5.2: Possıveis resultados das misturas A e B.

Como as duas misturas sao equivalentes ao estado atual, entao voce, se for coerente,

nao deveria ter preferencia entre elas. Isto claramente nao tem sentido, pois A e B tem

a mesma chance de perder 20 ou ganhar 10, mas A tem uma chance maior de ganhar

20, e menor de perder 10: A deveria ser preferıvel a B.

A forma de evitar esta incoerencia e atraves de uma funcao de utilidade.

5.2 A utilidade e crescente e limitada

As leis de probabilidade e a existencia de uma utilidade sao parte da abordagem norma-

tiva de teoria de decisao: elas sao um resultado necessario sob a hipotese de coerencia.

As propriedades que veremos de uma utilidade, por outro lado, sao meramente prescri-

tivas: elas sao razoaveis de um certo ponto de vista, mas voce nao e obrigado a seguir

a prescricao.

A primeira observacao obvia e que um aumento em x deveria causar um aumento na

utilidade: u(x) e crescente em x. Isto porque a maioria de nos prefere a maior entre

duas quantidades de dinheiro, e como a utilidade mede a desejabilidade do dinheiro,

a maior quantidade deve ter maior utilidade. Se isto nao fosse assim, deverıamos ver

pessoas literalmente jogando dinheiro fora (o que, em geral, nao acontece).

Uma segunda caracterıstica razoavel de u(x) pode ser obtida considerando valores muito

grandes de dinheiro: suponha que voce esta analisando uma consequencia que esta

associada a este valor, digamos, ganhar um milhao de dolares (ou, se isto nao for grande

suficiente, - se voce for uma grande empresa de tecnologia - uma quantidade realmente

grande). Entao voce encontrara muito difıcil diferenciar um valor x de um milhao e um

x de dois milhoes. E claro que o segundo e melhor, mas com o primeiro voce ja sera

capaz de fazer tudo o que voce tinha vontade de fazer e comprar tudo o que voce tinha

vontade de comprar, que um milhao a mais sera apenas um enfeite bonito em um objeto

ja muito atraente. Em outras palavras, chegara um ponto em que o capital extra deixara

de entusiasmar voce. E entao natural supor que a utilidade nao cresce ilimitadamente

com x, mas sim que tem um limitante superior, a medida que x cresce (limitante que

pode nunca ser alcancado).


Como u e crescente, entao u(0) e o limitante inferior de u. Assim, de acordo com o visto

anteriormente, podemos definir u(0) = 0 (utilidade da pior consequencia) e colocar

utilidade 1 como o limitante superior. A melhor consequencia, C, e o limitante superior

(ligeiramente superior a qualquer valor alcancavel de x), e para valores grandes de x,

u(x) e quase 1.

Da construcao de utilidade, podemos mostrar que nao afeta a tomada de decisao se a

utilidade for somada a uma constante, ou se ela for multiplicada por um fator constante.

Assim, os valores 0 e 1 sao escolhidos de modo a poder utilizar a construcao descrita:

substituir qualquer valor x por um jogo com alguma chance de obter uma utilidade 1 e

uma chance complementar de obter zero.

Voltemos ao investidor pensando em comprar acoes. Suponha que ele compra e que as

acoes sobem, de modo que seu capital passa de C para C + 100, e sua utilidade de u(C)

para u(C + 100), com ganho em utilidade u(C + 100) − u(C). Esta diferenca mede a

satisfacao dele com o adicional de 100 dolares, que, para a maioria de nos, depende do

capital inicial C. Se C = 100, terıamos terminado com o dobro, trazendo uma satisfacao

grande. Se C fosse um milhao, a satisfacao ja seria bem menor.

Assim, para um ganho fixo a > 0 em capital monetario, o crescimento na utilidade,

u(x+ a)− u(x) ,

e uma funcao decrescente do capital monetario inicial, x > 0. Isto e conhecido como o

princıpio da diminuicao da utilidade marginal do dinheiro. O termo “utilidade marginal”

se refere ao crescimento na utilidade devido a um crescimento no capital, a diferenca

da utilidade do capital. Se u for uma funcao duas vezes derivavel, esta condicao e

equivalente a dizer que a segunda derivada de u e negativa: u e uma funcao concava.

5.3 Exemplo

Voltemos ao exemplo das quatro apostas, e considere um investidor com um capital de

50 dolares. Ele pode perder ou ganhar 10 ou 20 dolares, e suponha que sua utilidade

para os valores de interesse sao:

dolares 30 40 50 60 70 100

utilidade u1 0.458 0.523 0.570 0.605 0.633 0.693

As probabilidades de ganhar que voce tinha que atribuir podem ser determinadas equa-

cionando as utilidades esperadas das apostas com a utilidade do estado atual, de 50

Consequencias 41

dolares. Assim, para a aposta I, temos

0.523(1− p1) + 0.605p1 = 0.570⇒ p1 = 0.57 .

Do mesmo modo, encontramos p2 = 0.43, p3 = 0.76, p4 = 0.64. Desta forma, todas as

apostas ou misturas delas tem mesma utilidade esperada, igual a 0.570, e a coerencia

fica garantida.

Exercıcio 13. Mostre que para os valores que voce atribuiu inicialmente, nao ha uma

funcao de utilidade que explique coerentemente estas escolhas.

5.4 Consequencias

Aversao ao risco

Um agente decisor com funcao concava e dito averso a correr riscos: nao gosta de algumas

apostas aparentemente favoraveis.

Figura 5.1: Explicacao geometrica para aversao ao risco.

Para ver isto, considere um decisor com risco como na Figura 5.1, com capital igual a

A, e utilidade u(A) = P . Suponha que ele esta analisando se entra em um jogo no qual

ele pode ganhar ou perder uma certa soma, C −A = A−B, com mesma probabilidade,

p = 1/2.

Em termos monetarios, o jogo e honesto, ja que o ganho esperado em dolares e zero. A

situacao muda se o jogo for julgado em termos de utilidade. No grafico, S representa a

utilidade esperada do jogo, que, pela condicao de convexidade, e menor que a utilidade

da situacao atual, de recusar o jogo.


Daqui a denominacao “averso ao risco”: com uma utilidade concava o decisor rejeita

um jogo monetariamente honesto (o que nao significa que ele va rejeitar um jogo com

uma ganho monetario esperado suficientemente grande).

Premio de probabilidade

Consideremos novamente o investimento em que podemos ganhar ou perder 100 dolares,

e denotemos por p a probabilidade que faz o jogo monetariamente honesto e por P , a

probabilidade que faz o jogo honesto em utilidade.

Como acabamos de ver, para uma utilidade concava, P > p. A diferenca P−p e chamada

o premio de probabilidade do jogo. Ele descreve o aumento na probabilidade necessario

para transformar um jogo honesto (do ponto de vista monetario) em um jogo aceitavel

(a partir de consideracoes sobre a utilidade).

O efeito de aversao ao risco fica mais claro para somas grandes. Por exemplo, suponha

que um decisor tem um capital de 500 dolares e esta analisando uma aposta na qual ele

perde tudo ou dobra seu capital. Este jogo e monetariamente honesto se a chance de

ganhar for 1/2. Suponha que suas utilidades para 500 e 1000 dolares sejam, respecti-

vamente, 0.570 e 0.693 (na tabela anterior, estamos modificando a escala do dinheiro,

multiplicando por 10, sem alterar a forma da utilidade), e que a de zero e zero. Entao a

utilidade esperada da aposta e 0.693/2 = 0.347, enquanto que a de nao apostar e 0.570.

Para que o jogo valesse a pena, a utilidade esperada deveria satisfazer 0.693×P = 0.570,

ou seja, P = 0.82, com um premio de probabilidade igual a P − p = 0.32 = 32%.

Se a curvatura do grafico da utilidade for convexa, entao o agente decisor aceita jogos

arriscados. A Figura 5.2 mostra um exemplo destes, com curvatura convexa para capital

abaixo de um certo valor. Dizemos, neste caso, que o agente decisor e propenso ao risco.

Figura 5.2: Curva de utilidade convexa para valores menores que B.

Consequencias 43

Aversao ao risco

Um tipo de aversao ao risco, conhecido como aversao constante, reflete que o decisor tem

um premio de probabilidade constante para aceitar um jogo monetariamente honesto,

independentemente de seu capital. Em outras palavras, para um decisor com aversao

ao risco constante e aposta h > 0, a funcao de utilidade satisfaz

u(x+ h)P + u(x− h)(1− P ) = u(x) ,

qualquer que seja x ≥ h. Deste modo,

P =u(x)− u(x− h)

u(x+ h)− u(x− h)⇒ P − 1

2= −u(x+ h)− 2u(x) + u(x− h)

2[u(x+ h)− u(x− h)]

e constante. No limite, fazendo h tender a zero, isto implica que u′′(x)/u′(x) e constante.

A solucao desta equacao diferencial, com u(0) = 0 e limitante superior 1, e

u(x) = 1− e−cx ,

onde c > 0 representa apenas uma mudanca de escala em x.

No exemplo do investimento, suponha que o decisor tem funcao de utilidade com aversao

ao risco constante, de modo que

dolares 300 400 500 600 700 800 900 1000

utilidade u2 0.259 0.330 0.393 0.451 0.503 0.551 0.593 0.632

Entao, qualquer que seja seu capital C, para uma aposta de 100 dolares, por exemplo, a

probabilidade P deve ser de 52%, com premio de probabilidade de 2%. Por outro lado,

para a utilidade u1, este premio diminui de 11%, com C = 100, para 2%, com C = 1000.

Dizemos que o decisor 1 tem aversao ao risco decrescente. A utilidade u1 e dada pela

expressao

u1(x) = 1− e−x/200/2− e−x/20/2 .

Outras funcoes podem ser descritas, por exemplo, da forma geral

u(x) = 1− we−ax − (1− w)e−bx ,

com a > 0, b > 0, 0 < w < 1.

Exercıcio 14. Para cada um dos decisores, com utilidades u1 e u2, determine o premio

de probabilidade se o capital for 2000 dolares e uma aposta para ganhar ou perder 100.

Exercıcio 15. Um decisor com aversao ao risco decrescente tem um capital de 30

dolares, e um problema de decisao com a seguinte estrutura


θ1 θ2

d1 −10 +5

d2 +15 −5

p 0.3 0.7

De o seu conselho na escolha da melhor decisao. O seu conselho se mantem se o capital

for de 200 dolares?

Exercıcio 16. O mesmo decisor do exercıcio anterior tem um capital de 20 dolares

e considera um jogo no qual ele pode ganhar 20 ou perder 10 dolares. Em termos

monetarios, este jogo sera honesto se a probabilidade de ganhar for 1/3. Determine o

premio de probabilidade. Faca o mesmo para o decisor com aversao ao risco constante.

Encontre o premio de probabilidade para o primeiro se seu capital for 200 dolares.

Exercıcio 17. Um decisor tem a seguinte utilidade para o dinheiro

dinheiro 0 20 40 60 80 100 120 140

utilidade 0 .04 .13 .27 .50 .73 .87 .96

Considere um jogo em que ele pode ganhar ou perder 20 dolares, primeiro quando seu

capital for de 40 dolares, e depois quando for de 100. Em cada caso, calcule o premio

de probabilidade.

Exercıcio 18. O decisor 1 com aversao ao risco decrescente tem um capital de 50

dolares. Quanto ele deveria estar preparado para pagar por um bilhete que da uma

chance 1/2 a 1/2 de ganhar 20 dolares? Suponha que ele ja tem o bilhete: por quanto

ele deveria estar preparado para vende-lo? Repita a questao para o decisor com aversao

ao risco constante e mostre que, neste caso, o preco de compra e o de venda sao iguais.

Exercıcio 19. Um decisor tem a seguinte utilidade para o dinheiro

dinheiro 0 10 20 30 40

utilidade 0 .10 .17 .22 .26

Com um capital de 20 dolares, ele esta considerando um jogo no qual pode ganhar 10

dolares com probabilidade 0.58, ou perder 10 dolares, caso contrario. Mostre que o jogo

deve ser rejeitado. Ele entao considera um jogo que consiste em duas rodadas do jogo

anterior. Mostre que o novo jogo deve ser aceito.

Capıtulo 6

Teorema de Bayes

6.1 Informacao e teoria de decisao

Em um problema de decisao, temos a lista de decisoes d1, . . . , dm e a de eventos incertos

θ1, . . . , θn. Se soubermos que θk ocorrera, por exemplo, entao podemos tomar a decisao

di que maximiza u(Cik), sem necessidade de probabilidades e utilidades esperadas.

No entanto, essa informacao tipicamente nao esta disponıvel, por ser muito cara ou por

ser impossıvel de ser obtida. Assim, o que nos interessa e conhecer o efeito de uma nova

informacao, X, sobre as probabilidades p(θ1), . . . , p(θn). Como vimos, este efeito e dado

pela regra de Bayes,

p(θj | X) = p(X | θj)p(θj)/p(X) .

Lembremos que os eventos θ1, . . . , θn sao exclusivos e exaustivos, de modo que suas

probabilidades somam 1, seja sob a informacao original H, ou sob H e X. Desta forma,

o termo p(X) e apenas uma constante de normalizacao para que esta soma satisfaca a

condicao, e podemos considerar somente o produto

p(X | θj)p(θj) ,

cujos valores, variando em j, somam p(X). Escrevemos usualmente,

p(θj | X) ∝ p(X | θj)p(θj) ,

e denominamos p(θj) a probabilidade a priori de θj , e p(θj | X), a probabilidade a

posteriori ou posterior de θj . Ambas sao probabilidades em θj e satisfazem as regras

que ja vimos. O terceiro termo, p(X | θj), nao e uma probabilidade em θj , e e chamada

verossimilhanca de θj (para a informacao X).

46 Teorema de Bayes

Dadas duas possibilidades, θ1 e θ2, a razao p(X | θ1)/p(X | θ2) e chamada a razao de

verossimilhanca entre θ1 e θ2.

Como exemplo, suponha que voce tem uma urna com uma grande quantidade de bolas

identicas exceto pela cor, de modo que ou 1/3 ou 2/3 delas sao brancas e as restantes,

pretas. Suponha tambem que voce nao sabe qual dos dois valores e o verdadeiro e

que ambos sao igualmente provaveis, p(θ1) = p(θ2) = 1/2. Voce recebe a permissao

de extrair uma bola da urna e observar sua cor. Isto dara alguma informacao sobre a

composicao da urna. Se voce puder repetir este experimento varias vezes, qual e o efeito

do conhecimento adquirido (a respeito da cor das bolas extraıdas) sobre sua incerteza

de θ1 e θ2?

Em particular, se forem extraıdas 33 bolas, das quais 20 resultarem ser brancas, quais

sao suas chances a favor da segunda urna? Responda esta questao antes de fazer as

seguintes contas.

Suponha que ocorre o evento de que a primeira bola e branca. Entao a razao de chances

a favor da primeira urna e 1/2, e portanto a razao a favor da segunda urna e 2. Ou seja,

a extracao de uma bola branca, dobra as chances da segunda urna e reduz a metade,

as da primeira. O mesmo ocorre se extrairmos uma segunda bola branca (dado que a

quantidade de bolas da urna e muito grande, e praticamente indiferente se as extracoes

sao realizadas com ou sem reposicao). Assim, se de 33 extracoes, 20 forem brancas e 13

pretas, entao dobramos as chances 20 vezes e reduzimos a metade 13; ou seja, dobramos

7 vezes as chances da segunda urna, obtendo uma razao de chances de 128 para 1.

Assim, se sua incerteza inicial sobre a urna e sobre as bolas forem as estabelecidas no

exemplo, para manter a coerencia, voce deveria ter atribuıdo a uma razao de chances

de 128 para 1.

Tipicamente, neste exemplo, as pessoas tendem a subestimar a evidencia entregue pelo

resultado das extracoes (20 brancas em 33). O ponto e que ha discrepancias entre o

descrito e o prescrito pelas regras de coerencia que vimos. Este fato faz com que o

ponto de vista coerente se torne ainda mais importante porque usa-lo pode melhorar

nossos metodos (intuitivos) incoerentes e ineficientes. A regra de Bayes descreve como

deverıamos aprender: como nossas opinioes, expressas em termos de probabilidade a

priori, devem ser modificadas pela informacao descrita pela verossimilhanca para chegar

a novas opinioes expressas pela probabilidade a posteriori.

Observe, em particular, que se um determinado evento incerto tiver, em sua opiniao,

p(E) = 0 entao p(E | X) = 0, qualquer que seja a nova informacao X, o que nao e

aconselhavel. O mesmo acontece se atribuirmos p(E) = 1, porque nesse caso p(EC) = 0.

Informacao e teoria de decisao 47

Esta e conhecida como a lei de Cromwell: p(E | H) < 1 a menos que H implique

logicamente que E e verdadeiro. Similarmente, p(E | H) > 0 a menos que H implique

logicamente que E e falso.

Consideremos novamente o investidor com aversao ao risco decrescente, com um capital

de 1000 dolares (e um fator escala de 10 para sua utilidade), que esta considerando um

investimento de 500 dolares em acoes, no qual ele pode ganhar ou perder 100 dolares.

Suponha que ele acha que este investimento tem mesma chance para cada resultado;

entao, por causa de sua aversao ao risco, ele decide nao fazer o investimento.

Ele poderia achar que vale a pena ir atras de um perito no assunto, antes de tomar uma

decisao: afinal, ele so precisa que p(θ1) alcance 52% para que a compra seja atrante. Ele

pergunta ao seu consultor financeiro, que afirma que as acoes irao subir.

Ele deve aceitar este conselho ou nao?

Temos que p(θ1 | H) = 1/2, onde H e o conhecimento do investidor. Denotemos por S,

a opiniao do consultor de que as acoes subirao. Queremos p(θ1 | H,S). A informacao

de que precisamos e a verossimilhanca p(S | θ1, H), que reflete a probabilidade de que o

consultor acerte em detectar um investimento favoravel, e mede parte da confianca do

investidor em seu consultor.

Suponha, por exemplo, que ele respeita a opiniao ao ponto de atribuir chance 0.8 de que

o consultor esteja correto, entao

p(θ1 | H,S) ∝ 1/2× 0.8 = 0.4 .

Do mesmo modo, com a verossimilhanca de que o consultor esteja errado, temos

p(θ2 | H,S) ∝ p(S | θ2, H)/2 = 0.2/2 = 0.1 .

Como ambas probabilidades somam 1, entao, devemos ter

p(θ1 | H,S) = 0.8 e p(θ2 | H,S) = 0.2 .

Assim, sua utilidade esperada, em face a esta informacao, e 0.709× 0.8 + 0.676× 0.2 =

0.702 > 0.693, que e a utilidade de deixar o dinheiro no banco.

Isto continua ocorrendo mesmo se o consultor for um pouco melhor do que lancar uma

moeda: se p(S | θ1, H) = 0.52, entao o investimento ja comeca a valer a pena.

Aqui analisamos apenas como levar em conta uma nova informacao, mas nao o seu custo,

o que veremos no proximo capıtulo.

48 Teorema de Bayes

6.2 Erros dos dois tipos

No exemplo anterior, supusemos que p(S | θ1, H) = 1 − p(S | θ2, H), o que nao e

necessariamente verdadeiro: o consultor poderia ser melhor para prever altas na bolsa

do que quedas. Nesse caso, dirıamos que o consultor e viesado.

Por exemplo, no caso da viagem pela cordilheira, poderıamos querer obter informacao

da companhia de transito. Denotemos por θ1 o evento de que a estrada estara fechada,

por θ2, seu complementar, e por S a informacao de que ela estara fechada.

Queremos p(S | θ1, H) e p(S | θ2, H). Poderıamos atribruir, por exemplo, 0.8 para a

primeira, ja que eles poderiam tardar em receber notıcias sobre tempestades de neve.

E para a segunda, 0.2 (como no exemplo anterior) parece pouco razoavel, ja que a

companhia prefere ser cautelosa ao recomendar ao motorista que viaje ou nao; assim,

poderıamos atribuir 0.5, de modo que

p(θ1 | H,S) ∝ 1/2× 0.8 = 0.4 e p(θ2 | H,S) ∝ 1/2× 0.5 = 0.25 .

Assim, a probabilidade de que a estrada esteja fechada, apos a informacao S, e 0.4/0.65 =

0.62.

Observe que ambas, p(SC | θ1) e p(S | θ2), correspondem a maus conselhos, a erros.

Estes sao os erros dos dois tipos, e ambos precisam ser especificados na abordagem

coerente.

6.3 Amostragem de atributos

Suponha que temos uma grande colecao de objetos, alguns dos quais sao de um tipo,

por ter um certo atributo, e o restante de outro, por nao ter o atributo, e que queremos

conhecer a proporcao do primeiro tipo.

Para obter informacao, selecionamos alguns indivıduos desta colecao e registramos seu

tipo. Como e modificada a incerteza sobre a proporcao com esta evidencia?

No exemplo do gerente da fabrica de tecidos, suponha que ele recebe os rolos em lotes

de 1000, e que ele sabe que os rolos nao sao homogeneos: alguns vem quase sem defeitos

e outros, com muitos. Assim, ele costuma amostrar alguns rolos para decidir aceitar o

lote ou nao. Suponha que ele amostra n rolos e encontra r < n defeituosos. Se o lote

vem com 1000 rolos, denotemos por θj cada uma das proporcoes de defeituosos que o

lote poderia ter.

Amostragem de atributos 49

Pela regra de Bayes,

p(θj | r, n) ∝ p(r, n | θj)p(θj) .

Aqui a informacao X e o par (r, n). Como a amostra e pequena com relacao ao lote,

podemos supor que a verossimilhanca e

p(r, n | θj) = θrj (1− θj)n−r ,

e assim

p(θj | r, n) ∝ θrj (1− θj)n−rp(θj) .

Exercıcio 20. No exemplo, considere uma amostra de tamanho n = 10, com r = 1

defeituoso, e uma probabilidade a priori para apenas 5 valores: p(0) = 0.1, p(0.1) = 0.2,

p(0.2) = 0.4, p(0.3) = 0.2, p(0.4) = 0.1. Obtenha as probabilidades com a informacao

dada pela amostra. Repita o exercıcio, para n = 20 e r = 2.

Esta discussao se refere a proporcao de defeituosos, ou mais geralmente, a proporcao

de indivıduos com um certo atributo dentro de uma colecao. Esta nao e usualmente a

quantidade de interesse final.

O medico nao quer saber a proporcao de pacientes que respondem bem a um certo

tratamento: ele quer saber se o paciente que ele esta tratando vai responder bem (se

voce for o paciente, voce tambem quer esta informacao).

Acima, calculamos p(θj | r, n), agora queremos p(D | r, n), onde D e o evento de que

um certo rolo seja defeituoso (ou que o tratamento seja efetivo para um certo paciente).

Extendendo a conversa de D para incluir θj , temos

p(D) =n∑

j=1

p(D | θj)p(θj) =n∑

j=1

θjp(θj) . (6.1)

Esta igualdade estabelece uma coerencia entre p(D) e p(θj). Aplicando o mesmo resul-

tado para as probabilidades posteriores, temos

p(D | r, n) =n∑

j=1

p(D | θj , r, n)p(θj | r, n) =n∑

j=1

θjp(θj | r, n) .

Exercıcio 21. Obtenha p(D | r, n) para os dois casos do exercıcio anterior.

No exemplo dos rolos de tecido, a utilidade esperada da decisao d1, de inspecionar os

rolos, era de 0.82, e a de d2, era de 0.80. Assim, optou-se por d1.

No entanto, depois da amostra, com n = 10 e r = 1, estas utilidades esperadas ficam

0.83 e 0.82. E depois da amostra, com n = 20 e r = 2, elas ficam ambas 0.84. Assim,

o valor crıtico de p(D), que faz os dois cursos de acao igualmente atraentes, tendo a

mesma utilidade esperada, e 1/6 (faca a conta).

50 Teorema de Bayes

6.4 Probabilidades vagas ou precisas

Quando discutimos eventos incertos e probabilidades como coisas comparaveis, surgiu o

argumento contrario de que nao e possıvel comparar qualquer coisa, e no mınimo muito

estranho.

Por exemplo, suponha que realizaremos o experimento de lancar uma moeda comum e

ver se ocorre o evento D, sair cara. Quase todos nos estaremos de acordo em atribuir

probabilidade 1/2 a este evento, sem muita margem para oposicoes.

Agora consideremos um ensaio clınico em que um novo medicamento sera testado e apli-

cado em apenas um de um par de pacientes, no qual o outro recebera o medicamento

usual. Suponha que os pacientes do par sao muito semelhantes nas caracterısticas im-

portantes para o ensaio, sendo a unica diferenca o tratamento ao qual sera submetido,

o novo ou o usual. Podemos ter uma mente aberta a respeito da efetividade do novo

medicamento e atribuir probabilidade 1/2 ao evento D, de que ele e melhor que o usual

para um certo par de pacientes.

Esta ultima probabilidade e vaga (imprecisa), no sentido que nao nos sentimos muito

seguros sobre o seu valor, mesmo sendo razoavel atribuir 1/2, para nao beneficiar nem

prejudicar o ensaio com uma ideia pre-concebida.

Para mostrar que estamos falando de uma unica incerteza, observemos que podemos

representar ambas as probabilidades com a extensao da conversa.

Imagine a moeda lancada 1000 vezes, e denote por θj a proporcao de cadas nestes 1000

lancamentos. Consideremos p(θj | H), a probabilidade a priori de θj , e p(D | H), a

probabilidade de sair cara em um certo lancamento.

Quais valores sao razoaveis para p(θj | H)? A maioria de nos atribuira valores muito

pequenos para θj proximo de zero ou proximo de 1, atribuindo os maiores valores para

θj proximo de 1/2. Esta e uma probabilidade precisa.

No caso do novo medicamento, denotemos por ψj a proporcao de pares de pacientes

nos quais o novo medicamento foi mais eficaz. As probabilidades p(ψj | H) tendem a

ser diferentes das anteriores. Nao podemos considerar irrelevantes os casos em que ψj

e proximo de zero (o novo tratamento nao e eficaz), ou em que e proximo de 1 (o novo

tratamento e melhor que o atual). Portanto, os valores de p estarao distribuıdos com

menor concentracao que no caso da moeda, e dizemos que e uma probabilidade vaga.

O que estamos dizendo ao dizer que podemos comparar eventos e suas probabilidades,

e que p(D | H) e o mesmo nos dois casos, usando (6.1).

Probabilidades vagas ou precisas 51

Qual e o efeito dos dados coletados nestas probabilidades?

Suponha que voce observa 12 lancamentos da moeda, todos resultando em cara, e 12

pares de pacientes, nos quais em todos, o novo medicamento foi melhor.

Para o primeiro caso, onde temos uma probabilidade a priori precisa (muito concentrada

em torno de 1/2), entao valores de θj com probabilidade muito pequena continuarao

tendo probabilidade pequena; ou seja, continuaremos com probabilidades muito concen-

tradas em torno de 1/2. No segundo caso, ficaremos muito mais convencidos de que ψj

deve ser proximo de 1, dando mais credito ao medicamento novo. As mesmas mudancas

se refletem na probabilidade p(D | H).

Exercıcio 22. Um exame rapido de consumo de alcool efetuado pela polıcia tem apenas

0.8 de chance de estar correto: dar um valor alto, quando houver consumo, e um valor

baixo, quando nao houver consumo. Os suspeitos, ou seja, os que tiveram resultado

positivo, sao encaminhados para um exame mais cuidadoso por um medico. Este segundo

teste nunca erra com motoristas sobrios, mas tem uma chance de erro de 10% em

motoristas que ingeriram alcool, devido ao tempo passado entre os dois exames. Quando

um motorista e parado pela polıcia, a chance de ter ingerido alcool e P .

(a) que proporcao de motoristas parados pela polıcia tera o segundo teste negativo?

(b) qual e a probabilidade posterior de que tal pessoa tenha de fato ingerido alcool?

(c) que proporcao das pessoas paradas nao fara o segundo teste?

Exercıcio 23. Um paciente pensa que tem cancer e consulta um medico, A, que, depois

de um exame, afirma que ele nao tem a doenca. O paciente sente que o medico e do tipo

cauteloso para diagnosticar cancer, de modo que decide procurar uma segundo medico,

B, que declara que ele tem cancer.

Suponha que o medico A diagnostica cancer em somente 60% dos pacientes que de fato

tem, e nunca nos casos em que nao tem. Suponha que B diagnostica cancer em 80%

dos pacientes que tem, e em 10% dos que nao tem. Suponhas que as duas opinioes sao

dadas independentemente. Por quanto sao multiplicadas as chances do paciente nao ter

cancer como um resultado das duas opinioes?

Exercıcio 24. Temos tres caixas fechadas e voce seleciona uma ao acaso. E sabido que

uma caixa contem 2 moedas de ouro, a outra 2 moedas de prata, e a terceira, uma de

prata e uma de ouro. Uma moeda e extraıda da caixa que voce selecionou e ela resulta

ser de ouro. Qual e a chance de que a segunda moeda tambem seja de ouro?

Exercıcio 25. Com a notacao anterior, suponha que θj e ψj podem assumir qualquer um

dos valores 0, .1, .2, . . . , .9, 1.0. No caso da moeda, suponha que p(θ = 0.5) = 0.9 e seja

52 Teorema de Bayes

0.01 para os demais dez casos. No caso do ensaio clınico, suponha que p(ψ = ψj) = 1/11,

para cada j. Suponha que em 5 lancamentos foram observadas 5 caras, e que em 5 pares

de pacientes, em todos o tratamento novo foi melhor. Determine as probabilidades a

posteriori para estas evidencias.

Capıtulo 7

O valor da informacao

7.1 Informacao perfeita

No capıtulo anterior, vimos o efeito de uma nova informacao nas probabilidades de

eventos incertos, em um problema de decisao. Agora avaliaremos a melhora obtida no

procedimento de decisao com estas probabilidades atualizadas. Basicamente, vendo os

dados como fonte de informacao, queremos saber como medir esta informacao: conhe-

cendo os ganhos esperados a partir dos dados antes de que eles sejam disponibilizados,

podemos avaliar se vale a pena coleta-los.

Para isso, comecaremos com a situacao (nao comum) em que os dados sao completamente

informativos: eles dizem exatamente qual evento incerto ocorrera. Chamamos isto de

informacao perfeita. Continuaremos no contexto de consequencias monetarias e, como

simplificacao, suporemos que no intervalo de dinheiro considerado a utilidade e linear (o

que e basicamente correto se este intervalo for pequeno em comparacao com o capital

total).

Consideremos novamente o exemplo do investidor, no caso em que seu capital e grande

com relacao aos 100 dolares que ele pode ganhar ou perder com o investimento, com

consequencias como na tabela seguinte.


d1: investimento 5100 4900

d2: deixa no banco 5000 5000

Exercıcio 26. Confira que as funcoes de utilidade u1 e u2, com um fator de escala de

100, por exemplo, sao de fato praticamente lineares no intervalo de 4900 a 5000.

54 O valor da informacao

Nossa pergunta e: se o agente decisor conhecer uma maneira de saber exatamente o

que acontecera com as acoes, quanto ele devera estar preparado para pagar por esta

informacao perfeita antes de recebe-la?

Claramente, isto depende da probabilidade de que as acoes subam: como um caso

extremo, se tivermos quase certeza de que as acoes vao subir, ganhamos pouco com a

informacao de elas vao subir.

Suponhamos primeiro que esta probabilidade e 1/2: p(θ1) = p(θ2) = 1/2.

Tipicamente, o preco do conselho de um consultor financeiro e uma comissao sobre a

compra das acoes; ou seja, o pagamento so ocorre se tomarmos a decisao d1, o que

enviesa o conselho. Assim, suporemos inicialmente que o pagamento e fixo ou pago

antes da informacao perfeita.

A informacao perfeita sera um dos dois casos: ou θ1 ocorrera ou θ2 ocorrera.

Se for que θ1 ocorrera, entao d1 e a melhor decisao. Caso contrario, a melhor decisao

sera d2. Consequentemente, com informacao perfeita, o decisor tera ou 5000 dolares ou

5100 dolares, e portanto o resultado esperado com informacao perfeita e

5100/2 + 5000/2 = 5050 .

Sem a informacao perfeita, o ganho esperado e 5000 dolares, para qualquer uma das

decisoes, de modo que o valor esperado da informacao perfeita e a diferenca, 50 dolares.

Ou seja, valeria a pena pagar ate 50 dolares por receber este conselho.

Outra possibilidade e incorporar o valor da informacao, digamos f , na tabela de con-

sequencias,


d1: investimento 5100− f 4900− fd2: deixa no banco 5000− f 5000− f

Se o conselho for θ1, d1 e selecionado, obtendo 5100 − f ; se for θ2, d2 e selecionado,

obtendo 5000 − f . A esperanca e 5050 − f , que e igual aos 5000 sem informacao se

f = 50. Esta segunda solucao e interessante quando lidamos com utilidades mais gerais.

Se tivermos mais confianca de que as acoes irao subir, atribuindo, por exemplo, p(θ1) =

3/4, entao sem o conselho, e melhor investir, com valor esperado 5050 dolares. Se o

conselho for θ1, d1 e otimo com 5100; se for θ2, d2 leva a 5000, como antes; deste modo,

a esperanca com informacao perfeita e 5075 dolares. A diferenca, 25 dolares, e o valor

da informacao.

Valor esperado da informacao perfeita 55

Se tivermos, por exemplo, p(θ1) = 1/4, pela simetria do problema, o valor esperado da

informacao perfeita sera novamente 25 dolares. Isto contradiz a intuicao das pessoas que

acham que vale mais a pena pagar por um conselho sobre um investimento promissor

do que sobre um duvidoso.

7.2 Valor esperado da informacao perfeita

Consideremos um caso com decisoes d1, . . . , dm, eventos incertos θ1, . . . , θn com proba-

bilidades pj = p(θj), e utilidades uij = u(Cij). Assim, a utilidade esperada de cada

decisao e

ui =

n∑j=1

uij pj , (7.1)

e a melhor decisao, di∗ e aquela com maior utilidade esperada. Em outras palavras, a

utilidade esperada sem informacao adicional e igual a (7.1) para i = i∗.

Representemos este problema por uma tabela, como as anteriores, desta vez com m

linhas e n colunas, e suponha que existe informacao perfeita. Se o evento incerto for

θj , entao selecionamos a decisao com maior utilidade, na coluna j. A utilidade espe-

rada com informacao perfeita e obtida multiplicando estas utilidades maximais por suas

correspondentes probabilidades,

n∑j=1

maxiuij pj . (7.2)

A diferenca entre esta quantidade e (7.1),

n∑j=1

maxiuij pj −

n∑j=1

uij pj ,

e chamada o valor esperado da informacao perfeita: e o ganho esperado na utilidade

esperada ao receber a informacao perfeita.

Observe que este valor e sempre positivo: podemos esperar que sempre vale a pena ter

informacao perfeita.

Exercıcio 27. Mostre que o valor esperado da informacao perfeita e zero se e so se

existir uma decisao que e melhor que as outras, qualquer que seja o evento incerto.

7.3 Perdas

Veremos agora outra forma util de abordar um problema de decisao: suponha que para

cada utilidade uij , um numero aj , dependente do evento incerto mas nao da decisao, e


subtraıdo. Ou seja, todas as utilidades correspondentes ao mesmo evento incerto θj sao

subtraıdas em aj .

Assim, qualquer que seja i, (7.1) sera reduzido da quantidade∑

j aj pj , assim como

(7.2), e a diferenca entre estes valores se mantem.

Tomemos aj = maxk ukj , de modo que a diferenca anterior seja

0−maxi

n∑j=1

(uij − aj) pj .

Definamos lij = maxk ukj − uij , a diferenca entre a utilidade da melhor decisao para θj

e a utilidade para di quando θj ocorre. Esta e chamada a perda ao decidir di quando θj

ocorre. Assim, reescrevendo a expressao acima, temos

mini

n∑j=1

lij pj .

Em outras palavras, o valor esperado com a informacao perfeita e igual a menor perda

esperada obtida com qualquer decisao.

No exemplo do investimento, as perdas estao dadas na tabela seguinte.




Com p1 = 3/4, a perda esperada com d1 e 25, com d2, 75. O menor destes valores e 25

dolares, que esta de acordo com o valor encontrado previamente.

Observe que a perda mede o quanto voce perde ao nao conhecer o evento incerto. A

informacao perfeita diz qual sera o evento incerto, reduzindo a perda a zero. Daqui, o

ganho compensa exatamente a perda.

Esta expressao alternativa de um problema de decisao nos leva a um princıpio equivalente

ao da maximizacao da utilidade esperada, que e o da minimizacao da perda esperada.

Para aplicar este princıpio, devemos considerar primeiro, para cada evento incerto, qual

e a melhor decisao, e entao avaliar quao piores sao as demais decisoes comparadas com

a otima (esta comparacao e mensurada pela perda).

Algumas vantagens deste procedimento sao:

(a) e necessaria a comparacao apenas entre as consequencias de cada coluna da tabela

de decisao, e nao sobre todas as consequencias;

(b) entrega diretamente uma expressao para o valor esperado da informacao perfeita.

Perdas 57

Um problema e a atribuicao dos valores das perdas, ja que eles dependem das utilidades,

que foram definidas em uma escala de probabilidade.

Por exemplo, para o investidor com funcao de utilidade u1, com aversao decrescente ao

risco, com fator de escala 10, no caso em que pode ganhar ou perder 100 dolares, tendo

um capital de 100 dolares. Em dolares, a tabela de decisao e




E tentador afirmar que a tabela de perdas e




reduzindo a situacao ao do agente decisor com capital de 5000 dolares analisando a

mesma aposta.

O argumento e falso, pois as perdas sao diferencas entre utilidades e nao entre quanti-

dades de dinheiro. A tabela de utilidades e


d1: investimento .364 .000

d2: deixa no banco .221 .221

com tabela de perdas (corretas)


d1: investimento .000 .221

d2: deixa no banco .143 .000

A perda esperada para d1 e .221× (1− p1), para d2 e .143× p1. Elas sao iguais quando

a razao de chances p1/(1− p1) for igual a .221/.143 = 1.55, ou em torno de 3 para 2. O

valor correspondente para p1 e 0.61.

Para qualquer decisor averso ao risco, a queda de 100 para 0 dolares e mais serio que o

aumento de 100 para 200 dolares, e isto se reflete na perda (definida apropriadamente)

se as acoes caırem ser maior do que no caso contrario.


7.4 Informacao perfeita com uma utilidade qualquer

Consideremos o valor esperado da informacao perfeita para um problema com resultados

monetarios, e com utilidade nao linear, como o da tabela seguinte.


d1: investimento u(C + a) u(C − a)

d2: deixa no banco u(C) u(C)

probabilidade p 1− p

Suponha que voce deva pagar uma taxa f para a informacao perfeita, que sera paga

qualquer que seja o resultado,


d1: investimento u(C + a− f) u(C − a− f)

d2: deixa no banco u(C − f) u(C − f)

probabilidade p 1− p

Com informacao perfeita, a utilidade esperada e

p u(C + a− f) + (1− p)u(C − f) .

Suponha que, sem tal informacao, a melhor decisao seja d2, com utilidade esperada

u(C). Entao a maior taxa que estarıamos dispostos a pagar e o valor f que faz este

valor esperado igual a u(C),

p u(C + a− f) + (1− p)u(C − f) = u(C) . (7.3)

Para um valor suficientemente pequeno de f , a desigualdade > se cumpre, e podemos

esperar que o conselho valha a pena.

Se d1 fosse a melhor decisao sem informacao, similarmente, obterıamos a condicao

p u(C + a− f) + (1− p)u(C − f) = p u(C + a) + (1− p)u(C − a) .

Para o decisor com aversao ao risco decrescente, considere o jogo de ganhar ou perder

100 dolares, com mesma chance, tendo um capital de 100 dolares, para o qual a melhor

decisao e d2. A equacao (7.3) fica

u(200− f)/2 + u(100− f)/2 = u(100) ,

representada pela Figura 7.1 (a escala foi omitida e a curvatura exagerada para facilitar

a visualizacao).

Informacao perfeita com uma utilidade qualquer 59

Figura 7.1: Avaliacao de uma taxa razoavel.

Por causa da diminuicao da utilidade marginal, (200 − f) − 100 > 100 − (100 − f), de

onde obtemos que f = 50 dolares seria uma taxa alta demais para pagar. Por tentativas

(com valores menores que 50), obtemos que f deve ser em torno de 44 dolares. Ja o

decisor mais rico, com capital de 5000 dolares, poderia pagar ate 50 dolares pela mesma

informacao.

O procedimento geral fica agora claro.

A situacao sem informacao entrega utilidades u(Cij) e o melhor que podemos fazer e

maximizar a utilidade esperada na forma usual.

Se a informacao perfeita custar f , em termos monetarios, entao todas as utilidades

virarao u(Cij − f), obtendo utilidade esperada

n∑j=1

maxiu(Cij − f) pj .

O valor monetario da informacao perfeita e entao a solucao da equacao

n∑j=1

maxiu(Cij − f) pj = max

i

n∑j=1

u(Cij) pj .

Em algumas situacoes, a taxa so e paga para algumas consequencias e nao para outras, ou

entao pode variar com as consequencias (como e o caso de comissoes em porcentagem).

Nestes casos, as consequencias sao modificadas de Cij para Cij − fij , e procedemos da

mesma maneira.

Se as consequencias Cij forem nao monetarias, entao o efeito da taxa deve ser combinado

com os elementos nao-monetarios de forma apropriada para derivar novas consequencias,


C ′ij , digamos. A taxa vale a pena se

n∑j=1

maxiu(C ′ij) pj ≥ max

i

n∑j=1

u(Cij) pj .

7.5 Valor esperado da informacao parcial

Passemos agora da situacao em que recebemos informacao perfeita (e nosso conheci-

mento muda as probabilidades para 0 ou 1), a situacao mais geral, em que a informacao

e menos que perfeita e as probabilidades sao modificadas pela regra de Bayes (e ainda

mantemos a incerteza).

Denotemos por X a informacao adicional. Para ser util, X deve estar relacionado com

os eventos θj e suponhamos que p(X | θj) sao conhecidas.

Com isto, o decisor tem novas probabilidades, dadas por p(θj | X), de modo que maxi-

mizar a utilidade esperada corresponde a encontrar di que alcanca

maxi

n∑j=1

uij p(θj | X) ,

no lugar de

maxi

n∑j=1

uij p(θj) ,

que ele obteria sem X.

Exatamente como no caso de informacao perfeita, no qual o decisor nao sabia a forma

que a informacao teria, aqui ele nao sabe o que os dados mostrarao. No entanto, ele

tem uma probabilidade para estes dados,

p(X) =

n∑j=1

p(X | θj) p(θj) .

O decisor sabe o que fazer se obtiver X, e sabe a probabilidade de obter X. Consequen-

temente, ele espera obter

∑X

maxi

n∑j=1

uij p(θj | X) p(X) .

Como p(θj | X) p(X) = p(X | θj)p(θj), a utilidade esperada resultante da informacao

parcial e ∑X

maxi

n∑j=1

uij p(X | θj) p(θj) . (7.4)

Valor esperado da informacao parcial 61

A diferenca deste valor com a utilidade esperada sem X e o valor esperado da informacao

parcial.

Voltemos ao nosso investidor, com um capital de 5000 dolares, analisando o jogo em que

pode ganhar ou perder 100 dolares, com mesma chance, e com utilidade proporcional

ao dinheiro. Vimos que a informacao perfeita valia 50 dolares.

Suponha que ele esta pensando em procurar assessoria de um consultor, que nao e

infalıvel, mas que tem mais informacao que ele proprio. Ate quanto ele deveria pagar

pelo conselho? Obviamente, menos que 50 dolares; quanto menos?

E claro que isto depende do grau de acerto do consultor: alguns consultores sao melhores

que outros, e devemos primeiramente descrever esta habilidade quantitativamente, como

ja vimos, atraves da funcao de verossimilhanca, p(X | θj).

Consideremos um assessor bastante confiavel, que da um bom conselho 3/4 das vezes,

ou seja,

p(X1 | θ1) = p(X2 | θ2) = 3/4 ,

onde denotamos por X1 o conselho de comprar acoes, e por X2, o de nao comprar. A

seguinte tabela mostra um resumo destes valores, do lado esquerdo.

θ1 θ2 X1 X2

d1 5100 4900 2525 2475

d2 5000 5000 2500 2500

pj 1/2 1/2

p(X1 | θj) 3/4 1/4

p(X2 | θj) 1/4 3/4

Do lado direito, para qualquer decisao e resultado X, calculamos parte de sua utilidade

esperada,

5100× 3/4× 1/2 + 4900× 1/4× 1/2 = 2525 etc.

Para cada X, selecionamos o maior valor (indicado pelo sublinhado). Somando estes

valores, em X, obtemos 5025 dolares. Sem o conselho, qualquer decisao produz uma

esperanca de 5000 dolares, consequentemente, deverıamos estar preparados para pagar

ate 25 dolares pelo conselho. Observe que isto e a metade de uma informacao perfeita.

As mesmas contas poderiam ter sido feitas usando perdas no lugar de utilidades. Neste

caso, como assumimos utilidade linear, as perdas sao simplesmente as diferencas nos

ganhos monetarios.

Exercıcio 28. Construa a tabela de perdas para este exemplo, e determine o valor do

assessor.


Exercıcio 29. Mostre que o valor esperado de informacao parcial e sempre maior que

zero, a menos que a informacao seja irrelevante.

Observe que isto implica que se voce estiver para receber alguma informacao relevante

sobre alguns eventos incertos, entao e esperado que a utilidade esperada para qualquer

problema de decisao envolvendo estes eventos aumente como resultado da informacao.

Aqui temos duas esperancas: uma devida aos eventos incertos, e outra a informacao

incerta.

Estas ideias nos permitem atribuir um valor esperado monetario a qualquer informacao,

pelo menos no caso em que as consequencias sao completamente monetarias e a utilidade

e linear. Se a informacao estiver disponıvel a um preco menor que este valor, entao e

melhor pega-la, caso contrario, ela deveria ser recusada. Desta forma, uma empresa con-

siderando a comercializacao de um novo produto pode determinar se vale a pena aceitar

o orcamento de um instituto de pesquisa de mercado para realizar um levantamento que

estime a demanda provavel do produto.

Outro uso destas ideias e na comparacao da eficiencia esperada entre dois tipos dife-

rentes de informacao. Um engenheiro, por exemplo, pode considerar realizar alguns

experimentos em laboratorio ou, alternativamente, construir um prototipo. Se os cus-

tos destas opcoes forem comparaveis, entao ele poderia decidir entre elas com base no

retorno esperado que estes dados poderiam ter.

Exercıcio 30. No exemplo anterior, suponha que um segundo consultor e muito bom

para identificar boas acoes, mas tem um desempenho regular para acoes que podem cair.

Ou seja, suponha que para este consultor p(X1 | θ1) = 0.9 e p(X2 | θ2) = 0.6. Determine

o valor maximo a ser pago para este segundo consultor.

A generalizacao para o caso de uma utilidade nao-linear e similar ao feito para informacao

perfeita. Mesmo que este caso extremo nao ocorra na pratica, conhecer o valor da

informacao perfeita entrega um limitante para o valor de uma informacao parcial.

Se a utilidade for nao-linear mas as consequencias forem monetarias, precisamos subtrair

o custo f de cada consequencia antes de avaliar a utilidade. A expressao (7.4) entao fica∑X

maxi

n∑j=i

u(Cij − f) p(X | θj) p(θj) ,

para custo f constante. O ganho monetario esperado da informacao e o valor f que

torna esta expressao igual a utilidade esperada original, maxi∑

j uijpj .

O interessante de calcular o valor da informacao perfeita e que ele entrega, com um

calculo simples, um limitante superior para o custo de uma informacao parcial.

Valor esperado da informacao parcial 63

Exercıcio 31. Determine o valor da informacao perfeita para os seguintes casos. As

entradas das tabelas estao em dolares, e a utilidade pode ser considerada linear em

funcao do dinheiro.

(a)

θ1 θ2

d1 130 90

d2 100 105

pj 1/3 2/3

(b)

θ1 θ2

d1 1000 100

d2 100 200

pj 0.2 0.8

(c)

θ1 θ2 θ3

d1 500 300 200

d2 400 200 400

pj 0.2 0.5 0.3

Exercıcio 32. Repita o item (b) do exercıcio anterior para o investidor com aversao

ao risco decrescente, com fator de escala igual a 10.

Exercıcio 33. (a) Para o item (a) do exercıcio anterior, calcule o valor esperado de

um consultor que acerta com probabilidade 2/3.

(b) Para o item (b) do exercıcio anterior, calcule o valor esperado de um consultor que

esta sempre correto se θ2 for verdadeiro, mas somente metade das vezes se θ1 for.

(c) Para o item (c) do exercıcio anterior, calcule o valor esperado de um consultor que

aconselha X1, X2, X3 com probabilidades

p(Xi | θi) = 1/2 , p(Xi | θj) = 1/4 se i 6= j .

Exercıcio 34. Uma firma esta considerando lancar um de dois produtos, d1 ou d2. O

primeiro e esperado ir bem se a economia andar bem; o segundo pode ir melhor se a

economia estiver fraca. Os retornos esperados (em 1000 dolares) e as probabilidades

relevantes sao


θ1: bom θ2: moderado θ3: fraco

d1 50 30 20

d2 40 30 30

pj 0.3 0.4 0.3

(a) Uma empresa de pesquisa de mercado oferece fazer um levantamento por 4000

dolares. Esta oferta deve ser aceita? Suponha que a utilidade e proporcional ao di-

nheiro.

(b) Calcule o valor esperado do conselho sugerido no item (c) do exercıcio anterior.

7.6 Aplicacao em amostragem

No exemplo do comerciante, que considerava a possibilidade de analisar uma amostra

para ganhar informacao parcial sobre a qualidade do lote a ser comprado, podemos

obter o valor monetario esperado da amostra, usando o valor esperado da informacao

parcial, e compara-lo com o custo real da amostragem. Alem disso, podemos determinar

o melhor tamanho de amostra com esta abordagem.

Tipicamente, a medida que a amostra aumenta, o valor esperado da informacao parcial,

que naturalmente aumenta, tem valor marginal cada vez menor.

Desta maneira, ha um ponto em que o crescimento marginal nao compensa o custo

adicional de uma nova unidade amostral. A Figura 7.2 mostra esta situacao, quando

consideramos custo linear com o tamanho da amostra.

Figura 7.2: Custo e valor esperado de uma amostra, em funcao de seu tamanho.

O ponto C mostra o tamanho de amostra otimal, onde a distancia AB (representando

a razao entre benefıcio e custo) e maxima.

Capıtulo 8

Arvores de decisao

Voltando ao exemplo do comerciante da secao anterior, ele poderia considerar a amostra-

gem de uma quantidade fixa de itens, digamos 10, e entao, depois de analisar a amostra,

tomar uma decisao.

Uma forma alternativa de procedimento e tomar a amostra com um item por vez,

inspecionando-o e entao, depois de cada inspecao, decidir continuar ou nao com a amos-

tragem. Em alguns casos, e possıvel chegar a uma decisao mais eficientemente do que

com uma amostra fixa. Por exemplo, se os 6 primeiros itens estiverem com defeito, o

comerciante poderia pensar que isto e evidencia suficiente para concluir que o lote e de

baixa qualidade e que nao vale a pena amostrar os quatro itens restantes.

O metodo de tomar uma decisao apos cada item amostrado e chamado sequencial.

Muito problemas de decisao sao de carater sequencial: o engenheiro planejando e cons-

truindo uma planta tipicamente nao toma uma decisao geral para todo o projeto e depois

o segue; o que ele faz e tomar algumas poucas decisoes iniciais, deixando outras para

depois quando tiver mais informacao. A operacao inteira consiste em uma sequencia de

problemas de decisao conectados.

Assim, no exemplo do comerciante, a quantidade do pedido esta relacionada com o

pedido da semana seguinte e com o da semana anterior. As regras de coerencia vistas

continuam a ser aplicadas em decisoes tomadas em sequencia, levando como antes a

regras otimas de procedimento.

A principal ferramenta para lidar com tais problemas e o conceito de arvore de decisao

e as ideias consequentes de programacao dinamica.

Voltemos ao exemplo do investidor, com tabela de decisao

66 Arvores de decisao

θ1 θ2

d1 5100 4900

d2 5000 5000

pj 0.6 0.4

p(X1 | θj) 0.8

p(X2 | θj) 0.7

Suporemos que a utilidade e linear sobre o intervalo de valores envolvidos no problema,

e que o investidor tem um assessor que pode aconselha-lo por um custo f , dizendo se

ele deve comprar acoes, X1, ou nao, X2. Suponha que a confianca no assessor e descrita

pelas probabilidades p(X1 | θ1) = 0.8 e p(X2 | θ2) = 0.7.

O investidor deve decidir se contrata ou nao o assessor e se investe ou nao nas acoes

(com ou sem conselho). Este problema pode ser descrito por uma arvore de decisao.

Esta arvore cresce horizontalmente da esquerda para a direita, comecando com as acoes

possıveis, representadas pelos primeiros galhos da esquerda: assessor, d1, d2. Seguindo

o galho do assessor, dois conselhos podem ser recebidos: X1 ou X2. Qualquer que seja o

conselho, o investidor deve entao decidir d1 ou d2. Finalmente, incorporamos ao fim dos

galhos a informacao sobre os eventos incertos, θ1 e θ2. A Figura 8.1 mostra a estrutura

de decisao do problema (esqueca os numeros que aparecem, por enquanto).

Figura 8.1: Arvore de decisao para o problema do investidor.

Cada nodo contem um grupo de galhos, representando ou decisoes ou resultados a serem

observados ou obtidos. Note que ao construir a arvore, seguimos a ordem natural dos

eventos no tempo.

67

Os nodos de decisao, cujos galhos dependem da escolha do decisor, sao representados

por um quadrado. O nodos dos resultados, que nao dependem do decisor mas sim de

uma amostra ou do estado da natureza, ambos incertos para o decisor, sao chamados

nodos aleatorios e sao representados por um cırculo.

A analise de uma arvore de decisao envolve dois tipos de quantidades: probabilidades e

utilidades.

A primeira informacao que adicionaremos a arvore sao as probabilidades envolvidas.

Lembrando que a arvore e construıda em ordem temporal, nos nodos aleatorios devemos

considerar somente a informacao conhecida previamente a eles: nossas probabilidades

sao condicionais a essa informacao.

Comecando, por exemplo, com d1, encontramos o nodo aleatorio com galhos θ1 e θ2.

Como, ate esse nodo, nao ha nenhum outro tipo de informacao, as probabilidades sao

as iniciais no problema, p1 = 0.6 e p2 = 0.4. O mesmo ocorre com d2.

Seguindo o galho do assessor, o argumento e diferente. O primeiro nodo aleatorio se

refere ao conselho que o assessor poderia dar, X1 ou X2. Como nao sabemos qual evento

incerto ocorrera, θ1 ou θ2, temos

p(X1) = p(X1 | θ1) p1 + p(X1 | θ2) p2 = 0.6

e p(X2) = 1 − p(X1) = 0.4. Continuando por estes galhos, chegamos a um nodo de

decisao e depois aos nodos aleatorios correspondentes a θ1 e θ2. As probabilidades

relevantes agora sao p(θj | Xi) para cada uma das informacoes X1 e X2, que sao obtidas

pela regra de Bayes,

p(θ1 | Xi) = p(Xi | θ1)p1/p(Xi) i ∈ {1, 2} .

Todas estas probabilidades obtidas sao adicionadas na arvore, nos respectivos galhos.

A seguir, consideramos a utilidade da consequencia de cada sequencia de decisoes e

eventos incertos, representadas por cada um dos galhos. Neste caso, como a utilidade e

suposta linear, consideramos os valores monetarios de cada galho. Estes sao os valores

finais que aparecem nos galhos da arvore.

Finalmente, realizamos a analise do problema, voltando pelos galhos em sentido inverso.

Em cada nodo aleatorio, registramos a utilidade esperada, e em cada nodo de decisao,

escolhemos a decisao com maior utilidade esperada, cortando o galho das decisoes ex-

cluıdas por este criterio.

Por exemplo, no galho assessor-X1, a utilidade esperada de d1 e 5060 − f e a de d2,

5000− f . Assim, excluımos a decisao d2.


Continuando assim por todos os galhos, chegamos na raiz da arvore, de onde excluımos

a decisao d2 por ter utilidade menor que d1. Concluımos que o assessor sera a melhor

decisao se seu custo f for menor que 16 dolares, caso contrario, d1 sera a melhor decisao.

8.1 Exemplo (petroleira)

Uma empresa exploradora de petroleo tem uma opcao em uma terreno dentro de uma

regiao produtora. Ela deve decidir entre fazer perfuracoes no lugar antes que a opcao

expire ou abandonar seus direitos. A rentabilidade das perfuracoes dependera de um

grande numero de variaveis desconhecidas e nao previsıveis com certeza: o custo da

perfuracao, a quantidade de petroleo ou gas encontrada, o preco de venda deste petroleo

ou gas, etc. O problema pode se complicar mais pelo fato de que e possıvel realizar varios

testes ou experimentos para obter mais informacao sobre a estrutura geofısica do terreno.

Como algumas estruturas sao mais favoraveis para a existencia de petroleo que outras,

esta informacao poderia ser muito util para tomar a decisao de escavar ou nao. Mas, os

varios testes possıveis tem um custo substancial (em dinheiro), e alem disso nao e obvio

que qualquer um deles deva ser realizado. A empresa deve decidir se realizara algum

dos testes e, finalmente, se realizara perfuracoes ou nao.

Consideremos uma versao simplificada deste problema, com as seguintes suposicoes:

1. se o terreno for escavado, isto sera feito com um contrato a preco fixo de 100 mil

dolares;

2. se for encontrado petroleo, a empresa imediatamente o vendera a um produtor de

larga escala por 450 mil dolares;

3. somente pode ser aplicado um tipo de teste, chamado sonar sısmico, antes de decidir

escavar ou nao. Este experimento custa 10 mil dolares; se for realizado, ele revelara com

certeza se a estrutura do terreno e de tipo A (favoravel a existencia de petroleo), tipo

B (menos favoravel), ou tipo C (muito desfavoravel).

Podemos imaginar a empresa tomando uma decisao sequencial: primeiro decidindo se

aplica ou nao o teste. Se decidir aplicar o teste, entao um de tres eventos ocorrera: a

estrutura do terreno sera diagnosticada como tipo A, B ou C; se decidir nao aplicar,

entao apenas um evento ocorre neste estagio: nao obter informacao.

O diagrama da Figura 8.2 mostra este processo, da esquerda para a direita: os nodos em

que o decisor tem o controle sao chamados nodos de escolha e denotados por quadrados;

os nodos em que o decisor nao tem controle sao nodos de eventos e denotados por

cırculos.

Exemplo (petroleira) 69

Figura 8.2: Arvore de decisao da empresa exploradora de petroleo.

Para qualquer uma desta opcoes de acao do primeiro estagio, a empresa deve entrar no

segundo estagio para decidir se realiza as perfuracoes ou se abandona a opcao. Se ela

escavar, entao um de dois eventos ocorrera: encontra petroleo ou a perfuracao esta seca;

se ela escolhe abandonar a opcao, entao o unico evento possıvel e “perde os direitos”.

Finalmente, ao extremo direito do grafico, descrevemos a consequencia de cada uma

das possıveis acoes e eventos. No exemplo, se a empresa decidir nao realizar o teste e

abandonar a opcao, a consequencia e 0 dolares: nao consideramos o investimento original

ao comprar a opcao, ja que este ja e fundo perdido que nao pode ser afetado pela decisao

atual e portanto e irrelevante para este problema de decisao.

A empresa poderia tambem adotar a estrategia de realizar escavacoes se souber que a

estrutura do terreno e de tipo A ou B, e nao realiza-las se for de tipo C. No entanto, seu

problema imediato e gastar ou nao 10 mil para conhecer o tipo de estrutura. Obviamente

esta informacao tem um valor, o que nao e claro e se este valor e maior ou menor que

os 10 mil que a informacao custa.

O problema enfrentado pela petroleira de fato e mais complicado que o representado

na Figura 8.2. Em primeiro lugar, porque existem diversos experimentos que poderiam

ser realizados para conhecer a estrutura do terreno; assim deverıamos ter mais galhos

correspondentes aos experimentos possıveis e um correspondente a nao realizacao de

experimentos. Alem disso, poderiam ser realizados mais de um experimento. A Figura

8.3 mostra a arvore de decisao com dois experimentos possıveis, I e II, tendo como

resultados F - favoravel, e U - nao favoravel.

Do mesmo modo, as possıveis escolhas finais em problemas reais sao muito mais nu-

merosas do que simplesmente “escavar” ou “abandonar”. Depois da fase de testes, a


Figura 8.3: Arvore de decisao da empresa exploradora de petroleo, considerando mais

de um tipo de teste exploratorio.

empresa poderia fazer diversas propostas compartilhando os riscos com outras empresas

ou investidores.

Finalmente, os possıveis resultados das escavacoes (com risco compartilhado ou nao)

nao sao somente “vender por 450 mil”. Este valor depende da quantidade estimada, da

profundidade em que o produto se encontra, etc.

Exercıcio 35. Construa a arvore de decisao dos seguintes problemas, resolvendo o

mesmo quando houver valores dados.

1. (inventario) O dono da cantina de uma escola deve abrir um pedido de compra de

uma mercadoria perecıvel (coxinha, empadinha de palmito), que estraga se nao for

vendida ate o fim do dia em que for entregue. Ele nao sabe qual sera a demanda

do item, no entanto ele deve decidir o total de unidades do pedido.

2. (excesso de producao) Um dono de uma empresa de manufatura e contratado

para entregar 100 pecas boas de um produto “costumizado” a um preco fixo pelo

lote. Ele sabe que havera algumas pecas com defeito entre as 100 primeiras pecas

produzidas. Realizar uma segunda linha de producao para completar as 100 pecas

boas do contrato tem um custo substancial (em dinheiro), de modo que ele prefere

fabricar pecas adicionais para substituicao das pecas com defeito. Por outro lado,

depois que as 100 pecas boas forem produzidas, o custo direto de producao dos

itens adicionais sera uma perda total, e portanto ele nao quer produzir um adicional

muito grande. Se ele soubesse exatamente quantas pecas deveriam ser produzidas

para ter 100 pecas boas no fim, escolher a quantidade certa para a producao seria

facil; mas ele deve tomar esta decisao sem essa informacao.

Exemplo (petroleira) 71

3. (metodos de manufatura) Um dono de manufatura pretende equipar sua empresa

para a producao de um produto novo. Este produto pode ser produzido por um de

dois processos: um deles requer um capital de investimento relativamente pequeno,

mas um alto custo de producao por unidade; o outro tem um custo muito menor

na producao de cada unidade, mas exige um investimento inicial muito mais alto.

O primeiro processo sera bom se as vendas do produto forem lentas, enquanto que

o segundo sera melhor se as vendas forem altas. No entanto, a decisao deve ser

tomada sem saber como serao de fato as vendas do novo produto.

4. (estrategia de mercado) O gerente de uma marca de embutidos esta considerando

mudar a embalagem do produto, com o intuito de que a nova embalagem chame

mais a atencao na gondola do supermercado, aumentando as vendas. Ele faz uma

pesquisa de mercado, e percebe que na semana anterior as vendas da embalagem

nova aumentaram em algumas lojas, mas que diminuiram em outras. Ele ainda

esta incerto sobre adotar ou nao a nova embalagem, ou sobre decidir gastar mais

dinheiro em uma nova pesquisa de mercado. No ultimo caso, ele deve decidir

se continua por mais algumas semanas nas mesmas lojas ja analisadas ou gastar

ainda mais dinheito para incorporar novas lojas em sua amostra.

5. Uma companhia petroleira deve decidir realizar ou nao perfuracoes em um ponto

especıfico. O custo de um teste sısmico e c, e seu resultado sobre a perspectiva

de petroleo pode ser “bom”, “medio” ou “ruim”. A operacao de perfuracao custa

75 unidades, com tres possıveis resultados: uma alta producao de petroleo que

pode ser vendida por 200 unidades, uma producao moderada de 100 unidades, ou

nenhuma. Os dados previos da companhia para lugares similares sao

alto moderado nenhum total

bom 20 10 10 40

medio 9 9 12 30

ruim 3 12 15 30

Alem disso, nao foram feitas perfuracoes em lugares com os seguintes registros

sısmicos: bom - 0; medio - 10; ruim - 20. Se tivessem sido realizadas, acredita-se

que os resultados seriam similares aos da tabela. Qual e o valor maximo c para

que o teste sısmico valha a pena de ser realizado? Se o custo do teste sısmico for 5

unidades a menos do que este valor, determine a interpretacao otima do resultado

do teste em termos da decisao de escavar ou nao. Qual e o lucro esperado?

6. Uma certa peca de um aeroplano pode ser submetida a um teste antes de ser

instalada. Este teste tem apenas 75% de chance de detectar uma falha, se ela


existir, e a mesma chance de aprovar uma peca sem defeitos. Sendo testada ou

nao, a peca poderia ser refeita a um custo bastante alto mas com a certeza de ficar

sem defeitos. Se uma peca defeituosa for instalada, a perda e L (em utilidade). Se

o processo de refazer a peca custa L/5 (em utilidade) e 1 de cada 8 pecas vem com

defeito, calcule ate quanto voce pagaria para realziar o teste e determine todas as

decisoes otimas.

7. Um medico deve decidir se submeter um certo paciente, com uma possıvel doenca,

a uma operacao de risco. Se o paciente tiver a doenca e for operado, a chance

de recuperacao e de 50%; sem a operacao, ele tem uma chance de 1 em 20 de se

recuperar. Por outro lado, se ele nao tiver a doenca e for submetido a cirurgia,

ele tem uma chance de 1 em 5 de morrer como resultado da operacao. Assessore

o medico nesta decisao (suponha que existem sempre apenas duas possibilidades,

morte ou recuperacao).

8. Refaca o exercıcio anterior, considerando recuperacao como ou completa ou parcial.

Se a operacao for realizada e houver recuperacao, esta sera sempre completa. Se

a operacao nao for realizada e houver recuperacao, esta sera parcial se ele tiver

a doenca e completa se nao (suponha que a cirurgia nao pode ser realizada mais

tarde se o paciente viver: a decisao deve ser feita ja).

Capıtulo 9

Atribuicao de probabilidades e

utilidades

O argumento que usamos ate agora foi o logico de que se voce quer tomar decisoes

sensatas, como por exemplo o uso do princıpio da coisa certa, entao a logica da situacao

de decisao o leva a considerar necessariamente probabilidades e utilidades, assim como

o princıpio da maximizacao da utilidade esperada. Qualquer outro procedimento de

decisao poderia deixar em aberto a possibilidade de fazer coisas absurdas, como perder

dinheiro com certeza como no exemplo do Dutch book.

Uma crıtica a esta abordagem e que as pessoas nao somos logicas, de modo que o

procedimento sugerido e impraticavel. No entanto, como vimos em alguns exemplos, e

possıvel desenvolver a habilidade de aplicar um raciocınio logico em decisoes na pratica:

uma forma e treinar para pensar probabilisticamente. Em particular, um estatıstico

deve estar formado para fazer isto. O fato de nao ser facil nao leva a concluir que a

teoria deva ser descartada (a mecanica newtoniana tambem foi difıcil no comeco...).

9.1 Atribuicao de probabilidades

Como mencionamos no comeco, temos tres metodos para atribuir probabilidades: regra

de escore, coerecia e metodos indiretos.

Uma regra de escore mede quao boa e nossa atribuicao de probabilidade em alguns casos

particulares (quando podemos saber de fato se o evento incerto ocorre), experiencia que

permite que melhoremos nossa atribuicao em outros casos.

74 Atribuicao de probabilidades e utilidades

Suponha que voce quer atribuir uma probabilidade p, de sua escolha, a um evento dado,

cuja probabilidade de fato e P . Usando escore quadratico, seu escore sera (p− 1)2 se o

evento for verdadeiro, com probabilidade P , ou p2 se falso, com probabilidade (1− P ).

O escore esperado, se voce escolher p, e

(p− 1)2P + p2(1− P ) = (p− P )2 + P (1− P ) ,

que alcanca seu valor mınimo quando p = P , encorajando a honestidade. Dizemos assim

que esta regra e propria: a melhor decisao e o valor correto de P .

Existem outras regras de escore que tambem sao proprias, como, por exemplo, a regra

logarıtmica, com escores − log p, se o evento for verdadeiro, e − log(1 − p), se for falso

(prove que p = P e ponto de mınimo do escore esperado).

Exercıcio 36. Refaca os exercıcios das tabelas das paginas 15 e 17, usando regra de

escore logarıtmico para ver a diferenca entre as duas regras.

Observe que esta regra aplica penalidades arbitrariamente grandes se p esta proxima

de 0 ou de 1, desencorajando a atribuicao destes valores extremais mais do que a regra

quadratica.

Outra exemplo e a regra raiz quadrada que aplica penalizacao 1/√p, se o evento for

verdadeiro, e√p, se for falso, quando atribuımos probabilidade p. Aqui, p pode ser

qualquer valor positivo. O escore esperado e

P√p

+ (1− P )√p ,

que alcanca o valor mınimo se√P/√p =

√(1− P )

√p, ou seja, quando p = P/(1−P ).

Esta regra e portanto impropria para P , no entanto, e propria para a razao de chances a

favor do evento. E possıvel verificar que esta regra implica nas regras de probabilidade

vistas (probabilidade da uniao, lei do produto, regra de Bayes etc) escritas em termos

da razao de chances.

Da mesma maneira, existem outras regras de escore que sao proprias para alguma funcao

de P . Existem, no entanto, regras que sao improprias e inadequadas para este problema.

Por exemplo, consideremos um escore dado pela distancia entre a atribuicao p e 1, se o

evento for verdadeiro, e entre p e 0, se for falsa. O escore esperado e

(1− p)P + p(1− P ) = p(1− 2P ) + P ,

que alcanca valor mınimo em p = 0 se 1− 2P for positivo, e em p = 1, se for negativo.

Assim, se P < 1/2, atribua p = 0, e se P > 1/2, atribua p = 1, qualquer um sendo

Atribuicao de probabilidades 75

aceitavel se P = 1/2. Esta regra e claramente absurda, ja que produz apenas dois valores,

0 ou 1, de acordo a se o evento e considerado menos ou mais provavel de ocorrer. Alias,

e o tipo de regra usado quando alguem deve escolher entre duas alternativas em uma

questao de multipla escolha, no lugar de poder responder a sua probabilidade para cada

uma.

Assim, podemos ter regras de escore que sao: proprias para a probabilidade, proprias

para uma funcao da probabilidade, ou improprias.

Uma dificuldade que pode aparecer com regras de escore e que uma pessoa pode es-

tar usando uma regra implıcita que e impropria para a probabilidade. Por exemplo,

consideremos uma modificacao da regra quadratica, tal que a perda quando o evento

e falso e duas vezes mais serio que quando e verdadeiro (por exemplo, orientar a es-

cavacao quando nao ha petroleo e mais grave do que orientar a nao escavacao quando

ha petroleo). Assim, os escores sao 2p2 se o evento for falso, e (1 − p)2, quando for

verdadeiro. O escore esperado e

(1− p)2P + 2p2(1− P ) ,

que alcanca seu mınimo quando p = P/(2 − P ), que e sempre menor que P . Assim,

estaremos sempre subestimando a probabilidade.

Inversamente, alguem que esta desenvolvendo um novo produto, ou medicamento ou

teoria cientıfica, pode refletir seu entusiasmo implicitamente na regra de escore, supe-

restimando a probabilidade P de que ele funcione.

Podemos corrigir esta situacao se percebermos que ela esta ocorrendo. Assim, no exem-

plo, podemos transformar o valor p em 2p/(1+p), e usa-lo como a probabilidade propria.

Usando o fato de que as probabilidades (ou razoes de chances) obedecem as regras ja

vistas, podemos melhorar a atribuicao feita pela regra de escore. Assim, ao pensar em

um evento incerto, podemos introduzir outros eventos, atribuir suas probabilidades, e

usar as leis de probabilidade para obter melhores atribuicoes que a original.

Esta e talvez a melhor forma pratica de evaluar probabilidades: pensar no problema

como um todo, e nao apenas em um evento, e pensar coerentemente sobre ele.

Assim, no exemplo do caminho pela cordilheira, usemos a seguinte notacao para os

eventos envolvidos: C, o carro e usado; O, o caminho esta aberto; G, as condicoes da

estrada sao boas; A, ocorre um acidente; T , a pessoa chega a tempo no seu destino.

Suponha que as probabilidades condicionais sao as descritas pela arvore da Figura 9.1,

de modo que: p(T | CC) = 0.9, p(O | C) = 4/5, p(G | C,O) = 2/3, p(A | C,OC) = 1/16,

p(T | C,O,G) = 0.95, p(T | C,O,GC) = 11/16 e p(A | C,O,GC) = 1/16.


Figura 9.1: Arvore de decisao para a viagem pela cordilheira.

Estas probabilidades sao atribuıdas na ordem natural do tempo. Esta forma de atri-

buicao e muito mais simples, pois estamos mais acostumados a pensar condicionalmente:

estas probabilidades condicionais podem assumir qualquer valor entre 0 e 1, sem outra

restricao com os eventos anteriores. No entanto, uma vez que estes valores sao selecio-

nados, todas as demais probabilidades do problema ficam determinadas.

Entao, por exemplo, se o carro for usado, a probabilidade de um acidente e

p(A | C) = p(A | C,O)p(O | C) + p(A | C,OC)p(OC | C) = 0.029 .

Se o agente decisor nao estiver de acordo com este valor, por nao refletir sua opiniao,

entao algumas das probabilidades anteriores devem ser revisadas, mantendo coerente-

mente as leis de probabilidade.

A coerencia sempre deve ser a principal ferramenta para entender a incerteza. Assim,

incluir outros eventos, relacionados com o evento em questao, pode facilitar o processo

de atribuicao de probabilidade.

Probabilidades pequenas

As vezes, e necessario considerar eventos com uma probabilidade muito pequena de

ocorrer, pois suas consequencias, se eles ocorrere, podem ser serias. Um acidente em

uma usina petroleira e um exemplo.

Aqui aparece um novo problema: e difıcil pensar em valores muito pequenos, como uma

probabilidade de 1 em 1000, ou 1 em um milhao. Este e um dos motivos porque log de

razao de chances podem ser preferıveis, que aqui dao os valores 3 e 6, respectivamente

(em base 10).

Um caminho util e compara o evento com outro que seja mais familiar e que tenha em

torno da mesma probabilidade. Por exemplo, 1 em 1000 e um pouco mais provavel

Atribuicao de probabilidades 77

que obter quatro 6’s em quatro lancamentos de um dado balanceado, ou 10 caras em

10 lancamentos de uma moeda equilibrada. Em uma pesquisa sobre lixo nuclear, a

probabilidade de contrair leucemia foi dita ser em torno da mesma de morrer como

resultado de usar transporte particular no lugar de transporte publico. Isto, claro,

nao implica que os eventos sejam igualmente aceitaveis: esta e uma comparacao de

probabilidades e nao de utilidades.

A forma mais comum de atribuir probabilidades muito pequenas e pela regra do produto.

Se o evento de interesse ocorre somente se varios outros eventos ocorrerem, podemos

pensar nele como “E1 e E2 . . . e En” e evaluar sua probabilidade como

p(E1) p(E2 | E1) . . . p(En | E1, . . . , En−1) .

Por exemplo, um acidente na usina ocorre se o reator sobreaquecer (E1), o mecanismo

de alarme falhar (E2) etc. Cada uma das probabilidades no produto deve ser maior que

o produto e mais razoavel que a probabilidade original, evitando as dificuldades de uma

probabilidade muito pequena.

Um problema que pode surgir aqui e pensar que o evento de interesse pode ocorrer de

apenas uma maneira. Frequentemente, isto nao e assim, e varias possibilidades precisam

ser consideradas, somando sua probabilidades se elas forem exclusivas. Consequente-

mente, e facil subestimar uma probabilidade pequena usando a regra do produto.

Outro problema e considerar os eventos E1, E2 . . . , En como independentes, quando na

verdade podem existir interacoes entre eles.

Finalmente, um terceiro metodo e o indireto, usando o fato de que agentes de decisao ti-

picamente conseguem atribuir valores para as consequencias sem pensar diretamente em

probabilidades. Este processo e mais natural para quem toma decisoes e ja desenvolveu

uma forma de pensar estes problemas.

Por exemplo, se for oferecido um bilhete que da um premio de 100 reais se o atual

governo for reeleito, e nada, caso contrario, quanto voce estaria disposto(a) a pagar pelo

bilhete? Suponha que voce diga 40 reais. Entao se tomarmos a utilidade linear, sua

probabilidade de que o evento ocorra, p, deve ser 0.4, ja que

0.4× (C + 60) + 0.6× (C − 40) = C ,

onde C e seu estado atual.

Ou seja, o valor que voce esta disposto a pagar em uma loteria como esta pode aju-

dar na atribuicao da probabilidade de interesse, desde que conhecamos a utilidade das

consequencias.


9.2 Atribuicao de utilidades

Comecemos com o caso mais simples, em que as consequencias sao completamente mo-

netarias, sem considerar outros fatores pessoais. Temos basicamente dois metodos para

atribuir utilidades: o metodo do estado fixo e o metodo da probabilidade fixa.

No primeiro metodo, o agente supoe que tem capital inicial C, e deve compara-lo com

um jogo no qual ele perde L ou ganha G, obtendo capitais C − L ou C + G. Em

particular, ele deve indicar qual probabilidade p de ganho o deixaria indiferente entre C

e o jogo.

No segundo metodo, realizamos a mesma pergunta, exceto que agora p e fixado, mas G

nao, e ele deve indicar qual valor de G o deixaria indiferente.

Veremos com detalhe o primeiro metodo. A equacao representando a indiferenca e

U(C) = pU(C +G) + (1− p)U(C − L) .

Como a utilidade nao e afetada por translacoes ou mudancas de escala, a utilidade do

pior estado C − L pode ser tomada como zero e a do melhor, C + G, como 1. Entao

U(C) = p, determinando U(C).

Para termos satisfeitas as condicoes de coerencia para a utilidade, escrevamos C −L, C

e C +G como C1, C2, C3, respectivamente, e adicionemos um quarto estado C4, melhor

que C3.

Entao, alem da questao sobre a indiferenca entre C2 e um jogo em C1 e C3, obtendo p2

(igual ao p anterior), o decisor deve comparar C3 com um jogo em C2 e C4, obtendo p3,

digamos. Neste ultimo jogo, a perda e C3 − C2 e o ganho, C4 − C3. Com U(C1) = 0 e

U(C4) = 1, as duas indiferencas sao expressas como

U(C2) = p2 U(C3) e U(C3) = p3 + (1− p3)U(C2) ,

com solucoes

U(C2) =p2p3

1− p2 + p2p3e U(C3) =

p31− p2 + p2p3

.

Assim, com estas quatro utilidades, verificamos a coerencia comparando agora C2 com

um jogo em C1 e C4 (com ganho C4−C2). Se p e a probabilidade de indiferenca obtida,

U(C2) = p ,

ja que U(C1) = 0 e U(C4) = 1, e portanto

p =p2p3

1− p2 + p2p3.

Atribuicao de utilidades 79

Qualquer outro valor diferente deste levaria a um Dutch book contra o decisor.

O procedimento geral consiste em selecionar n valores de capital C1, . . . , Cn, crescentes;

definir U(C1) = 0 e U(Cn) = 1, e pedir as comparacoes de Ci com um jogo em Ci−1 e

Ci+1, para i = 2, . . . , n − 1. As probabilidades obtidas determinam todas as utilidades

U(Ci) e a coerencia pode ser verificada usando as comparacoes de Cj com um jogo em

Ci e Ck, i < j < k, com perda Cj − Ci e ganho Ck − Cj .

Este metodo, usado para consequencias monetarias, se aplica igualmente bem a con-

sequencias medidas em termos de uma unica quantidade: unidades de energia dis-

ponıveis, quantidade de recursos hıdricos, classificacao em exame, tempo de viagem entre

dois lugares etc. De fato, o que e necessario e uma ordenacao entre as consequencias,

mais do que o valor numerico.

Por exemplo, a qualidade da visao e medida em uma escala de 0 a 10, com 0 corres-

pondendo a cegueira completa e 10 a visao perfeita. Os valores intermediarios apenas

oferecem uma ordem: 5 e melhor que qualquer numero anterior a 5, mas nao tem ne-

nhum sentido como sendo o meio entre cegueira e visao perfeita. O metodo de coerencia

que descrevemos funciona aqui com 11 estados, C0, . . . , C10, correspondentes ao estado

i na escala da visao.

Considere um paciente com visao no estado 1, considerando uma cirurgia que pode

deixa-lo mais provavelmente no estado 6, mas que tem uma pequena probabilidade de

falhar, deixando-o totalmente cego, no estado 0. Isto envolve uma comparacao entre

C1 e um jogo em C0 e C6. Tal comparacao pode ser mais natural, pelo menos para o

cirurgiao oftalmologista, do que uma entre C5 e um jogo em C4 e C6, dado que o ultimo

envolve apenas pequenas chances e nao seria uma forma normal de cirurgia.

Este exemplo e interessante pela forma da funcao de utilidade. Com U(C0) = 0 e

U(C10) = 1 como antes, temos que U(C1) e bastante grande, digamos em torno de 1/2

ou mesmo de 2/3. Isto expressa a experiencia de que mesmo uma pequena quantidade

de visao e muito valiosa. Ja U(C5) e quase 1, pois o uso de oculos pode fazer com que o

paciente esteja proximo de C10. Em particular, podemos concluir que a cirurgia anterior

so vale a pena se a probabilidade de cegueira total for de fato muito pequena.

O mesmo metodo pode ser generalizado, com dificuldades substanciais, de uma para

varias quantidades.

Vejamos o caso de duas variaveis, considerando o problema de decisao de onde construir

um novo aeroporto para uma cidade. Dentre as varias quantidades envolvidas, consi-

deremos apenas duas: a quantidade de poluicao causada pelos avioes, s, e o tempo de

viagem ate o aeroporto, t.


A utilidade claramente decresce quando qualquer uma destas variaveis cresce, dado que

preferimos poluicao e tempo de viagem mınimos. Estamos interessados em medir a

utilidade U(s, t). Ao fazer isto, podemos perceber que devem existir varios pares (s, t)

com mesma utilidade, de modo que somos indiferentes entre eles. Geralmente, podemos

definir curvas de indiferenca no plano (s, t), com a propriedade de indiferenca entre pares

de uma mesma curva. A Figura 9.2 mostra uma possıvel situacao, onde os dois pontos

marcados sao indiferentes entre si.

Figura 9.2: Curvas de indiferenca para poluicao e tempo ate o aeroporto.

Uma possıvel abordagem para este problema e primeiro encontrar as curvas de indi-

ferenca, o que nao envolve nenhuma mensuracao de utilidade nem de probabilidade,

apenas um julgamento de igualdade e de quanto um crescimento em s equilibra uma

diminuicao em t. Uma vez que estas curvas sao determinadas, o problema volta ao

problema ja considerado de encontrar o valor da utilidade de cada curva.

Por exemplo, tres situacoes, como as marcadas com tracos na Figura, podem ser sele-

cionadas par acomparar a intermediaria com um jogo nas outras duas. Aqui diversos

pontos podem ser selecionados: mantendo t fixo, como no exemplo, ou s fixo, ou vari-

ando ambos s e t. Alem de coerencia, devemos manter a atencao em perguntar sobre

jogos que facam sentido e sejam realistas para a pessoa cuja utilidade quer ser obtida.

9.3 Consideracoes

A abordagem utilizada neste texto e logica e racional (alguns podem dizer fria e desu-

mana). A pergunta de se existe algum criterio que alguem poderia razoavelmente querer

Consideracoes 81

usar em suas decisoes, vimos que este deve ser a coerencia, tanto em suas preferencias

entre consequencias quanto em suas opinioes sobre eventos incertos.

Um dos problemas desta teoria e o que acabamos de discutir neste capıtulo: a dificul-

dade em atribuir valores para as probabilidades e utilidades envolvidas. Novamente,

a coerencia e a principal ferramenta. O segundo ponto fraco e que a teoria vista e

aplicavel a um unico decisor, e nao a situacoes com mais de um decisor, como quando,

por exemplo, um comite (ou juri, comunidade, cidade ou paıs) deve entrar em acordo

sobre decisoes a serem tomadas. E importante ressaltar que nao existe uma teoria

normativa para varios decisores, se bem que ha varios trabalhos nessa area.

Mesmo nao havendo uma solucao coerente para decisoes em grupo, podemos seguir o

procedimento de um unico decisor: listar as possıveis acoes sugeridas pelos membros

do grupo, possivelmente adicionando outras que surjam da discussao do grupo; listar

os eventos incertos considerados pelos membros do grupo que sejam relevantes para as

acoes que o grupo pretende tomar.

Na atribuicao de probabilidades, suponha que dois membros atribuam probabilidades

diferentes p1(θ) e p2(θ) a um mesmo evento θ. Como estas probabilidades refletem a

informacao atual de cada decisor, deverıamos escrever mais corretamente p(θ | A1) e

p(θ | A2), onde Ai e a informacao disponıvel ao assessor i. E entao natural que ambos

comuniquem suas informacoes um ao outro, de modo que ambos possuam A1 e A2. E

mais raozavel portanto pensar que p(θ | A1, A2) poderia ser o mesmo para ambos os

membros.

Ponderar a informacao entre os membros e claramente um aspecto importante do tra-

balho do comite. De fato, e essencial para chegar a um razoavel consenso entre as

probabilidades dos membros.

O mesmo pode ser feito para as utilidades, se bem que aqui a situacao e mais complicada:

mesmo tendo as mesmas probabilidades, as pessoas podem discordar sobre a preferencia

nas consequencias.

Existem trabalhos mostrando que consenso, no sentido de passar de preferencias indivi-

duais para preferencias de um grupo, nao existe, sem violar alguns requerimentos obvios

(ver Arrow, Social choice and individual values, e a literatura subsequente).

O mais difıcil tipo de problema de decisao envolve dois ou mais decisores oponentes entre

si (indivıduos, grupos, governos etc). Neste caso, temos as listas de decisoes possıveis

para cada oponente: d1, d2, . . . e d′1, d′2, . . . , e as utilidades das consequencias para cada

par de acoes (di, d′j), que sao percebidas de forma diferente.


O exemplo mais simples desta situacao e um jogo com dois jogadores, com di e d′i suas

respectivas estrategias, e onde um jogador ganha e o outro perde. A solucao logica

para este jogo e chamada minimax, mas nao ha uma solucao geral para o problema de

conflito.

Um procedimento possıvel e o seguinte: o jogador 1 esta incerto sobre a escolha d′i do

jogador 2, entao atribui probabilidades p(d′i). Ele pode assim escolher di de modo a

maximizar a utilidade esperada. O jogador 2 pode fazer a mesma coisa, atribuindo

probabilidades p(di) e usando sua utilidade. Isto e sensato, mas tem a dificuldade de

que o jogador 1 deve se colocar no lugar do jogador 2, para atribuir suas probabilidades,

que dependem tambem das acoes do jogador 2. Em outras palavras, e logicamente difıcil

atribuir probabilidades p(d′i) ou p(di), e a dificuldade nao esta somente na atribuicao.

O dilema do prisioneiro Este e um famoso exemplo de uma situacao de conflito:

Joao e Maria sao ambos prisioneiros, impedidos de se comunicarem entre si. Cada um

deles tem duas estrategias possıveis: colaborar ou nao. As utilidades de cada decisao

conjunta sao as da tabela abaixo. Se ambos colaborarem, os dois ficam melhor (1, 1) do

que se ambos nao colaborarem (0, 0). Mas se um colaborar e o outro nao, aquele que

colaborou tem prejuizo -1, e o outro um ganho 2.

Joao \ Maria colabora nao colabora

colabora (1, 1) (−1, 2)

nao colabora (2,−1) (0, 0)

Analisemos o problema do ponto de vista de Maria. Ela nao sabe o que Joao vai fazer

e esta analisando a probabilidade de que ele colabore. Nisso ela percebe que se ele

colaborar, a melhor decisao para ela e nao colaborar, ganhando 2 no lugar de 1; e se ele

nao colaborar, ainda assim a melhor decisao para ela e nao colaborar, ganhando 0 no

lugar de −1. Assim, a probabilidade nao e relevante, ja que sua utilidade e maximizada

com certeza ao nao colaborar. Similarmente, Joao chega a mesma conclusao e decide

nao colaborar, de modo que ambos tem utilidade zero.

Mas claramente esta estrategia nao e otima, ja que ambos ganhariam 1 se ambos cola-

borassem.

A dificuldade com a colaboracao de ambos, que nao e a decisao com maior utilidade

esperada, e que vale a pena para qualquer um dos dois nao cooperar. Por exemplo, se

Maria colaborar, achando que Joao o fara, mas ele se arrepender no ultimo minuto, ela

cai de 1 para −1. Para Joao valeria a pena voltar atras neste caso, pois ele subiria de 1

para 2.

Minimax 83

A solucao com ambos colaborando e altamente instavel, enquanto que a solucao com

nenhum colaborando e estavel: nao se ganha nada fazendo o oposto.

9.4 Minimax

Outro metodo de solucao usado em situacoes como esta e o chamado minimax.

Este metodo reconhece e usa utilidades (ou perdas), mas nao probabilidades. Assim, a

tabela de decisao contem apenas a primeira informacao, como no exemplo abaixo.

θ1 θ1

d1 u 0

d2 1 1

Aqui u e um valor maior que 1 (se fosse menor, entao d2 seria a melhor decisao com

certeza). A tabela tem a forma conhecida: d2 e um investimento seguro certo de obter

1, e d1 e um jogo onde podemos ganhar um valor maior u ou perder tudo.

O metodo minimax funciona assim: para cada linha (ou seja, para cada decisao), sele-

cione a menor utilidade. Na tabela, e 0 para d1, e 1 para d2. Agora escolha a decisao

que tem o maior destes valores. No caso, d2, com valor 1. Assim, o metodo minimax

aconselha a escolher d2 e nao apostar.

Em geral, com utilidades uij , a decisao e escolhida de modo a maximizar minj uij .

O metodo proposto ate agora foi atribuir probabilidades, pj = p(θj), e escolher d2 se

1 > up1, ou u < 1/p1. Caso contrario, escolher d2.

Consequentemente, o metodo minimax diz para nunca apostar, enquanto que nosso

metodo diz para apostar se u for grande o suficiente.

Esta e uma falha importante do metodo minimax: voce recusaria um jogo onde poderia

perder 1 real e ganhar um milhao? A maioria de nos nao recusaria, a menos que p1 fosse

muito pequeno.

Outra crıtica para o metodo minimax e que ele nao leva em conta a informacao existente.

Se o decisor receber a informacao de que θ1 e quase certo de ocorrer, na decisao minimax

ele recusaria d1, mesmo estando quase certo de obter um benefıcio com isso.

No caso de uma peca que sera usada (como no exercıcio do aviao), seja θ1 o evento que

a peca esta boa, e θ2, que esta defeituosa. Seja d1 a decisao de usa-la e d2, comprar uma

nova peca. Entao, sem importar quantos testes forem realizados indicando que a peca

esta boa, a recomendacao minimax e comprar uma nova peca.


Alem destas crıticas, observe que o metodo minimax e incoerente.

De fato, considere a tabela de decisao a seguir

θ1 θ1

d3 0 u

d2 1 1

onde consideramos a decisao d3, que e o jogo oposto a d1. Nesta tabela, a decisao

minimax continua sendo d2.

Agora, consideremos conjuntamente as decisoes d1, d2 e d3. Pelo argumento acima, d2

e melhor que ambas d1 e d3.

Considere uma nova acao d, construıda da seguinte maneira: uma moeda equilibrada e

lancada, escolhendo d1 se sair cara ou d3, se sair coroa. Assim as utilidades de d para

θ1 e θ2 sao ambas iguais a u/2. Ou seja, se u > 2, entao d e preferıvel a d2, de acordo

com o criterio minimax.

Consequentemente, temos uma situacao em que nem d1 nem d3 sao preferidas, mas uma

escolha entre elas baseada no lancamento de uma moeda e a melhor decisao. Isto e

incoerencia.

Minimax com perdas

O metodo minimax usualmente nao e aplicado a utilidades, como acima, mas a perdas,

onde uma perda lij e definida como a diferenca entre a utilidade da melhor acao para

θj e uij . Como as perdas sao iguais a uma constante menos as utilidades, este metodo

escolhe a decisao que minimiza maxj lij .

Por exemplo, consideremos as tabelas de utilidades e de perdas abaixo.

θ1 θ1

d1 8 0

d2 2 4

utilidades

θ1 θ1

d1 0 4

d2 6 0

perdas

Aplicando minimax na tabela de perdas, obtemos para d1 um maximo de 4, e para d2

um maximo de 6. Assim, d1 e selecionada, ja que tem menor valor.

No entanto, a incoerencia continua existindo. De fato, adicionemos novamente uma

decisao d3.

Minimax 85

θ1 θ1

d1 8 0

d2 2 4

d3 1 7

utilidades

θ1 θ1

d1 0 7

d2 6 3

d3 7 0

perdas

Os maximos para as tres linhas sao, respectivamente, 7, 6 e 7, de modo que a melhor

decisao e d2, com um mınimo de 6. Consequentemente, o efeito de introduzir uma nova

decisao d3 e mudar a preferencia de d1 sobre d2, no seu oposto. Isto e incoerente. E

como se voce, tendo decidido ficar em casa em vez de ir ao teatro, resolvesse mudar de

opiniao porque ficou sabendo que tem um filme novo passando.

Assim, dentro de nossa exigencia de coerencia, o metodo minimax e inaceitavel, tendo

como grande falha o fato de que ignora qualquer atribuicao (mesmo nao numerica) das

incertezas associadas aos eventos.

No caso de uma situacao de conflito, em que uma pessoa ganha e a outra perde, no

entanto, ele pode ser interessante. Este tipo de situacao e chamado de jogo com soma

zero ou com dois oponentes.

Para aplicar este princıpio, usaremos o que chamamos decisao mista, isto e, uma decisao

na qual misturamos, digamos d1 e d2, aplicando d1 com probabilidade p e d2, com

probabilidade 1− p (como a que usamos no exemplo acima para definir d).

Estas decisoes mistas nao tem importancia ao maximizar a utilidade esperada, ja que

nao podem ter utilidade esperada maior que a da melhor decisao. Em uma situacao de

conflito, elas podem ter algum merito ao esconder de Maria o que o Joao vai decidir.

Isto e particularmente verdadeiro, em repeticoes do conflito ou do jogo.

Um exemplo simples e dado pelo seguinte jogo: Joao e Maria simultaneamente mostram

uma moeda, ou com cara ou com coroa voltada para cima. Joao ganha as duas moedas

se as faces forem iguais, e Maria ganha as duas moedas, se elas nao forem. Na tabela

abaixo, mostramos as duas estrategias de mostrar cara, mostrar coroa, e uma estrategia

mista de escolher a face com probabilidade 1/2.

Joao \ Maria cara coroa mista

cara (1,−1) (−1, 1) (0, 0)

coroa (−1, 1) (1,−1) (0, 0)

mista (0, 0) (0, 0) (0, 0)

Claramente, esta terceira decisao tem utilidade zero, sendo a decisao minimax.

Assim, se o jogo for realizado repetidas vezes, o procedimento minimax pode ser bom,

e se Maria tiver uma outra estrategia, Joao pode usar isso a seu favor. Por exemplo,


ao realizar este jogo com uma crianca pequena, podemos imaginar que ela alternara

sua escolha mais frequentemente do que seria esperado por chance. Assim, poderıamos

facilmente ganhar (ou perder, se quisermos deixa-la feliz) supondo que ela fara o oposto

do que fez na ultima vez.

Para um unico jogador, a maximizacao da utilidade esperada e o sensato a ser feito, e ela

sera tambem minimax para Maria se ela pensar que Joao tem a mesma probabilidade

de usar cara ou coroa.

Bibliografia

[1] M. DeGroot (2004) Optimal statistical decisions. Wiley.

[2] D.V. Lindley (1985) Making decisions. Wiley.

[3] J. Pratt, H. Raiffa, R. Schlaifer (1995) Statistical decision theory. MIT Press.

Introdu˘c~ao a teoria da decis~ao - ime.unicamp.brlaurarifo/aulas/mi686/apostila.pdf ·...

Documents

Transcript of Introdu˘c~ao a teoria da decis~ao - ime.unicamp.brlaurarifo/aulas/mi686/apostila.pdf ·...