Introdu˘c~ao a teoria da decis~ao - ime.unicamp.brlaurarifo/aulas/mi686/apostila.pdf ·...
Transcript of Introdu˘c~ao a teoria da decis~ao - ime.unicamp.brlaurarifo/aulas/mi686/apostila.pdf ·...
Universidade Estadual de Campinas
Introducao a teoria da decisao
Conceitos basicos
Prof. Laura L. R. Rifo
- 2o semestre, 2014 -
Conteudo
1 Introducao 1
1.1 Tomada de decisao como uma escolha entre acoes . . . . . . . . . . . . . 2
1.2 O papel da incerteza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 O modelo para a tomada de decisao . . . . . . . . . . . . . . . . . . . . 6
1.4 Plano do curso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2 Medida numerica para incerteza 9
2.1 Mensuracao da incerteza atraves de um padrao . . . . . . . . . . . . . . 11
Quao bom e o seu chute em probabilidade? . . . . . . . . . . . . . . . . 14
2.2 Mensuracao da incerteza atraves de uma regra de escore . . . . . . . . . 16
A regra de escore como auxılio na atribuicao de uma probabilidade . . . 17
2.3 Atribuindo probabilidade com um seguro . . . . . . . . . . . . . . . . . 19
3 Leis da probabilidade 21
3.1 Coerencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.2 Extensao da conversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.3 Regra de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.4 Paradoxo de Simpson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.5 Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.6 Dutch book . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4 Medida numerica para consequencias 31
4.1 As consequencias de uma decisao . . . . . . . . . . . . . . . . . . . . . . 31
4.2 Um exemplo de incoerencia . . . . . . . . . . . . . . . . . . . . . . . . . 34
ii Conteudo
5 A utilidade do dinheiro 37
5.1 Incoerencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.2 A utilidade e crescente e limitada . . . . . . . . . . . . . . . . . . . . . . 39
5.3 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5.4 Consequencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Aversao ao risco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
Premio de probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
Aversao ao risco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
6 Teorema de Bayes 45
6.1 Informacao e teoria de decisao . . . . . . . . . . . . . . . . . . . . . . . . 45
6.2 Erros dos dois tipos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
6.3 Amostragem de atributos . . . . . . . . . . . . . . . . . . . . . . . . . . 48
6.4 Probabilidades vagas ou precisas . . . . . . . . . . . . . . . . . . . . . . 50
7 O valor da informacao 53
7.1 Informacao perfeita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
7.2 Valor esperado da informacao perfeita . . . . . . . . . . . . . . . . . . . 55
7.3 Perdas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
7.4 Informacao perfeita com uma utilidade qualquer . . . . . . . . . . . . . 58
7.5 Valor esperado da informacao parcial . . . . . . . . . . . . . . . . . . . . 60
7.6 Aplicacao em amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . 64
8 Arvores de decisao 65
8.1 Exemplo (petroleira) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
9 Atribuicao de probabilidades e utilidades 73
9.1 Atribuicao de probabilidades . . . . . . . . . . . . . . . . . . . . . . . . 73
Probabilidades pequenas . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
9.2 Atribuicao de utilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
9.3 Consideracoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
Conteudo iii
9.4 Minimax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
Minimax com perdas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Capıtulo 1
Introducao
Nesta parte do curso, veremos os conceitos gerais abordados em problemas de tomada
de decisao: incerteza, consequencias, informacao. Estas notas estao fortemente baseadas
nos livros classicos de Lindley [2] e Pratt et al. [3].
Pretendemos estudar como as decisoes sobre o curso de acao a seguir devem ser tomadas.
Todos devemos tomar decisoes todos os dias, a maioria triviais: qual blusa usar, o que
almocar na cantina, etc. No entanto, podemos facilmente imaginar situacoes em que este
processo nao e tao trivial, referentes as proximas eleicoes, a uma proposta de casamento,
a um novo emprego ou bolsa, a compra de uma casa, nas quais as consequencias precisam
ser bem pensadas antes de chegar a uma conclusao.
As vezes, nossas decisoes podem afetar nossos colegas, e nao apenas a nos mesmos ou
nossas famılias, como as de alguem em um cargo de chefia; ou afetar uma populacao
inteira, como as de alguem em um cargo importante do governo. Todos estamos ligados
a processos de tomada de decisao, seja como agentes decisorios, seja afetados pelas suas
consequencias.
Um dos objetivos deste curso e apresentar aspectos comuns a tomada de decisao em
diversos ambitos. A escolha de uma acao, como atividade humana, e dependente da
personalidade do indivıduo que a fara, e neste aspecto tem um forte elemento pessoal,
subjetivo no processo. No entanto, e possıvel tirar proveito de um olhar mais distante
ou abstrato em algumas situacoes; ha partes em um processo de decisao passıveis de um
estudo analıtico e sistematico. Por exemplo, o gerente de uma empresa usa a informacao
dada por seus contadores.
Nao veremos neste curso nenhum algoritmo para indicar o curso de acao correto em um
dado problema. Apenas pretendemos mostrar algumas linhas gerais para auxiliar uma
2 Introducao
tomada de decisao sensata e que permitem quebrar um problema de decisao complexo
em partes menores (e mais simples) cuja analise pode ser combinada para chegar a uma
solucao para o problema completo.
Observando tomadas de decisao racionais e outras, com resultados insatisfatorios, po-
demos deduzir algumas regras que devem ser seguidas para assegurar a coerencia de
uma decisao. A forma mais simples de obter esta coerencia e desenvolvendo padroes de
comparacao adequados.
Imagine um predio, grande e complicado, e concentre-se apenas em suas dimensoes,
sem se importar com o uso dele nem com as pessoas que o habitam; pense apenas
nos comprimentos das salas, portas, moveis, etc. O predio devem manter uma certa
consistencia em suas dimensoes: a janela nao pode ser mais alta que a parede, por
exemplo. Mas no lugar de comparar as duas medicoes, o arquiteto compara cada uma
delas com um padrao, como o metro.
Ao tomar uma decisao tambem temos padroes de comparacao para cada uma das par-
tes componentes do problema geral. Estes padroes nos permitirao desenvolver o que
chamamos de tomada de decisao coerente.
A abordagem que daremos e prescritiva, nao descritiva. Ou seja, nao estudaremos
como as decisoes sao tomadas na sociedade moderna (se bem que com as ferramentas
que veremos poderıamos descrever que o ser humano e em geral incoerente). Nossa
abordagem pretende prescrever bons metodos que deveriam ser usados ao selecionar um
curso de acao. Tambem pretende ser normativa: fazer o estudo logico da escolha entre
decisoes do ponto de vista puramente matematico e dizer como uma pessoa deveria se
comportar. Esta analise normativa entrega o fundamento logico sobre o qual os metodos
praticos e operacionais podem se basear.
1.1 Tomada de decisao como uma escolha entre acoes
Uma pessoa enfrenta um problema de decisao sempre que existir uma escolha de pelo
menos dois cursos de acao. Se voce tem uma unica blusa para usar, nao ha o que decidir.
A primeira coisa a fazer em uma situacao de decisao e considerar quais sao todas as
possıveis acoes. Tipicamente, nao e aconselhavel incluir uma decisao e sua negacao
como a segunda decisao possıvel. Por exemplo, se voce estiver considerando ir ao teatro
em um certo dia, o problema de ir ou nao ir ao teatro nao e um problema de decisao
bem colocado. A decisao de nao ir, na verdade, envolve diversas decisoes possıveis: ficar
Tomada de decisao como uma escolha entre acoes 3
em casa assistindo TV, ficar estudando, ler um livro, namorar, etc. O problema deve,
portanto, ser colocado considerando estes outros cursos de acao.
Este aspecto e muito aplicavel, mas tambem provavelmente esquecido em muitas decisoes
importantes. Por exemplo, ha alguns anos, em meu condomınio foi votada a construcao
de uma nova guarita. O fundo de reserva do condomınio era insuficiente e havia portanto
a necessidade de arrecadar um fundo adicional para a obra, no valor previsto incialmente
de 160 mil reais. A decisao foi votada e aprovada por maioria. Esta foi uma decisao
de gastar 160 mil reais na construcao de uma guarita, sem considerar outros usos dessa
quantidade de dinheiro que poderiam ter sido mais uteis para o condomınio. E como
decidir ir ao teatro sem considerar as demais alternativas.
Muitas decisoes importantes do governo frequentemente parecem, a nos cidadaos co-
muns, ser tomadas sem considerar outras possibilidades, se bem que deveria ser uma
das obrigacoes da oposicao chamar a atencao para elas, antes de serem votadas.
Assim, em qualquer problema de decisao, devemos fazer inicialmente uma lista de todas
as alternativas razoaveis de acoes possıves. Por exemplo, um comerciante ao ter que de-
cidir quantos itens comprar de seu fornecedor poderia fazer um pedido variando de 0 ate
a capacidade de sua loja. Estas sao apenas as possibilidades imediatas. Frequentemente,
nao podemos ter certeza de que alguma possibilidade atraente nao foi omitida: sempre
existe a chance de que alguem imaginativo apareca com uma opcao nao considerada
pelo agente decisor. Uma parte do sucesso de um bom tomador de decisao e sua habili-
dade em propor novas ideias, mais do que a habilidade de selecionar de uma lista. Para
desenvolver este fator humano nao ha conselho cientıfico que possa ser oferecido neste
curso. Quando conseguimos fazer uma lista razoavelmente completa das possibilidades,
dizemos que ela e uma lista exaustiva.
E tambem conveniente estabelecer que apenas uma das decisoes dessa lista pode ser
tomada. Escolher de um cardapio, por exemplo, nao satisfaz esta condicao, pois po-
derıamos pedir entrada e sobremesa. Mas a escolha da sobremesa satisfaz (usualmente).
Uma lista com esta propriedade e facil de construir a partir de qualquer lista, pegando
todos os pares ou ternas, ou outras ordenacoes, que poderiam ser escolhidas exclusi-
vamente, ou sequencialmente: primeiro a entrada, depois o prato principal, depois a
sobremesa.
Uma lista com esta propriedade e dita uma lista de decisoes exclusivas.
As decisoes que consideraremos sao ambas, exclusivas e exaustivas: uma delas deve ser
tomada, e no maximo uma delas pode ser tomada.
4 Introducao
Podemos descrever os elementos desta lista com uma linguagem neutra: decisao 1,
decisao 2, etc, e denota-los simplesmente por d1, d2, . . . , dm, para m cursos de acao
(assumiremos m finito).
1.2 O papel da incerteza
A selecao de um unico item em uma lista, que seja melhor em algum sentido, como um
curso de acao a seguir, e, em princıpio, simples, se tivermos uma informacao completa.
Por exemplo, o comerciante anterior nao teria nenhuma dificuldade em fazer o pedido
se soubesse exatamente quantos itens ele vendera antes da entrega seguinte. A escolha
no cardapio poderia ser facilitada se tivermos informacao sobre a qualidade de cada
opcao (”hoje recomendamos o salmao: ele foi pescado ontem”e uma informacao tıpica
e valiosa).
Ao tomarmos uma decisao em um contexto onde todos os possıveis fatores importan-
tes sao completamente conhecidos (com certeza), os motivos que poderiam justificar
uma decisao errada sao um planejamento descuidado ou dificuldades computacionais ou
tecnicas. No entanto, quando o contexto envolve situacao de incerteza a respeito de
alguns dos fatores, nao e possıvel afirmar de antemao qual e a decisao (mais) correta.
Sob situacoes de incerteza, o agente decisor e obrigado a apostar, esperando ganhar,
sabendo que poderia perder.
Se a dificuldade de uma decisao estiver nas incertezas da situacao, entao estas incertezas
devem ser consideradas no estudo, conjuntamente com as decisoes em si.
Sobre o comerciante, por exemplo, suponha que m e a capacidade de armazenamento da
loja e, por simplicidade, que no momento da compra, ele nao tem nenhum item. Assim,
podemos denotar por di a decisao de comprar i itens, i = 1, . . . ,m. Denotemos por J o
total de itens que ele vendera antes da ordem seguinte, e suponhamos que 1 ≤ J ≤ m.
Se o comerciante soubesse que ele vendera J = j itens entao ele tomaria a decisao dj .
Como ele nao sabe, ele poderia usar sua experiencia anterior para ter uma ideia do
valor de J . Por exemplo, ele poderia ter quase certeza de que J ≥ 2, mas achar pouco
provavel vender mais que 25. E esta incerteza que devemos ser capazes de incluir em
nossa analise.
Chamamos evento qualquer ocorrencia ou acontecimento. Um evento sobre o qual temos
a informacao de se ele ocorreu (ou ocorrera) ou nao e chamado um evento certo. Caso
contrario, o chamamos evento incerto. Assim, o evento de que a loja esta vazia e certo,
e o de que ele vendera 4 itens e incerto.
O papel da incerteza 5
Denotemos por θj o evento que o comerciante vendera exatamente j itens. Assim, temos
m tais eventos (incertos). Note que estes eventos, assim como as decisoes, tambem sao
exclusivos e exaustivos.
Nem sempre e simples enumerar os eventos incertos envolvidos em um problema. Por
exemplo, suponha que voce esta em Vina del Mar, no Chile, e gostaria de ir para a cidade
de Mendoza, na Argentina, durante o mes de agosto, no meio do inverno. Suponha que
voce tem duas opcoes: d1, ir de carro ou d2, ir de aviao. A incerteza entra no problema
porque voce nao sabe se a estrada estara fechada por causa da neve, evento que acontece
nesta epoca, as vezes por algumas horas ate por alguns dias. O clima na costa e muito
diferente do da cordilheira, de modo que e irrelevante olhar pela janela para ver o tempo;
alem disso, a previsao do tempo costuma falhar. O que voce deve fazer?
Uma analise simples sugere que existem dois eventos incertos: θ1, a estrada estara
fechada, e θ2, ela estara aberta. Estes eventos sao claramente exaustivos e exclusivos.
Mas, pensando melhor, voce percebe que eles nao refletem adequadamente os eventos
incertos do problema. Suponha que a estrada esta aberta, mas a visibilidade e ruim ou
a estrada estara com gelo, de modo que voce deveria dirigir lentamente e com cuidado,
levando bastante tempo para chegar. Por outro lado, se a estrada estiver aberta e
o tempo ensolarado, o passeio sera muito agradavel e com uma vista linda. Assim,
poderıamos ter tres eventos incertos: θ1, a estrada estara fechada, θ2, ela estara aberta
e o tempo ruim, e θ3, ela estara aberta e o tempo ensolarado. Mas pensando mais um
pouco, poderia haver outras possibilidades, como uma pane ou acidente com o carro,
suficientemente serio para estragar o passeio. O acidente tambem poderia ocorrer com
o aviao. Voce poderia achar que isto e menos provavel, mas poderia haver um atraso
grande que levasse voce a perder a reserva no hotel em Mendoza, o que ja e bem mais
provavel.
Todas estas consideracoes sugerem abrir o leque para mais eventos incertos, que dificil-
mente serao todos listados. (Faca sua propria lista de eventos para este exemplo.)
Um ponto importante ao definir os eventos incertos que serao considerados e que eles
devem cobrir todas as contingencias possıveis de afetar a tomada de decisao, tais como
acidentes no carro ou atrasos no aviao. Por outro lado, eventos irrelevantes, como a mare
esta alta ou baixa, podem ser omitidos: eles sao irrelevantes porque nao influenciam a
escolha do carro ou do aviao.
Estes eventos podem ser escritos de maneira exclusiva e exaustiva, de modo que um, e
apenas um, deles ocorrera.
Assim como no caso da lista de decisoes possıveis, aqui tambem ha espaco para a sub-
6 Introducao
jetividade: alguem poderia considerar relevante um evento que outra pessoa esqueceu
ou desconsiderou. A capacidade de julgar a relevancia dos fatores e uma habilidade
importante ao tomar decisoes.
1.3 O modelo para a tomada de decisao
Em resumo, consideraremos uma lista d1, . . . , dm de decisoes exclusivas e exaustivas, e
uma lista θ1, . . . , θn de eventos incertos exclusivos e exaustivos. O nosso problema e
selecionar um unico item da primeira lista, sem saber qual elemento da segunda lista
ocorrera.
Este e o modelo basico que usaremos em nossa discussao de tomada de decisao.
Ele poderia ser considerado simples demais, por ignorar certas caracterısticas de um
problema de decisao tıpico; ou complicado demais, por ser frequentemente impossıvel
considerar todas as decisoes e todos os eventos incertos. E sempre difıcil julgar se um
modelo e adequado ou nao. No entanto, em um problema de decisao complicado, o
simples fato de tentar fazer estas duas listas pode ser bastante esclarecedor.
Perceber que tomar uma decisao envolve uma comparacao entre alternativas, e assim
levando a considera-las, ja e em si um avanco. Perceber que e necessario considerar as
incertezas que podem afetar o problema faz com que vejamos os resultados de nossa
tomada de decisao menos descuidadamente. (Ainda mais: se voce resolver desistir
do curso e ficar apenas com esta primeira aula, seus procedimentos de decisao ja serao
melhorados.) Pensar seriamente nas listas d1, . . . , dm e θ1, . . . , θn pode ser muito eficiente
para entender o problema.
Como exercıcio intelectual, pegue o jornal de hoje e veja um dos muitos exemplos de
tomada de decisao que aparecem nele, aplicando a analise que vimos aqui (mesmo que
a reportagem nao entregue suficientes detalhes, conhecidos pelos agentes decisorios).
Outro exercıcio interessante: considere algum momento de sua vida em que teve que
tomar uma decisao importante, e faca a lista das opcoes de acao que voce tinha e dos
eventos incertos na epoca; analise as consequencias de cada decisao em cada um destes
eventos incertos; perceba quais foram seus mecanismos para reduzir a incerteza destes
eventos, ou seja, como voce juntou informacao sobre estes eventos. Depois desta analise,
e sem considerar as consequencias que voce conhece hoje, voce tomaria a mesma decisao?
Plano do curso 7
1.4 Plano do curso
O primeiro dos elementos que analisaremos e o conceito de eventos incertos. Veremos
como a incerteza pode ser descrita numericamente em termos de probabilidade, cujas
leis nos permitem assegurar a coerencia.
Um curso de acao leva a consequencias, o que nos leva a desenvolver uma segunda
escala numerica para descrever o seu merito: resultados desejaveis tem um alto valor, e
indesejaveis, um baixo valor. Esta medida de merito e chamada utilidade. Veremos as
condicoes que ela deve satisfazer para, novamente, garantir a coerencia.
Estes dois conceitos numericos, de probabilidade e de utilidade, formam uma utilidade
esperada. O resultado principal deste curso pode ser expressado na ideia de que uma
decisao deve ser tomada maximizando a utilidade esperada.
A reacao natural de alguem que deve tomar uma decisao em uma situacao de incerteza
e tentar diminuir o grau de incerteza, conseguindo mais informacao. Veremos tambem
como incorporar informacao adicional na analise de um problema. O resultado basico
aqui e a regra de Bayes. Mesmo se a informacao for dada, ela tem algum custo, e neste
ponto queremos saber quanto custa a informacao, ou melhor, quanto deverıamos pagar
por uma informacao.
Exercıcio 1. Um cardapio de almoco contem apenas dois itens: um prato com carne
e um com peixe. Voce pensa que cada um pode ser ou bom ou ruim. Liste os eventos
incertos exclusivos e as decisoes exclusivas. Voce tambem poderia considerar outra de-
cisao: ir embora e comer em outro lugar. Voce tambem poderia considerar que outro
evento relevante e o que tem de comida para o jantar em sua casa: suponha de novo que
pode ser ou carne ou peixe. Repita o exercıcio. Suponha que voce decide que se a carne
estiver boa, voce almocara isso, independentemente do que tem para jantar. Mostre que
nao sao necessarios mais que 5 eventos incertos.
Exercıcio 2. Um gerente de uma empresa de transportes tem que comprar novos ca-
minhoes. Existem apenas dois tipos disponıveis: de 5 toneladas ou de 10 toneladas, e
ele precisa de uma capacidade total de 30 toneladas. Ele afirma portanto que tem duas
decisoes possıveis: d1, comprar 6 caminhoes mais leves, ou d2, comprar 3 dos mais
pesados. Esta lista e razoavelmente exaustiva? Se nao, faca uma.
Exercıcio 3. Uma empresa pode produzir unidades de tres tipos, A, B, C. O trabalho
de um dia produz tres lotes. Todas as unidades produzidas em cada um dos lotes sao
do mesmo tipo. O gerente de producao deve dizer no comeco do dia quais unidades
8 Introducao
serao produzidas em cada lote. Se somente a producao total do dia importar, e nao se
um certo tipo foi produzido no primeiro lote ou em qualquer outro, liste suas decisoes
exclusivas e exaustivas. Se a demanda de um dia qualquer por cada um dos tipo e zero
ou igual a producao de dois lotes, liste os possıveis eventos incertos do problema. Se ao
comeco do dia, nao ha nenhum item de tipo A armazenado, ha um lote de tipo B e dois
de tipo C, considere o merito de algumas das decisoes possıveis do gerente.
Exercıcio 4. Um paciente tem uma de quatro doencas possıveis, θ1, θ2, θ3, θ4. O seu
medico tem tres tratamentos possıveis, t1, t2, t3. Ele pode aplicar qualquer tratamento
e, se falhar, aplicar outro, e se ambos falharem, aplicar um terceiro. A eficacia esta
descrita na seguinte tabela, onde 1 significa efetivo e 0, ineficaz. Enumere as possıveis
θ1 θ2 θ3 θ4
t1 1 0 1 1
t2 0 1 0 1
t3 0 1 1 0
sequencias de tratamentos (ou seja, de decisoes) que o medico pode seguir.
Capıtulo 2
Medida numerica para incerteza
Como vimos, um problema de decisao pode ser abordado construindo duas listas: a das
decisoes di e a dos eventos incertos θj . Neste capıtulo, nos dedicaremos ao estudo dos
eventos incertos.
Nos exemplos mencionados, vimos alguns eventos incertos: a estrada esta fechada, cho-
vera hoje, o comerciante vendera 10 itens antes da proxima compra, etc, etc, etc. Esta-
mos rodeados de incertezas: a lista nao acaba.
Mas mesmo que eventos sejam incertos, no sentido de que nao sabemos se eles sao
verdadeiros ou falsos, ou se eles ocorrerao ou nao, alguns eventos sao mais provaveis de
ocorrer que outros.
E mais provavel obter cara no lancamento equilibrado de uma moeda balanceada do
que o evento de que voce morra neste ano. O comerciante pode achar que vendera em
torno de 10 itens no proximo perıodo, e que vender menos que 2 ou mais que 25 e pouco
usual. Em portugues, temos diversas palavras que descrevem esta incerteza: verossımil,
provavel, crıvel, plausıvel, possıvel, chance, razao de chances, etc. Nosso objetivo e
descrever a incerteza de um evento da forma mais simples que conhecemos para ordenar
coisas: com numeros.
Faremos isto de modo que quanto maior o numero atribuıdo, mais provavel e que o
evento ocorra: assim, o evento de que sejam vendidos 10 itens deve ter um valor maior
que 2 ou 25 itens, talvez 0.2 para o primeiro e somente 0.01 para qualquer um dos outros
dois.
Poderia ser objetado que e absurdo supor que todos os eventos incertos podem ter
sua incerteza medida e reduzida a um numero, ja que alguns sao muito complicados ou
envolvem aspectos emocionais, etc. No entanto, a medicao em numero, se for conseguida,
10 Medida numerica para incerteza
abre diversas possibilidades de analise, de modo que vale a pena tenta-la. Do mesmo
modo que para outros valores numericos, como a realizacao de mensuracoes fısicas, a
obtencao pode ser complicada na pratica, mas a ideia e simples.
Por exemplo, um demografo usa dados estatısticos sobre a populacao (numeros, idade,
salario, etc) e, a partir destes, constroi dados atuariais, como a expectativa de vida
dos diversos grupos. Considere o seu caso especıfico: voce nao sabe quando voce vai
morrer, mas em uma tabela de vida voce poderia encontrar sua expectativa de vida
baseado no grupo ao qual voce pertence, por exemplo, homem, branco, com idade entre
20 e 30 anos. Estes numeros sao muito considerados por companhias de seguro que,
de fato, apostam sobre sua morte (mesmo que nao usem esta linguagem de casa de
apostas). As condicoes do seu seguro, o premio ou o pagamento do seguro quando
a morte acontece, por exemplo, dependem das tabelas atuariais sobre expectativa de
vida. Todas as decisoes de uma companhia de seguros se baseiam em eventos incertos
(a perda de um bem material, morte ou acidente), e a mensuracao feita em dinheiro que
a companhia usa e parcialmente uma mensuracao da incerteza do evento.
Assim, poderıamos dizer que a Porto Seguro, por exemplo, e um aparelho de medicao
da incerteza. No entanto, nao e um bom aparelho, pois os valores cobrados envolvem
outros fatores, alem da incerteza: o dinheiro, obviamente, mas, mais importante ainda,
a percepcao sobre o valor do dinheiro tanto da seguradora quanto do cliente. Isto sera
discutido com mais detalhe quando estudarmos utilidade.
Continuamos com o problema: como medir a incerteza de um evento?
Poderıamos pensar em dividir os evento em dois tipos: eventos repetıveis e eventos
nao-repetıveis. Deste modo, poderıamos pensar em atribuir um valor para a incerteza
do evento repetıvel que esteja relacionado com a sua ocorrencia, ao repetir a situacao
diversas vezes essencialmente sob condicoes similares. Chamamos este tipo de evento de
evento estatıstico.
Sob este ponto de vista, um jogo de azar, por exemplo, envolve tipicamente eventos
estatısticos: a obtencao de um as ao lancar um dado ou selecionar uma carta de um
baralho. Do mesmo modo, para um atuario, a morte e tambem um evento estatıstico,
dado que ele considera uma grande populacao e o evento ocorre sempre que morre
alguem.
E no exemplo da viagem pela cordilheira: que a estrada esteja fechada e um evento
estatıstico?
Poderıamos, por exemplo, obter o registro meteorologico historico da regiao, nos ultimos
anos, para calcular uma probabilidade estatıstica (no sentido de frequencia) de que
Mensuracao da incerteza atraves de um padrao 11
a estrada esteja fechada, e assim considerar o evento como estatıstico. No entanto,
suponha que as autoridades locais recentemente fizeram melhorias na estrada, adquirindo
um novo equipamento para desbloquear a neve. Neste caso, observe que a probabilidade
estatıstica obtida deixa de ser valida, mesmo que o evento nao tenha mudado. O evento
e estatıstico ou nao? A melhoria feita pelas autoridades nao muda o evento; ela apenas
altera a relevancia dos dados climatologicos para o evento.
Mesmo um evento considerado estatıstico por um observador pode nao ser considerado
assim por outro. Por exemplo, para o atuario, a morte de um indivıduo da populacao
e um evento estatıstico, mas se esse indivıduo for voce, claramente, o evento nao tem
nada de repetıvel. Mesmo para o atuario, o evento poderia deixar de ser estatıstico se
ele decidir calcular a expectativa de vida de alguem especıfico, por exemplo, a minha: o
atuario poderia me alocar no grupo de mulheres, brancas com idade acima de ?, onde
haverıamos varias de nos. Mas ele poderia continuar restringindo o grupo: nao fumantes,
casada, universitaria, pratica esportes, idade de morte de meus pais e avos, alimentacao,
origem etnica, regiao onde mora, etc, etc, etc, ate sobrar apenas eu.
Finalmente, nesta classificacao, resta a ambiguidade do que significa ser ”repetıvel”.
Por exemplo, uma pessoa lanca uma moeda tres vezes obtendo cara apenas no ultimo
lancamento. O que deveria ser repetido: os tres lancamentos ou lancamentos ate obter
cara por primeira vez? Voce poderia achar que esta pergunta e irrelevante, no entanto,
ela esta na raiz de uma grande controversia em estatıstica.
Usaremos a nocao de probabilidade para lidar com estes eventos individuais, nao re-
petıveis. Uma vantagem desta abordagem e que ela pode ser usada sempre, mesmo com
eventos considerados estatısticos. Alem disso, o agente decisor esta quase sempre ligado
a eventos particulares que aparecem quando uma unica decisao deve ser tomada, nao
com uma sequencia de decisoes.
2.1 Mensuracao da incerteza atraves de um padrao
Qualquer mensuracao e feita com relacao a um padrao. O comprimento e descrito
em termos do comprimento de onda da luz amarela de sodio; o tempo, em termos da
oscilacao de um cristal. Qual pode ser um padrao para a incerteza?
Observe tambem que estes padroes nao sao usados na pratica: voce nao mede o compri-
mento de uma mesa usando uma luz de sodio, mas sim com uma fita metrica ou similar.
Ao medir a incerteza tambem nao usaremos o padrao para fins praticos, mas ele servira
para definir e estabelecer as regras que a incerteza deve obedecer.
12 Medida numerica para incerteza
Para construir um padrao, consideraremos uma urna contendo 100 bolas tao similares
quanto possıvel, exceto que algumas sao brancas e outras pretas. Uma bola sera extraıda
da urna de tal maneira que voce considere que cada uma das 100 bolas tem a mesma
chance de ser extraıda. Considere o evento incerto B de que a bola extraıda e branca.
A incerteza depende, portanto, de quantas bolas brancas ha na urna.
Se tivermos b bolas brancas (e portanto 100− b bolas pretas), a probabilidade do evento
B e definida como b/100 ou b%. Este o padrao que sera usado para todos os eventos
incertos, ou melhor, o conjunto de padroes para diferentes valores de b, variando de 0
ate 100.
Por exemplo, consideremos o evento E de que chovera amanha em Barao Geraldo, e
suponha que voce recebera um pequeno premio se o evento ocorrer, sem nenhum tipo
de perda caso nao chova. Agora suponha que voce recebera o mesmo premio se uma
bola branca for sorteada da urna nas condicoes que descrevemos acima. Ou seja, temos
dois jogos, um relacionado ao evento E, chuva, e o outro a B, bola branca, ambos com
o mesmo tipo de premiacao.
Se voce puder optar por apenas um dos jogos, qual voce prefere? Claramente, isto
depende da quantidade de bolas brancas na urna.
Se nao houver nenhuma bola branca, e melhor apostar na chuva; no outro extremo, se
so houver bolas brancas, a urna e melhor. Em geral, quanto mais bolas brancas houver
na urna, melhor ela e, neste contexto. Daqui podemos concluir que deve existir um
numero, digamos b, tal que voce e indiferente entre os dois jogos: se houver b+ 1 bolas,
a urna e melhor, e se houver b− 1, ela e pior.
Como os dois jogos sao agora equivalentes em todos os aspectos, dizemos que a proba-
bilidade do evento E e tambem b%. O valor de b e simplesmente o numero que deixa
voce indiferente entre os dois jogos.
Obs: o termo “aposta” nao e usado aqui como usualmente, em termos de apostas
em corridas ou jogos de azar, etc, mas sim refletindo sua opiniao ou informacao na
ocorrencia de um evento. Todos nos estamos sempre expostos a eventos incertos como
“chover amanha”, e devemos agir em face dessa incerteza - faremos o churrasco na
piscina? Neste sentido, todos nos fazemos apostas todos os dias, e este e o significado
atribuıdo.
O premio, neste caso, nao precisa ser ganho; ele apenas e considerado. O conceito
essencial e a acao em face da incerteza: como voce age ao escolher entre os eventos B
e E? (O total de bolas igual a 100 foi dado por simplicidade, mas qualquer total N
poderia ter sido usado.)
Mensuracao da incerteza atraves de um padrao 13
No exemplo da chuva, em algum momento (depois de amanha) saberemos se o evento
E ocorreu ou nao; no entanto, para outros eventos, e possıvel que nao tenhamos essa
informacao disponıvel.
Observe tambem que esta definicao de probabilidade, atraves de um padrao, nao usa
repeticao e e nao-estatıstica: a bola e extraıda uma unica vez (depois disso, tanto a urna
quanto as bolas poderiam ser destruıdas). Ela e resultado de um exercıcio mental, e nao
de uma realizacao fısica do ato de extrair uma bolinha da urna.
Em particular, a probabilidade derivada com referencia a um padrao depende de voce,
da pessoa que esta fazendo o julgamento sobre as bolas serem igualmente provaveis de
serem extraıdas, e sobre o merito relativo entre os dois jogos.
Dizemos que a probabilidade e pessoal (subjetiva): depende da pessoa que esta julgando
os experimentos. Ela reflete a relacao entre a pessoa e o mundo em que ela esta e no qual
ela pensa. Duas pessoas diferentes podem perfeitamente ter probabilidades diferentes
para o mesmo evento.
Esta diferenca pode ser justificada considerando a diferenca entre as informacoes que
cada pessao tem a respeito do evento; ou seja, se duas pessoas tiverem a mesma in-
formacao, elas deveriam concordar sobre a probabilidade. Neste sentido, ha tentativas
de definir probabilidades impessoais para um evento E, isto e, probabilidades que deve-
riam ser consensuais com base na mesma informacao (teoria objetivista).
Um ponto importante nesta discussao e saber como a probabilidade muda com a in-
formacao.
Para uma pessoa com uma informacao H (de historia) sobre um evento E, poderıamos
denotar corretamente a probabilidade dessa pessoa para o evento E por p(E | H). Para
facilitar a notacao, quando nao houver necessidade de ser tao correta, denotaremos esta
probabilidade simplesmente por p.
Ao comparar um evento qualquer E com um evento B relacionado com bolas em uma
urna, estamos fazendo implicitamente uma suposicao de coerencia nesta comparacao.
Isto significa que se tivermos tres eventos, E1, E2, E3, tais que E1 e mais provavel que
E2 e E2 mais provavel que E3, entao E1 deve ser mais provavel que E3. (Faca a prova
deste fato usando o padrao.) Esta ultima comparacao e dita ser coerente com as outras
duas.
Se esta suposicao falhasse, poderıamos ter a seguinte situacao: uma pessoa acha que E1
e mais provavel que E2 e que E2 e mais provavel que E3, mas que E3 e mais provavel
que E1. Suponha que ela recebe um premio se E3 ocorrer, e que nao recebe nada em
14 Medida numerica para incerteza
caso contrario. Entao, pela segunda comparacao, ela poderia preferir deixar a aposta
em funcao de E2: ela pagaria uma certa quantidade de dinheiro para ter E3 trocado
por E2. O mesmo argumento para a primeira comparacao levaria a concluir que ela
pagaria uma certa quantidade de dinheiro para ter E2 trocado por E1. Finalmente,
pela terceira comparacao, ela pagaria novamente para ter E1 trocado por E3. Ela esta
de volta a aposta inicial e com menos dinheiro do que no comeco. Este ciclo poderia
se repetir novamente, de modo que a pessoa incoerente vire uma maquina perpetua de
fazer dinheiro.
Daqui que somente comparacoes coerentes fazem sentido.
A coerencia e a base para a analise de tomadas de decisao: nao pretendemos afirmar
se uma comparacao e correta ou errada, mas sim se um conjunto de comparacoes e
coerente ou nao. Do mesmo modo, nao diremos se uma decisao e correta, mas sim se
ela e coerente.
A teoria de decisao trata da relacao entre eventos e decisoes, e esta relacao e defi-
nida de maneira precisa e nao arbitraria. Esta abordagem e ao mesmo tempo muito
liberal e muito restritiva: liberal no sentido em que permite uma ampla gama de pre-
ferencias, e restritiva no sentido em que estas preferencias devem obedecer certas regras
(de coerencia). Os erros ao tomar decisoes ocorrem porque estas regras sao violadas.
Quao bom e o seu chute em probabilidade?
Consideremos um evento E, uma informacao H e uma probabilidade para E conhecendo
H, p(E | H) ou simplesmente p.
Por exemplo, se E e o evento de obter cara no lancamento de uma moeda, voce poderia
pensar que p = 0.5; para o evento de que a Franca tem territorio maior que e Espanha,
voce poderia ter p = 0.3.
Em termos praticos, o que significa que esta probabilidade esteja correta?
Esta pergunta faz sentido quando falamos do comprimento de uma janela. Como pode-
mos responde-la para um evento?
Uma resposta aceitavel, pelo menos para alguns eventos, pode ser construıda da seguinte
forma: como um evento e verdadeiro ou falso, podemos dizer que uma mensuracao de
sua incerteza e boa se ela atribui probabilidade grande para um evento incerto, que
resulta ser verdadeiro, e se atribui probabilidade pequena para um evento que resulta
ser falso. Isto funciona sempre que pudermos verificar a veracidade de um evento.
Mensuracao da incerteza atraves de um padrao 15
Consideremos os seguintes exemplos, para testar o seu julgamento sobre a veracidade
de cada afirmacao. Cada evento tem uma alternativa, de modo que uma das duas
afirmacoes esta correta com certeza.
1. O compositor Michael Haydn foi o pai (irmao) de Joseph Haydn, o compositor
mais famoso.
2. Claret e o nome ingles para o vinho de Bordeaux (Burgundy).
3. Charlotte (Emily) Bronte escreveu Jane Eyre.
4. O hino nacional mais antigo e o da Gra-Bretanha (Franca).
5. A viola moderna tem 5 (4) cordas.
6. Zambia e o nome atual da antiga Rodesia do Norte (do Sul).
7. Roma, na Italia, esta mais ao sul (norte) que Washington DC, nos Estados Unidos.
8. O perigeu e o ponto mais afastado (proximo) da terra na orbita de um satelite
artificial.
9. Nos anos 70, a producao mundial de trigo foi em torno de 5 (9) bilhoes de toneis.
10. A Goodyear (Firestone) foi quem criou o processo de vulcanizacao que tornou
possıvel o uso comercial da borracha.
O exercıcio consiste em atribuir uma probabilidade para os eventos sem parenteses. Se
voce souber que uma afirmacao e correta, entao voce deveria atribuir probabilidade 1; se
voce souber que uma afirmacao e errada, a probabilidade atribuıda deveria ser 0. Para
as demais, sua probabilidade deveria ser um numero entre 0 e 1. Faca o seu melhor
chute.
Depois de comparar sua probabilidade p com a resposta correta, voce deveria se sentir
bem se atribuiu valores altos para eventos corretos, e pequenos para eventos falsos. No
extremo, voce achara que cometeu um erro feio se atribuiu probabilidade 1 para um
evento falso: voce pensou que ele era verdadeiro, mas na verdade ele era falso. Da
mesma forma se p = 0 para um evento verdadeiro.
Menos extremo, p = 0.8 para um evento verdadeiro fara voce se sentir melhor que
p = 0.6. Quao melhor?
16 Medida numerica para incerteza
2.2 Mensuracao da incerteza atraves de uma regra de es-
core
Uma forma de responder esta pergunta e usando uma regra de escore (scoring rule).
Esta e uma regra que atribui uma nota a cada valor p dependendo de se o evento e
verdadeiro ou falso. Esta nota mede a qualidade da mensuracao p.
Veremos um caso particular, a regra de escore quadratica, definida por (1 − p)2 se o
evento for verdadeiro e por p2, se for falso.
Este escore pode ser visto como uma penalizacao, quanto menor o escore melhor foi seu
julgamento.
E usual multiplicar o escore por 100 e ignorar os decimais. Assim, considere um evento
que posteriormente resulta ser verdadeiro. O valor p = 1 significa que voce estava correto
em pensar que ele era verdadeiro, sem incorrer em uma penalizacao. O valor p = 0.9,
significando que voce tinha quase certeza de que o evento era verdadeiro, tem um escore
pequeno (1−0.9)2 = 0.01 ou, multiplicando por 100, igual a 1. Um valor menor, p = 0.7,
tem escore 9, e a opiniao de que ele tinha a mesma probabilidade de ser verdadeiro ou
falso, p = 0.5, tem um escore maior de 25. Pensar que ele era falso, p = 0, tem o escore
mais alto igual a 100.
A Tabela 2.1 entrega os escores quadraticos para diversos valores de p, em ambos os
casos, de evento certo ou falso.
probabilidade 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
evento verdadeiro 100 81 64 49 36 25 16 9 4 1 0
evento falso 0 1 4 9 16 25 36 49 64 81 100
Tabela 2.1: Regra de escore quadratica.
Usando os valores da tabela, calcule seu escore para cada afirmacao e some os valores.
Como voce se saiu?
Isto depende de dois aspectos: sua habilidade em expressar sua incerteza numericamente,
e de quanto voce sabe. Uma pessoa com mais conhecimento e boa memoria de se sair
melhor que alguem com pouco conhecimento do assunto.
Para ter uma ideia do que e um escore razoavel, vejamos os casos extremos.
Se todas as respostas forem conhecidas e todas estiverem corretas, o escore total obtido e
0; se todas estiverem erradas, ha uma penalidade de 1000. Estes sao os limites. Suponha
que todas as opcoes sao indiferentes para voce, ou que o exercıcio e ridıculo; voce pode
Mensuracao da incerteza atraves de uma regra de escore 17
entao fazer duas coisas: atribuir p = 0.5 para cada afirmacao, ou chutar, colocando
p = 1 para as que voce chuta como verdadeiras, e p = 0 para as outras. O primeiro
procedimento da escore 25 para cada afirmacao, com escore total igual a 250. O segundo
da escore 0 ou 100 para cada evento e, se metade estiver correta (suposicao razoavel ao
chutar), o escore total e 500.
Imediatamente podemos perceber que atribuir p = 0.5 e uma estrategia muito melhor,
com metade do escore obtido com chutar.
Assim, ao fazer o exercıcio, voce nao deveria ter um escore maior que 250, dado que
voce tem alguma informacao sobre os eventos.
Analisando os escores individuais, podemos perceber o que a regra quadratica esta fa-
zendo.
Se um evento for verdadeiro, um valor de p acima de 0.5 dara um escore modesto; sao os
valores pequenos de p que darao a maior contribuicao. Assim, p = 0.7 da 9, mas p = 0.3
da 49.
A razao para nao selecionar valores extremos de p, proximos de 0 ou de 1, e que eles
resultam em penalidades tambem extremas se a verdade nao estiver na direcao do que
voce pensava. Alguem que tenha muita confianca em sua propria opiniao, mas que
estiver errado, tera um enorme 100 se atribuir p = 1, mas somente 81, uma reducao de
19, se atribuir p = 0.9. Inversamente, se ele estiver correto, a reducao no escore que ele
obtem quando p vai de 0.9 para 1, e de apenas 1. Em outras palavras, vale a pena ser
cauteloso.
Por outro lado, ser cauteloso demais tambem nao e interessante. Considere alguem que
pensa que o evento e verdadeiro mas nao tem certeza absoluta, atribuindo p = 0.6. Se
ele estiver correto, seu escore sera 16, mas poderia ter sido reduzido quase pela metade,
para 9, se ele tivesse atribuıdo p = 0.7.
Uma pessoa informada, com pouca confianca, dara valores proximos de p = 0.5 na
direcao correta. Seu escore poderia ser reduzido se ela se afastasse ainda mais de 1/2.
Uma pessoa confiante ira para os extremos de p, o que sera bom se sua confianca for
justificada, mas sera um fracasso se nao.
A regra de escore como auxılio na atribuicao de uma probabilidade
Levando em conta a analise anterior, tente agora as proximas perguntas. Possivelmente
seu escore melhorara nesta segunda tentativa, a menos que estas questoes sejam mais
difıceis para voce, por exemplo.
18 Medida numerica para incerteza
1. Johann Strauss o jovem (o velho) escreveu a valsa Danubio Azul.
2. Hock e o nome ingles para alguns vinhos da Alsacia (Alemanha).
3. “The golden bough”, O ramo de ouro, foi escrito por James Frazer (Henry James).
4. A batata foi introduzida na Europa proveniente da China (America).
5. O oboe moderno tem uma palheta simples (dupla).
6. Guiana e o nome atual da Guiana Britanica (Holandesa).
7. Santiago do Chile esta a oeste (leste) de Nova York, USA.
8. A temperatura media da superfıcie de Venus e em torno de 450oC (250oC).
9. Em torno de 22% (15%) da populacao mundial e muculmana.
10. O primeiro processo economico para fazer aco foi criado por Bessemer (Kelly).
A regra quadratica foi usada nos Estados Unidos no treinamento de previsores do clima.
O evento considerado e “chovera amanha” em um certo lugar, e ao preditor e pedida sua
probabilidade. Este procedimento se repete por um mes ou mais, registrando o escore
quadratico total. Quanto melhor o meteorologista, menor seu escore. O treinamento
se reflete nas previsoes entregues na televisao, que frequentemente sao da forma “a
probabilidade de chuva para amanha e de 85%”, significando p = 0.85. O treinamento
seria ainda melhor porque as pessoas nem sempre entendem o que significa probabilidade;
conta-se de um deles que disse que isto significava que choveria em 85% da area coberta
pela emissora de TV.
No Brasil, assim como em varios outros paıses, a ideia de probabilidade lamentavelmente
nao e usada, e a previsao do tempo e tipicamente entregue em termos vagos do tipo “ha
possibilidades de pancadas de chuva isoladas”, ou “amanha chovera em toda a regiao”.
O costume de fazer afirmacoes como “vai chover” quando na verdade a situacao e de
incerteza apenas alimenta a ignorancia das pessoas com respeito ao conceito de proba-
bilidade. O habito de substituir a incerteza por assercoes definitivas reflete o profundo
desconforto com a incerteza e o desejo de sentir que estamos no controle, sabendo o que
ira acontecer. Este habito e ensinado desde a escola, onde somos obrigados a escolher
a alternativa correta, no lugar de, por exemplo, colocar nossa probabilidade para cada
alternativa.
Atribuindo probabilidade com um seguro 19
Exercıcio 5. Considere o evento de obter face 5 ou 6 no lancamento de um dado equi-
librado. Para as estrategias abaixo, determine o escore quadratico medio obtido em 27
lancamentos do dado.
(a) para cada lancamento, a sua probabilidade e p = 0.3;
(b) em 1/3 dos lancamentos, sua probabilidade e p = 1 e no restante 2/3 dos lancamen-
tos, e p = 0;
(c) para cada lancamento, como voce nao sabe o que ira ocorrer, a sua probabilidade e
p = 0.5.
Defina outra estrategia, diferente das anteriore, e determine seu escore quadratico me-
dio.
2.3 Atribuindo probabilidade com um seguro
Considere um evento incerto E, que pode ou nao acontecer para voce. Pensemos em E
como um evento desastroso, ou seja, um que voce espera fortemente que nao aconteca.
(O argumento funciona igualmente bem se E for favoravel, apenas revertendo os sinais
das quantidades consideradas.) Por exemplo, E pode estar relacionado com a perda de
um bem valioso, como seu celular. Suponha que recupera-lo custaria para voce uma
quantidade c, se E acontecesse.
Se seu capital for C, ha duas possibilidades: ou E nao ocorre e seu capital permanece C,
ou E ocorre e seu capital fica C − c. Em qualquer um dos casos voces estara na mesma
situacao, exceto pela possıvel perda de capital; em particular, voce tera um celular.
Ao enfrentar uma possıvel perda de c, voce pode considerar contratar um seguro que
pagara c se o evento E ocorrer. Se o premio da apolice for m, aceitar o seguro significa
que seu capital certamente sera C −m, voce perca o celular ou nao, e a incerteza de E
desaparece.
A situacao pode ser descrita pela Tabela 2.2, onde EC denota o evento complementar a
E.
evento incerto E EC
resultado sem seguro C − c C
resultado com seguro C −m C −m
Tabela 2.2: Seguro contra E.
Tipicamente, m e muito menor que c. Agora, para premios suficientemente pequenos,
pagar o seguro sera atraente, enquanto que para premios grandes, seria melhor correr
20 Medida numerica para incerteza
o risco. Similarmente ao argumento ja usado para a urna, existe um unico valor de
m para o qual premios menores serao aceitaveis, e premios maiores, nao. Em outras
palavras, para este valor m de premio, contratar o seguro ou nao serao opcoes igualmente
atraentes.
Considere agora outra situacao. Suponha que seu capital e C − m, onde m e o valor
unico da paragrafo anterior, e que alguem oferece o seguinte jogo por uma aposta de
valor c−m: se uma bola preta for extraıda de uma urna (evento BC), voce ganhara m
(e seu valor apostado devolvido), caso contrario, voce perde o que apostou.
Assim, se B nao ocorrer, seu capital aumenta para C; se ocorrer, ele cai para C − c. A
Tabela 2.3 descreve esta situacao.
evento incerto B BC
resultado se aceitar a aposta C − c C
resultado se rejeitar a aposta C −m C −m
Tabela 2.3: Seguro contra E.
Se houver uma quantidade pequena b de bolas pretas na urna, voce aceitara a aposta;
para uma quantidade grande, voce rejeitara. Novamente, existe um unico valor de b tal
que, valores menores levarao a aceitar a aposta, e valores maiores, a rejeitar. Para tal
valor (que define a probabilidade de B), aceitar ou nao a aposta sao opcoes igualmente
atraentes.
Ao comparar as tabelas, vemos que as situacoes se a aposta e rejeitada ou se o seguro
e contratado sao identicas: um capital de C −m. Elas sao, respectivamente, tao atra-
entes quanto as situacoes se a aposta e aceita ou o risco se o seguro nao e contratado.
Consequentemente, o jogo e o risco de nao contratar o seguro sao igualmente atraentes.
A unica diferenca e que em um e o evento B quem determina o resultado, e no outro, e
o evento E.
Assim, a unica conclusao a qual podemos chegar e que E e B sao igualmente incertos,
e portanto sua probabilidade e a mesma para ambos, igual a b/100.
Resposta para as 10 questoes da primeira leva: F, T, T, T, F, T, F, F, F, T,
e da segunda leva: T, F, T, F, F, T, F, T, T, F.
Capıtulo 3
Leis da probabilidade
Vimos, no ultimo capıtulo, como descrever numericamente a incerteza que temos sobre
um evento, usando dois metodos: um padrao e uma regra de escore. Queremos agora
mostrar que os valores obtidos por estes metodos satisfazem certas regras.
Consideremos um evento E e sua probabilidade de E de acordo com sua informacao,
p(E).
Lei da convexidade 0 ≤ p(E) ≤ 1
Esta lei e imediata da construcao atraves de um padrao, ja que a proporcao de bolas na
urna e necessariamente um valor entre 0 e 1. No entanto, nao e tao obvia assim quando
usamos a construcao via regra de escore, e sua demonstracao expoe outro aspecto de
coerencia.
Mostraremos que e um absurdo escolher qualquer numero fora do intervalo [0,1]. Supo-
nha que, por exemplo, e selecionado p = 2. Se E for verdadeiro, a penalidade e (2− 1)2,
ou 100, e se for falso, o escore e 400. Quando p = 1, os respectivos escores sao 0 e
100. Em ambos os casos, o escore e reduzido, e portanto p = 1 e melhor que p = 2.
O mesmo argumento serve para qualquer valor de p maior do que 1, e, por simetria,
p = 0 e melhor do que qualquer valor menor. O mesmo nao ocorre para p entre 0 e 1,
onde mudar o valor de p, aumenta uma penalidade e diminui a outra. Portanto, so faz
sentido considerar 0 ≤ p ≤ 1.
Agora analisemos o princıpio anterior. Olhemos para a escolha de p como uma decisao.
Seja d2 a decisao de usar p = 2, e d1, a de usar p = 1. Entao o resultado de d2 quando
E for verdadeiro e pior que o de d1; o mesmo acontece quando E for falso; ou seja, d2 e
pior que d1 independentemente de E, e portanto d2 e pior que d1 quando E e incerto.
22 Leis da probabilidade
Isto e chamado o princıpio da coisa certa (the sure-thing principle): se d2 e pior que d1
quando E for verdadeiro e quando E for falso, entao e pior quando E e incerto.
Este e o segundo exemplo de coerencia entre tres julgamentos com respeito a d2 e d1:
um quando E e verdadeiro, um quando e falso, e um quando e incerto.
Lei da adicao Consideremos dois eventos, E1 e E2, exclusivos, e o evento que ocorre
se e somente se pelo menos um dos dois ocorrer, E1 ∪ E2.
Suponha que voce atribuiu as probabilidades p(E1 | H) e p(E2 | H), a partir da mesma
informacao. A lei da adicao diz que, neste caso,
p(E1 ∪ E2 | H) = p(E1 | H) + p(E2 | H) .
Assim, no exemplo da viagem entre Vina del Mar e Mendoza, seja E1 o evento de passar
pela fronteira (o caminho esta aberto) e nao ter acidente de carro, e E2 o evento de passar
pela fronteira (o caminho esta aberto) e ter um acidente de carro, para os quais voce
atribui probabilidades p(E1 | H) = 3/4 e p(E2 | H) = 1/20, com a mesma informacao.
Como ambos eventos sao exclusivos, entao para E1 ∪ E2, o evento de que o caminho
esteja aberto, voce deveria atribuir probabilidade 3/4 + 1/20 = 4/5.
Faca a prova desta lei, usando a construcao com o padrao, considerando uma urna com
N bolinhas, das quais b1 sao pretas, representando a probabilidade de E1, e b2 sao azuis,
por exemplo, representando a probabilidade de E2.
Um caso especial e quando E2 e a negacao de E1 = E. Como eles sao exclusivos e sua
uniao e certa de ocorrer, temos p(E) + p(EC) = 1.
A lei da adicao se aplica tambem a qualquer numero, n, de eventos exclusivos:
p(E1 ∪ E2 ∪ · · · ∪ En) = p(E1) + · · ·+ p(En) .
Uma consequencia imediata disto e que na lista de eventos incertos, exclusivos e exaus-
tivos, considerada no Capıtulo 1, θ1, . . . , θn, suas probabilidades devem somar 1.
Isto poderia nao ocorrer em uma primeira tentativa de atribuicao de probabilidade, de
modo que esta lei nos da outro exemplo de coerencia. Por exemplo, suponha que voce
esta analisando como voce poderia morrer (para decidir a cobertura de um seguro, por
exemplo); denotemos por θ1 ataque cardıaco, θ2 cancer, θ3 violencia, θ4 qualquer outra
causa nao violenta. Como estes eventos sao todos desagradaveis para voce, e possıvel
que suas probabilidades somem menos que 1; se assim for, a coerencia requer que alguma
delas seja mudada.
23
A prova desta lei usando a construcao por regra de escore passa novamente pelo princıpio
da coisa certa. Provaremos o caso especial de E e sua negacao EC .
Suponha que voce atribuiu o valor x a E, e y a EC . Entao seu escore total se E for
comprovado como verdadeiro sera a soma (x−1)2 +y2. Por outro lado, se E resultar ser
falso, seu escore total sera x2 + (y − 1)2. Se x e y nao somarem 1, considere a diferenca
1− (x+ y) e a metade deste valor, t, somando-o a x e a y, obtendo x+ t e y + t (cuja
soma agora e 1). Com estes novos valores, se E for verdadeiro, seu escore passa a ser
(x+ t− 1)2 + (y + t)2, que e menor que o anterior:
(x− 1)2 + y2 −((x+ t− 1)2 + (y + t)2
)= −2t(x+ y − 1 + t) = 2t2 > 0 .
O mesmo ocorre se E resultar ser falso. Assim, pelo princıpio da coisa certa, x+ y deve
ser igual a 1, que e a opcao com menor escore.
Lei do produto Considere dois eventos incertos E1 e E2, e o evento E1 ∩ E2 que
ocorre se e somente se ambos ocorrerem. Observe que se E1 e E2 forem exclusivos,
entao E1 ∩ E2 e impossıvel.
Se E1 e E2 nao forem exclusivos, entao nos poderıamos ser informados sobre sua
ocorrencia em ordem, digamos, primeiro sobre E1 e depois sobre E2.
Por exemplo, o comerciante poderia achar que suas vendas dependem de se o governo
facilita as condicoes sobre emprestimos ou nao. Denotemos por E1 o evento incerto
de que o governo facilita o emprestimo. Seja E2 o evento de que o comerciante vende
menos que quatro itens (que nao e exclusivo com E1). Pode acontecer que o governo
facilite o emprestimo e que o comerciante receba esta informacao. Ele entao ja nao esta
interessado em p(E2), mas sim em p(E2 | E1).
A lei do produto estabelece que
p(E1 ∩ E2) = p(E1) p(E2 | E1) .
Com o uso desta lei, vejamos como podemos atribuir a probabilidade ao evento da
estrada estar aberta e nao ter acidente de carro, no exemplo da viagem pela cordilheira.
Denotemos por E1 o evento de que a estrada esta aberta, e por E2, o evento de nao
ter um acidente de carro. Suponha que atribuımos p(E1) = 4/5, e que apos alguma
reflexao, atribuımos p(EC2 | E1) = 1/16 a probabilidade de ter algum tipo de acidente
de carro, se passarmos pela estrada aberta. Assim,
p(E1 ∩ E2) =4
5×(
1− 1
16
)=
3
4.
24 Leis da probabilidade
Exercıcio 6. Prove a lei do produto usando a construcao com a urna.
Exercıcio 7. Prove a lei do produto usando a construcao com regra de escore. Dica:
atribua valores x, y, z quaisquer aos tres eventos, e construa modificacoes neles que
minimizem o escore total para qualquer caso de verdade de E1 e E2.
Esta lei pode ser generalizada para n eventos, lembrando que o sımbolo · | E indica
informacao sobre a ocorrencia do evento E.
3.1 Coerencia
As leis de convexidade, da adicao e do produto sao leis basicas de probabilidade. Ne-
nhuma delas pode ser deduzida das outras duas, mas com as tres conseguimos provar
qualquer outro resultado em probabilidade. Em nossa construcao de probabilidade elas
sao provadas a partir dos conceitos simples com os quais fazemos nossa atribuicao, a
diferenca da construcao de Kolomogorov, onde elas sao consideradas como axiomas.
O ponto central disto e que, qualquer que seja a forma em que atribuımos probabilidade,
ela nao e arbitraria; ela deve satisfazer estas tres leis. Elas garantem que diversas
afirmacoes sobre incerteza sejam coerentes.
Em particular, quando encaramos o problema de atribuir probabilidades a diversos
eventos, nao e necessario atribuir probabilidade a todos eles, pois algumas podem ser
derivadas de outras, atraves destas leis: elas fazem parte deste aparelho para medir
incerteza.
Os demais resultados que veremos podem ser derivados destas leis basicas.
3.2 Extensao da conversa
Consideremos dois eventos E1 e E2 exclusivos e exaustivos, e A um evento qualquer;
entao
p(A) = p(A | E1)p(E1) + p(A | E2)p(E2) .
Este resultado pode ser estendido para qualquer numero de eventos E1, . . . En. Observe
que p(A) sera um valor entre p(A | E1) e p(A | E2).
Este resultado e util quando temos informacao parcial sobre a probabilidade de A em
termos de E1, . . . , En. Se, para um problema especıfico, voce achar que p(A) e mais
Extensao da conversa 25
simples de ser atribuıda diretamente, mesmo assim, a regra anterior deve ser satisfeita
quaisquer sejam os eventos exclusivos e exaustivos E1, . . . , En.
Vejamos o exemplo do comerciante a luz deste resultado. Sua decisao dependia da
quantidade de itens vendidos ate a compra seguinte: θ1, . . . , θm, que formam um conjunto
de eventos exclusivos e exaustivos. Suponha que ele quer saber se ele sera capaz de
cobrir seu saldo negativo no banco: denotemos por A este evento. Claramente, se
ele vender uma grande quantidade de itens, a chance de que A ocorra e grande, caso
contrario, a chance e pequena. Consequentemente, ele pode ser mais capaz de descrever
a probabilidade p(A | θj), para cada valor de j, do que p(A) diretamente.
O problema dos tres prisioneiros Este conhecido problema permite discutir a
nocao de coerencia em probabilidade.
Alan, Bernardo e Carlos estao na cadeia, impossibilitados de se comunicar entre si,
ou com quem quer que seja, exceto com o carcereiro. Alan sabe que dois deles serao
executados e o outro sera deixado livre, e depois de pensar no assunto, ele conclui que
nao ha nenhum motivo para acreditar que um deles tenha maior probabilidade que os
outros de ser deixado livre. Denotando por A o evento de que Alan e deixado livre, e
analogamente, para B e C, este raciocınio significa que p(A) = p(B) = p(C) = 1/3, na
opiniao de Alan.
Alan entao diz ao carcereiro: “Como um dos dois, Bernardo ou Carlos, com certeza sera
executado, voce nao estara me dando imformacao nenhuma sobre minhas chances de ficar
livre se voce me disser o nome de um deles, Bernardo ou Carlos, que sera executado.”
Aceitando este argumento, o carcereiro (honesto) diz “Bernardo sera executado”.
Entao Alan fica contente porque agora, ele ou Carlos serao deixados livres e, como antes,
ele nao tem razao para pensar que e mais provavel que seja Carlos, de modo que sua
chance agora e 1/2, nao 1/3, como antes.
Qual argumento esta correto, aquele que convenceu o carcereiro ou o que deixou Alan
contente?
Para analisar a situacao devemos comparar p(A) = 1/3 com p(A | b), onde b e a afirmacao
do carcereiro de que Bernardo sera executado. Pelo primeiro argumento, p(A | b) = 1/3
e b nao tem efeito nenhum; pelo segundo, p(A | b) = 1/2.
Sabemos que o carcereiro e honesto, ou seja, p(b | B) = 0 e p(b | C) = 1. O que nao e
claro e como devemos descrever p(b | A): se Alan fosse ser libertado, e portanto ambos
Bernardo e Carlos fossem ser executados, o carcereiro falaria da execucao de Bernardo
26 Leis da probabilidade
ou de Carlos? Denotemos esta probabilidade por p = p(b | A) e por x = p(A | b), a
quantidade de interesse.
Pela extensao da conversa,
p(b) = p(b | A)p(A) + p(b | B)p(B) + p(b | C)p(C) = p/3 + 0 + 1/3 = (1 + p)/3 .
Pela regra do produto
p(A ∩ b) = p(A | b)p(b) = x(1 + p)/3 ,
assim como
p(A ∩ b) = p(b | A)p(A) = p/3 .
Portanto, x = p/(1 + p).
Na conversa com o carcereiro, Alan arguiu que x = 1/3. Pela igualdade acima, isto
implicaria que p = p(b | A) = 1/2: se Alan fosse ser libertado, o carcereiro poderia dizer
igualmente Bernardo ou Carlos.
No entanto, ao ficar contente, Alan estava tomando x = 1/2, o que implica que p = p(b |A) = 1: ou seja, nas mesmas circunstancias acima, o carcereiro sempre diria Bernardo.
Assim, ambas atribuicoes, 1/3 e 1/2, sao coerentes, mas a primeira implica uma escolha
meio a meio do carcereiro para informar sobre os dois homens que serao executados,
enquanto que a segunda implica que, na opiniao de Alan, o carcereiro indicara Bernardo.
A essencia do problema, e a razao de sua ambiguidade, e a falha para estabelecer o que
o carcereiro dira se Alan for ser liberado. Se Alan se sente aliviado com a informacao do
carcereiro, entao esta reacao e razoavel e coerente se ele perceber que esta julgando que
o carcereiro dira Bernardo nesta circunstancia. Isto sera coerente, mas possivelmente
nao e o que a maioria de nos sentiria: a maioria optaria por p = 1/2 e consequentemente
x = 1/3, de modo que a informacao do carcereiro e, na verdade, irrelevante.
Observe como e possıvel atribuir probabilidades aparentemente razoaveis, p(A) = 1/3 e
p(A | b) = 1/2, mas entao, usando as regras de coerencia, calcular outra probabilidade,
p(b | A) = 1, que nao parece razoavel.
Para manter a coerencia, e necessario uma revisao nas atribuicoes originais, para fazer
com que todas as probabilidades estejam de acordo com nossa opiniao. As probabilidades
nao devem ser julgadas isoladamente, mas sim comparadas umas com as outras.
Regra de Bayes 27
3.3 Regra de Bayes
Sejam E e F dois eventos, com p(E) 6= 0; entao
p(F | E) = p(E | F )p(F )/p(E) .
A importancia deste resultado e que ele conecta duas probabilidades completamente
diferentes relacionadas aos mesmos dois eventos, p(E | F ) e p(F | E). No primeiro, F
faz parte da informacao e E e incerto, e no segundo os papeis sao trocados.
Ao ser usado em ciencia, F e alguma lei geral e E, um caso especial: assim, podemos
passar de uma afirmacao incerta sobre o caso especial p(E | F ) (que e frequentemente
facil) para uma sobre a lei geral p(F | E). Esta regra explica como podemos fazer
afirmacoes gerais com base em casos particulares.
Podemos reescrever a regra de Bayes, considerando tambem FC :
p(FC | E) = p(E | FC)p(FC)/p(E) e
e dividindo ambas igualdade para obter
p(F | E)
p(FC | E)=
p(E | F )
p(E | FC)
p(F )
p(FC).
A razao entre a probabilidade de um evento e seu complementar, nas mesmas cir-
cunstancias, e chamada razao de chances a favor do evento, e a denotaremos por r.
Assim, a igualdade anterior fica
r(F | E) =p(E | F )
p(E | FC)r(F ) .
Suponha qu F denota o evento incerto de que um acusado em um tribunal seja cul-
pado. A informacao inicial H (nao indicada na notacao) e toda a evidencia previa e o
conhecimento anterior do juri ou do juiz, que tem que se pronunciar sobre a culpa do
acusado.
A regra de Bayes permite obter a razao de chances a favor da culpa, em face de uma
nova informacao E, como o produto entre a razao original e o fator p(E | F )/p(E | FC).
Observer como as duas razoes se referem ao evento incerto da culpa, mas o fator se
refere ao evento incerto da evidencia: a probabilidade da evidencia se ele fosse culpado
pela mesma probabilidade se ele fosse inocente. Geralmente, para entender o signifi-
cado de qualquer evidencia, e preciso considerar quao provavel ela e sob uma suposicao
comparado com a outra. Ambas sao necessarias para uma avaliacao coerente.
28 Leis da probabilidade
3.4 Paradoxo de Simpson
Consideremos um ensaio clınico em que 40 pacientes sao alocados no tratamento T e
40, no grupo de controle (placebo, por exemplo) TC . Para cada paciente, foi registrado
posteriormente se ficou recuperado R, ou nao, RC . Suponha que os dados obtidos
sao os da Tabela 3.1, onde vemos evidencia de que o tratamento melhora a taxa de
recuperacao, passando de 40% para 50%, ou em termos de probabilidade, p(R | T ) = 0.5
e p(R | TC) = 0.4.
R RC total taxa de recuperacao
T 20 20 40 50%
TC 16 24 40 40%
Tabela 3.1: Resultado do ensaio clınico para todos os pacientes.
Suponha agora que os medicos tambem registraram o sexo dos pacientes do estudo, com
igual numero de homens e mulheres. Os resultados dos 40 homens estao na Tabela 3.2.
R RC total taxa de recuperacao
T 18 12 30 60%
TC 7 3 10 70%
Tabela 3.2: Resultado do ensaio clınico para os pacientes homens.
Veja que o tratamento foi prejudicial para os homens, reduzindo, no lugar de aumentar,
a taxa de recuperacao em 10%. Como o tratamento foi bom para o grupo, e ruim para
os homens, entao deve ter sido benefico para as mulheres, cujos resultados podem ser
obtidos subtraindo os resultados da Tabela 3.2 daqueles da Tabela 3.1, e aparecem na
Tabela 3.3.
R RC total taxa de recuperacao
T 2 8 10 20%
TC 9 21 30 30%
Tabela 3.3: Resultado do ensaio clınico para as pacientes mulheres.
No entanto, nao e isso o que acontece: para as mulheres, o tratamento tambem reduziu
a taxa em 10%.
Ou seja, o tratamento foi ruim para cada grupo, homens e mulheres, mas foi benefico
para todos juntos. Este e o paradoxo.
Veja que, se o estudo nao considerasse a informacao sobre o sexo, o tratamento seria
Independencia 29
veiculado como benefico; caso contrario, nao. A decisao, portanto, e afetada pelas
indicacoes contrarias do paradoxo.
Colocado de outra forma: se voce tivesse a disposicao apenas os dados totais, como voce
poderia saber que nao existe outro fator que reverte os resultados, transformando um
ganho de 10% em uma perda de 10%? Em nosso exemplo, foi sexo, mas poderia ter
sido tipo sanguıneo, modo de vida urbano ou rural, ou qualquer outra possibilidade que
pode nao ter sido considerada no estudo.
No exemplo, o paradoxo aparece pela seguinte razao: observe que o tratamento e muito
mais eficaz em homens do que em mulheres, e que ele foi predominantemente usado
com homens, enquanto que o placebo foi usado majoritariamente com mulheres (com
baixa taxa de recuperacao). Como resultado, o tratamento parecia ser melhor no grupo
completo. Dizemos que a variavel sexo e um fator de confusao para o tratamento.
Estas consideracoes mostram como o paradoxo pode ser evitado: qualquer tratamento
deve ser alocado aos pacientes de modo que nao haja confusao com qualquer outro fator.
Por exemplo, se tivessem sido alocados 20 homens e 20 mulheres ao tratamento, usando
as taxas das Tabelas 3.2 e 3.3, terıamos uma queda de 10% na taxa de recuperacao, e o
paradoxo nao apareceria.
Em termos de probabilidade, a Tabela 3.1 diz que p(R | T ) = 0.5 e p(R | TC) = 0.4; ja
as Tabelas 3.2 e 3.3 dizem que
p(R | T,H) = 0.6 , p(R | TC , H) = 0.7 , p(R | T,M) = 0.2 , p(R | TC ,M) = 0.3 .
Estendendo a conversa do tratamento e recuperacao para incluir o sexo,
p(R | T ) = p(R | T,H)p(H | T ) + p(R | T,M)p(M | T ) ,
e substituindo os valores conhecidos, obtemos
0.5 = 0.6p(H | T ) + 0.2(1− p(H | T ))
e
0.4 = 0.7p(H | TC) + 0.3(1− p(H | TC)) .
No exemplo, p(H | T ) = 0.75 e p(H | TC) = 0.25, valores muito diferentes entre si.
3.5 Independencia
Um evento E e independente de outros eventos se a probabilidade de E, p(E | H), fica
inalterada com qualquer informacao relativa a esses outros eventos. Um conjunto de
eventos e independente se isto for verdadeiro para cada evento no conjunto.
30 Leis da probabilidade
Em vista da natureza subjetiva de probabilidade, este e um julgamento da pessoa ou do
agente decisor, e o que pode ser independente para uma pessoa pode nao ser para outra.
Para dois eventos E1 e E2, a independencia significa
p(E1 | E2) = p(E1 | EC2 ) = p(E1) ,
e o correspondente resultado se trocarmos E1 com E2. Ou, em termos da lei do produto,
p(E1 ∩ E2) = p(E1)p(E2) ,
o que permite uma generalizacao imediata.
Exercıcio 8. Considere um dado balanceado com 4 faces (triangulares) com faces 110,
101, 011, 000. Seja Ei o evento de obter 1 na posicao i da face para baixo em um
lancamento do dado. Verifique a independencia entre os eventos dois a dois, e dos tres
juntos.
3.6 Dutch book
Retomando a lei da soma, suponha que voce seja incoerente e atribui p(E) = 0.2 e
p(EC) = 0.7, para um dado evento E.
De acordo com a primeira afirmacao (p(E) = 0.2), voce consideraria justo fazer a aposta:
receber um valor a para pagar 4a se E ocorrer. Similarmente, para p(EC) = 0.7, voce
receberia um valor b para pagar 3b/7 se EC ocorrer.
Suponha que ambas as apostas sao feitas por voce, com a = 2 e b = 7. Entao, se E
ocorrer, voce perde 8 do primeiro e ganha 7 do segundo, perdendo 1. Se E nao ocorrer,
voce ganha 2 do primeiro, e perde 3 do segundo, novamente perdendo 1.
Esta situacao incoerente, de combinar apostas que levam a perder dinheiro com certeza,
e chamada dutch book. Ela somente pode ser evitada estabelecendo probabilidades
coerentes.
Capıtulo 4
Medida numerica para
consequencias
4.1 As consequencias de uma decisao
Comecemos novamente com a lista d1, . . . , dm de possiveis decisoes, θ1, . . . , θn de eventos
incertos, e suas probabilidades p(θj).
Suponha que uma determinada decisao di e tomada e que o evento incerto θj ocorre.
Com esta combinacao, temos uma consequencia previsıvel, Cij .
Por exemplo, suponha que o gerente de uma fabrica de tecidos, que acabou de fabricar
um rolo de cortina e esta a ponto de vende-lo, deve decidir entre d1 inspecionar o item
a procura de defeitos ou d2 nao inspecionar. Supondo que ha dois eventos incertos, θ1
que o rolo nao tem defeitos, θ2 que ele tem pelo menos um defeito, podemos representar
as consequencias em uma tabela.
θ1: material bom θ2: material com defeito
d1: fazer a inspecao C11: cliente satisfeito C12: procurar um novo rolo bom
custo da inspecao custo da inspecao
cliente satisfeito
d2: nao fazer a inspecao C21: cliente satisfeito C22: reclamacao do cliente
substituicao por um rolo novo
Tabela 4.1: Tabela de decisao para o problema da inspecao.
Neste exemplo, uma possıvel ordem das consequencias, com a melhor primeiro, e:
C21, C11, C12, C22. Mas, por exemplo, se o custo da inspecao for muito alto, mas re-
solver o problema, se ele aparecer, for facil, entao C22 pode nao ser a pior consequencia.
32 Medida numerica para consequencias
Um fabricante de celulares pode tomar decisoes diferentes em termos da qualidade da
inspecao dependendo do cliente alvo para cada um de seus produtos: produtos mais
exclusivos podem ter uma inspecao mais apurada.
Novamente, ha espaco para incluir as preferencias pessoais entre as consequencias.
Mesmo assim, nao e imediatamente claro qual decisao deve ser tomada. Se θ1 for
verdadeiro, entao d2 e a melhor decisao; por outro lado, se θ2 for verdadeiro, entao d1 e
preferıvel.
Se o gerente atribuir probabilidades para estes dois eventos, o quadro pode ficar mais
claro. Por exemplo, se p(θ1) for quase 1, entao ele poderia escolher d1, e inversamente,
se p(θ1) for quase 0, entao ele poderia razoavelmente escolher d2. Ou seja, em algum
ponto a medida que p(θ1) decresce de 1 ate 0, o gerente possivelmente mudara de d1
para d2. Onde?
Do mesmo modo que foi feito para mensurar incerteza, nosso objetivo agora e usar um
padrao para atribuir valores que permitam comparar consequencias coerentemente.
Para isso usaremos duas consequencias de referencia: uma delas e melhor (ou nao pior)
que qualquer uma das consequencias da tabela relevante; e a outra e pior (ou nao melhor)
que todas as Cij .
Suporemos tambem que quaisquer duas consequencias podem sempre ser comparadas
no sentido de uma ser preferıvel que a outra, ou de elas serem igualmente desejaveis.
Esta comparacao deve ser coerente: se C1 for preferıvel a C2 e C2 preferıvel a C3, entao
C1 e preferıvel a C3.
Denotemos por C qualquer consequencia tal que nenhuma consequencia na tabela e pre-
ferıvel a ela. Similarmente, seja c qualquer consequencia tal que nenhuma consequencia
na tabela e pior que ela. Aqui, C e c poderiam ser consequencias da tabela (a melhor e
a pior), ou de fora da tabela.
Tomemos uma consequencia Cij , e consideremos o padrao de bolas em uma urna, com
U bolas brancas em um total de N . Selecione uma bola da urna: se for branca, suponha
que ocorre C, se for preta, ocorre c.
Em outras palavras, voce recebera C com probabilidade u = U/N , e c com probabilidade
complementar 1− u.
Daqui, se u = 1, este experimento e melhor que Cij , se u = 0, e pior. Portanto, deve
existir um valor de u para o qual voce e indiferente entre “C com probabilidade u” e Cij .
Este valor sera chamado a utilidade de Cij e denotado por u(Cij). Assim, os valores de
u refletem a relacao de ordem criada pelas preferencias.
As consequencias de uma decisao 33
Observe que esta utilidade e uma probabilidade (a probabilidade de obter a consequencia
mais desejada) e, portanto, obedece as regras de probabilidade vistas no capıtulo ante-
rior.
Podemos representar estes valores na mesma tabela anterior.
θ1: material bom θ2: material com defeito
d1: fazer a inspecao 0.9 0.5
d2: nao fazer a inspecao 1.0 0.0
probabilidades 0.8 0.2
Tabela 4.2: Tabela de decisao para o problema da inspecao, com as utilidades e proba-
bilidades.
Nesta tabela, consideramos C = C21 e c = C22, com utilidades respectivas 1.0 e 0.0.
Como C11 difere de C apenas pelo custo da inspecao, teve uma utilidade atribuıda igual
a 0.9: a inspecao resulta em uma perda de utilidade de 0.1. O mesmo raciocınio segue
a atribuicao da utilidade de C12.
Vejamos agora como combinar estes valores para determinar a melhor decisao. Para isso
pensaremos no resultado como sendo C ou c.
Suponha que tomamos a decisao di e que o evento incerto θj ocorre: a probabilidade de
obter C e
p(C | di, θj) = u(Cij) .
Entao, pela extensao da conversa,
p(C | di) = p(C | di, θ1)p(θ1) + · · ·+ p(C | di, θn)p(θn). =n∑
j=1
u(Cij)p(θj) .
Lembrando que se C nao ocorrer, o que vai ocorrer e c, podemos ver p(C | di) como
uma medida do merito de di.
Consequentemente, a melhor decisao e aquela com maior valor para esta probabili-
dade. Observe que esta conclusao e inevitavel se nos basearmos apenas na condicao de
coerencia para eventos e consequencias.
O valor p(C | di) e chamado utilidade esperada da decisao di, e sera denotado por u(di).
O procedimento anterior indica escolher a decisao com maior utilidade esperada.
No exemplo anterior, com os valores da Tabela 4.2, obtemos
u(d1) = 0.9× 0.8 + 0.5× 0.2 = 0.82 e
u(d2) = 1.0× 0.8 + 0.0× 0.2 = 0.80 .
34 Medida numerica para consequencias
Portanto, d1 e a melhor decisao (mas nao extraordinariamente melhor).
Em resumo, seguindo as leis basicas de coerencia, o procedimento recomendado ao tomar
uma decisao segue os passos:
1. listar as possıveis decisoes, d1, . . . , dm;
2. listar os eventos incertos, θ1, . . . , θn;
3. atribuir probabilidades a estes eventos, p(θ1), . . . , p(θn);
4. atribuir utilidades u(di, θj) as consequencias;
5. escolher a decisao com maior utilidade esperada, u(di).
4.2 Um exemplo de incoerencia
Lembrando do ditado: “mais vale um passaro na mao que dois voando”, consideremos
a consequencia Cij de receber 100 reais, e seja C um pouco maior, digamos 101 reais.
O que voce prefere: receber 100 reais com certeza ou receber 101 reais com probabilidade
p, para p < 1?
Algumas pessoas prefeririam receber 100 reais, mesmo que p seja grande (< 1), usando
o argumento de que preferem a certeza de receber 100 reais do que qualquer coisa
envolvendo o risco (mesmo pequeno) de nao ganhar nada, ja que o aumento no premio
de 100 para 101 e muito pequeno. Ou seja, estas pessoas preferem
(1) uma certeza de 100 reais, a
(2) uma chance p de 101 reais, contra 1 − p de nao ganhar nada, por maior que p seja
(menor que 1).
Portanto, elas deveriam preferir
(3) uma certeza de 101 reais, a
(4) uma chance p de 102 reais, contra 1− p de nao ganhar nada, para o mesmo valor de
p.
Suponha que modificamos (2) de modo que se o evento de chance p ocorrer, entao os
101 reais sao substituıdos por uma chance em 102 reais (alternativa (4)). Isto deixa
(2) ainda pior, porque os 102 reais somente serao ganhos se o evento ocorrer duas
vezes independentemente, o que ocorre com probabilidade p2. Consequentemente, (1) e
preferıvel a
(5) uma chance de p2 de 102 reais, contra 1− p2 de nao ganhar nada.
O mesmo argumento pode ser usado repetidas vezes para mostrar que (1) e preferıvel
(6) uma chance de p100 de 200 reais, contra 1− p100 de nao ganhar nada.
Um exemplo de incoerencia 35
Como p e arbitrario, podemos ter p100 tao proximo de 1 quanto quisermos. Por exemplo,
se a razao de chances em (2) fossem um milhao a 1, em (6) seriam 10 mil a 1. Ou seja,
por um pequeno risco, o valor recebido poderia ser dobrado.
Se a diferenca de 100 para 200 nao for suficiente, o argumento vale para 1000 reais com
probabilidade p900 (aproximadamente de mil para 1).
E neste ponto, poderıamos ter que (6) e preferıvel a (1), mostrando que o argumento
original e incoerente.
A forma de eliminar o problema e admitir que (2) e preferıvel a (1) para p suficientemente
proximo de 1.
Exercıcio 9. Em cada uma das seguintes situacoes, temos um jogo com varios premios
possıveis com suas probabilidades. Quanto voce esperaria ganhar em uma unica jogada
de cada jogo?
(i) premios: -1, 0, 1
probabilidades: 0.2, 0.5, 0.3
(ii) premios: 1, 2, 4, 8, 16, 32, 64
probab: 1/2, 1/4, 1/8, 1/16, 1/32, 1/64, 1/64
(iii) premios: -100, 5
probab: 0.01, 0.99
Exercıcio 10. Um agente decisor determinou suas utilidades e quer determinar a pro-
babilidade relevante p. Determine o valor de p para o qual as utilidades esperadas de d1
θ1 θ2
d1 0.6 0.8
d2 1.0 0.0
probabilidades p 1− p
e d2 sao iguais. Mostre entao que se alguem o convence de que p e menor que 1/2, ele
nao precisa mais considerar p e chega a uma decisao. Qual decisao?
Exercıcio 11. Um baralho de 9 cartas contem 2 ases, 3 reis e 4 valetes. Uma carta e
escolhida ao acaso, o jogador olha e pode ou (d1) pedir uma segunda carta do baralho
agora com 8 cartas, ou (d2) desistir de jogar. Se ele escolher d2, ele nao recebe nada.
Se ele escolher d1, entao os premios sao os seguintes: 2 ases ou 2 reis obtem 2 dolares,
2 valetes ou um as e um rei obtem 1 dolar, e qualquer outra combinacao perde 1 dolar.
Para cada possıvel primeira carta, encontre a escolha otima entre d1 e d2, e o valor
esperado do jogo. Se participar do jogo exige o pagamento de uma taxa de admissao,
qual taxa faria deste um jogo honesto?
36 Medida numerica para consequencias
Exercıcio 12. Considere o Exercıcio 4. Suponha que os tratamentos t1, t2, t3 custem
3, 2, 1, respectivamente, e que p(θ1) = 0.2, p(θ2) = 0.5, p(θ3) = 0.2, p(θ4) = 0.1. Com
base apenas nos custos, qual e a melhor decisao para o medico?
Capıtulo 5
A utilidade do dinheiro
Analisaremos neste capıtulo consequencias representadas em termos de ganhos ou perdas
em dinheiro: investimentos no mercado de acoes, seguro contra perda de bens materiais
etc.
Considere alguem que esta pensando em investir 500 dolares em uma pasta de acoes
por um perıodo de 3 meses. Ao fim desse perıodo, as acoes podem valer mais ou menos
do que o valor original gasto em sua compra. Suponha, por simplicidade, que ao fim
dos tres meses, as acoes podem ou ter subido para 600 dolares ou ter caıdo para 400.
Assim, temos dois eventos incertos: θ1, subir para 600; θ2, cair para 400. Com duas
possıveis decisoes: d1 investir ou d2 deixar os 500 dolares no banco, estamos na situacao
do capıtulo anterior, que pode ser representada pela Tabela 5.1, onde Crepresenta o
capital no instante da compra.
θ1: as acoes sobem θ2: as acoes caem
d1: investir C + 100 C − 100
d2: deixar no banco C C
Tabela 5.1: Resultados monetarios para o exemplo do investimento.
Analisemos, por exemplo, a consequencia de (d1, θ2), investimento seguido de uma queda.
A questao importante aqui e a comparacao entre perder 100 dolares e o resultado de
nao investir.
Para qualquer quantidade de capital x, denotemos por u(x) sua utilidade. No exemplo,
queremos c(C − 100), u(C), u(C + 100).
Daqui, observamos que a decisao de investir ou nao pode depender de C, o capital no
momento da decisao, o que e uma conclusao realista. Os montantes de capital serao
supostos sempre nao-negativos.
38 A utilidade do dinheiro
Nosso problema, entao, e definir a relacao entre um bem monetario, x, e sua utilidade.
No proximo exemplo, veremos porque precisamos desta funcao e de que forma podemos
por em pratica os princıpios de coerencia anteriores.
5.1 Incoerencia
Consideremos as seguintes quatro apostas:
I: perde 10, ganha 10
II: perde 10, ganha 20
III: perde 20, ganha 10
IV: perde 20, ganha 20,
onde os valores representam dolares. Dependendo de sua interpretacao de dolar, voce
pode reescalar este valores para cima ou para baixo.
Nao mencionamos nenhuma probabilidade nessas apostas. Antes de continuar, atribua
para cada aposta, o menor valor de p, a probabilidade de ganhar, que levaria voce a
aceitar a aposta. Ou seja, a aposta com este valor de p deve ser tao atraente quanto
rejeitar a aposta e preservar o seu estado atual; um valor menor, leva voce a rejeitar a
aposta, e um maior, o leva a acreditar que vale a pena.
Voce possivelmente escolheu o valor de pi para cada uma das apostas, separadamente.
Vejamos como esses valores coerem.
Suponha que voce atribuiu os valores: p1 = 0.6, p2 = 0.5, p3 = 0.8, p4 = 0.6, que sao
razoaveis, ja que II e a aposta mais favoravel e deveria ter o menor valor de p, III e a pior
e deveria ter o maior valor. No entanto, mostraremos que estes valores sao incoerentes.
Ao atribuir estes valores, voce considera que todos as apostas com estas probabilidades
sao igualmente preferıveis, ja que elas sao equivalente ao seu estado atual.
Consideremos agora uma mistura destas apostas, ou seja, selecionamos uma delas ao
acaso com probabilidades a1, a2, a3, a4.
Por exemplo, com a1 = a2 = 1/2 e a3 = a4 = 0, temos o equivalente a lancar uma moeda
para escolher entre I e II, ignorando III e IV. Como cada aposta, I e II, e equivalente ao
estado atual, entao a mistura tambem e.
Para o exemplo numerico, tomemos a mistura A: a1 = a3 = 0.3, a2 = 0.4, a4 = 0.
Com esta mistura, podemos ganhar 10 se forem escolhidos I ou II, ou ganhar 20 se for
escolhido III. Os possıveis valores de ganho e suas probabilidades aparecem na Tabela
5.2. A segunda linha e para a mistura B: a1 = 0.7, a2 = a4 = 0.15, a3 = 0.
A utilidade e crescente e limitada 39
mistura perde 20 perde 10 ganha 10 ganha 20
A 0.06 0.32 0.42 0.20
B 0.06 0.355 0.42 0.165
Tabela 5.2: Possıveis resultados das misturas A e B.
Como as duas misturas sao equivalentes ao estado atual, entao voce, se for coerente,
nao deveria ter preferencia entre elas. Isto claramente nao tem sentido, pois A e B tem
a mesma chance de perder 20 ou ganhar 10, mas A tem uma chance maior de ganhar
20, e menor de perder 10: A deveria ser preferıvel a B.
A forma de evitar esta incoerencia e atraves de uma funcao de utilidade.
5.2 A utilidade e crescente e limitada
As leis de probabilidade e a existencia de uma utilidade sao parte da abordagem norma-
tiva de teoria de decisao: elas sao um resultado necessario sob a hipotese de coerencia.
As propriedades que veremos de uma utilidade, por outro lado, sao meramente prescri-
tivas: elas sao razoaveis de um certo ponto de vista, mas voce nao e obrigado a seguir
a prescricao.
A primeira observacao obvia e que um aumento em x deveria causar um aumento na
utilidade: u(x) e crescente em x. Isto porque a maioria de nos prefere a maior entre
duas quantidades de dinheiro, e como a utilidade mede a desejabilidade do dinheiro,
a maior quantidade deve ter maior utilidade. Se isto nao fosse assim, deverıamos ver
pessoas literalmente jogando dinheiro fora (o que, em geral, nao acontece).
Uma segunda caracterıstica razoavel de u(x) pode ser obtida considerando valores muito
grandes de dinheiro: suponha que voce esta analisando uma consequencia que esta
associada a este valor, digamos, ganhar um milhao de dolares (ou, se isto nao for grande
suficiente, - se voce for uma grande empresa de tecnologia - uma quantidade realmente
grande). Entao voce encontrara muito difıcil diferenciar um valor x de um milhao e um
x de dois milhoes. E claro que o segundo e melhor, mas com o primeiro voce ja sera
capaz de fazer tudo o que voce tinha vontade de fazer e comprar tudo o que voce tinha
vontade de comprar, que um milhao a mais sera apenas um enfeite bonito em um objeto
ja muito atraente. Em outras palavras, chegara um ponto em que o capital extra deixara
de entusiasmar voce. E entao natural supor que a utilidade nao cresce ilimitadamente
com x, mas sim que tem um limitante superior, a medida que x cresce (limitante que
pode nunca ser alcancado).
40 A utilidade do dinheiro
Como u e crescente, entao u(0) e o limitante inferior de u. Assim, de acordo com o visto
anteriormente, podemos definir u(0) = 0 (utilidade da pior consequencia) e colocar
utilidade 1 como o limitante superior. A melhor consequencia, C, e o limitante superior
(ligeiramente superior a qualquer valor alcancavel de x), e para valores grandes de x,
u(x) e quase 1.
Da construcao de utilidade, podemos mostrar que nao afeta a tomada de decisao se a
utilidade for somada a uma constante, ou se ela for multiplicada por um fator constante.
Assim, os valores 0 e 1 sao escolhidos de modo a poder utilizar a construcao descrita:
substituir qualquer valor x por um jogo com alguma chance de obter uma utilidade 1 e
uma chance complementar de obter zero.
Voltemos ao investidor pensando em comprar acoes. Suponha que ele compra e que as
acoes sobem, de modo que seu capital passa de C para C + 100, e sua utilidade de u(C)
para u(C + 100), com ganho em utilidade u(C + 100) − u(C). Esta diferenca mede a
satisfacao dele com o adicional de 100 dolares, que, para a maioria de nos, depende do
capital inicial C. Se C = 100, terıamos terminado com o dobro, trazendo uma satisfacao
grande. Se C fosse um milhao, a satisfacao ja seria bem menor.
Assim, para um ganho fixo a > 0 em capital monetario, o crescimento na utilidade,
u(x+ a)− u(x) ,
e uma funcao decrescente do capital monetario inicial, x > 0. Isto e conhecido como o
princıpio da diminuicao da utilidade marginal do dinheiro. O termo “utilidade marginal”
se refere ao crescimento na utilidade devido a um crescimento no capital, a diferenca
da utilidade do capital. Se u for uma funcao duas vezes derivavel, esta condicao e
equivalente a dizer que a segunda derivada de u e negativa: u e uma funcao concava.
5.3 Exemplo
Voltemos ao exemplo das quatro apostas, e considere um investidor com um capital de
50 dolares. Ele pode perder ou ganhar 10 ou 20 dolares, e suponha que sua utilidade
para os valores de interesse sao:
dolares 30 40 50 60 70 100
utilidade u1 0.458 0.523 0.570 0.605 0.633 0.693
As probabilidades de ganhar que voce tinha que atribuir podem ser determinadas equa-
cionando as utilidades esperadas das apostas com a utilidade do estado atual, de 50
Consequencias 41
dolares. Assim, para a aposta I, temos
0.523(1− p1) + 0.605p1 = 0.570⇒ p1 = 0.57 .
Do mesmo modo, encontramos p2 = 0.43, p3 = 0.76, p4 = 0.64. Desta forma, todas as
apostas ou misturas delas tem mesma utilidade esperada, igual a 0.570, e a coerencia
fica garantida.
Exercıcio 13. Mostre que para os valores que voce atribuiu inicialmente, nao ha uma
funcao de utilidade que explique coerentemente estas escolhas.
5.4 Consequencias
Aversao ao risco
Um agente decisor com funcao concava e dito averso a correr riscos: nao gosta de algumas
apostas aparentemente favoraveis.
Figura 5.1: Explicacao geometrica para aversao ao risco.
Para ver isto, considere um decisor com risco como na Figura 5.1, com capital igual a
A, e utilidade u(A) = P . Suponha que ele esta analisando se entra em um jogo no qual
ele pode ganhar ou perder uma certa soma, C −A = A−B, com mesma probabilidade,
p = 1/2.
Em termos monetarios, o jogo e honesto, ja que o ganho esperado em dolares e zero. A
situacao muda se o jogo for julgado em termos de utilidade. No grafico, S representa a
utilidade esperada do jogo, que, pela condicao de convexidade, e menor que a utilidade
da situacao atual, de recusar o jogo.
42 A utilidade do dinheiro
Daqui a denominacao “averso ao risco”: com uma utilidade concava o decisor rejeita
um jogo monetariamente honesto (o que nao significa que ele va rejeitar um jogo com
uma ganho monetario esperado suficientemente grande).
Premio de probabilidade
Consideremos novamente o investimento em que podemos ganhar ou perder 100 dolares,
e denotemos por p a probabilidade que faz o jogo monetariamente honesto e por P , a
probabilidade que faz o jogo honesto em utilidade.
Como acabamos de ver, para uma utilidade concava, P > p. A diferenca P−p e chamada
o premio de probabilidade do jogo. Ele descreve o aumento na probabilidade necessario
para transformar um jogo honesto (do ponto de vista monetario) em um jogo aceitavel
(a partir de consideracoes sobre a utilidade).
O efeito de aversao ao risco fica mais claro para somas grandes. Por exemplo, suponha
que um decisor tem um capital de 500 dolares e esta analisando uma aposta na qual ele
perde tudo ou dobra seu capital. Este jogo e monetariamente honesto se a chance de
ganhar for 1/2. Suponha que suas utilidades para 500 e 1000 dolares sejam, respecti-
vamente, 0.570 e 0.693 (na tabela anterior, estamos modificando a escala do dinheiro,
multiplicando por 10, sem alterar a forma da utilidade), e que a de zero e zero. Entao a
utilidade esperada da aposta e 0.693/2 = 0.347, enquanto que a de nao apostar e 0.570.
Para que o jogo valesse a pena, a utilidade esperada deveria satisfazer 0.693×P = 0.570,
ou seja, P = 0.82, com um premio de probabilidade igual a P − p = 0.32 = 32%.
Se a curvatura do grafico da utilidade for convexa, entao o agente decisor aceita jogos
arriscados. A Figura 5.2 mostra um exemplo destes, com curvatura convexa para capital
abaixo de um certo valor. Dizemos, neste caso, que o agente decisor e propenso ao risco.
Figura 5.2: Curva de utilidade convexa para valores menores que B.
Consequencias 43
Aversao ao risco
Um tipo de aversao ao risco, conhecido como aversao constante, reflete que o decisor tem
um premio de probabilidade constante para aceitar um jogo monetariamente honesto,
independentemente de seu capital. Em outras palavras, para um decisor com aversao
ao risco constante e aposta h > 0, a funcao de utilidade satisfaz
u(x+ h)P + u(x− h)(1− P ) = u(x) ,
qualquer que seja x ≥ h. Deste modo,
P =u(x)− u(x− h)
u(x+ h)− u(x− h)⇒ P − 1
2= −u(x+ h)− 2u(x) + u(x− h)
2[u(x+ h)− u(x− h)]
e constante. No limite, fazendo h tender a zero, isto implica que u′′(x)/u′(x) e constante.
A solucao desta equacao diferencial, com u(0) = 0 e limitante superior 1, e
u(x) = 1− e−cx ,
onde c > 0 representa apenas uma mudanca de escala em x.
No exemplo do investimento, suponha que o decisor tem funcao de utilidade com aversao
ao risco constante, de modo que
dolares 300 400 500 600 700 800 900 1000
utilidade u2 0.259 0.330 0.393 0.451 0.503 0.551 0.593 0.632
Entao, qualquer que seja seu capital C, para uma aposta de 100 dolares, por exemplo, a
probabilidade P deve ser de 52%, com premio de probabilidade de 2%. Por outro lado,
para a utilidade u1, este premio diminui de 11%, com C = 100, para 2%, com C = 1000.
Dizemos que o decisor 1 tem aversao ao risco decrescente. A utilidade u1 e dada pela
expressao
u1(x) = 1− e−x/200/2− e−x/20/2 .
Outras funcoes podem ser descritas, por exemplo, da forma geral
u(x) = 1− we−ax − (1− w)e−bx ,
com a > 0, b > 0, 0 < w < 1.
Exercıcio 14. Para cada um dos decisores, com utilidades u1 e u2, determine o premio
de probabilidade se o capital for 2000 dolares e uma aposta para ganhar ou perder 100.
Exercıcio 15. Um decisor com aversao ao risco decrescente tem um capital de 30
dolares, e um problema de decisao com a seguinte estrutura
44 A utilidade do dinheiro
θ1 θ2
d1 −10 +5
d2 +15 −5
p 0.3 0.7
De o seu conselho na escolha da melhor decisao. O seu conselho se mantem se o capital
for de 200 dolares?
Exercıcio 16. O mesmo decisor do exercıcio anterior tem um capital de 20 dolares
e considera um jogo no qual ele pode ganhar 20 ou perder 10 dolares. Em termos
monetarios, este jogo sera honesto se a probabilidade de ganhar for 1/3. Determine o
premio de probabilidade. Faca o mesmo para o decisor com aversao ao risco constante.
Encontre o premio de probabilidade para o primeiro se seu capital for 200 dolares.
Exercıcio 17. Um decisor tem a seguinte utilidade para o dinheiro
dinheiro 0 20 40 60 80 100 120 140
utilidade 0 .04 .13 .27 .50 .73 .87 .96
Considere um jogo em que ele pode ganhar ou perder 20 dolares, primeiro quando seu
capital for de 40 dolares, e depois quando for de 100. Em cada caso, calcule o premio
de probabilidade.
Exercıcio 18. O decisor 1 com aversao ao risco decrescente tem um capital de 50
dolares. Quanto ele deveria estar preparado para pagar por um bilhete que da uma
chance 1/2 a 1/2 de ganhar 20 dolares? Suponha que ele ja tem o bilhete: por quanto
ele deveria estar preparado para vende-lo? Repita a questao para o decisor com aversao
ao risco constante e mostre que, neste caso, o preco de compra e o de venda sao iguais.
Exercıcio 19. Um decisor tem a seguinte utilidade para o dinheiro
dinheiro 0 10 20 30 40
utilidade 0 .10 .17 .22 .26
Com um capital de 20 dolares, ele esta considerando um jogo no qual pode ganhar 10
dolares com probabilidade 0.58, ou perder 10 dolares, caso contrario. Mostre que o jogo
deve ser rejeitado. Ele entao considera um jogo que consiste em duas rodadas do jogo
anterior. Mostre que o novo jogo deve ser aceito.
Capıtulo 6
Teorema de Bayes
6.1 Informacao e teoria de decisao
Em um problema de decisao, temos a lista de decisoes d1, . . . , dm e a de eventos incertos
θ1, . . . , θn. Se soubermos que θk ocorrera, por exemplo, entao podemos tomar a decisao
di que maximiza u(Cik), sem necessidade de probabilidades e utilidades esperadas.
No entanto, essa informacao tipicamente nao esta disponıvel, por ser muito cara ou por
ser impossıvel de ser obtida. Assim, o que nos interessa e conhecer o efeito de uma nova
informacao, X, sobre as probabilidades p(θ1), . . . , p(θn). Como vimos, este efeito e dado
pela regra de Bayes,
p(θj | X) = p(X | θj)p(θj)/p(X) .
Lembremos que os eventos θ1, . . . , θn sao exclusivos e exaustivos, de modo que suas
probabilidades somam 1, seja sob a informacao original H, ou sob H e X. Desta forma,
o termo p(X) e apenas uma constante de normalizacao para que esta soma satisfaca a
condicao, e podemos considerar somente o produto
p(X | θj)p(θj) ,
cujos valores, variando em j, somam p(X). Escrevemos usualmente,
p(θj | X) ∝ p(X | θj)p(θj) ,
e denominamos p(θj) a probabilidade a priori de θj , e p(θj | X), a probabilidade a
posteriori ou posterior de θj . Ambas sao probabilidades em θj e satisfazem as regras
que ja vimos. O terceiro termo, p(X | θj), nao e uma probabilidade em θj , e e chamada
verossimilhanca de θj (para a informacao X).
46 Teorema de Bayes
Dadas duas possibilidades, θ1 e θ2, a razao p(X | θ1)/p(X | θ2) e chamada a razao de
verossimilhanca entre θ1 e θ2.
Como exemplo, suponha que voce tem uma urna com uma grande quantidade de bolas
identicas exceto pela cor, de modo que ou 1/3 ou 2/3 delas sao brancas e as restantes,
pretas. Suponha tambem que voce nao sabe qual dos dois valores e o verdadeiro e
que ambos sao igualmente provaveis, p(θ1) = p(θ2) = 1/2. Voce recebe a permissao
de extrair uma bola da urna e observar sua cor. Isto dara alguma informacao sobre a
composicao da urna. Se voce puder repetir este experimento varias vezes, qual e o efeito
do conhecimento adquirido (a respeito da cor das bolas extraıdas) sobre sua incerteza
de θ1 e θ2?
Em particular, se forem extraıdas 33 bolas, das quais 20 resultarem ser brancas, quais
sao suas chances a favor da segunda urna? Responda esta questao antes de fazer as
seguintes contas.
Suponha que ocorre o evento de que a primeira bola e branca. Entao a razao de chances
a favor da primeira urna e 1/2, e portanto a razao a favor da segunda urna e 2. Ou seja,
a extracao de uma bola branca, dobra as chances da segunda urna e reduz a metade,
as da primeira. O mesmo ocorre se extrairmos uma segunda bola branca (dado que a
quantidade de bolas da urna e muito grande, e praticamente indiferente se as extracoes
sao realizadas com ou sem reposicao). Assim, se de 33 extracoes, 20 forem brancas e 13
pretas, entao dobramos as chances 20 vezes e reduzimos a metade 13; ou seja, dobramos
7 vezes as chances da segunda urna, obtendo uma razao de chances de 128 para 1.
Assim, se sua incerteza inicial sobre a urna e sobre as bolas forem as estabelecidas no
exemplo, para manter a coerencia, voce deveria ter atribuıdo a uma razao de chances
de 128 para 1.
Tipicamente, neste exemplo, as pessoas tendem a subestimar a evidencia entregue pelo
resultado das extracoes (20 brancas em 33). O ponto e que ha discrepancias entre o
descrito e o prescrito pelas regras de coerencia que vimos. Este fato faz com que o
ponto de vista coerente se torne ainda mais importante porque usa-lo pode melhorar
nossos metodos (intuitivos) incoerentes e ineficientes. A regra de Bayes descreve como
deverıamos aprender: como nossas opinioes, expressas em termos de probabilidade a
priori, devem ser modificadas pela informacao descrita pela verossimilhanca para chegar
a novas opinioes expressas pela probabilidade a posteriori.
Observe, em particular, que se um determinado evento incerto tiver, em sua opiniao,
p(E) = 0 entao p(E | X) = 0, qualquer que seja a nova informacao X, o que nao e
aconselhavel. O mesmo acontece se atribuirmos p(E) = 1, porque nesse caso p(EC) = 0.
Informacao e teoria de decisao 47
Esta e conhecida como a lei de Cromwell: p(E | H) < 1 a menos que H implique
logicamente que E e verdadeiro. Similarmente, p(E | H) > 0 a menos que H implique
logicamente que E e falso.
Consideremos novamente o investidor com aversao ao risco decrescente, com um capital
de 1000 dolares (e um fator escala de 10 para sua utilidade), que esta considerando um
investimento de 500 dolares em acoes, no qual ele pode ganhar ou perder 100 dolares.
Suponha que ele acha que este investimento tem mesma chance para cada resultado;
entao, por causa de sua aversao ao risco, ele decide nao fazer o investimento.
Ele poderia achar que vale a pena ir atras de um perito no assunto, antes de tomar uma
decisao: afinal, ele so precisa que p(θ1) alcance 52% para que a compra seja atrante. Ele
pergunta ao seu consultor financeiro, que afirma que as acoes irao subir.
Ele deve aceitar este conselho ou nao?
Temos que p(θ1 | H) = 1/2, onde H e o conhecimento do investidor. Denotemos por S,
a opiniao do consultor de que as acoes subirao. Queremos p(θ1 | H,S). A informacao
de que precisamos e a verossimilhanca p(S | θ1, H), que reflete a probabilidade de que o
consultor acerte em detectar um investimento favoravel, e mede parte da confianca do
investidor em seu consultor.
Suponha, por exemplo, que ele respeita a opiniao ao ponto de atribuir chance 0.8 de que
o consultor esteja correto, entao
p(θ1 | H,S) ∝ 1/2× 0.8 = 0.4 .
Do mesmo modo, com a verossimilhanca de que o consultor esteja errado, temos
p(θ2 | H,S) ∝ p(S | θ2, H)/2 = 0.2/2 = 0.1 .
Como ambas probabilidades somam 1, entao, devemos ter
p(θ1 | H,S) = 0.8 e p(θ2 | H,S) = 0.2 .
Assim, sua utilidade esperada, em face a esta informacao, e 0.709× 0.8 + 0.676× 0.2 =
0.702 > 0.693, que e a utilidade de deixar o dinheiro no banco.
Isto continua ocorrendo mesmo se o consultor for um pouco melhor do que lancar uma
moeda: se p(S | θ1, H) = 0.52, entao o investimento ja comeca a valer a pena.
Aqui analisamos apenas como levar em conta uma nova informacao, mas nao o seu custo,
o que veremos no proximo capıtulo.
48 Teorema de Bayes
6.2 Erros dos dois tipos
No exemplo anterior, supusemos que p(S | θ1, H) = 1 − p(S | θ2, H), o que nao e
necessariamente verdadeiro: o consultor poderia ser melhor para prever altas na bolsa
do que quedas. Nesse caso, dirıamos que o consultor e viesado.
Por exemplo, no caso da viagem pela cordilheira, poderıamos querer obter informacao
da companhia de transito. Denotemos por θ1 o evento de que a estrada estara fechada,
por θ2, seu complementar, e por S a informacao de que ela estara fechada.
Queremos p(S | θ1, H) e p(S | θ2, H). Poderıamos atribruir, por exemplo, 0.8 para a
primeira, ja que eles poderiam tardar em receber notıcias sobre tempestades de neve.
E para a segunda, 0.2 (como no exemplo anterior) parece pouco razoavel, ja que a
companhia prefere ser cautelosa ao recomendar ao motorista que viaje ou nao; assim,
poderıamos atribuir 0.5, de modo que
p(θ1 | H,S) ∝ 1/2× 0.8 = 0.4 e p(θ2 | H,S) ∝ 1/2× 0.5 = 0.25 .
Assim, a probabilidade de que a estrada esteja fechada, apos a informacao S, e 0.4/0.65 =
0.62.
Observe que ambas, p(SC | θ1) e p(S | θ2), correspondem a maus conselhos, a erros.
Estes sao os erros dos dois tipos, e ambos precisam ser especificados na abordagem
coerente.
6.3 Amostragem de atributos
Suponha que temos uma grande colecao de objetos, alguns dos quais sao de um tipo,
por ter um certo atributo, e o restante de outro, por nao ter o atributo, e que queremos
conhecer a proporcao do primeiro tipo.
Para obter informacao, selecionamos alguns indivıduos desta colecao e registramos seu
tipo. Como e modificada a incerteza sobre a proporcao com esta evidencia?
No exemplo do gerente da fabrica de tecidos, suponha que ele recebe os rolos em lotes
de 1000, e que ele sabe que os rolos nao sao homogeneos: alguns vem quase sem defeitos
e outros, com muitos. Assim, ele costuma amostrar alguns rolos para decidir aceitar o
lote ou nao. Suponha que ele amostra n rolos e encontra r < n defeituosos. Se o lote
vem com 1000 rolos, denotemos por θj cada uma das proporcoes de defeituosos que o
lote poderia ter.
Amostragem de atributos 49
Pela regra de Bayes,
p(θj | r, n) ∝ p(r, n | θj)p(θj) .
Aqui a informacao X e o par (r, n). Como a amostra e pequena com relacao ao lote,
podemos supor que a verossimilhanca e
p(r, n | θj) = θrj (1− θj)n−r ,
e assim
p(θj | r, n) ∝ θrj (1− θj)n−rp(θj) .
Exercıcio 20. No exemplo, considere uma amostra de tamanho n = 10, com r = 1
defeituoso, e uma probabilidade a priori para apenas 5 valores: p(0) = 0.1, p(0.1) = 0.2,
p(0.2) = 0.4, p(0.3) = 0.2, p(0.4) = 0.1. Obtenha as probabilidades com a informacao
dada pela amostra. Repita o exercıcio, para n = 20 e r = 2.
Esta discussao se refere a proporcao de defeituosos, ou mais geralmente, a proporcao
de indivıduos com um certo atributo dentro de uma colecao. Esta nao e usualmente a
quantidade de interesse final.
O medico nao quer saber a proporcao de pacientes que respondem bem a um certo
tratamento: ele quer saber se o paciente que ele esta tratando vai responder bem (se
voce for o paciente, voce tambem quer esta informacao).
Acima, calculamos p(θj | r, n), agora queremos p(D | r, n), onde D e o evento de que
um certo rolo seja defeituoso (ou que o tratamento seja efetivo para um certo paciente).
Extendendo a conversa de D para incluir θj , temos
p(D) =n∑
j=1
p(D | θj)p(θj) =n∑
j=1
θjp(θj) . (6.1)
Esta igualdade estabelece uma coerencia entre p(D) e p(θj). Aplicando o mesmo resul-
tado para as probabilidades posteriores, temos
p(D | r, n) =n∑
j=1
p(D | θj , r, n)p(θj | r, n) =n∑
j=1
θjp(θj | r, n) .
Exercıcio 21. Obtenha p(D | r, n) para os dois casos do exercıcio anterior.
No exemplo dos rolos de tecido, a utilidade esperada da decisao d1, de inspecionar os
rolos, era de 0.82, e a de d2, era de 0.80. Assim, optou-se por d1.
No entanto, depois da amostra, com n = 10 e r = 1, estas utilidades esperadas ficam
0.83 e 0.82. E depois da amostra, com n = 20 e r = 2, elas ficam ambas 0.84. Assim,
o valor crıtico de p(D), que faz os dois cursos de acao igualmente atraentes, tendo a
mesma utilidade esperada, e 1/6 (faca a conta).
50 Teorema de Bayes
6.4 Probabilidades vagas ou precisas
Quando discutimos eventos incertos e probabilidades como coisas comparaveis, surgiu o
argumento contrario de que nao e possıvel comparar qualquer coisa, e no mınimo muito
estranho.
Por exemplo, suponha que realizaremos o experimento de lancar uma moeda comum e
ver se ocorre o evento D, sair cara. Quase todos nos estaremos de acordo em atribuir
probabilidade 1/2 a este evento, sem muita margem para oposicoes.
Agora consideremos um ensaio clınico em que um novo medicamento sera testado e apli-
cado em apenas um de um par de pacientes, no qual o outro recebera o medicamento
usual. Suponha que os pacientes do par sao muito semelhantes nas caracterısticas im-
portantes para o ensaio, sendo a unica diferenca o tratamento ao qual sera submetido,
o novo ou o usual. Podemos ter uma mente aberta a respeito da efetividade do novo
medicamento e atribuir probabilidade 1/2 ao evento D, de que ele e melhor que o usual
para um certo par de pacientes.
Esta ultima probabilidade e vaga (imprecisa), no sentido que nao nos sentimos muito
seguros sobre o seu valor, mesmo sendo razoavel atribuir 1/2, para nao beneficiar nem
prejudicar o ensaio com uma ideia pre-concebida.
Para mostrar que estamos falando de uma unica incerteza, observemos que podemos
representar ambas as probabilidades com a extensao da conversa.
Imagine a moeda lancada 1000 vezes, e denote por θj a proporcao de cadas nestes 1000
lancamentos. Consideremos p(θj | H), a probabilidade a priori de θj , e p(D | H), a
probabilidade de sair cara em um certo lancamento.
Quais valores sao razoaveis para p(θj | H)? A maioria de nos atribuira valores muito
pequenos para θj proximo de zero ou proximo de 1, atribuindo os maiores valores para
θj proximo de 1/2. Esta e uma probabilidade precisa.
No caso do novo medicamento, denotemos por ψj a proporcao de pares de pacientes
nos quais o novo medicamento foi mais eficaz. As probabilidades p(ψj | H) tendem a
ser diferentes das anteriores. Nao podemos considerar irrelevantes os casos em que ψj
e proximo de zero (o novo tratamento nao e eficaz), ou em que e proximo de 1 (o novo
tratamento e melhor que o atual). Portanto, os valores de p estarao distribuıdos com
menor concentracao que no caso da moeda, e dizemos que e uma probabilidade vaga.
O que estamos dizendo ao dizer que podemos comparar eventos e suas probabilidades,
e que p(D | H) e o mesmo nos dois casos, usando (6.1).
Probabilidades vagas ou precisas 51
Qual e o efeito dos dados coletados nestas probabilidades?
Suponha que voce observa 12 lancamentos da moeda, todos resultando em cara, e 12
pares de pacientes, nos quais em todos, o novo medicamento foi melhor.
Para o primeiro caso, onde temos uma probabilidade a priori precisa (muito concentrada
em torno de 1/2), entao valores de θj com probabilidade muito pequena continuarao
tendo probabilidade pequena; ou seja, continuaremos com probabilidades muito concen-
tradas em torno de 1/2. No segundo caso, ficaremos muito mais convencidos de que ψj
deve ser proximo de 1, dando mais credito ao medicamento novo. As mesmas mudancas
se refletem na probabilidade p(D | H).
Exercıcio 22. Um exame rapido de consumo de alcool efetuado pela polıcia tem apenas
0.8 de chance de estar correto: dar um valor alto, quando houver consumo, e um valor
baixo, quando nao houver consumo. Os suspeitos, ou seja, os que tiveram resultado
positivo, sao encaminhados para um exame mais cuidadoso por um medico. Este segundo
teste nunca erra com motoristas sobrios, mas tem uma chance de erro de 10% em
motoristas que ingeriram alcool, devido ao tempo passado entre os dois exames. Quando
um motorista e parado pela polıcia, a chance de ter ingerido alcool e P .
(a) que proporcao de motoristas parados pela polıcia tera o segundo teste negativo?
(b) qual e a probabilidade posterior de que tal pessoa tenha de fato ingerido alcool?
(c) que proporcao das pessoas paradas nao fara o segundo teste?
Exercıcio 23. Um paciente pensa que tem cancer e consulta um medico, A, que, depois
de um exame, afirma que ele nao tem a doenca. O paciente sente que o medico e do tipo
cauteloso para diagnosticar cancer, de modo que decide procurar uma segundo medico,
B, que declara que ele tem cancer.
Suponha que o medico A diagnostica cancer em somente 60% dos pacientes que de fato
tem, e nunca nos casos em que nao tem. Suponha que B diagnostica cancer em 80%
dos pacientes que tem, e em 10% dos que nao tem. Suponhas que as duas opinioes sao
dadas independentemente. Por quanto sao multiplicadas as chances do paciente nao ter
cancer como um resultado das duas opinioes?
Exercıcio 24. Temos tres caixas fechadas e voce seleciona uma ao acaso. E sabido que
uma caixa contem 2 moedas de ouro, a outra 2 moedas de prata, e a terceira, uma de
prata e uma de ouro. Uma moeda e extraıda da caixa que voce selecionou e ela resulta
ser de ouro. Qual e a chance de que a segunda moeda tambem seja de ouro?
Exercıcio 25. Com a notacao anterior, suponha que θj e ψj podem assumir qualquer um
dos valores 0, .1, .2, . . . , .9, 1.0. No caso da moeda, suponha que p(θ = 0.5) = 0.9 e seja
52 Teorema de Bayes
0.01 para os demais dez casos. No caso do ensaio clınico, suponha que p(ψ = ψj) = 1/11,
para cada j. Suponha que em 5 lancamentos foram observadas 5 caras, e que em 5 pares
de pacientes, em todos o tratamento novo foi melhor. Determine as probabilidades a
posteriori para estas evidencias.
Capıtulo 7
O valor da informacao
7.1 Informacao perfeita
No capıtulo anterior, vimos o efeito de uma nova informacao nas probabilidades de
eventos incertos, em um problema de decisao. Agora avaliaremos a melhora obtida no
procedimento de decisao com estas probabilidades atualizadas. Basicamente, vendo os
dados como fonte de informacao, queremos saber como medir esta informacao: conhe-
cendo os ganhos esperados a partir dos dados antes de que eles sejam disponibilizados,
podemos avaliar se vale a pena coleta-los.
Para isso, comecaremos com a situacao (nao comum) em que os dados sao completamente
informativos: eles dizem exatamente qual evento incerto ocorrera. Chamamos isto de
informacao perfeita. Continuaremos no contexto de consequencias monetarias e, como
simplificacao, suporemos que no intervalo de dinheiro considerado a utilidade e linear (o
que e basicamente correto se este intervalo for pequeno em comparacao com o capital
total).
Consideremos novamente o exemplo do investidor, no caso em que seu capital e grande
com relacao aos 100 dolares que ele pode ganhar ou perder com o investimento, com
consequencias como na tabela seguinte.
θ1: as acoes sobem θ2: as acoes caem
d1: investimento 5100 4900
d2: deixa no banco 5000 5000
Exercıcio 26. Confira que as funcoes de utilidade u1 e u2, com um fator de escala de
100, por exemplo, sao de fato praticamente lineares no intervalo de 4900 a 5000.
54 O valor da informacao
Nossa pergunta e: se o agente decisor conhecer uma maneira de saber exatamente o
que acontecera com as acoes, quanto ele devera estar preparado para pagar por esta
informacao perfeita antes de recebe-la?
Claramente, isto depende da probabilidade de que as acoes subam: como um caso
extremo, se tivermos quase certeza de que as acoes vao subir, ganhamos pouco com a
informacao de elas vao subir.
Suponhamos primeiro que esta probabilidade e 1/2: p(θ1) = p(θ2) = 1/2.
Tipicamente, o preco do conselho de um consultor financeiro e uma comissao sobre a
compra das acoes; ou seja, o pagamento so ocorre se tomarmos a decisao d1, o que
enviesa o conselho. Assim, suporemos inicialmente que o pagamento e fixo ou pago
antes da informacao perfeita.
A informacao perfeita sera um dos dois casos: ou θ1 ocorrera ou θ2 ocorrera.
Se for que θ1 ocorrera, entao d1 e a melhor decisao. Caso contrario, a melhor decisao
sera d2. Consequentemente, com informacao perfeita, o decisor tera ou 5000 dolares ou
5100 dolares, e portanto o resultado esperado com informacao perfeita e
5100/2 + 5000/2 = 5050 .
Sem a informacao perfeita, o ganho esperado e 5000 dolares, para qualquer uma das
decisoes, de modo que o valor esperado da informacao perfeita e a diferenca, 50 dolares.
Ou seja, valeria a pena pagar ate 50 dolares por receber este conselho.
Outra possibilidade e incorporar o valor da informacao, digamos f , na tabela de con-
sequencias,
θ1: as acoes sobem θ2: as acoes caem
d1: investimento 5100− f 4900− fd2: deixa no banco 5000− f 5000− f
Se o conselho for θ1, d1 e selecionado, obtendo 5100 − f ; se for θ2, d2 e selecionado,
obtendo 5000 − f . A esperanca e 5050 − f , que e igual aos 5000 sem informacao se
f = 50. Esta segunda solucao e interessante quando lidamos com utilidades mais gerais.
Se tivermos mais confianca de que as acoes irao subir, atribuindo, por exemplo, p(θ1) =
3/4, entao sem o conselho, e melhor investir, com valor esperado 5050 dolares. Se o
conselho for θ1, d1 e otimo com 5100; se for θ2, d2 leva a 5000, como antes; deste modo,
a esperanca com informacao perfeita e 5075 dolares. A diferenca, 25 dolares, e o valor
da informacao.
Valor esperado da informacao perfeita 55
Se tivermos, por exemplo, p(θ1) = 1/4, pela simetria do problema, o valor esperado da
informacao perfeita sera novamente 25 dolares. Isto contradiz a intuicao das pessoas que
acham que vale mais a pena pagar por um conselho sobre um investimento promissor
do que sobre um duvidoso.
7.2 Valor esperado da informacao perfeita
Consideremos um caso com decisoes d1, . . . , dm, eventos incertos θ1, . . . , θn com proba-
bilidades pj = p(θj), e utilidades uij = u(Cij). Assim, a utilidade esperada de cada
decisao e
ui =
n∑j=1
uij pj , (7.1)
e a melhor decisao, di∗ e aquela com maior utilidade esperada. Em outras palavras, a
utilidade esperada sem informacao adicional e igual a (7.1) para i = i∗.
Representemos este problema por uma tabela, como as anteriores, desta vez com m
linhas e n colunas, e suponha que existe informacao perfeita. Se o evento incerto for
θj , entao selecionamos a decisao com maior utilidade, na coluna j. A utilidade espe-
rada com informacao perfeita e obtida multiplicando estas utilidades maximais por suas
correspondentes probabilidades,
n∑j=1
maxiuij pj . (7.2)
A diferenca entre esta quantidade e (7.1),
n∑j=1
maxiuij pj −
n∑j=1
uij pj ,
e chamada o valor esperado da informacao perfeita: e o ganho esperado na utilidade
esperada ao receber a informacao perfeita.
Observe que este valor e sempre positivo: podemos esperar que sempre vale a pena ter
informacao perfeita.
Exercıcio 27. Mostre que o valor esperado da informacao perfeita e zero se e so se
existir uma decisao que e melhor que as outras, qualquer que seja o evento incerto.
7.3 Perdas
Veremos agora outra forma util de abordar um problema de decisao: suponha que para
cada utilidade uij , um numero aj , dependente do evento incerto mas nao da decisao, e
56 O valor da informacao
subtraıdo. Ou seja, todas as utilidades correspondentes ao mesmo evento incerto θj sao
subtraıdas em aj .
Assim, qualquer que seja i, (7.1) sera reduzido da quantidade∑
j aj pj , assim como
(7.2), e a diferenca entre estes valores se mantem.
Tomemos aj = maxk ukj , de modo que a diferenca anterior seja
0−maxi
n∑j=1
(uij − aj) pj .
Definamos lij = maxk ukj − uij , a diferenca entre a utilidade da melhor decisao para θj
e a utilidade para di quando θj ocorre. Esta e chamada a perda ao decidir di quando θj
ocorre. Assim, reescrevendo a expressao acima, temos
mini
n∑j=1
lij pj .
Em outras palavras, o valor esperado com a informacao perfeita e igual a menor perda
esperada obtida com qualquer decisao.
No exemplo do investimento, as perdas estao dadas na tabela seguinte.
θ1: as acoes sobem θ2: as acoes caem
d1: investimento 0 100
d2: deixa no banco 100 0
Com p1 = 3/4, a perda esperada com d1 e 25, com d2, 75. O menor destes valores e 25
dolares, que esta de acordo com o valor encontrado previamente.
Observe que a perda mede o quanto voce perde ao nao conhecer o evento incerto. A
informacao perfeita diz qual sera o evento incerto, reduzindo a perda a zero. Daqui, o
ganho compensa exatamente a perda.
Esta expressao alternativa de um problema de decisao nos leva a um princıpio equivalente
ao da maximizacao da utilidade esperada, que e o da minimizacao da perda esperada.
Para aplicar este princıpio, devemos considerar primeiro, para cada evento incerto, qual
e a melhor decisao, e entao avaliar quao piores sao as demais decisoes comparadas com
a otima (esta comparacao e mensurada pela perda).
Algumas vantagens deste procedimento sao:
(a) e necessaria a comparacao apenas entre as consequencias de cada coluna da tabela
de decisao, e nao sobre todas as consequencias;
(b) entrega diretamente uma expressao para o valor esperado da informacao perfeita.
Perdas 57
Um problema e a atribuicao dos valores das perdas, ja que eles dependem das utilidades,
que foram definidas em uma escala de probabilidade.
Por exemplo, para o investidor com funcao de utilidade u1, com aversao decrescente ao
risco, com fator de escala 10, no caso em que pode ganhar ou perder 100 dolares, tendo
um capital de 100 dolares. Em dolares, a tabela de decisao e
θ1: as acoes sobem θ2: as acoes caem
d1: investimento 200 0
d2: deixa no banco 100 100
E tentador afirmar que a tabela de perdas e
θ1: as acoes sobem θ2: as acoes caem
d1: investimento 0 100
d2: deixa no banco 100 0
reduzindo a situacao ao do agente decisor com capital de 5000 dolares analisando a
mesma aposta.
O argumento e falso, pois as perdas sao diferencas entre utilidades e nao entre quanti-
dades de dinheiro. A tabela de utilidades e
θ1: as acoes sobem θ2: as acoes caem
d1: investimento .364 .000
d2: deixa no banco .221 .221
com tabela de perdas (corretas)
θ1: as acoes sobem θ2: as acoes caem
d1: investimento .000 .221
d2: deixa no banco .143 .000
A perda esperada para d1 e .221× (1− p1), para d2 e .143× p1. Elas sao iguais quando
a razao de chances p1/(1− p1) for igual a .221/.143 = 1.55, ou em torno de 3 para 2. O
valor correspondente para p1 e 0.61.
Para qualquer decisor averso ao risco, a queda de 100 para 0 dolares e mais serio que o
aumento de 100 para 200 dolares, e isto se reflete na perda (definida apropriadamente)
se as acoes caırem ser maior do que no caso contrario.
58 O valor da informacao
7.4 Informacao perfeita com uma utilidade qualquer
Consideremos o valor esperado da informacao perfeita para um problema com resultados
monetarios, e com utilidade nao linear, como o da tabela seguinte.
θ1: as acoes sobem θ2: as acoes caem
d1: investimento u(C + a) u(C − a)
d2: deixa no banco u(C) u(C)
probabilidade p 1− p
Suponha que voce deva pagar uma taxa f para a informacao perfeita, que sera paga
qualquer que seja o resultado,
θ1: as acoes sobem θ2: as acoes caem
d1: investimento u(C + a− f) u(C − a− f)
d2: deixa no banco u(C − f) u(C − f)
probabilidade p 1− p
Com informacao perfeita, a utilidade esperada e
p u(C + a− f) + (1− p)u(C − f) .
Suponha que, sem tal informacao, a melhor decisao seja d2, com utilidade esperada
u(C). Entao a maior taxa que estarıamos dispostos a pagar e o valor f que faz este
valor esperado igual a u(C),
p u(C + a− f) + (1− p)u(C − f) = u(C) . (7.3)
Para um valor suficientemente pequeno de f , a desigualdade > se cumpre, e podemos
esperar que o conselho valha a pena.
Se d1 fosse a melhor decisao sem informacao, similarmente, obterıamos a condicao
p u(C + a− f) + (1− p)u(C − f) = p u(C + a) + (1− p)u(C − a) .
Para o decisor com aversao ao risco decrescente, considere o jogo de ganhar ou perder
100 dolares, com mesma chance, tendo um capital de 100 dolares, para o qual a melhor
decisao e d2. A equacao (7.3) fica
u(200− f)/2 + u(100− f)/2 = u(100) ,
representada pela Figura 7.1 (a escala foi omitida e a curvatura exagerada para facilitar
a visualizacao).
Informacao perfeita com uma utilidade qualquer 59
Figura 7.1: Avaliacao de uma taxa razoavel.
Por causa da diminuicao da utilidade marginal, (200 − f) − 100 > 100 − (100 − f), de
onde obtemos que f = 50 dolares seria uma taxa alta demais para pagar. Por tentativas
(com valores menores que 50), obtemos que f deve ser em torno de 44 dolares. Ja o
decisor mais rico, com capital de 5000 dolares, poderia pagar ate 50 dolares pela mesma
informacao.
O procedimento geral fica agora claro.
A situacao sem informacao entrega utilidades u(Cij) e o melhor que podemos fazer e
maximizar a utilidade esperada na forma usual.
Se a informacao perfeita custar f , em termos monetarios, entao todas as utilidades
virarao u(Cij − f), obtendo utilidade esperada
n∑j=1
maxiu(Cij − f) pj .
O valor monetario da informacao perfeita e entao a solucao da equacao
n∑j=1
maxiu(Cij − f) pj = max
i
n∑j=1
u(Cij) pj .
Em algumas situacoes, a taxa so e paga para algumas consequencias e nao para outras, ou
entao pode variar com as consequencias (como e o caso de comissoes em porcentagem).
Nestes casos, as consequencias sao modificadas de Cij para Cij − fij , e procedemos da
mesma maneira.
Se as consequencias Cij forem nao monetarias, entao o efeito da taxa deve ser combinado
com os elementos nao-monetarios de forma apropriada para derivar novas consequencias,
60 O valor da informacao
C ′ij , digamos. A taxa vale a pena se
n∑j=1
maxiu(C ′ij) pj ≥ max
i
n∑j=1
u(Cij) pj .
7.5 Valor esperado da informacao parcial
Passemos agora da situacao em que recebemos informacao perfeita (e nosso conheci-
mento muda as probabilidades para 0 ou 1), a situacao mais geral, em que a informacao
e menos que perfeita e as probabilidades sao modificadas pela regra de Bayes (e ainda
mantemos a incerteza).
Denotemos por X a informacao adicional. Para ser util, X deve estar relacionado com
os eventos θj e suponhamos que p(X | θj) sao conhecidas.
Com isto, o decisor tem novas probabilidades, dadas por p(θj | X), de modo que maxi-
mizar a utilidade esperada corresponde a encontrar di que alcanca
maxi
n∑j=1
uij p(θj | X) ,
no lugar de
maxi
n∑j=1
uij p(θj) ,
que ele obteria sem X.
Exatamente como no caso de informacao perfeita, no qual o decisor nao sabia a forma
que a informacao teria, aqui ele nao sabe o que os dados mostrarao. No entanto, ele
tem uma probabilidade para estes dados,
p(X) =
n∑j=1
p(X | θj) p(θj) .
O decisor sabe o que fazer se obtiver X, e sabe a probabilidade de obter X. Consequen-
temente, ele espera obter
∑X
maxi
n∑j=1
uij p(θj | X) p(X) .
Como p(θj | X) p(X) = p(X | θj)p(θj), a utilidade esperada resultante da informacao
parcial e ∑X
maxi
n∑j=1
uij p(X | θj) p(θj) . (7.4)
Valor esperado da informacao parcial 61
A diferenca deste valor com a utilidade esperada sem X e o valor esperado da informacao
parcial.
Voltemos ao nosso investidor, com um capital de 5000 dolares, analisando o jogo em que
pode ganhar ou perder 100 dolares, com mesma chance, e com utilidade proporcional
ao dinheiro. Vimos que a informacao perfeita valia 50 dolares.
Suponha que ele esta pensando em procurar assessoria de um consultor, que nao e
infalıvel, mas que tem mais informacao que ele proprio. Ate quanto ele deveria pagar
pelo conselho? Obviamente, menos que 50 dolares; quanto menos?
E claro que isto depende do grau de acerto do consultor: alguns consultores sao melhores
que outros, e devemos primeiramente descrever esta habilidade quantitativamente, como
ja vimos, atraves da funcao de verossimilhanca, p(X | θj).
Consideremos um assessor bastante confiavel, que da um bom conselho 3/4 das vezes,
ou seja,
p(X1 | θ1) = p(X2 | θ2) = 3/4 ,
onde denotamos por X1 o conselho de comprar acoes, e por X2, o de nao comprar. A
seguinte tabela mostra um resumo destes valores, do lado esquerdo.
θ1 θ2 X1 X2
d1 5100 4900 2525 2475
d2 5000 5000 2500 2500
pj 1/2 1/2
p(X1 | θj) 3/4 1/4
p(X2 | θj) 1/4 3/4
Do lado direito, para qualquer decisao e resultado X, calculamos parte de sua utilidade
esperada,
5100× 3/4× 1/2 + 4900× 1/4× 1/2 = 2525 etc.
Para cada X, selecionamos o maior valor (indicado pelo sublinhado). Somando estes
valores, em X, obtemos 5025 dolares. Sem o conselho, qualquer decisao produz uma
esperanca de 5000 dolares, consequentemente, deverıamos estar preparados para pagar
ate 25 dolares pelo conselho. Observe que isto e a metade de uma informacao perfeita.
As mesmas contas poderiam ter sido feitas usando perdas no lugar de utilidades. Neste
caso, como assumimos utilidade linear, as perdas sao simplesmente as diferencas nos
ganhos monetarios.
Exercıcio 28. Construa a tabela de perdas para este exemplo, e determine o valor do
assessor.
62 O valor da informacao
Exercıcio 29. Mostre que o valor esperado de informacao parcial e sempre maior que
zero, a menos que a informacao seja irrelevante.
Observe que isto implica que se voce estiver para receber alguma informacao relevante
sobre alguns eventos incertos, entao e esperado que a utilidade esperada para qualquer
problema de decisao envolvendo estes eventos aumente como resultado da informacao.
Aqui temos duas esperancas: uma devida aos eventos incertos, e outra a informacao
incerta.
Estas ideias nos permitem atribuir um valor esperado monetario a qualquer informacao,
pelo menos no caso em que as consequencias sao completamente monetarias e a utilidade
e linear. Se a informacao estiver disponıvel a um preco menor que este valor, entao e
melhor pega-la, caso contrario, ela deveria ser recusada. Desta forma, uma empresa con-
siderando a comercializacao de um novo produto pode determinar se vale a pena aceitar
o orcamento de um instituto de pesquisa de mercado para realizar um levantamento que
estime a demanda provavel do produto.
Outro uso destas ideias e na comparacao da eficiencia esperada entre dois tipos dife-
rentes de informacao. Um engenheiro, por exemplo, pode considerar realizar alguns
experimentos em laboratorio ou, alternativamente, construir um prototipo. Se os cus-
tos destas opcoes forem comparaveis, entao ele poderia decidir entre elas com base no
retorno esperado que estes dados poderiam ter.
Exercıcio 30. No exemplo anterior, suponha que um segundo consultor e muito bom
para identificar boas acoes, mas tem um desempenho regular para acoes que podem cair.
Ou seja, suponha que para este consultor p(X1 | θ1) = 0.9 e p(X2 | θ2) = 0.6. Determine
o valor maximo a ser pago para este segundo consultor.
A generalizacao para o caso de uma utilidade nao-linear e similar ao feito para informacao
perfeita. Mesmo que este caso extremo nao ocorra na pratica, conhecer o valor da
informacao perfeita entrega um limitante para o valor de uma informacao parcial.
Se a utilidade for nao-linear mas as consequencias forem monetarias, precisamos subtrair
o custo f de cada consequencia antes de avaliar a utilidade. A expressao (7.4) entao fica∑X
maxi
n∑j=i
u(Cij − f) p(X | θj) p(θj) ,
para custo f constante. O ganho monetario esperado da informacao e o valor f que
torna esta expressao igual a utilidade esperada original, maxi∑
j uijpj .
O interessante de calcular o valor da informacao perfeita e que ele entrega, com um
calculo simples, um limitante superior para o custo de uma informacao parcial.
Valor esperado da informacao parcial 63
Exercıcio 31. Determine o valor da informacao perfeita para os seguintes casos. As
entradas das tabelas estao em dolares, e a utilidade pode ser considerada linear em
funcao do dinheiro.
(a)
θ1 θ2
d1 130 90
d2 100 105
pj 1/3 2/3
(b)
θ1 θ2
d1 1000 100
d2 100 200
pj 0.2 0.8
(c)
θ1 θ2 θ3
d1 500 300 200
d2 400 200 400
pj 0.2 0.5 0.3
Exercıcio 32. Repita o item (b) do exercıcio anterior para o investidor com aversao
ao risco decrescente, com fator de escala igual a 10.
Exercıcio 33. (a) Para o item (a) do exercıcio anterior, calcule o valor esperado de
um consultor que acerta com probabilidade 2/3.
(b) Para o item (b) do exercıcio anterior, calcule o valor esperado de um consultor que
esta sempre correto se θ2 for verdadeiro, mas somente metade das vezes se θ1 for.
(c) Para o item (c) do exercıcio anterior, calcule o valor esperado de um consultor que
aconselha X1, X2, X3 com probabilidades
p(Xi | θi) = 1/2 , p(Xi | θj) = 1/4 se i 6= j .
Exercıcio 34. Uma firma esta considerando lancar um de dois produtos, d1 ou d2. O
primeiro e esperado ir bem se a economia andar bem; o segundo pode ir melhor se a
economia estiver fraca. Os retornos esperados (em 1000 dolares) e as probabilidades
relevantes sao
64 O valor da informacao
θ1: bom θ2: moderado θ3: fraco
d1 50 30 20
d2 40 30 30
pj 0.3 0.4 0.3
(a) Uma empresa de pesquisa de mercado oferece fazer um levantamento por 4000
dolares. Esta oferta deve ser aceita? Suponha que a utilidade e proporcional ao di-
nheiro.
(b) Calcule o valor esperado do conselho sugerido no item (c) do exercıcio anterior.
7.6 Aplicacao em amostragem
No exemplo do comerciante, que considerava a possibilidade de analisar uma amostra
para ganhar informacao parcial sobre a qualidade do lote a ser comprado, podemos
obter o valor monetario esperado da amostra, usando o valor esperado da informacao
parcial, e compara-lo com o custo real da amostragem. Alem disso, podemos determinar
o melhor tamanho de amostra com esta abordagem.
Tipicamente, a medida que a amostra aumenta, o valor esperado da informacao parcial,
que naturalmente aumenta, tem valor marginal cada vez menor.
Desta maneira, ha um ponto em que o crescimento marginal nao compensa o custo
adicional de uma nova unidade amostral. A Figura 7.2 mostra esta situacao, quando
consideramos custo linear com o tamanho da amostra.
Figura 7.2: Custo e valor esperado de uma amostra, em funcao de seu tamanho.
O ponto C mostra o tamanho de amostra otimal, onde a distancia AB (representando
a razao entre benefıcio e custo) e maxima.
Capıtulo 8
Arvores de decisao
Voltando ao exemplo do comerciante da secao anterior, ele poderia considerar a amostra-
gem de uma quantidade fixa de itens, digamos 10, e entao, depois de analisar a amostra,
tomar uma decisao.
Uma forma alternativa de procedimento e tomar a amostra com um item por vez,
inspecionando-o e entao, depois de cada inspecao, decidir continuar ou nao com a amos-
tragem. Em alguns casos, e possıvel chegar a uma decisao mais eficientemente do que
com uma amostra fixa. Por exemplo, se os 6 primeiros itens estiverem com defeito, o
comerciante poderia pensar que isto e evidencia suficiente para concluir que o lote e de
baixa qualidade e que nao vale a pena amostrar os quatro itens restantes.
O metodo de tomar uma decisao apos cada item amostrado e chamado sequencial.
Muito problemas de decisao sao de carater sequencial: o engenheiro planejando e cons-
truindo uma planta tipicamente nao toma uma decisao geral para todo o projeto e depois
o segue; o que ele faz e tomar algumas poucas decisoes iniciais, deixando outras para
depois quando tiver mais informacao. A operacao inteira consiste em uma sequencia de
problemas de decisao conectados.
Assim, no exemplo do comerciante, a quantidade do pedido esta relacionada com o
pedido da semana seguinte e com o da semana anterior. As regras de coerencia vistas
continuam a ser aplicadas em decisoes tomadas em sequencia, levando como antes a
regras otimas de procedimento.
A principal ferramenta para lidar com tais problemas e o conceito de arvore de decisao
e as ideias consequentes de programacao dinamica.
Voltemos ao exemplo do investidor, com tabela de decisao
66 Arvores de decisao
θ1 θ2
d1 5100 4900
d2 5000 5000
pj 0.6 0.4
p(X1 | θj) 0.8
p(X2 | θj) 0.7
Suporemos que a utilidade e linear sobre o intervalo de valores envolvidos no problema,
e que o investidor tem um assessor que pode aconselha-lo por um custo f , dizendo se
ele deve comprar acoes, X1, ou nao, X2. Suponha que a confianca no assessor e descrita
pelas probabilidades p(X1 | θ1) = 0.8 e p(X2 | θ2) = 0.7.
O investidor deve decidir se contrata ou nao o assessor e se investe ou nao nas acoes
(com ou sem conselho). Este problema pode ser descrito por uma arvore de decisao.
Esta arvore cresce horizontalmente da esquerda para a direita, comecando com as acoes
possıveis, representadas pelos primeiros galhos da esquerda: assessor, d1, d2. Seguindo
o galho do assessor, dois conselhos podem ser recebidos: X1 ou X2. Qualquer que seja o
conselho, o investidor deve entao decidir d1 ou d2. Finalmente, incorporamos ao fim dos
galhos a informacao sobre os eventos incertos, θ1 e θ2. A Figura 8.1 mostra a estrutura
de decisao do problema (esqueca os numeros que aparecem, por enquanto).
Figura 8.1: Arvore de decisao para o problema do investidor.
Cada nodo contem um grupo de galhos, representando ou decisoes ou resultados a serem
observados ou obtidos. Note que ao construir a arvore, seguimos a ordem natural dos
eventos no tempo.
67
Os nodos de decisao, cujos galhos dependem da escolha do decisor, sao representados
por um quadrado. O nodos dos resultados, que nao dependem do decisor mas sim de
uma amostra ou do estado da natureza, ambos incertos para o decisor, sao chamados
nodos aleatorios e sao representados por um cırculo.
A analise de uma arvore de decisao envolve dois tipos de quantidades: probabilidades e
utilidades.
A primeira informacao que adicionaremos a arvore sao as probabilidades envolvidas.
Lembrando que a arvore e construıda em ordem temporal, nos nodos aleatorios devemos
considerar somente a informacao conhecida previamente a eles: nossas probabilidades
sao condicionais a essa informacao.
Comecando, por exemplo, com d1, encontramos o nodo aleatorio com galhos θ1 e θ2.
Como, ate esse nodo, nao ha nenhum outro tipo de informacao, as probabilidades sao
as iniciais no problema, p1 = 0.6 e p2 = 0.4. O mesmo ocorre com d2.
Seguindo o galho do assessor, o argumento e diferente. O primeiro nodo aleatorio se
refere ao conselho que o assessor poderia dar, X1 ou X2. Como nao sabemos qual evento
incerto ocorrera, θ1 ou θ2, temos
p(X1) = p(X1 | θ1) p1 + p(X1 | θ2) p2 = 0.6
e p(X2) = 1 − p(X1) = 0.4. Continuando por estes galhos, chegamos a um nodo de
decisao e depois aos nodos aleatorios correspondentes a θ1 e θ2. As probabilidades
relevantes agora sao p(θj | Xi) para cada uma das informacoes X1 e X2, que sao obtidas
pela regra de Bayes,
p(θ1 | Xi) = p(Xi | θ1)p1/p(Xi) i ∈ {1, 2} .
Todas estas probabilidades obtidas sao adicionadas na arvore, nos respectivos galhos.
A seguir, consideramos a utilidade da consequencia de cada sequencia de decisoes e
eventos incertos, representadas por cada um dos galhos. Neste caso, como a utilidade e
suposta linear, consideramos os valores monetarios de cada galho. Estes sao os valores
finais que aparecem nos galhos da arvore.
Finalmente, realizamos a analise do problema, voltando pelos galhos em sentido inverso.
Em cada nodo aleatorio, registramos a utilidade esperada, e em cada nodo de decisao,
escolhemos a decisao com maior utilidade esperada, cortando o galho das decisoes ex-
cluıdas por este criterio.
Por exemplo, no galho assessor-X1, a utilidade esperada de d1 e 5060 − f e a de d2,
5000− f . Assim, excluımos a decisao d2.
68 Arvores de decisao
Continuando assim por todos os galhos, chegamos na raiz da arvore, de onde excluımos
a decisao d2 por ter utilidade menor que d1. Concluımos que o assessor sera a melhor
decisao se seu custo f for menor que 16 dolares, caso contrario, d1 sera a melhor decisao.
8.1 Exemplo (petroleira)
Uma empresa exploradora de petroleo tem uma opcao em uma terreno dentro de uma
regiao produtora. Ela deve decidir entre fazer perfuracoes no lugar antes que a opcao
expire ou abandonar seus direitos. A rentabilidade das perfuracoes dependera de um
grande numero de variaveis desconhecidas e nao previsıveis com certeza: o custo da
perfuracao, a quantidade de petroleo ou gas encontrada, o preco de venda deste petroleo
ou gas, etc. O problema pode se complicar mais pelo fato de que e possıvel realizar varios
testes ou experimentos para obter mais informacao sobre a estrutura geofısica do terreno.
Como algumas estruturas sao mais favoraveis para a existencia de petroleo que outras,
esta informacao poderia ser muito util para tomar a decisao de escavar ou nao. Mas, os
varios testes possıveis tem um custo substancial (em dinheiro), e alem disso nao e obvio
que qualquer um deles deva ser realizado. A empresa deve decidir se realizara algum
dos testes e, finalmente, se realizara perfuracoes ou nao.
Consideremos uma versao simplificada deste problema, com as seguintes suposicoes:
1. se o terreno for escavado, isto sera feito com um contrato a preco fixo de 100 mil
dolares;
2. se for encontrado petroleo, a empresa imediatamente o vendera a um produtor de
larga escala por 450 mil dolares;
3. somente pode ser aplicado um tipo de teste, chamado sonar sısmico, antes de decidir
escavar ou nao. Este experimento custa 10 mil dolares; se for realizado, ele revelara com
certeza se a estrutura do terreno e de tipo A (favoravel a existencia de petroleo), tipo
B (menos favoravel), ou tipo C (muito desfavoravel).
Podemos imaginar a empresa tomando uma decisao sequencial: primeiro decidindo se
aplica ou nao o teste. Se decidir aplicar o teste, entao um de tres eventos ocorrera: a
estrutura do terreno sera diagnosticada como tipo A, B ou C; se decidir nao aplicar,
entao apenas um evento ocorre neste estagio: nao obter informacao.
O diagrama da Figura 8.2 mostra este processo, da esquerda para a direita: os nodos em
que o decisor tem o controle sao chamados nodos de escolha e denotados por quadrados;
os nodos em que o decisor nao tem controle sao nodos de eventos e denotados por
cırculos.
Exemplo (petroleira) 69
Figura 8.2: Arvore de decisao da empresa exploradora de petroleo.
Para qualquer uma desta opcoes de acao do primeiro estagio, a empresa deve entrar no
segundo estagio para decidir se realiza as perfuracoes ou se abandona a opcao. Se ela
escavar, entao um de dois eventos ocorrera: encontra petroleo ou a perfuracao esta seca;
se ela escolhe abandonar a opcao, entao o unico evento possıvel e “perde os direitos”.
Finalmente, ao extremo direito do grafico, descrevemos a consequencia de cada uma
das possıveis acoes e eventos. No exemplo, se a empresa decidir nao realizar o teste e
abandonar a opcao, a consequencia e 0 dolares: nao consideramos o investimento original
ao comprar a opcao, ja que este ja e fundo perdido que nao pode ser afetado pela decisao
atual e portanto e irrelevante para este problema de decisao.
A empresa poderia tambem adotar a estrategia de realizar escavacoes se souber que a
estrutura do terreno e de tipo A ou B, e nao realiza-las se for de tipo C. No entanto, seu
problema imediato e gastar ou nao 10 mil para conhecer o tipo de estrutura. Obviamente
esta informacao tem um valor, o que nao e claro e se este valor e maior ou menor que
os 10 mil que a informacao custa.
O problema enfrentado pela petroleira de fato e mais complicado que o representado
na Figura 8.2. Em primeiro lugar, porque existem diversos experimentos que poderiam
ser realizados para conhecer a estrutura do terreno; assim deverıamos ter mais galhos
correspondentes aos experimentos possıveis e um correspondente a nao realizacao de
experimentos. Alem disso, poderiam ser realizados mais de um experimento. A Figura
8.3 mostra a arvore de decisao com dois experimentos possıveis, I e II, tendo como
resultados F - favoravel, e U - nao favoravel.
Do mesmo modo, as possıveis escolhas finais em problemas reais sao muito mais nu-
merosas do que simplesmente “escavar” ou “abandonar”. Depois da fase de testes, a
70 Arvores de decisao
Figura 8.3: Arvore de decisao da empresa exploradora de petroleo, considerando mais
de um tipo de teste exploratorio.
empresa poderia fazer diversas propostas compartilhando os riscos com outras empresas
ou investidores.
Finalmente, os possıveis resultados das escavacoes (com risco compartilhado ou nao)
nao sao somente “vender por 450 mil”. Este valor depende da quantidade estimada, da
profundidade em que o produto se encontra, etc.
Exercıcio 35. Construa a arvore de decisao dos seguintes problemas, resolvendo o
mesmo quando houver valores dados.
1. (inventario) O dono da cantina de uma escola deve abrir um pedido de compra de
uma mercadoria perecıvel (coxinha, empadinha de palmito), que estraga se nao for
vendida ate o fim do dia em que for entregue. Ele nao sabe qual sera a demanda
do item, no entanto ele deve decidir o total de unidades do pedido.
2. (excesso de producao) Um dono de uma empresa de manufatura e contratado
para entregar 100 pecas boas de um produto “costumizado” a um preco fixo pelo
lote. Ele sabe que havera algumas pecas com defeito entre as 100 primeiras pecas
produzidas. Realizar uma segunda linha de producao para completar as 100 pecas
boas do contrato tem um custo substancial (em dinheiro), de modo que ele prefere
fabricar pecas adicionais para substituicao das pecas com defeito. Por outro lado,
depois que as 100 pecas boas forem produzidas, o custo direto de producao dos
itens adicionais sera uma perda total, e portanto ele nao quer produzir um adicional
muito grande. Se ele soubesse exatamente quantas pecas deveriam ser produzidas
para ter 100 pecas boas no fim, escolher a quantidade certa para a producao seria
facil; mas ele deve tomar esta decisao sem essa informacao.
Exemplo (petroleira) 71
3. (metodos de manufatura) Um dono de manufatura pretende equipar sua empresa
para a producao de um produto novo. Este produto pode ser produzido por um de
dois processos: um deles requer um capital de investimento relativamente pequeno,
mas um alto custo de producao por unidade; o outro tem um custo muito menor
na producao de cada unidade, mas exige um investimento inicial muito mais alto.
O primeiro processo sera bom se as vendas do produto forem lentas, enquanto que
o segundo sera melhor se as vendas forem altas. No entanto, a decisao deve ser
tomada sem saber como serao de fato as vendas do novo produto.
4. (estrategia de mercado) O gerente de uma marca de embutidos esta considerando
mudar a embalagem do produto, com o intuito de que a nova embalagem chame
mais a atencao na gondola do supermercado, aumentando as vendas. Ele faz uma
pesquisa de mercado, e percebe que na semana anterior as vendas da embalagem
nova aumentaram em algumas lojas, mas que diminuiram em outras. Ele ainda
esta incerto sobre adotar ou nao a nova embalagem, ou sobre decidir gastar mais
dinheiro em uma nova pesquisa de mercado. No ultimo caso, ele deve decidir
se continua por mais algumas semanas nas mesmas lojas ja analisadas ou gastar
ainda mais dinheito para incorporar novas lojas em sua amostra.
5. Uma companhia petroleira deve decidir realizar ou nao perfuracoes em um ponto
especıfico. O custo de um teste sısmico e c, e seu resultado sobre a perspectiva
de petroleo pode ser “bom”, “medio” ou “ruim”. A operacao de perfuracao custa
75 unidades, com tres possıveis resultados: uma alta producao de petroleo que
pode ser vendida por 200 unidades, uma producao moderada de 100 unidades, ou
nenhuma. Os dados previos da companhia para lugares similares sao
alto moderado nenhum total
bom 20 10 10 40
medio 9 9 12 30
ruim 3 12 15 30
Alem disso, nao foram feitas perfuracoes em lugares com os seguintes registros
sısmicos: bom - 0; medio - 10; ruim - 20. Se tivessem sido realizadas, acredita-se
que os resultados seriam similares aos da tabela. Qual e o valor maximo c para
que o teste sısmico valha a pena de ser realizado? Se o custo do teste sısmico for 5
unidades a menos do que este valor, determine a interpretacao otima do resultado
do teste em termos da decisao de escavar ou nao. Qual e o lucro esperado?
6. Uma certa peca de um aeroplano pode ser submetida a um teste antes de ser
instalada. Este teste tem apenas 75% de chance de detectar uma falha, se ela
72 Arvores de decisao
existir, e a mesma chance de aprovar uma peca sem defeitos. Sendo testada ou
nao, a peca poderia ser refeita a um custo bastante alto mas com a certeza de ficar
sem defeitos. Se uma peca defeituosa for instalada, a perda e L (em utilidade). Se
o processo de refazer a peca custa L/5 (em utilidade) e 1 de cada 8 pecas vem com
defeito, calcule ate quanto voce pagaria para realziar o teste e determine todas as
decisoes otimas.
7. Um medico deve decidir se submeter um certo paciente, com uma possıvel doenca,
a uma operacao de risco. Se o paciente tiver a doenca e for operado, a chance
de recuperacao e de 50%; sem a operacao, ele tem uma chance de 1 em 20 de se
recuperar. Por outro lado, se ele nao tiver a doenca e for submetido a cirurgia,
ele tem uma chance de 1 em 5 de morrer como resultado da operacao. Assessore
o medico nesta decisao (suponha que existem sempre apenas duas possibilidades,
morte ou recuperacao).
8. Refaca o exercıcio anterior, considerando recuperacao como ou completa ou parcial.
Se a operacao for realizada e houver recuperacao, esta sera sempre completa. Se
a operacao nao for realizada e houver recuperacao, esta sera parcial se ele tiver
a doenca e completa se nao (suponha que a cirurgia nao pode ser realizada mais
tarde se o paciente viver: a decisao deve ser feita ja).
Capıtulo 9
Atribuicao de probabilidades e
utilidades
O argumento que usamos ate agora foi o logico de que se voce quer tomar decisoes
sensatas, como por exemplo o uso do princıpio da coisa certa, entao a logica da situacao
de decisao o leva a considerar necessariamente probabilidades e utilidades, assim como
o princıpio da maximizacao da utilidade esperada. Qualquer outro procedimento de
decisao poderia deixar em aberto a possibilidade de fazer coisas absurdas, como perder
dinheiro com certeza como no exemplo do Dutch book.
Uma crıtica a esta abordagem e que as pessoas nao somos logicas, de modo que o
procedimento sugerido e impraticavel. No entanto, como vimos em alguns exemplos, e
possıvel desenvolver a habilidade de aplicar um raciocınio logico em decisoes na pratica:
uma forma e treinar para pensar probabilisticamente. Em particular, um estatıstico
deve estar formado para fazer isto. O fato de nao ser facil nao leva a concluir que a
teoria deva ser descartada (a mecanica newtoniana tambem foi difıcil no comeco...).
9.1 Atribuicao de probabilidades
Como mencionamos no comeco, temos tres metodos para atribuir probabilidades: regra
de escore, coerecia e metodos indiretos.
Uma regra de escore mede quao boa e nossa atribuicao de probabilidade em alguns casos
particulares (quando podemos saber de fato se o evento incerto ocorre), experiencia que
permite que melhoremos nossa atribuicao em outros casos.
74 Atribuicao de probabilidades e utilidades
Suponha que voce quer atribuir uma probabilidade p, de sua escolha, a um evento dado,
cuja probabilidade de fato e P . Usando escore quadratico, seu escore sera (p− 1)2 se o
evento for verdadeiro, com probabilidade P , ou p2 se falso, com probabilidade (1− P ).
O escore esperado, se voce escolher p, e
(p− 1)2P + p2(1− P ) = (p− P )2 + P (1− P ) ,
que alcanca seu valor mınimo quando p = P , encorajando a honestidade. Dizemos assim
que esta regra e propria: a melhor decisao e o valor correto de P .
Existem outras regras de escore que tambem sao proprias, como, por exemplo, a regra
logarıtmica, com escores − log p, se o evento for verdadeiro, e − log(1 − p), se for falso
(prove que p = P e ponto de mınimo do escore esperado).
Exercıcio 36. Refaca os exercıcios das tabelas das paginas 15 e 17, usando regra de
escore logarıtmico para ver a diferenca entre as duas regras.
Observe que esta regra aplica penalidades arbitrariamente grandes se p esta proxima
de 0 ou de 1, desencorajando a atribuicao destes valores extremais mais do que a regra
quadratica.
Outra exemplo e a regra raiz quadrada que aplica penalizacao 1/√p, se o evento for
verdadeiro, e√p, se for falso, quando atribuımos probabilidade p. Aqui, p pode ser
qualquer valor positivo. O escore esperado e
P√p
+ (1− P )√p ,
que alcanca o valor mınimo se√P/√p =
√(1− P )
√p, ou seja, quando p = P/(1−P ).
Esta regra e portanto impropria para P , no entanto, e propria para a razao de chances a
favor do evento. E possıvel verificar que esta regra implica nas regras de probabilidade
vistas (probabilidade da uniao, lei do produto, regra de Bayes etc) escritas em termos
da razao de chances.
Da mesma maneira, existem outras regras de escore que sao proprias para alguma funcao
de P . Existem, no entanto, regras que sao improprias e inadequadas para este problema.
Por exemplo, consideremos um escore dado pela distancia entre a atribuicao p e 1, se o
evento for verdadeiro, e entre p e 0, se for falsa. O escore esperado e
(1− p)P + p(1− P ) = p(1− 2P ) + P ,
que alcanca valor mınimo em p = 0 se 1− 2P for positivo, e em p = 1, se for negativo.
Assim, se P < 1/2, atribua p = 0, e se P > 1/2, atribua p = 1, qualquer um sendo
Atribuicao de probabilidades 75
aceitavel se P = 1/2. Esta regra e claramente absurda, ja que produz apenas dois valores,
0 ou 1, de acordo a se o evento e considerado menos ou mais provavel de ocorrer. Alias,
e o tipo de regra usado quando alguem deve escolher entre duas alternativas em uma
questao de multipla escolha, no lugar de poder responder a sua probabilidade para cada
uma.
Assim, podemos ter regras de escore que sao: proprias para a probabilidade, proprias
para uma funcao da probabilidade, ou improprias.
Uma dificuldade que pode aparecer com regras de escore e que uma pessoa pode es-
tar usando uma regra implıcita que e impropria para a probabilidade. Por exemplo,
consideremos uma modificacao da regra quadratica, tal que a perda quando o evento
e falso e duas vezes mais serio que quando e verdadeiro (por exemplo, orientar a es-
cavacao quando nao ha petroleo e mais grave do que orientar a nao escavacao quando
ha petroleo). Assim, os escores sao 2p2 se o evento for falso, e (1 − p)2, quando for
verdadeiro. O escore esperado e
(1− p)2P + 2p2(1− P ) ,
que alcanca seu mınimo quando p = P/(2 − P ), que e sempre menor que P . Assim,
estaremos sempre subestimando a probabilidade.
Inversamente, alguem que esta desenvolvendo um novo produto, ou medicamento ou
teoria cientıfica, pode refletir seu entusiasmo implicitamente na regra de escore, supe-
restimando a probabilidade P de que ele funcione.
Podemos corrigir esta situacao se percebermos que ela esta ocorrendo. Assim, no exem-
plo, podemos transformar o valor p em 2p/(1+p), e usa-lo como a probabilidade propria.
Usando o fato de que as probabilidades (ou razoes de chances) obedecem as regras ja
vistas, podemos melhorar a atribuicao feita pela regra de escore. Assim, ao pensar em
um evento incerto, podemos introduzir outros eventos, atribuir suas probabilidades, e
usar as leis de probabilidade para obter melhores atribuicoes que a original.
Esta e talvez a melhor forma pratica de evaluar probabilidades: pensar no problema
como um todo, e nao apenas em um evento, e pensar coerentemente sobre ele.
Assim, no exemplo do caminho pela cordilheira, usemos a seguinte notacao para os
eventos envolvidos: C, o carro e usado; O, o caminho esta aberto; G, as condicoes da
estrada sao boas; A, ocorre um acidente; T , a pessoa chega a tempo no seu destino.
Suponha que as probabilidades condicionais sao as descritas pela arvore da Figura 9.1,
de modo que: p(T | CC) = 0.9, p(O | C) = 4/5, p(G | C,O) = 2/3, p(A | C,OC) = 1/16,
p(T | C,O,G) = 0.95, p(T | C,O,GC) = 11/16 e p(A | C,O,GC) = 1/16.
76 Atribuicao de probabilidades e utilidades
Figura 9.1: Arvore de decisao para a viagem pela cordilheira.
Estas probabilidades sao atribuıdas na ordem natural do tempo. Esta forma de atri-
buicao e muito mais simples, pois estamos mais acostumados a pensar condicionalmente:
estas probabilidades condicionais podem assumir qualquer valor entre 0 e 1, sem outra
restricao com os eventos anteriores. No entanto, uma vez que estes valores sao selecio-
nados, todas as demais probabilidades do problema ficam determinadas.
Entao, por exemplo, se o carro for usado, a probabilidade de um acidente e
p(A | C) = p(A | C,O)p(O | C) + p(A | C,OC)p(OC | C) = 0.029 .
Se o agente decisor nao estiver de acordo com este valor, por nao refletir sua opiniao,
entao algumas das probabilidades anteriores devem ser revisadas, mantendo coerente-
mente as leis de probabilidade.
A coerencia sempre deve ser a principal ferramenta para entender a incerteza. Assim,
incluir outros eventos, relacionados com o evento em questao, pode facilitar o processo
de atribuicao de probabilidade.
Probabilidades pequenas
As vezes, e necessario considerar eventos com uma probabilidade muito pequena de
ocorrer, pois suas consequencias, se eles ocorrere, podem ser serias. Um acidente em
uma usina petroleira e um exemplo.
Aqui aparece um novo problema: e difıcil pensar em valores muito pequenos, como uma
probabilidade de 1 em 1000, ou 1 em um milhao. Este e um dos motivos porque log de
razao de chances podem ser preferıveis, que aqui dao os valores 3 e 6, respectivamente
(em base 10).
Um caminho util e compara o evento com outro que seja mais familiar e que tenha em
torno da mesma probabilidade. Por exemplo, 1 em 1000 e um pouco mais provavel
Atribuicao de probabilidades 77
que obter quatro 6’s em quatro lancamentos de um dado balanceado, ou 10 caras em
10 lancamentos de uma moeda equilibrada. Em uma pesquisa sobre lixo nuclear, a
probabilidade de contrair leucemia foi dita ser em torno da mesma de morrer como
resultado de usar transporte particular no lugar de transporte publico. Isto, claro,
nao implica que os eventos sejam igualmente aceitaveis: esta e uma comparacao de
probabilidades e nao de utilidades.
A forma mais comum de atribuir probabilidades muito pequenas e pela regra do produto.
Se o evento de interesse ocorre somente se varios outros eventos ocorrerem, podemos
pensar nele como “E1 e E2 . . . e En” e evaluar sua probabilidade como
p(E1) p(E2 | E1) . . . p(En | E1, . . . , En−1) .
Por exemplo, um acidente na usina ocorre se o reator sobreaquecer (E1), o mecanismo
de alarme falhar (E2) etc. Cada uma das probabilidades no produto deve ser maior que
o produto e mais razoavel que a probabilidade original, evitando as dificuldades de uma
probabilidade muito pequena.
Um problema que pode surgir aqui e pensar que o evento de interesse pode ocorrer de
apenas uma maneira. Frequentemente, isto nao e assim, e varias possibilidades precisam
ser consideradas, somando sua probabilidades se elas forem exclusivas. Consequente-
mente, e facil subestimar uma probabilidade pequena usando a regra do produto.
Outro problema e considerar os eventos E1, E2 . . . , En como independentes, quando na
verdade podem existir interacoes entre eles.
Finalmente, um terceiro metodo e o indireto, usando o fato de que agentes de decisao ti-
picamente conseguem atribuir valores para as consequencias sem pensar diretamente em
probabilidades. Este processo e mais natural para quem toma decisoes e ja desenvolveu
uma forma de pensar estes problemas.
Por exemplo, se for oferecido um bilhete que da um premio de 100 reais se o atual
governo for reeleito, e nada, caso contrario, quanto voce estaria disposto(a) a pagar pelo
bilhete? Suponha que voce diga 40 reais. Entao se tomarmos a utilidade linear, sua
probabilidade de que o evento ocorra, p, deve ser 0.4, ja que
0.4× (C + 60) + 0.6× (C − 40) = C ,
onde C e seu estado atual.
Ou seja, o valor que voce esta disposto a pagar em uma loteria como esta pode aju-
dar na atribuicao da probabilidade de interesse, desde que conhecamos a utilidade das
consequencias.
78 Atribuicao de probabilidades e utilidades
9.2 Atribuicao de utilidades
Comecemos com o caso mais simples, em que as consequencias sao completamente mo-
netarias, sem considerar outros fatores pessoais. Temos basicamente dois metodos para
atribuir utilidades: o metodo do estado fixo e o metodo da probabilidade fixa.
No primeiro metodo, o agente supoe que tem capital inicial C, e deve compara-lo com
um jogo no qual ele perde L ou ganha G, obtendo capitais C − L ou C + G. Em
particular, ele deve indicar qual probabilidade p de ganho o deixaria indiferente entre C
e o jogo.
No segundo metodo, realizamos a mesma pergunta, exceto que agora p e fixado, mas G
nao, e ele deve indicar qual valor de G o deixaria indiferente.
Veremos com detalhe o primeiro metodo. A equacao representando a indiferenca e
U(C) = pU(C +G) + (1− p)U(C − L) .
Como a utilidade nao e afetada por translacoes ou mudancas de escala, a utilidade do
pior estado C − L pode ser tomada como zero e a do melhor, C + G, como 1. Entao
U(C) = p, determinando U(C).
Para termos satisfeitas as condicoes de coerencia para a utilidade, escrevamos C −L, C
e C +G como C1, C2, C3, respectivamente, e adicionemos um quarto estado C4, melhor
que C3.
Entao, alem da questao sobre a indiferenca entre C2 e um jogo em C1 e C3, obtendo p2
(igual ao p anterior), o decisor deve comparar C3 com um jogo em C2 e C4, obtendo p3,
digamos. Neste ultimo jogo, a perda e C3 − C2 e o ganho, C4 − C3. Com U(C1) = 0 e
U(C4) = 1, as duas indiferencas sao expressas como
U(C2) = p2 U(C3) e U(C3) = p3 + (1− p3)U(C2) ,
com solucoes
U(C2) =p2p3
1− p2 + p2p3e U(C3) =
p31− p2 + p2p3
.
Assim, com estas quatro utilidades, verificamos a coerencia comparando agora C2 com
um jogo em C1 e C4 (com ganho C4−C2). Se p e a probabilidade de indiferenca obtida,
U(C2) = p ,
ja que U(C1) = 0 e U(C4) = 1, e portanto
p =p2p3
1− p2 + p2p3.
Atribuicao de utilidades 79
Qualquer outro valor diferente deste levaria a um Dutch book contra o decisor.
O procedimento geral consiste em selecionar n valores de capital C1, . . . , Cn, crescentes;
definir U(C1) = 0 e U(Cn) = 1, e pedir as comparacoes de Ci com um jogo em Ci−1 e
Ci+1, para i = 2, . . . , n − 1. As probabilidades obtidas determinam todas as utilidades
U(Ci) e a coerencia pode ser verificada usando as comparacoes de Cj com um jogo em
Ci e Ck, i < j < k, com perda Cj − Ci e ganho Ck − Cj .
Este metodo, usado para consequencias monetarias, se aplica igualmente bem a con-
sequencias medidas em termos de uma unica quantidade: unidades de energia dis-
ponıveis, quantidade de recursos hıdricos, classificacao em exame, tempo de viagem entre
dois lugares etc. De fato, o que e necessario e uma ordenacao entre as consequencias,
mais do que o valor numerico.
Por exemplo, a qualidade da visao e medida em uma escala de 0 a 10, com 0 corres-
pondendo a cegueira completa e 10 a visao perfeita. Os valores intermediarios apenas
oferecem uma ordem: 5 e melhor que qualquer numero anterior a 5, mas nao tem ne-
nhum sentido como sendo o meio entre cegueira e visao perfeita. O metodo de coerencia
que descrevemos funciona aqui com 11 estados, C0, . . . , C10, correspondentes ao estado
i na escala da visao.
Considere um paciente com visao no estado 1, considerando uma cirurgia que pode
deixa-lo mais provavelmente no estado 6, mas que tem uma pequena probabilidade de
falhar, deixando-o totalmente cego, no estado 0. Isto envolve uma comparacao entre
C1 e um jogo em C0 e C6. Tal comparacao pode ser mais natural, pelo menos para o
cirurgiao oftalmologista, do que uma entre C5 e um jogo em C4 e C6, dado que o ultimo
envolve apenas pequenas chances e nao seria uma forma normal de cirurgia.
Este exemplo e interessante pela forma da funcao de utilidade. Com U(C0) = 0 e
U(C10) = 1 como antes, temos que U(C1) e bastante grande, digamos em torno de 1/2
ou mesmo de 2/3. Isto expressa a experiencia de que mesmo uma pequena quantidade
de visao e muito valiosa. Ja U(C5) e quase 1, pois o uso de oculos pode fazer com que o
paciente esteja proximo de C10. Em particular, podemos concluir que a cirurgia anterior
so vale a pena se a probabilidade de cegueira total for de fato muito pequena.
O mesmo metodo pode ser generalizado, com dificuldades substanciais, de uma para
varias quantidades.
Vejamos o caso de duas variaveis, considerando o problema de decisao de onde construir
um novo aeroporto para uma cidade. Dentre as varias quantidades envolvidas, consi-
deremos apenas duas: a quantidade de poluicao causada pelos avioes, s, e o tempo de
viagem ate o aeroporto, t.
80 Atribuicao de probabilidades e utilidades
A utilidade claramente decresce quando qualquer uma destas variaveis cresce, dado que
preferimos poluicao e tempo de viagem mınimos. Estamos interessados em medir a
utilidade U(s, t). Ao fazer isto, podemos perceber que devem existir varios pares (s, t)
com mesma utilidade, de modo que somos indiferentes entre eles. Geralmente, podemos
definir curvas de indiferenca no plano (s, t), com a propriedade de indiferenca entre pares
de uma mesma curva. A Figura 9.2 mostra uma possıvel situacao, onde os dois pontos
marcados sao indiferentes entre si.
Figura 9.2: Curvas de indiferenca para poluicao e tempo ate o aeroporto.
Uma possıvel abordagem para este problema e primeiro encontrar as curvas de indi-
ferenca, o que nao envolve nenhuma mensuracao de utilidade nem de probabilidade,
apenas um julgamento de igualdade e de quanto um crescimento em s equilibra uma
diminuicao em t. Uma vez que estas curvas sao determinadas, o problema volta ao
problema ja considerado de encontrar o valor da utilidade de cada curva.
Por exemplo, tres situacoes, como as marcadas com tracos na Figura, podem ser sele-
cionadas par acomparar a intermediaria com um jogo nas outras duas. Aqui diversos
pontos podem ser selecionados: mantendo t fixo, como no exemplo, ou s fixo, ou vari-
ando ambos s e t. Alem de coerencia, devemos manter a atencao em perguntar sobre
jogos que facam sentido e sejam realistas para a pessoa cuja utilidade quer ser obtida.
9.3 Consideracoes
A abordagem utilizada neste texto e logica e racional (alguns podem dizer fria e desu-
mana). A pergunta de se existe algum criterio que alguem poderia razoavelmente querer
Consideracoes 81
usar em suas decisoes, vimos que este deve ser a coerencia, tanto em suas preferencias
entre consequencias quanto em suas opinioes sobre eventos incertos.
Um dos problemas desta teoria e o que acabamos de discutir neste capıtulo: a dificul-
dade em atribuir valores para as probabilidades e utilidades envolvidas. Novamente,
a coerencia e a principal ferramenta. O segundo ponto fraco e que a teoria vista e
aplicavel a um unico decisor, e nao a situacoes com mais de um decisor, como quando,
por exemplo, um comite (ou juri, comunidade, cidade ou paıs) deve entrar em acordo
sobre decisoes a serem tomadas. E importante ressaltar que nao existe uma teoria
normativa para varios decisores, se bem que ha varios trabalhos nessa area.
Mesmo nao havendo uma solucao coerente para decisoes em grupo, podemos seguir o
procedimento de um unico decisor: listar as possıveis acoes sugeridas pelos membros
do grupo, possivelmente adicionando outras que surjam da discussao do grupo; listar
os eventos incertos considerados pelos membros do grupo que sejam relevantes para as
acoes que o grupo pretende tomar.
Na atribuicao de probabilidades, suponha que dois membros atribuam probabilidades
diferentes p1(θ) e p2(θ) a um mesmo evento θ. Como estas probabilidades refletem a
informacao atual de cada decisor, deverıamos escrever mais corretamente p(θ | A1) e
p(θ | A2), onde Ai e a informacao disponıvel ao assessor i. E entao natural que ambos
comuniquem suas informacoes um ao outro, de modo que ambos possuam A1 e A2. E
mais raozavel portanto pensar que p(θ | A1, A2) poderia ser o mesmo para ambos os
membros.
Ponderar a informacao entre os membros e claramente um aspecto importante do tra-
balho do comite. De fato, e essencial para chegar a um razoavel consenso entre as
probabilidades dos membros.
O mesmo pode ser feito para as utilidades, se bem que aqui a situacao e mais complicada:
mesmo tendo as mesmas probabilidades, as pessoas podem discordar sobre a preferencia
nas consequencias.
Existem trabalhos mostrando que consenso, no sentido de passar de preferencias indivi-
duais para preferencias de um grupo, nao existe, sem violar alguns requerimentos obvios
(ver Arrow, Social choice and individual values, e a literatura subsequente).
O mais difıcil tipo de problema de decisao envolve dois ou mais decisores oponentes entre
si (indivıduos, grupos, governos etc). Neste caso, temos as listas de decisoes possıveis
para cada oponente: d1, d2, . . . e d′1, d′2, . . . , e as utilidades das consequencias para cada
par de acoes (di, d′j), que sao percebidas de forma diferente.
82 Atribuicao de probabilidades e utilidades
O exemplo mais simples desta situacao e um jogo com dois jogadores, com di e d′i suas
respectivas estrategias, e onde um jogador ganha e o outro perde. A solucao logica
para este jogo e chamada minimax, mas nao ha uma solucao geral para o problema de
conflito.
Um procedimento possıvel e o seguinte: o jogador 1 esta incerto sobre a escolha d′i do
jogador 2, entao atribui probabilidades p(d′i). Ele pode assim escolher di de modo a
maximizar a utilidade esperada. O jogador 2 pode fazer a mesma coisa, atribuindo
probabilidades p(di) e usando sua utilidade. Isto e sensato, mas tem a dificuldade de
que o jogador 1 deve se colocar no lugar do jogador 2, para atribuir suas probabilidades,
que dependem tambem das acoes do jogador 2. Em outras palavras, e logicamente difıcil
atribuir probabilidades p(d′i) ou p(di), e a dificuldade nao esta somente na atribuicao.
O dilema do prisioneiro Este e um famoso exemplo de uma situacao de conflito:
Joao e Maria sao ambos prisioneiros, impedidos de se comunicarem entre si. Cada um
deles tem duas estrategias possıveis: colaborar ou nao. As utilidades de cada decisao
conjunta sao as da tabela abaixo. Se ambos colaborarem, os dois ficam melhor (1, 1) do
que se ambos nao colaborarem (0, 0). Mas se um colaborar e o outro nao, aquele que
colaborou tem prejuizo -1, e o outro um ganho 2.
Joao \ Maria colabora nao colabora
colabora (1, 1) (−1, 2)
nao colabora (2,−1) (0, 0)
Analisemos o problema do ponto de vista de Maria. Ela nao sabe o que Joao vai fazer
e esta analisando a probabilidade de que ele colabore. Nisso ela percebe que se ele
colaborar, a melhor decisao para ela e nao colaborar, ganhando 2 no lugar de 1; e se ele
nao colaborar, ainda assim a melhor decisao para ela e nao colaborar, ganhando 0 no
lugar de −1. Assim, a probabilidade nao e relevante, ja que sua utilidade e maximizada
com certeza ao nao colaborar. Similarmente, Joao chega a mesma conclusao e decide
nao colaborar, de modo que ambos tem utilidade zero.
Mas claramente esta estrategia nao e otima, ja que ambos ganhariam 1 se ambos cola-
borassem.
A dificuldade com a colaboracao de ambos, que nao e a decisao com maior utilidade
esperada, e que vale a pena para qualquer um dos dois nao cooperar. Por exemplo, se
Maria colaborar, achando que Joao o fara, mas ele se arrepender no ultimo minuto, ela
cai de 1 para −1. Para Joao valeria a pena voltar atras neste caso, pois ele subiria de 1
para 2.
Minimax 83
A solucao com ambos colaborando e altamente instavel, enquanto que a solucao com
nenhum colaborando e estavel: nao se ganha nada fazendo o oposto.
9.4 Minimax
Outro metodo de solucao usado em situacoes como esta e o chamado minimax.
Este metodo reconhece e usa utilidades (ou perdas), mas nao probabilidades. Assim, a
tabela de decisao contem apenas a primeira informacao, como no exemplo abaixo.
θ1 θ1
d1 u 0
d2 1 1
Aqui u e um valor maior que 1 (se fosse menor, entao d2 seria a melhor decisao com
certeza). A tabela tem a forma conhecida: d2 e um investimento seguro certo de obter
1, e d1 e um jogo onde podemos ganhar um valor maior u ou perder tudo.
O metodo minimax funciona assim: para cada linha (ou seja, para cada decisao), sele-
cione a menor utilidade. Na tabela, e 0 para d1, e 1 para d2. Agora escolha a decisao
que tem o maior destes valores. No caso, d2, com valor 1. Assim, o metodo minimax
aconselha a escolher d2 e nao apostar.
Em geral, com utilidades uij , a decisao e escolhida de modo a maximizar minj uij .
O metodo proposto ate agora foi atribuir probabilidades, pj = p(θj), e escolher d2 se
1 > up1, ou u < 1/p1. Caso contrario, escolher d2.
Consequentemente, o metodo minimax diz para nunca apostar, enquanto que nosso
metodo diz para apostar se u for grande o suficiente.
Esta e uma falha importante do metodo minimax: voce recusaria um jogo onde poderia
perder 1 real e ganhar um milhao? A maioria de nos nao recusaria, a menos que p1 fosse
muito pequeno.
Outra crıtica para o metodo minimax e que ele nao leva em conta a informacao existente.
Se o decisor receber a informacao de que θ1 e quase certo de ocorrer, na decisao minimax
ele recusaria d1, mesmo estando quase certo de obter um benefıcio com isso.
No caso de uma peca que sera usada (como no exercıcio do aviao), seja θ1 o evento que
a peca esta boa, e θ2, que esta defeituosa. Seja d1 a decisao de usa-la e d2, comprar uma
nova peca. Entao, sem importar quantos testes forem realizados indicando que a peca
esta boa, a recomendacao minimax e comprar uma nova peca.
84 Atribuicao de probabilidades e utilidades
Alem destas crıticas, observe que o metodo minimax e incoerente.
De fato, considere a tabela de decisao a seguir
θ1 θ1
d3 0 u
d2 1 1
onde consideramos a decisao d3, que e o jogo oposto a d1. Nesta tabela, a decisao
minimax continua sendo d2.
Agora, consideremos conjuntamente as decisoes d1, d2 e d3. Pelo argumento acima, d2
e melhor que ambas d1 e d3.
Considere uma nova acao d, construıda da seguinte maneira: uma moeda equilibrada e
lancada, escolhendo d1 se sair cara ou d3, se sair coroa. Assim as utilidades de d para
θ1 e θ2 sao ambas iguais a u/2. Ou seja, se u > 2, entao d e preferıvel a d2, de acordo
com o criterio minimax.
Consequentemente, temos uma situacao em que nem d1 nem d3 sao preferidas, mas uma
escolha entre elas baseada no lancamento de uma moeda e a melhor decisao. Isto e
incoerencia.
Minimax com perdas
O metodo minimax usualmente nao e aplicado a utilidades, como acima, mas a perdas,
onde uma perda lij e definida como a diferenca entre a utilidade da melhor acao para
θj e uij . Como as perdas sao iguais a uma constante menos as utilidades, este metodo
escolhe a decisao que minimiza maxj lij .
Por exemplo, consideremos as tabelas de utilidades e de perdas abaixo.
θ1 θ1
d1 8 0
d2 2 4
utilidades
θ1 θ1
d1 0 4
d2 6 0
perdas
Aplicando minimax na tabela de perdas, obtemos para d1 um maximo de 4, e para d2
um maximo de 6. Assim, d1 e selecionada, ja que tem menor valor.
No entanto, a incoerencia continua existindo. De fato, adicionemos novamente uma
decisao d3.
Minimax 85
θ1 θ1
d1 8 0
d2 2 4
d3 1 7
utilidades
θ1 θ1
d1 0 7
d2 6 3
d3 7 0
perdas
Os maximos para as tres linhas sao, respectivamente, 7, 6 e 7, de modo que a melhor
decisao e d2, com um mınimo de 6. Consequentemente, o efeito de introduzir uma nova
decisao d3 e mudar a preferencia de d1 sobre d2, no seu oposto. Isto e incoerente. E
como se voce, tendo decidido ficar em casa em vez de ir ao teatro, resolvesse mudar de
opiniao porque ficou sabendo que tem um filme novo passando.
Assim, dentro de nossa exigencia de coerencia, o metodo minimax e inaceitavel, tendo
como grande falha o fato de que ignora qualquer atribuicao (mesmo nao numerica) das
incertezas associadas aos eventos.
No caso de uma situacao de conflito, em que uma pessoa ganha e a outra perde, no
entanto, ele pode ser interessante. Este tipo de situacao e chamado de jogo com soma
zero ou com dois oponentes.
Para aplicar este princıpio, usaremos o que chamamos decisao mista, isto e, uma decisao
na qual misturamos, digamos d1 e d2, aplicando d1 com probabilidade p e d2, com
probabilidade 1− p (como a que usamos no exemplo acima para definir d).
Estas decisoes mistas nao tem importancia ao maximizar a utilidade esperada, ja que
nao podem ter utilidade esperada maior que a da melhor decisao. Em uma situacao de
conflito, elas podem ter algum merito ao esconder de Maria o que o Joao vai decidir.
Isto e particularmente verdadeiro, em repeticoes do conflito ou do jogo.
Um exemplo simples e dado pelo seguinte jogo: Joao e Maria simultaneamente mostram
uma moeda, ou com cara ou com coroa voltada para cima. Joao ganha as duas moedas
se as faces forem iguais, e Maria ganha as duas moedas, se elas nao forem. Na tabela
abaixo, mostramos as duas estrategias de mostrar cara, mostrar coroa, e uma estrategia
mista de escolher a face com probabilidade 1/2.
Joao \ Maria cara coroa mista
cara (1,−1) (−1, 1) (0, 0)
coroa (−1, 1) (1,−1) (0, 0)
mista (0, 0) (0, 0) (0, 0)
Claramente, esta terceira decisao tem utilidade zero, sendo a decisao minimax.
Assim, se o jogo for realizado repetidas vezes, o procedimento minimax pode ser bom,
e se Maria tiver uma outra estrategia, Joao pode usar isso a seu favor. Por exemplo,
86 Atribuicao de probabilidades e utilidades
ao realizar este jogo com uma crianca pequena, podemos imaginar que ela alternara
sua escolha mais frequentemente do que seria esperado por chance. Assim, poderıamos
facilmente ganhar (ou perder, se quisermos deixa-la feliz) supondo que ela fara o oposto
do que fez na ultima vez.
Para um unico jogador, a maximizacao da utilidade esperada e o sensato a ser feito, e ela
sera tambem minimax para Maria se ela pensar que Joao tem a mesma probabilidade
de usar cara ou coroa.
Bibliografia
[1] M. DeGroot (2004) Optimal statistical decisions. Wiley.
[2] D.V. Lindley (1985) Making decisions. Wiley.
[3] J. Pratt, H. Raiffa, R. Schlaifer (1995) Statistical decision theory. MIT Press.