Capítulo 10 Programação Dinâmica - Autenticação · •Resolução do problema com PD 21....

Capítulo 10

Optimização e DecisãoResumo de aula

3 Novembro 2008

Programação Dinâmica

Autores: Miguel Couto, nº 53226

José Dias, nº 63736

Sumário

1. Introdução

2. Exemplo 1

3. Programação Dinâmica Determinística

2

3. Programação Dinâmica Determinística

4. Problema de Distribuição de Recursos

5. Exemplo 2

6. Exemplo 3

7. Conclusões

2

Introdução

• Não há uma formulação convencional para o problema

• Equações particulares têm de ser obtidas de modo

33

• Equações particulares têm de ser obtidas de modo a enquadrarem-se em cada problema

.·. É necessário praticar muito para perceber quando e como um problema pode ser resolvido com PD

Exemplo 1 …

Objectivo: ir do IST para o Bairro Alto pelo caminho mais seguro (a pé).

44

Exemplo 1…

Enumeração exaustiva -> menos eficiente para grandes problemas

5

Exemplo 1…

• Formulação

Sendo,

A � x1 � x2 � x3 � J

f*n(s) = min fn(s,xn) = fn(s,x*n) f*n(s) = min fn(s,xn) = fn(s,x*n)

f n (s, xn) = cImediato(n) + min(cFuturo)

f*5(J) = 0;

Calcular f*4(s), f*3(s), f*3(s), f*2(s) para cada s

possível.

Finalmente obtém-se f*1(A)

6

xn

Exemplo 1…

• Procedimento para determinar solução

n = 4

7

n = 3

Exemplo 1…

n = 2

8

n = 1

Exemplo 1…

• Solução optima �� Qual o caminho que é

mais seguro?

99

Exemplo 1

Conclusões

• Problema simples com poucas

interrelações entre etapas

• Caminho percorrido não influencia

1010

• Caminho percorrido não influencia

próxima etapa

• Estados da mesma etapa não podem

estar ligados

Características PD …

1. Problema dividido em etapas

– Decisão é necessária em cada etapa

– Sequência de decisões interrelacionadas

2. Etapas têm estados associados ao início de

cada etapa

11

cada etapa

3. Efeito da decisão em cada etapa é transformar

o estado actual num estado associado com o

início da próxima etapa

4. Desenvolvimento da solução encontra solução

óptima

Características PD

5. Princípio de Optimalidade (propriedade

Markoviana)

6. Solução começa por calcular a decisão óptima

para a última etapa

7. Relacionamento recursivo identifica decisão

12

7. Relacionamento recursivo identifica decisão

óptima na etapa n com base na decisão

óptima da etapa n+1

Programação Dinâmica

Determinística

• Problemas determinísticos: o estado da

etapa seguinte é totalmente determinado

pelo estado e política de decisão no

estado actual.estado actual.

• Forma da função objectivo

• Conjunto de estados

13

Problema de Distribuição de

Recursos

• Formulação:

– Etapa n = actividade n

• xn = quantidade de recursos usados na actividade

n

Estado S = quantidade de recursos restantes das • Estado Sn = quantidade de recursos restantes das

etapas anteriores

– Na etapa n, no estado Sn, a escolha de xn

resulta de o estado em n+1 ser Sn+1=Sn-xn

14

Exemplo 2

• Objectivo: distribuir equipas médicas por países

de modo a máxima eficácia.

15

3 eq. médicas

disponíveis

nº equipas

médicasn =

???xn =

??? ???sn =

Exemplo 2 ...

Visualização gráfica do problema

16

Exemplo 2 ...

• Definição do problema

17

Exemplo 2 ...

• Equações

18

Exemplo 2 ...

• Resolução do problema com PD

19

Exemplo 2 ...


20

Exemplo 2 ...


21

Exemplo 2

Solução GráficaSolução Gráfica

22

Problema de Distribuição de

Recursos

• Formulação:

– Etapa n = actividade n

• xn = quantidade de recursos usados na actividade • xn = quantidade de recursos usados na actividade

n

• Estado Sn = quantidade de recursos restantes das

etapas anteriores

– Na etapa n, no estado Sn, a escolha de xn

resulta de o estado em n+1 ser Sn+1=Sn-xn

23

Exemplo 3

• Recurso xn = nº de aparelhos a produzir na

semana n

24

Week

Maximum Production,

Regular Time

Maximum Production,

Overtime

Production Cost per Unit

Regular Time

1 2 2 $300

2 3 2 $500

3 1 2 $400

Exemplo 3

• sn

= numero de aparelhos disponiveis no

inicio da semana n

• sn+1 = sn + xn -3

• s1 = 2.• s1 = 2.

• cn = custo de produção em tempo regular

25

Exemplo…

n rn mn cn

1 2 4 300

2 3 5 500

3 1 3 400

26

rn = tempo de produção regular maximomn= produção maxima total

)3,0max(50),0max(100),( −++−+=n

xns

nr

nx

nx

nc

nx

ns

np

Exemplo 3

)]3(),([min)( *1

3

*−++=

+≤≤−

nnnnnnmxs

nn xsfxspsfnnn

Sn+1

s f *(s ) x *

For n = 3:

27

s3 f3*(s3) x3

*

0 1,400 3

1 900 2

2 400 1

3 ≤ s3 0 0

Exemplo 3

x2 f2(s2, x2) = p2(s2, x2)+ f3*(s2+ x2-3) f2

*(s2) x2*

s2 0 1 2 3 4 5

0 2,900 3,050 3,200 2,900 3

1 2,400 2,450 2,600 2,850 2,400 2

2 1,900 1,950 2,000 2,250 2,900 1,900 1

For n = 2:

2 1,900 1,950 2,000 2,250 2,900 1,900 1

3 1,400 1,450 1,500 1,650 2,300 2,950 1,400 0

28

x1 f1(s1, x1) = p1(s1, x1)+ f2*(s1+ x1-3) f1

*(s1) x1*

s1 0 1 2 3 4

2 3,200 3,050 3,000 2,950 2,950 4

For n = 1:

Concluões

• Variáveis de estado são discretas (sn)

• Ordem das etapas pode não ser relevante

(característica dos ProbDistEsf)

29

(característica dos ProbDistEsf)

• Condições da PL (proporcionalidade, divisibilidade e certeza)

podem não ser cumpridas em problemas de PD.

Apenas a aditividade tem de ser cumprida

(príncipio de optimalidade) para ProbDistEsf.

Outros Exemplos

• Variáveis de estados discretas

– Worked Examples (CD-ROM) – 2 exemplos

30

• Variáveis de estado contínuas

– Exemplo 4: Escalonamento do nível de emprego

• Mais do que um recurso

– Exemplo 5 – Wynddor Glass Company

Capítulo 10 Programação Dinâmica - Autenticação · •Resolução do problema com PD 21....

Documents

Transcript of Capítulo 10 Programação Dinâmica - Autenticação · •Resolução do problema com PD 21....