IA - Aula 04 - Agentes parte 2
-
Upload
andrei-formiga -
Category
Documents
-
view
2.937 -
download
1
Transcript of IA - Aula 04 - Agentes parte 2
Inteligência ArtificialAula 04 – Agentes, parte 2
Prof. Andrei de A. Formiga
Construindo Agentes Racionais
Já sabemos o que significa ser racional Medidas de desempenho Conhecimento do ambiente Percepção Ações
Sabemos (em princípio) como projetar um agente Preencher a tabela da função do agente
O que é um Agente Racional?
Para cada seqüência perceptiva possível, um agente racional deve selecionar uma ação cujo resultado esperado é maximizar sua medida de desempenho, dada a evidência fornecida pela seqüência perceptiva e pelo conhecimento prévio do agente sobre seu ambiente.
Construindo Agentes Racionais
Construir um agente que chega ao melhor resultado
= Preencher a tabela da função do agente para
atingir a melhor medida de desempenho
Método prático para criar agentes? Qual a dificuldade de criar um agente?
Dificuldade das Tarefas
Existem agentes mais ”difíceis” que outros?
Por exemplo: Mundo do aspirador Motorista de taxi Cálculo de troco Jogador de futebol Jogador de xadrez
Dificuldade das Tarefas
Tarefas não são criadas iguais
Como caracterizar os problemas?
Como antecipar dificuldades?
O Ambiente da Tarefa
Agrupa informações sobre o problema Quatro componentes:
Medidas de desempenho Ambiente Percepção Ações
Descrição PEAS
PEAS
Performance Measure
Environment
Actuators
Sensors
Exemplo: Motorista de Taxi
Desempenho? Chegar no destino Minimizar consumo Minimizar desgaste do carro Minimizar tempo de viagem Minimizar infrações Maximizar conforto Maximizar lucro
Exemplo: Motorista de Taxi
Ambiente? Ruas, avenidas, estradas Tráfego, pedestres, carros Animais, obras, policiais Poças, buracos Passageiros Outros: neve, chuva, vento...
Exemplo: Motorista de Taxi
Atuadores Acelerador Freios Direção Comunicação com o passageiro Comunicação com outros veículos
Exemplo: Motorista de Taxi
Sensores Visão (câmeras) Velocímetro Odômetro Outros
Acelerômetro Sensores do sistema GPS
PEAS do Motorista de Taxi
Tipo do Agente Medidas deDesempenho
Ambiente Atuadores Sensores
Motorista de Taxi Viagens seguras,rápidas, corretas,confortáveis;maximizar lucros.
Ruas, avenidas,estradas, outroscarros, pedestres,passageiros.
Direção,acelerador, freio,buzina, tela.
Câmeras, sonar,velocímetro,odômetro, GPS,acelerômetro,sensores demotor, teclado.
Outros Exemplos
Tipo do Agente Medidas deDesempenho
Ambiente Atuadores Sensores
Sistema deDiagnóstico Médico
Paciente saudável;minimizar custos eprocessos.
Paciente, hospital,equipe.
Perguntas, exames,diagnósticos,tratamentos.
Sintomas, históricomédico, respostas.
Analisador deImagens de Satélite
Categorização corretade imagens
Conexão com satélite. Apresentarcategorização.
Arrays de pixels(imagens).
Robô de linha deprodução
Porcentagem de peçascolocadascorretamente.
Esteira com peças;receptáculos.
Braço e mãomecânicos.
Câmera, sensores dobraço e mão.
Controlador derefinaria
Maximizar pureza,saída, segurança.
Refinaria, operadores. Válvulas, tubos,aquecedores, displays.
Temperatura, pressão,sensores químicos.
Tutor interativo deportuguês
Maximizar notas doaluno.
Conjunto de alunos,instituição de ensino.
Exercícios, sugestões,correções.
Teclado.
Ambientes Artificiais e Reais
Ambientes reais podem ser simples Inspeção de peças em uma esteira
Ambientes artificiais podem ser complexos Piloto para simulador de vôo Detecção de fraudes na internet
Propriedades dos Problemas
Totalmente x Parcialmente observável Determinístico x Estocástico Episódico x Sequencial Estático x Dinâmico Discreto x Contínuo Agente único x Multi-agentes
Observabilidade
Totalmente observável: sensores do agente reportam todas as informações sobre o estado do ambiente Como definir ”todas”? Relevância ⇒ Desempenho
Parcialmente observável: nem todas as informações do estado estão disponíveis Sensores imprecisos; falta informação
Determinístico x Estocástico
Determinístico: o próximo estado do ambiente é completamente determinado pelo estado atual e a ação do agente Determinismo + observabilidade total: previsível
Estocástico: Incerteza sobre o estado futuro do ambiente, mesmo tendo informações atuais Observabilidade parcial e não-determinismo Estratégico: Determinístico, exceto pelas ações de
outros agentes
Episódico x Sequencial
Episódico: Tarefa se repete em episódios independentes Desnecessário manter memória entre episódios Sem distinção curto x longo prazo Ex.: Classificação
Sequencial: Tarefa se desenrola em episódios não independentes Ações podem ter consequências de longo prazo
Estático x Dinâmico
Dinâmico: Ambiente pode mudar enquanto agente ”pensa” Não decidir é o mesmo que fazer nada
Estático: Ambiente só muda após alguma ação Tempo é praticamente irrelevante
Semi-dinâmico: Ambiente estático, mas desempenho pode piorar com o tempo
Discreto x Contínuo
Aplicada a Estado Tempo Ações Perceptos
Quantidades contínuas x discretas
Agente único x Multi-agentes
Agente único: apenas um agente atuando no ambiente
Multi-agentes: vários agentes atuando Quando considerar uma entidade como agente? Dependência de desempenho Ambientes competitivos x cooperativos
Exemplos
Ambiente Observ. Detem. Episódico Estático Discreto Agentes
Palavras cruzadas Total Determ. Seq. Est. Disc. Único
Xadrez c/ relógio Total Estrat. Seq. Semi Disc. Multi
Poker Parcial Estrat. Seq. Est. Disc. Multi
Gamão Total Estoc. Seq. Est. Disc. Multi
Motorista de Táxi Parcial Estoc. Seq. Dinâmico Cont. Multi
Diagnóstico médico Parcial Estoc. Seq. Dinâmico Cont. Único
Análise de imagens Total Determ. Epis. Semi Cont. Único
Robô de montagem Parcial Estoc. Epis. Dinâmico Cont. Único
Controlador refinaria Parcial Estoc. Seq. Dinâmico Cont. Único
Tutor de português Parcial Estoc. Seq. Dinâmico Disc. Multi
Classificação de Problemas
Combinação mais difícil: Parcialmente observável Estocástico Sequencial Dinâmico Contínuo Multi-agentes
Classificação de Problemas
Nem sempre simples ou precisa Classificação de imagens: semi-estática? Xadrez: Totalmente observável? Diagnóstico médico: agente único? episódico? Torneio de xadrez: episódico x sequencial