Sistema de Reconhecimento de voz na Radiologia com vocabulário restrito Márcio Geovani Jasinski...
Transcript of Sistema de Reconhecimento de voz na Radiologia com vocabulário restrito Márcio Geovani Jasinski...
Sistema de Reconhecimento de Sistema de Reconhecimento de voz na Radiologia com voz na Radiologia com vocabulário restritovocabulário restrito
Márcio Geovani Jasinski
Projeto CyclopsLaboratório de Telemedicina
Universidade Federal de Santa Catarina
Estrutura da ApresentaçãoEstrutura da Apresentação
• Introdução
• Metodologia
• Resultados
• Discussões e Conclusões
IntroduçãoIntrodução
• Projeto Cyclops - software na área médica desde 1998;• Tecnologias - dinamizar o processo de laudo;• Resistência médica na aceitação do software;
• Cenários no processo de geração de laudo:
1. Laudo manuscrito:• Letra ilegível;• Documentos perdidos;• Recuperação do documento (histórico);• Relação manual com as demais informações do exame.
Introdução Introdução – – Cenários existentesCenários existentes
2. Laudo ditado em fitas:
• Fitas regravadas – qualidade ruim e sem histórico;
• Fitas danificadas ou perdidas;
• Problemas com etiquetas;
Introdução - Introdução - Cenários existentesCenários existentes
Ambiente ideal
3. Laudo ditado em áudio digital e rec. de voz:• Alta qualidade do áudio;• Transcrição automática;• Permite ao médico ditar o laudo com as mãos livres
para manipulação do equipamento;• Dinamiza o processo e evita os erros do processo
manual ou com fitas; • Histórico do ditado;
Introdução Introdução - - Tecnologias de laudo:Tecnologias de laudo:
• PACSPACS - Sistema para arquivamento e comunicação em diagnóstico por imagem.
• DICOM Structured Report - Padrão DICOM para laudos estruturados;
• Telemedicina – Tecnologia médica acessível de qualquer lugar que evita deslocamento excessivo de pacientes;
• Áudio Digital - Gravação laudo com qualidade e que permite reconhecimento de voz.
• Reconhecimento de voz - Processo de obter palavras faladas e transcrição para texto ou DICOM SR;
MetodologiaMetodologia
• PACS com portal de telemedicina:• Hospital Universitário – UFSC;
• Estado de Santa Catarina;
• Desafios:• Resistência na digitação dos laudos;
• Dinamizar geração de laudos de setores de alta demanda – Radiologia HU/UFSC 21 exames/dia;
Quilombo ECG – Antes: 20 exames/mês,
Após a implantação da telemedicina: 91,5 exames/mês
Metodologia Metodologia –– Soluções livresSoluções livres
• Tecnologias livres, open-source e multi-plataforma:
• Linux – Sistema operacional;
• PortAudio – Entrada e saída de áudio;
• wxWidgets – Interface gráfica para o usuário;
• HTK – Biblioteca para reconhecimento de voz;
• Postgresql – Armazenamento de informações;
Metodologia Metodologia –– VocabulárioVocabulário
Domínio Perplexidade
Radiologia 20
Medicina de emergência 60
Jornalismo 105
Fala geral 247
• O vocabulário médico: Bem definido e formal;• A definição de perplexidade, indica a Radiologia
“Número médio de palavras possíveis depois que o modelo de linguagem foi aplicado.”
Metodologia Metodologia –– Reconhecimento de vozReconhecimento de voz
• Sistema de rec. de voz é constituído de:
• Definição de Gramática e do Dicionário Regras usadas no reconhecimento;
• Definição do Modelo Acústico
Forma de representação para análise - HMMs;
• Definição do corpo de treinamento
• Frases e palavras ditadas para rec. de padrões;
Metodologia Metodologia –– Reconhecimento de vozReconhecimento de voz
• Definição dos modelos HMMS Número de estados e valores iniciais;
• Configurações de codificaçãoParâmetros e algoritmos para o rec./ treino;
• Treinamento
Ditado para balancear os valores do modelo;
• Reconhecimento/AvaliaçõesUso do sistema e verificação dos resultados
ResultadosResultados
• Análise realizada com ferramentas do HTK:
• Gramática: 5 palavras – Acerto de 80% a 99%;
• Inexistência de dicionário português:• 50 Gravações e 150 marcações;
ResultadosResultados
• Implementações:• Laudo ditado com integração com o portal;
• Módulo para ditado no software de captura;
Discussões e ConclusõesDiscussões e Conclusões
• O uso de laudo áudio digital com a telemedicina é um avanço excelente pois:• Reduz a resistência na aceitação do sistema;
• Evita erros inerentes ao processo manual;
• Mantém histórico do ditado;
• Permite o reconhecimento de voz automatizado;
• Gravação de laudo por Palmtops.
Discussões e ConclusõesDiscussões e Conclusões
• Definir uma base de dados, que permita o reconhecimento de voz em larga escala;
• Rec. De voz com gramática definida conduz ao DICOM SR pela forma não ambígua de ambos;
• Forma de armazenamento compactado – verificar a viabilidade com rec. De voz