Gerenciamento de problemas: Um estudo de caso aplicado a ... · Falta de histórico sobre as falhas...
Transcript of Gerenciamento de problemas: Um estudo de caso aplicado a ... · Falta de histórico sobre as falhas...
Gerenciamento de problemas: Um estudo de caso aplicado a PROCERGS
Francisco José Paz
PONTIFÍCIA UNIVERSIDADE CATÓLICA DO RIO GRANDE DO SULFACULDADE DE ADMINISTRAÇÃO, CONTABILIDADE E ECONOMI ACURSO ESPECIALIZAÇÃO EM GOVERNANÇA E ESTRATÉGIA DE TI
Orientadora: Profª EdimaraMezzomo Luciano
AGENDA
Introdução
Situação problemática
Justificativa
Objetivos
Método de pesquisa
Coleta e análise de dados
Resultados
Considerações Finais
INTRODUÇÃO
Gerenciamentode
Problemas
MetodologiaITIL
Necessidade deMelhoria dosProcessos
RealidadePROCERGS
Estudos comparativos
Visão GeralVisão Geral
SITUAÇÃO PROBLEMÁTICA
�Incidentes e problemas são tratados da mesma forma no sistema (ocorrências)
�Registros sem padrão definido e categorização muito desatualizada
�Falta de consistências das informações (registros X categoria)
�Falta de histórico sobre as falhas encontradas e problemas resolvidos
� Perda de agilidade na resolução das falhas
SITUAÇÃO PROBLEMÁTICA
Como utilizar as informações registradas nos incidentes para auxiliar na identificação
e tratamento diferenciado de problemas?
JUSTIFICATIVA
�Atendimento de uma necessidade operacional contemplada nas demandas do GOP
�Agilidade na resolução e diagnóstico de problemas, diminuindo o tempo entre falhas
�Eficiência e eficácia na prestação dos serviços de TI e Telecomunicações
�Estudo do Gerenciamento de Problemas, tópico ainda não tratado
OBJETIVOS
Desenvolver uma sistemática e propor melhorias na identificação e tratamento dos problemas
relacionados à TI da PROCERGS, considerando as boas práticas sugerida pelo ITIL.
Geral
� Identificar a forma como os problemas são diagnosticados e resolvidos na PROCERGS
� Confrontar o cenário atual de diagnóstico e de resolução de problemas com as melhores práticas sugeridas pelo ITIL
� Sugerir melhorias dos processos ligados a resolução de problemas na PROCERGS
OBJETIVOS
Específicos
MÉTODO DE PESQUISA
Identificação das áreas com mais volume de
ocorrências e de problemas mais
comuns
Levantamento e análise das
ocorrências das áreas selecionadas
Entrevistas: para identificar a forma
utilizada pelos técnico para resolver os
problemas
Classificação de ocorrências
identificando 5 problemas mais
freqüentes
Entrevistas com técnicos
Análise de documentos (relatórios)
Coleta de dados
Forma atual de tratamento de
problemas
ITIL
Comparação
Análise dos dados
Criar sistemática
Propor melhorias
Resultados
COLETA DE DADOS (1)
Identificação das áreas com mais volume de
ocorrências e de problemas mais
comuns
Levantamento e análise das
ocorrências das áreas selecionadas
Entrevistas: para identificar a forma
utilizada pelos técnico para resolver os
problemas
Classificação de ocorrências
identificando 5 problemas mais
freqüentes
Entrevistas com técnicos
Análise de documentos (relatórios )
Coleta de dados
COLETA DE DADOS (1)
Público alvo: líderes de equipe que atendem ocorrências
Áreas pesquisadas:Campo, Interno, Windows, Linux e Conectividade
Pergunta realizada:
Quais são os principais problemas resolvidos pela equipe no dia-a-dia?
1ª etapa Entrevistas - variáveis1ª etapa Entrevistas - variáveis
Equipes Entrevistado Problema mais frequente Perda de conectividade BRT – 10% do total de canais Perda de conectividade - outros reparos
Conectividade TEC-07
Lentidão Teclado/mouse Video CPU Impressora Softwares/Sistemas operacionais
Internas TEC-04
Problemas operacionais Softwares/Sistemas operacionais Erros Operacionais Problemas em impressoras
Campo TEC-11
Conectividade Windows TEC-12 Agentes de Backup/TNG
Restore de dados (Solicitação) Envio e recebimento de mensagens do Via-RS Problema de performace no servidor de Hospedagem Apontamento de DNS
Linux TEC-13
Lentidão de internet
1275124713411237Total de ocorrências
347340388314Conectividade
296303335250Campo
230243212236Interna
956790127Linux
73538383Windows
Médianov/06out/06set/06Equipes
Total de ocorrências por equipe dos meses de setembro, outubro e novembro de 2006.
Análise de relatóriosAnálise de relatórios
COLETA DE DADOS (1) - Resultados
COLETA DE DADOS (1)
Identificação das áreas com mais volume de
ocorrências e de problemas mais
comuns
Levantamento e análise das
ocorrências das áreas
selecionadas
Entrevistas: para identificar a forma
utilizada pelos técnico para resolver os
problemas
Classificação de ocorrências
identificando 5 problemas mais
freqüentes
Entrevistas com técnicos
Análise de documentos (relatórios)
Coleta de dados
COLETA DE DADOS (1)
Base do levantamento: Entrevistas + relatórios
�Período: meses de setembro, outubro e novembro de 2006.
�Equipes: Interna e Conectividade
�Amostra: 120 ocorrências por mês por equipe no período. Total = 720 ocorrências (42%)
�Informações desejadas:
�Primeiro momento: Problemas
�Segundo momento:solução
Análise do sistema (RTP)Análise do sistema (RTP)
COLETA DE DADOS (1) - Resultados
100%12081,1%97,33Sem comunicação10,8%13,00Instável/lentidão/ perda pacotes5,0%6,00Sem acesso3,2%3,65Outros
%MédiaReferências/ Problemas
Equipe Conectividade - ProblemaEquipe Conectividade - Problema
100%120Total21%25,00Aplicativo17%20,67Estação16%19,67Impressora15%18,33Windows9%10,33Monitor6%7,67Rede4%4,67Inventário4%4,33Internet9%9Outros
%MédiaReferências/ Problemas
Equipe Interna - ProblemaEquipe Interna - Problema
COLETA DE DADOS (1) - Resultados
100%Total
54,7%Atendida pela Brasil Telecom (BrT)
15,3%Problema aleatório / não identificado
12,3%Problema na estação / equipamentos /sistema do cliente / rede interna
7,7%Reset no modem/roteador/firewall/equipamentos10,0%Outros
MédiaSoluções para problema "sem comunicação"
Equipe Conectividade - SoluçõesEquipe Conectividade - Soluções
COLETA DE DADOS (1) - Resultados
Equipe Interna - SoluçãoEquipe Interna - Solução
27%16Reinstalação/reconfiguraçãoImpressora (59)
34%21Teclado/mouse substituido
27%17Substituição /memória/coolers/hd/outraspartes
Estação (62)61%45Reinstalação/reconfiguração
Aplicativos (74)37%20Limpeza geral/ajustes/anti-spyware/virus
Windows (54)
COLETA DE DADOS (1) - Resultados
�Em alguns casos é difícil identificar as ações tomadas para resolver o incidente(sem padrão)
�Dificuldade de levantar as informações do sistema (quantificar as ocorrências por tipo)
�Sistema não serve como base de conhecimento de problemas e soluções
�Dificuldade de gerar indicadores
Resumo da análise do sistemaResumo da análise do sistema
COLETA DE DADOS (1) - Análise
Identificação das áreas com mais volume de
ocorrências e de problemas mais
comuns
Levantamento e análise das
ocorrências das áreas selecionadas
Entrevistas: para identificar a forma
utilizada pelos técnico para resolver os
problemas
Classificação de ocorrências
identificando 5 problemas mais
freqüentes
Entrevistas com técnicos
Análise de documentos (relatórios)
Coleta de dados
COLETA DE DADOS (1)
COLETA DE DADOS (1)
2ª etapa Entrevistas - variáveis2ª etapa Entrevistas - variáveis
Conectividade: Sem comunicação
Interna: Windows, Aplicativos, Impressora e Estação
Pergunta realizada:
Qual o modelo lógico individual utilizado para identificar, diagnosticar e resolver o(s) problema(s) mais freqüente(s)?
ReinstalaçãoVerificar Spywares, virusverificar SOVerificação de hardwareTEC-06
––ReinstalaçãoBackup dos arquivosTEC-05
–Reinstalaçãoreparar SOVerificação de hardwareTEC-04
ReinstalaçãoTentativa de recuperaçãoColeta de infosMensagens de erroTEC-03
–ReinstalaçãoTeste de hardwareSoftware de verif. do SOTEC-02
–ReinstalaçãoVerif. Spywares, virusVerificar se carrega o SOTEC-01
Passo 4Passo 3Passo 2Passo 1Técnicos
Windows
COLETA DE DADOS (1) - Resultados
Padrão lógico equipe interna - exemploPadrão lógico equipe interna - exemplo
––Acionar BRTEcaminhamento paracampo ou brt ouinformatica do cliente
Passo 6
Ecaminhamento paracampo ou brt ouinformatica do cliente
–Teste nosequipamentos no cliente
Define problemaPasso 5
Identificação do problema
Ecaminhamentopara campo ou brtou informatica do cliente
Testes nosequipamentos de conectividade pontaPROCERGS
Testes nosequipamentos do clientePasso 4
Testes de conectividade com o cliente
Testes com o cliente nosequipamentos de conectividade
Verificar canal de comunicação
Verificar equipamentosde conectividade no cliente
Passo 3
Reset nosequipamentos
Verificação dos equipamentos naparte daPROCERGS
Teste nosequipamentos no cliente
Verificar equipamento de conectividade pontaPROCERGS
Passo 2
Verificar problemasem equipentos no cliente
Verificação dadimensão do problema com o cliente
Verificar informaçoesda ocoDados do chamadoPasso 1
TÉCNICO DTÉCNICO CTÉCNICO BTÉCNICO A
Sem conectividade
Padrão lógico equipe conectividadePadrão lógico equipe conectividade
COLETA DE DADOS (1) - Análise
�Menos experiente e mais rotativa;
�Possibilidades de solução e tipos de atendimentos mais variados ;
�Padrão lógico de diagnóstico e resolução de incidentes e problemas indefinido;
�Profundidade do diagnóstico se dá conforme a experiência do técnico.
Equipe internaEquipe interna
�Mais experiente e menos rotativa
�Menos variação de tipos de atendimento com maior número de possibilidades de solução
�Maior padrão de solução e diagnóstico similar entre os técnicos da equipe
�Diagnósticos profundos e detalhados
Equipe conectividadeEquipe conectividade
COLETA DE DADOS (1) - Análise
SEM COMUNICAÇÃO FRAME-RELAY
(somente Porto Alegre)
INFORMAÇÕES: Rede IP Máscara N Link Interface up/up? ACIONA BRT Canal Roteador e Porta S SLDD ? N Verifica com o cliente se cabos e equipamentos S estão ligados Modem-rout er? S Interface N up/up? N S OK Solucionou? Modem e Roteador Separados S N Testes de Ping LAN e WAN ACIONA BRT Interface UP/DOWN N Ping Wan N ? OK ? S Interface S DOWN/DOWN Testes de LDL 1 com cliente S Canalizado ? S Loop N N 2 Retorna ? ACIONA BRT 3
1 Encaminha Manutenção da Rede do cliente S Roteador da S Telnet pela WA N PROCERGS ? - verificação d e Roteador OK ? configuração, status da eth e cache de arp N N ACIONA BRT Encaminha Manu tenção do Roteador pela PROCERGS (Acerto de configuração remotamente ou troca rote- ador se problema hardware) 2 S Verifica:
- Conexão Rede/Router Encaminha Manutenção - Hubs e Switches Problem a N do Hardware: - Cabos e conexões Roteador - Placa Rede Micro - Placa Rede Micro ? - Hubs ou Switches - Interface ETH Router - Cabeamento
3 Encaminha Técnico Para conectar cabo Tem cabo entr e Roteador e o Conectando canal BRT. (RCD ou Em POP ? S Roteador ao DM. DM / RCD ? N S Verifica Conexão de Cabos ACIONA BRT Na Sala Telecom PROCERGS
RESULTADOS – Situação atual
Conclusão das entrevistasConclusão das entrevistas
Identificação do problema Testes
Ação corretiva e/ou
encaminhamento
Registro de início de atendimento
Registra o fim do atendimento e/ou
encaminha incidente
Recebimento do incidente
Modelo identificado através da análise do sistema e nas entrevistas
Conceituando Gerenciamento de Problemas
Controle de Problemas:
Identificação do problema e sua causa raiz
Controle de Erros
Monitoração e controle dos erros até a sua resolução
����É registrado no sistema dentro do incidente em texto livre, sem possibilidade de buscar histórico automaticamente.Registro da resolução de erro
����- RDM: já existe sistema para cadastramento de RDM’s
����O erro é avaliado conforme a experiência do técnico. Avaliação do erro
����
Erros conhecidos são identificados pela experiência individual ou da equipe e são registrados nos incid entes. Não existe procedimento nem forma de armazenamento dessas informações
Identificação e registro do erro
Controle de Erros
����- Resolução e encerramento de problemas: Incidentes e problemas possuem a mesma conotação no sistema da PROCERGS, não é feito diferenciação de ambos.
����- RDM: já existe sistema para cadastramento de RDM’sRDM e Resolução e encerramento do problema
!- Falta de procedimentos e de documentações que auxiliem no aprofundamento e padronização de investigação e diagnóstico
Investigação e diagnóstico do problema
����- Não há qualquer recurso para identificação de impacto , urgência e prioridade , essa função fica a cargo da experiência dos profissionais
!- Categorização em estágio inicial (a cargo do projeto de incidentes na PROCERGS)
Classificação do problema
����
Sistema sem suporte a registro ou identificação de problemas: não existem meios de registrar informações de forma que facilite a identificação de problemas a partir de incidentes.
Identificação e registro dos problemas
SituaçãoSituação na PROCERGSAtividade (ITIL)
Controle de Problemas
Gerenciamento de Problemas
EstratégiaEstratégia
Melhorar o tratamento das informações
registradas nos incidentes
Propor um processo para tratar os problemas
+
RESULTADOS (3)
Identificação do problema Testes
Ação corretiva e/ou
encaminhamento
Registro de início de atendimento
Registra o fim do atendimento e/ou
encaminha incidente
Recebimento do incidente
Gerenciamento de Incidentes
Identificação da não conformidade
Testes Ação corretiva
Registro de início de atendimento
Encarra e/ou encaminha o
incidente
Recebimento do incidente
Classificação /CategorizaçãoRegistro de testes Registro de ações
Registro da não conformidade identificada
Gerenciamento de problemas
Fluxo existente
Proposta de inclusão no fluxo
RDM
Passo 1
Identificação do problema
Passo 2
Classificação
Passo 3
Investigação e diagnóstico
Passo 4
Descoberta da Causa Raiz
Gerenciamento de Configuração
Passo 5
Identificação e registro do erro
Passo 6
Avaliação do erro
Passo 7
Registro da resolução do erro
Equipes de segundo a
quarto nível de atendimento
Passo 8
Encerramento do erro
Controle de Problemas
Controle de Erros Gerenciamento
de Mudanças
Gerenciamento de Problemas
Gerenciamento de Incidentes
Funcionamento do processo segundo ITIL
Funcionamento do processo segundo ITIL
RESULTADOS (3)
Informações sobre
os incidentes
Informações sobre os
problemas
RDMStatus da Mudança
Informações sobre os IC´s
Ferramenta de incidentes
(RTP)
Ferramenta de Gerenciamento de Mudanças
(GMUD)
Ferramenta de Gerenciamento
de Configuração
(GCO)
Ferramenta de Gerenciamento de
Problemas
Interação entre ferramentasInteração entre ferramentas
RESULTADOS (3)
InícioIdentificada
repetição de uma não conformidade
Abertura de um registro de problema e
seleção do IC envolvido
Informações sobre os IC’s
Conferência e registro da classificação
Realização de investigação e diagnósticos
Registro dos testes
Identificada a Causa
Raiz?
Testes e Dignósticos
Registro dos testesNão
Registra resoluções
Necessita RDM?
Abertura de RDM
Aplica a resolução
Registro da resolução do erro
Avaliação do erro Identificação e registro do erro
Fim
Gerenciamento de Incidentes
Sim
Não
Informações sobre categoria
Inclusão do IC envolvido 1
1
Sim
Status da mudança
Gerenciamento de Problemas Controle de Problemas
Gerenciamento de Problemas Controle de Erros
Gerenciamento de Mudanças
Gerenciamento de Configurações
Fim
�Análise da situação atual do tratamento de problemas
�Proposta de um processo de trabalho para o Gerenciamento de Problemas
�Subsídios para criação de um projeto de Gerenciamento de Problemas
CONSIDERAÇÕES FINAISContribuições para a empresaContribuições para a empresa
�Oportunidade de unir atividade profissional com acadêmica
�Desenvolver um dos assuntos abordados durante o curso de Pós-Graduação
�Aprofundar os conhecimentos sobre o tema
CONSIDERAÇÕES FINAIS
Contribuições para o PesquisadorContribuições para o Pesquisador
�Manter um padrão de registro
�Criar base de conhecimento (procedimentos )
�Categorização adequada (atualizada)
�Link entre incidentes e problemas
�Reforçar entre as áreas a existência do Gestor de Incidentes (definir poderes)
CONSIDERAÇÕES FINAISRecomendações - IncidentesRecomendações - Incidentes
�Definição e mapeamento do processo
�Definição de responsabilidades (dono do processo + áreas responsáveis por problemas) -evitar sobreposições
�Criação/definição de ferramenta baseada no controle de problemas e de erros
� Ligação de problemas com os outros processos
�Comunicação sobre o gerenciamento de problemas
CONSIDERAÇÕES FINAISRecomendações - ProblemasRecomendações - Problemas