Por que é importante saber a diferença entre problemas e incidentes?
Superficialmente, pode parecer que um “incidente” e um “problema” são a mesma coisa. Para profissionais fora do mundo da tecnologia da informação, qualquer uma das palavras pode ser usada para descrever uma situação que está causando impacto negativo nos negócios. Mas em TI, os dois termos são diferentes e precisam ser tratados e gerenciados de formas distintas.
O que é um incidente?
De acordo com o ITIL 4, um incidente é uma interrupção não planejada ou redução na qualidade de um serviço.
O que é um problema?
Um problema é a causa raiz de um ou mais incidentes. Uma vez que as linhas de escalonamento são ativadas e nenhuma solução é disponibilizada, é possível que seja necessária a abertura de chamado de um problema para áreas específicas investigaram a solução.
Distinguir entre incidentes e problemas é o mesmo que separar causa e efeito. Os problemas são a causa e os incidentes são o efeito.
As melhores práticas de ITIL indicam a maneira adequada de lidar com incidentes e problemas.
Gestão de Incidentes: A prática de minimizar o impacto negativo dos incidentes, restaurando a operação normal do serviço o mais rápido possível.
Gestão de Problemas: A prática de reduzir a probabilidade e o impacto dos incidentes, identificando as causas reais e potenciais dos incidentes e gerenciando soluções alternativas e erros conhecidos.
Gestão de Incidentes - Fluxo de Processos
Registro de Incidentes: A primeira etapa no gerenciamento de incidentes é relatar o incidente identificado. A equipe de TI deve capturar informações completas sobre o incidente usando um modelo de formulário para acelerar o processo de recuperação.
Classificação de Incidentes: Segmente os incidentes com a categoria e subcategoria adequada para facilitar a identificação. Personalize o formulário de incidente com os campos certos e configure regras automatizadas para classificação, priorização e atribuição de tíquetes.
Priorização de Incidentes: Estabeleça uma definição realista de SLA para atender aos compromissos do cliente.
Investigação e Diagnóstico: Quando um chamado de incidente é aberto, a equipe de TI realiza uma análise inicial e envia uma resolução ao usuário final. Se necessário deve-se escalar o chamado de incidente para equipes de nível II e nível III para investigação mais detalhada.
Resolução e fechamento de chamados de incidentes: Um dos principais objetivos de qualquer equipe de TI é resolver qualquer incidente o mais rápido possível. A comunicação eficiente sobre a resolução e o fechamento dos chamados resolvidos é muito importante.
Gestão de Problemas - Fluxo de Processos
Identificação proativa de problemas: Melhore a disponibilidade geral dos serviços identificando problemas de forma proativa para que possam ser resolvidos antes que futuros incidentes ocorram.
Diagnóstico e resolução de problemas: Identifique a causa raiz de um problema e aplique a solução mais apropriada.
Controle de problemas e erros: Monitore constantemente os problemas pendentes para que quando necessário, medidas corretivas possam ser introduzidas.
Encerramento e avaliação do problema: Certifique-se de que, após a solução de um problema, o registro contenha uma descrição histórica completa e que a base de conhecimento seja atualizada.
Revisão do problema principal: Analise a resolução do problema para garantir que as situações problemáticas tenham sido totalmente eliminadas. Identifique as ações preventivas (como mudanças no processo) que devem ser realizadas para evitar a recorrência do problema.
Relatórios de gestão de problemas: Informe todas as áreas de TI sobre os problemas pendentes, seus status e soluções existentes.
Fontes: CIO, Global Knowledge e IT Process Wiki