O gerenciamento de incidentes coordena os recursos de TI e seus esforços para restaurar o mais rápido possível um serviço após ocorrer falha. É um processo essencial para reduzir a indisponibilidade (downtime).

Proposito do processo

O propósito do gerenciamento de incidente é restaurar a operação normal do serviço o mais rápido possível e minimizar o impacto adverso sobre as operações da CDSA, assegurando assim que os níveis acordados de qualidade sejam mantidos. "A operação normal dos serviços" é definida como um estado operacional, onde os serviços e ICs ficam operando dentro dos seus níveis de serviço (ANS) e níveis operacionais acordados (ANO).

Se ocorrer uma interrupção ou uma redução da qualidade no serviço (por exemplo, lentidão no acesso ao serviço), é o processo gerenciamento de incidente que entrará em ação para restaurar o serviço para sua operação normal. Qualquer situação anormal no serviço pode se reportado pelos usuários ou até mesmo pela própria pessoa de suporte da TI-CDSA. Este processo contempla passos necessários para lidar com incidentes que podem ocorrer a qualquer momento. É um processo imprescindível para sustentar a garantia de um serviço.

Objetivos do processo

  • Assegurar o uso de métodos e procedimentos padronizados de análise, documentação, gerenciamento contínuo e reporte de incidentes.
  • Aumentar a visibilidade e a comunicação de incidentes para o negócio e o pessoal de suporte de TI.
  • Aumentar a percepção do negócio em relação à TI por meio do uso de uma abordagem profissional, resolvendo e comunicando rapidamente os incidentes quando eles ocorrerem.
  • Alinhar as atividades e prioridades do gerenciamento de incidente às do negocio.
  • Manter a satisfação do usuário como a qualidade dos serviços de TI.

Escopo do processo

O escopo deste processo inclui qualquer evento que interrompa ou que possa interromper um serviço de TI na CDSA. Os eventos podem ser comunicados diretamente por usuários, tanto por meio da central de serviços como por alguma interface de gerenciamento de eventos à ferramenta do gerenciamento de incidentes.

Incidentes também podem ser reportados e/ou registrados pelo equipe de TI (se, por exemplo, eles perceberem algo estranho com algum componente de Hardware ou de rede, eles podem reportar ou registrar um incidente e comunicá-los à central de serviços).

Valor para CDSA

O gerenciamento de incidentes é altamente visível, por isso, será o primeiro processo a ser implementado no projeto de gerenciamento de serviços da DTI-CDSA. O benefício adicional deste processo pode ser usado para destacar outras áreas que necessitem de atenção e justificativa para gasto com implementação de outros processos.

O valor deste processo também inclui na capacidade de detectar e resolver incidentes, o que resulta em menos "Downtime" (indisponibilidade) para a CDSA, e identificar necessidades adicionais de serviço ou de treinamento encontradas na TI ou no nado da CDSA.

Definições e abreviações

  • ANS – Acordo de Nível de Serviço;
  • Base de conhecimento – um banco de dados lógico contendo dados e informações usadas pelo SGCS
  • SGCS - Sistema de gerenciamento de conhecimento de serviço;
  • IC - Item de Configuração – qualquer componente que necessite ser gerenciado para que possa entregar um Serviço de TI. Ex.: servidor, roteador, software, documentos etc.;
  • SGS – Sistema de Gerenciamento de Serviços de TI;
  • Backlog - refere-se a um log (resumo histórico) de acumulação de trabalho num determinado intervalo de tempo

Política do processo

O Gerenciamento de Incidentes deve estar alinhado às seguintes políticas e diretrizes:

  • Todos os incidentes devem ser registrados, inclusive os incidentes reportados por telefone;
  • Toda informação relevante durante o ciclo de vida do incidente deve ser registrada;
  • Os incidentes e seu estado devem ser comunicados ao usuário.
  • A Central de Serviços deve solicitar mais informações do usuário quando o chamado não dispuser de informação suficiente para o atendimento.
  • Os chamados devem ser categorizados e priorizados pela Central de Serviços, dentro do prazo acordado;
  • Incidentes devem ser resolvidos na Central de Serviços somente quando existir uma solução documentada;
  • O banco de dados de erros conhecidos deve ser atualizado constantemente;
  • Ações corretivas, preventivas e oportunidade de melhorias no processo devem ser registradas e encaminhadas ao dono do processo.

Escala de tempo

É necessário entender que nem todo incidente é igual, portanto cada incidente terá um tempo de resposta diferente e vão divergir dependendo do nível de prioridade do incidente.

Modelos de incidentes

  • Incidente grave : é aquele que gera impacto significativo para a CDSA e normalmente está associado a falhas em serviços considerados críticos para o funcionamento da CDSA e cuja indisponibilidade gera perda financeira. Para este tipos de incidente será usado um procedimento separado, com escala de tempo mais curta e maior urgência. A definição do que constitui um incidente grave será acordada e mapeado no esquema de priorização dos ANS.
  • Incidente normal: é aquele que gera impacto na operação de serviço.

Fluxograma do processo

Atividades do Processo

  • Identificação: O trabalho deste processo não pode começar a lidar com incidente até que se saiba da sua ocorrência, e o reporte será através da Central de Serviços;
  • Registro: Todos os incidentes devem ser registrados independente se ele forem levantados por meio de alguma chamada telefônica, ferramenta WEB á central de serviço, detectados automaticamente via algum alerta de evento ou oura fonte;
  • Categorização: Código adequados de categoria de incidente será necessário para ajudar na analise de tipo e frequência;
  • Priorização: determina como i incidente será tratado pelo suporte de TI da CDSA e a priorização vai indicar os tempos para ações que precisam ser tomados;
  • Diagnóstico inicial: envolve levantar todos os sintomas do incidente e determinar exatamente o que deu errado e como corrigir;
  • Escalação: ocorre quando um incidente requer um ação de um funcionário sênior ou de outro especialista. Pode ser Funcional ou hierárquica;
  • Investigação e diagnóstico: todos que participarem desta etapa, deverão registrar detalhes de quais ações tomadas para tentar resolver o incidente, documentando de modo a manter um registro histórico completo de todos as atividades realizadas;
  • Resolução e recuperação: quando uma resolução em potencial tiver sido identificada ela precisa ser aplicada e testada;
  • Encerramento: A central de serviços precisa verificar que o incidente foi plenamente resolvido e que os usuários estão satisfeitos e dispostos a concordar que o incidente possa ser encerrado;

Papéis e responsabilidades

Os papéis e responsabilidades dos envolvidos no processo de Gerenciamento de Incidentes são definidos como:

  1. Dono do processo
    • Garantir que o processo esteja adequado aos propósitos do CDSA e realizar as melhorias necessárias;
    • Garantir que a documentação do processo esteja atualizada e acessível a todos os envolvidos;
    • Garantir que os envolvidos sejam informados das mudanças efetuadas no processo;
    • Definir e revisar periodicamente os indicadores de desempenho utilizados para aferir a eficácia e eficiência do processo;
    • Garantir que relatórios com os indicadores de desempenho sejam produzidos e distribuídos entre os interessados;
    • Auditar periodicamente o processo para garantir que esteja sendo seguido conforme o especificado;
    • Garantir que o processo seja automatizado na ferramenta de Gerenciamento de Serviços da CDSA;
    • Garantir que os envolvidos recebam os treinamentos adequados para a fiel execução do processo;
    • Garantir a autoridade necessária a todos os papéis do processo;
    • Garantir que o processo esteja adequado aos propósitos da CDSA e realizar as melhorias necessárias;
    • Garantir que a documentação do processo esteja atualizada e acessível a todos os envolvidos;
    • Garantir que os envolvidos sejam informados das mudanças efetuadas no processo;
    • Definir e revisar periodicamente os indicadores de desempenho utilizados para aferir a eficácia e eficiência do processo;
    • Garantir que relatórios com os indicadores de desempenho sejam produzidos e distribuídos entre os interessados;
    • Auditar periodicamente o processo para garantir que esteja sendo seguido conforme o especificado;
    • Garantir que o processo seja automatizado na ferramenta de Gerenciamento de Serviços de TI;
    • Garantir que os envolvidos recebam os treinamentos adequados para a fiel execução do processo;
    • Garantir a autoridade necessária a todos os papéis do processo..
  2. Gerente do Processo
    • Indicar as pessoas adequadas aos papéis definidos no processo;
    • Promover e garantir que o processo seja seguido conforme o especificado;
    • Gerenciar os recursos alocados ao processo (pessoal, financeiros, etc.) de forma otimizada;
    • Garantir que os indicadores de desempenho do processo sejam atingidos;
    • Registrar e informar ao Dono do Processo as sugestões de melhorias no processo e no Sistema de Gerenciamento se serviços;
    • Garantir que os usuários sejam mantidos informados sobre seus incidentes;
    • Decidir sobre a alocação de incidentes aos Operadores de Incidentes;
    • Decidir sobre as escalações hierárquicas de incidentes;
    • Garantir a inclusão e atualização dos erros conhecidos na base de conhecimento;
    • Conduzir reuniões periódicas com a equipe da Central de Serviços e com as equipes de atendimento do 2º nível;
    • Auxiliar os operadores na solução de incidentes;
  3. Operador da Central de Serviços
    • Registar todos os incidentes reportados através de ligações telefônicas;
    • Realizar a categorização dos incidentes no prazo acordado no SLA;
    • Buscar mais informações do usuário quando o chamado não estiver suficientemente descrito;
    • Realizar o atendimento dos incidentes cuja solução esteja na base de conhecimento;
    • Apoiar na atualização dos erros conhecidos na base de conhecimento;
  4. Suporte de 2º nível
    • Recategorizar os chamados categorizados de forma equivocada e comunicar os operadores da central sobre o equívoco;
    • Solucionar os incidentes que não possuem solução documentada na base de conhecimento ou que não foram solucionado pela Central de Serviços no prazo definido pelo ANS;
    • Atualizar ou adicionar novos registros de erros conhecidos na base de conhecimento.

Indicadores de desempenho

Tempo médio para resolução de incidentes.

  Nível de satisfação dos usuários Histórico de versões

 

Tempo médio para resolução de incidentes.
objetivo Analisar o tempo médio para alcançar a resolução ou contorno de um incidente 
Fonte SGS
Periodicidade Mensal e anual
Regra de cálculo Tempo total de resolução dos chamados de incidentes/total de chamados de incidentes
Meta A definir

.

Tamanho do backlog
objetivo Analisar o backlog em todos os serviços por período 
Fonte SGS
Periodicidade Mensal e anual
Regra de cálculo Quantidade de chamados com TTO em atraso
Meta A definir

Histórico de versões

Data de atualização versão Alterações realizadas
 01/06/2021 1.0 Início do processo

Partes interessadas 

PAPEL RESPONSÁVEL ASSINATURA
Dono do processo Divisão de TI  
Gerente do processo Seção de TI  
Operador do processo Atendentes da Central de Serviços de TI