Sunday, October 09, 2011

Comunicação no Datacenter

Na Itil v3 temos o processo Operação de Serviço onde o objetivo entregar aos clientes e usuários os níveis de serviço acordados e gerenciar as aplicações, tecnologia e infraestrutura que suportam a entrega do serviço.


Esse é o estágio em que os serviços entregam valor ao cliente, ou seja, o cliente percebe a eficiência e a eficácia dos serviços acordados, para isso acontecer a comunicação entre as equipes que cuidam do serviço em especifico devem  esta bem alinhada , em caso de um incidente. A comunicação por exemplo quando um incidente acontece todos envolvido no processo devem esta ciente, devemos usar as ferramentas de comunicação disponíveis , telefone, e-mail , sms, sinal de fumaça etc… (Existe alguns gestores que discordam desse ponto)
Papel da comunicação: a comunicação entre as equipes de TI, departamentos, usuários, clientes e primordial na Operação de Serviço. Uma politica de comunicação em cada equipe ou departamento e para cada processo deve ser estabelecida. A comunicação pode ser formal, mas não necessariamente complexa.
Conceitos Básicos:
  • Requisição de serviço: e um pedido de informação para uma mudança ou para acessar um serviço de TI. E geralmente atendida pela Central de Serviço e não requer a abertura de uma requisição de mudança.
  • Evento: e um status report criado por um serviço, IC ou ferramenta de monitoramento causado pela alteração no desempenho da infraestrutura ou de entrega de serviço. Geralmente requer que incidentes sejam registrados e uma ação seja tomada pelo pessoal de operações de TI. E uma mudança de estado significativa para um IC ou serviço.
  • Alerta: E um aviso ou advertência sobre uma meta (threshold), mudança ou falha que ocorreu. E produzido e tratado por ferramentas de gerenciamento de sistemas e pelo processo de gerenciamento de eventos.
  • Incidente: interrupção inesperada ou redução na qualidade de um serviço de TI. Pode ser uma falha de um IC que ainda não tenha impactado o serviço.
  • Problema: e a causa de um ou mais incidentes. O processo de Gerenciamento de Problema e responsável pela investigação da causa raiz.
  • Solução de contorno (workaround): resolve uma dificuldade ou questão de forma temporária, paliativa.
  • Erro conhecido (known error): e um problema que tem a causa raiz documentada e uma solução de contorno identificada. Erros conhecidos são criados no ciclo de vida do processo de Gerenciamento de Problema.
  • Base de Erros Conhecidos: registro centralizado de erros conhecidos. Tais registros são utilizados pelo processo de Gerenciamento de Incidente para resolver incidentes. Esta base, por sua vez, faz parte do SKMS / SGCS – Sistema de Gerenciamento do Conhecimento de Serviço. Esta base pode ser disponibilizada para que os usuários façam o próprio atendimento.
  • Impacto, urgência e prioridade: a avaliação de impacto e da urgência de incidentes, problemas e mudanças e importante para determinar suas prioridades. A prioridade determina a ordem de execução. Determiná-la baseado na combinação entre impacto x urgência e uma boa praticam. O impacto considera quantas pessoas, clientes ou quanto do negocio será afetado, enquanto a urgência determina a velocidade em que o incidente precisa ser resolvido.


No comments: