Blameless Postmortem
Política
A medida que os incidentes ocorrem nos sistemas do Perímetro Central e passam pela esteira do processo de Gestão de Incidentes, é necessário definir quais deles serão abordados e investigados mais minuciosamente através da elaboração de um Postmortem. Desta forma, é fundamental que sejam definidos critérios para tal, de modo que fique claro quais incidentes atendem e quais não atendem as condições para que se investigue seus respectivos contextos, impactos, causas raiz e próximos passos.
Portanto, a fim de que tais critérios sejam estruturados, foi definida a seguinte política de Postmortem para os incidentes do Perímetro Central.
Um Postmortem deve ser realizado não mais do que 3 dias após a ocorrência de um incidente que atenda a pelo menos um dos seguintes critérios:
se o tempo de inatividade foi perceptível ao usuário por pelo menos 10 minutos consecutivos;
se houve perda de dados de qualquer tipo;
se foi necessária a intervenção de um engenheiro de plantão para a resolução;
se o tempo de resolução do incidente foi maior que 2 dias;
se a severidade do incidente foi de 1-Crítica ou 2-Alta (é possível consultar a severidade dos incidentes em: https://openfinancebrasil.atlassian.net/l/cp/u0Dy6eA0).
Papéis
A fim de garantir a eficiência da sessão de Postmortem, é fundamental que a reunião conte com a presença de pessoas munidas das informações requeridas sobre o produto e o incidente, bem como daquelas que facilitam o andamento e as boas práticas da reunião.
Os papéis de cada envolvido, bem como suas respectivas responsabilidades e seus inputs são descritos a seguir.