Pic

03:14 ч. в SOC-а

Алармата на SIEM-а врещи. Дежурният анализатор, Мартин, е сам. Вместо да блокира изтичането на 12 000 клиентски записа, той затваря тикета с „FP“ – false positive. Седем часа по-късно всички са будни, но в атмосферата мирише на страх и вина. Шефът вика: „Кой точно спа?“
Това е моментът, в който или ще циментираш blame културата, или ще създадеш екип, който никога повече няма да премълчава инцидент.

Защо вината убива реакцията при инциденти

  • Страх от наказание → мозъкът преминава в режим „замръзване“ и прикрива данни.
  • Социално бездействие: „Ако никой не разбере, че аз съм сгрешил, рискът се разпределя.“
  • Научена безпомощност: множеството обвинения водят до усещането „каквото и да направя – все е без значение“.

Резултатът е техническ дълг при инциденти: една и съща първопричина се повтаря, но остава скрита под килима на страха.

Какво всъщност е blameless post-mortem?

Определение: Структуриран разбор на инцидента, фокусиран върху системите и процесите, а не върху индивида.

Цел: Не „кой“, а „какво в процеса позволи тази грешка да се случи“.

Изходни документи: timeline, impact graph, action items с owner и deadline, но никога имена на „виновници“.

5 стъпки за провеждане на blameless post-mortem

  1. Покани рано и всички
    Изпрати календарна покана още докато инцидентът е отворен – включи дежурния, разработчиците, SRE и дори комуникационния екип.
  2. Хронология без пропуски
    Използвай времеви печати в UTC, експорт от Slack, логове на GitHub Actions и JSON-и от SIEM. Фокусът е „какво се случи“, а не „кой го направи“.
  3. Техниката „петте защо“, но без обвинения
    Пример: „Алармата не се ескалира“ → „Правилото в PagerDuty има грешен regex“ → „Липсва автоматизиран тест за regex“.
  4. Действия в SMART формат
    „Добавяне на unit тест за regex-а в PagerDuty до 15.09.2025 г., отговорник @ivan_dev“.
  5. Публикувай и празнувай
    Качи резюмето в Confluence, спомени го в общия stand-up и благодари публично на екипа, че е споделил грешката.

Чек-лист за психологична безопасност

✔️ „Благодаря, че го сподели“ – всяко изказване започва с благодарност.
✔️ Без записване – срещата не се записва, за да няма страх от доказателства.
✔️ Ротация на водещ – всеки месец друг човек води, за да не се концентрира власт.
✔️ Анонимен вход – преди post-mortem пусни Google формуляр с въпроса: „Какво те притесняваше по време на инцидента?“

Вероятна история: български fintech стартъп

Инцидент: 11 юни 2024 г. – скрипт изтрива 8 % от транзакционните логове.
Blameless резултат: причината се оказва липсващ dry-run флаг в Ansible playbook. Вместо уволнение, разработчикът получава бюджет за внедряване на canary + feature flags в CI/CD. Три месеца по-късно MTTR спада с 42 %.

Запомни: Грешката е данни. Данните са оръжие. А blameless post-mortem е спусъкът.

 

Готов ли си да превърнеш екипа си в машина за безгрешни инцидент-реакции?

В store.nit.bg ще откриеш специално разработени онлайн обучения за мениджъри – от лидерски умения и емоционална интелигентност до курсове по киберсигурност и GDPR, които учат как да водиш blameless post-mortem и да градиш психологично безопасна култура.