Chaos Engineering, от первой атаки до создания команды

Опыт внедрения инженерных практик

Доклад принят в программу конференции

Тезисы

В докладе мы поделимся реальным опытом использования техник Chaos Engineering в различных современных и legacy-проектах, расскажем о проблемах, с которыми сталкивались, покажем, как их обойти, и подтвердим и развеем мифы о надежности систем. Проведем слушателя от первой атаки до создания Chaos Engineering-команды. Покажем на примерах реальные проблемы, "которые никогда не наступят", и как с помощью Chaos Engineering можно было бы к ним подготовиться и понимать, как поведет себя ваша система в различных турбулентных сценариях от просроченных сертификатов до split-brain между кластерами.

RnD-архитектор, техлид. Разрабатывал различные распределенные системы, системы принятия решений на основе AI. Chaos Engineering is fun 🙂

Создал команду Chaos Engineering в розничном блоке, успешно проводит атаки на различные системы и улучшает уровень отказоустойчивости систем. Также имеет большой опыт в банковском ПО, участник программы централизации и др.

Видео

Подготовительное задание
На мастер-классе мы проведем различные типы атак на "игрушечном", но архитектурно вполне взрослом приложении. Для этого вам понадобится к себе на ноутбук установить docker, docker-compose и перед мастер-классом необходимо скачать docker-compose.yml-файл, запустить и убедиться, что все работает, вызвав localhost:8080/healthcheck.
Также будет круто, если вы изучите несколько статей в интернете:
<link1>
<link2>
<link3>