Конференция завершена. Ждем вас на TechLead Conf в следующий раз!

Мониторинг СronJob в Kuberenetes

Обратная связь

Доклад принят в программу конференции

Мнение Программного комитета о докладе

Вроде нередкая задача, но всегда вызывает боль. Докладчица рассказывает, как минимизировать боль и что стоит использовать.

Целевая аудитория

Те, кто развивает инфраструктуру мониторинга, кто эксплуатирует большое количество объектов в Kubernetes, кто давно мечтал собирать метрики с Cronjob.

Тезисы

В докладе расскажу, как устроен мониторинг в Ozon в целом, и как мы организовали мониторинг CronJob в Kubernetes на базе готовых решений Prometheus-Thanos-Grafana и Kube-state-metrics при наличии давно сформированной инфраструктуры мониторинга. Нашей целью было внедрить новые инструменты с минимальным влиянием на разработчиков, но при этом получить максимум с точки зрения мониторинга.

В результате у нас получился полноценный инструмент мониторинга CronJob, который предоставляет как базовые алерты и агрегации, так и дает возможность репортить свои метрики. Значительно сократили время реагирования на инциденты, где участвуют Сronjob.

Доклад будет наиболее полезен тем, кто развивает инфраструктуру мониторинга, кто эксплуатирует большое количество CronJob в Kubernetes, кто давно мечтал собирать метрики с CronJob.

Руководитель команды инструментов мониторинга, специализируется на создании удобных сервисов вокруг инфраструктуры мониторинга. Помогает разработчикам следить и наблюдать за своими сервисами.

Ozon

Ozon — ведущий e-com России. В их IT-команде уже 5 000 специалистов, которые создают продукты для миллионов людей по всей стране и за рубежом. Ozon Tech разрабатывает собственные решения, контрибьютит в Open Source и использует современный стек: Go, C#, Kotlin, Swift TypeScript, Vue.js, Kubernetes и Kafka. Они продолжают расти, чтобы повышать доступность сервисов и быть ещё ближе к пользователям.

Видео