- Регистрация
- 26.05.2022
- Сообщения
- 23 590
- Реакции
- 56
- Баллы
- 48
Это первый курс по SRE в России. Мы рассмотрим все доступные SRE практики и инструменты, будем следовать SRE принципам, поймем как выстраивать SRE процессы и обсудим связь с DevOps. Полученные знания можно сразу применять к своей ежедневной работе и улучшать жизнь себе, коллегам, проекту и компании. В курсе мы подробно разберем современные SRE практики на примерах таких компаний как Google, Facebook, Netflix, Spotify, Evernote, PagerDuty, NewRelic. А также рассмотрим SRE подходы в российских компаниях - Яндекс, Mail.ru, Авито, Badoo, HH.ru. Курс подготовлен на основе опыта, накопленного компанией Экспресс 42, которая на протяжении уже более 5 лет, помогает внедрять DevOps и SRE практики в крупных российских и зарубежных компаниях. На курсе мы рассказываем про надежность, доступность и эффективность сервисов, про управление изменениями, мониторинг, реагирование на инциденты и производительность своих сервисов. Практические задания будем выполнять на базе следующего технологического стека: Linux, AWS, GCP, Ansible, Salt, Consul, Prometheus, Okmeter, NewRelic, PagerDuty, Perf, Strace, Go, Python. Кому будет полезен этот курс - Разработчикам, которые развиваются дальше. Те, кто заинтересован в получении опыта эксплуатации сервисов. Те, кто думают о надежности своих сервисов или отвечают за свои сервисы в production окружениях, - Инфраструктурным и платформенным инженерам, которые начали предоставлять свои платформы как сервис, - Техническим директорам, руководителям и тимлидам, которые хотят разобраться и внедрить SRE практики и инструменты. Минимальные требования: - Опыт из разработки, тестирования или эксплуатации, - Будет плюсом один из пройденных курсов по разработке в ОТУС, - Будет плюсом пройденный курс по Linux, - Будет плюсом пройденный курс по DevOps практикам и инструментам, Заключительный месяц курса посвящен проектной работе. Свой проект это использование SRE практик и инструментов, которые были интересны слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе работы по проекту можно получить консультации преподавателей. Примеры тем проекта: - Повышение надежности своего сервиса, - Вывод сервиса в production окружение, - Покрытие мониторингом своего сервиса, - Создание процесса управления инцидентами и on-call, - Тестирование надежности своего сервиса, программа курса Модуль 1. Введение в SRE Введение в SRE. Правила SRE и среда эксплуатации Модуль 2. Принципы SRE SLI, SLA, SLO и управление рисками. Автоматизация. Мониторинг. Непрерывная поставка. Снижение рутины и стремление к простоте. Модуль 3. Практики SRE Практика оповещений. Практика on-call. Практика диагностики и решения проблем. Практика реагирования на инциденты. Практика управления инцидентами. Практика постмортемов. Практика управление конфигурацией. Практика управление релизами. Практика управления нагрузкой. Практика предотвращения перегрузок и сбоев. Практика тестирования надежности систем. Практика разрешения конфликтов. Практика конвейера обработки данных. Практика сохранности данных. Практика разработки в SRE. Практика машинного обучения. Модуль 4. Управление в SRE Управление прерываниями и операционной нагрузкой. Жизненный цикл SRE команды. Взаимодействие с SRE. |