- Регистрация
- 26.05.2022
- Сообщения
- 23 592
- Реакции
- 55
- Баллы
- 48
SRE практики и инструменты Научим как ориентироваться в SRE и разъяснить их принципы коллегам. И расскажем как выстраивать SRE-процессы SRE - это подход к организации IT Operations. Команды SRE используют программное обеспечение как инструмент для управления системами, решения проблем и автоматизации операционных задач. SRE берет на себя задачи, которые исторически выполнялись операторами и системными администраторами, часто вручную, и вместо этого передает их операционным группам, которые используют программное обеспечение и автоматизацию для решения проблем и управления системами. SRE - это практика создания масштабируемых и высоконадежных программных систем. Она помогает управлять большими системами с помощью инфраструктурного кода, который является более масштабируемым и устойчивым для системных администраторов, управляющих тысячами или сотнями тысяч компьютеров. В крупных компаниях, таких как Google и Netflix, есть практика ротации, когда разработчики, тестировщики или инженеры эксплуатации могут временно, на несколько месяцев, сменить должность и поработать в других командах, мы предлагаем вам провести аналогичный эксперимент. Курс подойдет для: - Разработчиков, которые развиваются дальше и отвечают за свои сервисы в production окружениях - SRE и системных инженеров, в задачи которых входит обеспечение надежности и доступности - Инфраструктурных и платформенных инженеров, которые начали предоставлять свои сервисы другим командам - Техническим директорам, руководителям и тимлидам, которые хотят разобраться и внедрить лучшие SRE практики и инструменты На курсе вы узнаете, как: - Внедрить SRE практики в своей организации - Управлять надежностью, доступностью и эффективностью сервисов - Управлять изменениями - Осуществлять мониторинг - Реагировать на инциденты и производительность Практические задания будем выполнять на базе следующего технологического стека: Linux, AWS, GCP, Kubernetes, Ansible, Terraform, Prometheus, Go, Python. По окончании курса вы будете: - Ориентироваться в SRE-практиках и инструментах - Уметь разъяснить SRE-принципы коллегам - Понимать как выстраивать SRE-процессы в контексте взаимодействия с другими отделами компании - Сможете применять полученные знания в своей ежедневной работе, улучшая жизнь себе, коллегам, проекту и компании Необходимые знания - Опыт из разработки, тестирования или эксплуатации - Будет плюсом один из пройденных курсов по разработке в ОТУС - Будет плюсом пройденные курсы по DevOps практикам и инструментам и Linux Программа обучения В процессе обучения вы получите комплексные знания и навыки. Модуль 1. Введение в SRE Тема 1. Введение в SRE Тема 2. Основные принципы SRE Модуль 2. Практики SRE Тема 3. SLI, SLA, SLO и управление рисками Тема 4. Автоматизация 1 Тема 5. Автоматизация 2 Тема 6. Практика управление конфигурацией. Ansible Тема 7. Практика управление конфигурацией. Terraform Тема 8. Практика управление конфигурацией. Helm Тема 9. Мониторинг и практика оповещений Тема 10. QA-сессия Тема 11. Непрерывная поставка и управление изменениями Тема 12. Практика управление релизами Тема 13. Практика тестирования надежности систем Тема 14. Практика управления нагрузкой предотвращения перегрузок и сбоев Тема 15. Практика on-call и жизненный цикл SRE команды Тема 16. Практика постмортемов Тема 17. Практика диагностики и решения проблем Модуль 3. Проектная работа Тема 18. Выбор темы и организация проектной работы Тема 19. Консультация по проектам и домашним заданиям - промежуточная приемка Тема 20. Защита проектных работ otus.ru/lessons/sre/ |