Программа SRE
Интенсив пройдёт в декабре 2020. Каждый день начинаем в 10:00, проверка связи в 9:45. По расписанию занятия идут до 19:00 с перерывом на обед.
Программа может незначительно
меняться без потери ценности.
Тема №1: Основные принципы и методы SRE
Что нужно чтобы стать SRE?
DevOps vs SRE
Почему разработчики ценят SRE и очень грустят, когда в проекте их нет
SLI, SLO и SLA
Error budget и его роль в SRE
Тема №2: Дизайн распределенных систем
Архитектура и функционал приложения
Non-Abstract Large System Design
Operability / Design for failure
gRPC или REST
Версионирование и обратная совместимость
Тема №3: Как принимают проект SRE
Лучшие практики от SRE
Чек-лист приема проекта
Логирование, метрики, трейсинг
Забираем CI/CD в свои руки
Тема №4: Проектирование и запуск распределенной системы
Обратное проектирование — как работает система?
Согласовываем SLI и SLO
Практика capacity planning
Запуск трафика на приложение, наши пользователи начинают им «пользоваться»
Запускаем Prometheus, Grafana, Elastic
Тема №5: Monitoring, Observability and Alerting
Monitoring vs. Observability
Настраиваем мониторинг и алертинг с Prometheus
Практический мониторинг SLI и SLO
Symptoms vs. Causes
Black-Box vs. White-Box Monitoring
Распределенный мониторинг доступности приложений и серверов
4 золотых сигнала (обнаружение аномалий)
Тема №6: Практика тестирования надежности систем
Работа под давлением
Failure-injection
Chaos Monkey
Тема №7: Практика incident response
Алгоритм управления стрессом
Взаимодействие между участниками инцидента
Постмортем
Knowledge sharing
Формирование культуры
Контроль неисправностей
Проведение blameless разбора полетов
Тема №8: Практика управления нагрузкой
Балансировка нагрузки
Отказоустойчивость приложений: retry, timeout, failure injection, circuit breaker
DDoS (создаем нагрузку) + Cascading Failures
Тема №9: Реагирование на инциденты
Разбор полетов
Практика On-Call
Различные типы аварий (тестирование, изменение конфигурации, сбой оборудования)
Протоколы управления инцидентами
Тема №10: Диагностика и решение проблем
Журналирование
Отладка
Практика анализа и отладки на нашем приложении
Тема №11: Тестирование надежности систем
Нагрузочное тестирование
Тестирование конфигураций
Тестирование производительности
Canary release
Тема №12: Самостоятельная работа и ревью
Реальные кейсы
Проверка спикерами
Интенсив пройдёт в декабре 2020. Каждый день начинаем в 10:00, проверка связи в 9:45. По расписанию занятия идут до 19:00 с перерывом на обед.
Программа может незначительно
меняться без потери ценности.
Тема №1: Основные принципы и методы SRE
Что нужно чтобы стать SRE?
DevOps vs SRE
Почему разработчики ценят SRE и очень грустят, когда в проекте их нет
SLI, SLO и SLA
Error budget и его роль в SRE
Тема №2: Дизайн распределенных систем
Архитектура и функционал приложения
Non-Abstract Large System Design
Operability / Design for failure
gRPC или REST
Версионирование и обратная совместимость
Тема №3: Как принимают проект SRE
Лучшие практики от SRE
Чек-лист приема проекта
Логирование, метрики, трейсинг
Забираем CI/CD в свои руки
Тема №4: Проектирование и запуск распределенной системы
Обратное проектирование — как работает система?
Согласовываем SLI и SLO
Практика capacity planning
Запуск трафика на приложение, наши пользователи начинают им «пользоваться»
Запускаем Prometheus, Grafana, Elastic
Тема №5: Monitoring, Observability and Alerting
Monitoring vs. Observability
Настраиваем мониторинг и алертинг с Prometheus
Практический мониторинг SLI и SLO
Symptoms vs. Causes
Black-Box vs. White-Box Monitoring
Распределенный мониторинг доступности приложений и серверов
4 золотых сигнала (обнаружение аномалий)
Тема №6: Практика тестирования надежности систем
Работа под давлением
Failure-injection
Chaos Monkey
Тема №7: Практика incident response
Алгоритм управления стрессом
Взаимодействие между участниками инцидента
Постмортем
Knowledge sharing
Формирование культуры
Контроль неисправностей
Проведение blameless разбора полетов
Тема №8: Практика управления нагрузкой
Балансировка нагрузки
Отказоустойчивость приложений: retry, timeout, failure injection, circuit breaker
DDoS (создаем нагрузку) + Cascading Failures
Тема №9: Реагирование на инциденты
Разбор полетов
Практика On-Call
Различные типы аварий (тестирование, изменение конфигурации, сбой оборудования)
Протоколы управления инцидентами
Тема №10: Диагностика и решение проблем
Журналирование
Отладка
Практика анализа и отладки на нашем приложении
Тема №11: Тестирование надежности систем
Нагрузочное тестирование
Тестирование конфигураций
Тестирование производительности
Canary release
Тема №12: Самостоятельная работа и ревью
Реальные кейсы
Проверка спикерами
Пн Мар 04, 2024 8:47 am автор Admin
» Как майнить Notcoin Not подробное описание
Сб Фев 03, 2024 12:04 am автор Admin
» Кто придумал Toncoin
Ср Янв 31, 2024 3:38 am автор Admin
» Недельный дайджест???? Криптовалюты
Вт Янв 23, 2024 8:06 pm автор Admin
» Notcoin как играть подробное описанин
Вт Янв 23, 2024 7:03 pm автор Admin
» Что такое Not coin токен подробнее
Пн Янв 22, 2024 2:23 pm автор Admin
» Что такое not coin как в него играть. Подробнее.
Сб Янв 20, 2024 11:39 pm автор Admin
» Notcoin от Павла Дурова как заработать
Сб Янв 20, 2024 8:37 am автор Admin
» Новая криптовалюта на Телеграм Notcoin
Пт Янв 19, 2024 3:34 am автор Admin