Вся правда об SRE-инженерах: чем занимается, чем отличаются от DevOps, на каком стеке работают
В соседней статье мы уже рассказывали о работе технического департамента на примере слоеного пирога. Так вот за самый верхний слой у нас как раз и отвечает команда SRE-инженеров — она делает так, чтобы софт, который написали наши разработчики, запустился и обслуживался 24/7, круглогодично, в праздники и в любую погоду.
Вообще, SRE (Site Reliability Engineering) — это обеспечение надежности информационных систем, поэтому специалистов, которые этим занимаются, часто путают с DevOps — но их ключевая задача заключается в автоматизации сборки, настройки и развертывания ПО.
Поэтому, если говорить о разнице между ними, то DevOps отвечает за написание и развертывание кода, а SRE выступает за комплексный подход ко всему, ведь при работе над системой команда примеряет на себя роль конечного пользователя.
SRE-инженеры в нашем понимании – это люди, которые отвечают за продакшен. Они делают так, чтобы все наши проекты работали постоянно и без ошибок. Это специалисты, которые имеют доступ на продсистему и отвечают за выкатку кода.
А ещё они отвечают за то, чтобы все наши сервисы, API, все наши сервера, всё наше железо работало без перебоев. Это люди, которые, в том числе отвечают за пайплайн выкатки, люди, которые отвечают за конфигурацию боевых систем.
Владимир Тишин:
Наши SRE-инженеры работают над обеспечением бесперебойного функционирования продуктивного контура огромных информационных систем (самый настоящий highload!). Семь дата-центров, тысячи хостов, миллионы активных пользователей и миллиарды зарегистрированных аккаунтов. Самый популярный, удобный и классный продукт в своем сегменте. Имя — проверенное годами!
На каком стеке работают SRE
У нас в команде порядка 150 инженеров. Они работают в 13 разных командах. Это обусловлено тем, что у каждого проекта есть какая-то своя специфика. А ещё это помогает команде сфокусироваться на своём проекте, хорошо знать все его задачи, дорожную карту развития и все технические детали.
При этом у нас есть какие-то общие подходы, общие технологии. Мы базируемся на опенсорс-стеке — это всегда Unix-системы. Мы практически не эксплуатируем решения Microsoft или чьи-то другие. Пользуемся широко известным веб-сервером Nginx.
Безусловно, у нас есть также и собственные решения. Но всё же, если говорить про общий стек, то он очень лаконичный. Это виртуализация на Linux и OpenStack, системы управления Docker и системы автоматизации Kuber.