Контрольные точки управления и понятие труда
Введение
Когда я был юн и неопытен, мне довелось поработать в Институте программных систем Российской Академии наук (ИПС РАН). Исследовательский центр мультипроцессорных систем возглавлял чл.-корр. РАН, д.ф.-м.н. Сергей Михайлович Абрамов. Я приезжал на работу на автобусе в 9 утра, «целовал закрытую дверь» и шел домой писать программы по автоматизации деплоймента исходных кодов заказчика на суперкомпьютере СКИФ-2000. Тогда мне казалось диким, что с утра на работе нет ни души… Люди если и появлялись, то к обеду. И лишь спустя много лет я понял, что Сергей Михайлович был гением! Ведь все задачи решались, научная работа шла, а выгорание персонала было полностью устранено. И смотря на тех сотрудников, кто сейчас работает в ИПС РАН, я узнаю знакомые лица и с гордостью говорю, что мне с ними довелось работать! И слава богу, что в новых сотрудниках я узнаю детей тех, кто и поныне трудится там. Ну а Сергей Михайлович был эффективным пользователем технологии управления под названием Agile. И сейчас его статьи я читаю на Хабре.
А теперь давайте рассмотрим такие понятия как SLI, SLO и SLA, а также поговорим о бюджетах рисков, ошибок и трудозатрат. Поговорим также про инструменты OSS/BSS.
Немного теории управления
Сложно предметно говорить о разработке программного обеспечения без последовательного и согласованного способа описания безотказной работы системы и доступности, а также без четкого измерения времени безотказной работы и определения приоритетов доступности.
Вычисление и поддержание необходимого уровня доступности является одной из задач SRE – инженерной Agile-дисциплины обеспечения эксплуатационной надежности, которая возникла как продолжение DevOps. В частности, SRE уточняет, какие именно показатели эксплуатационной надежности приложений должны непрерывно измеряться и оцениваться.
SRE гарантирует, что все согласны с тем, как измеряется доступность и что необходимо делать, когда доступность выходит за рамки, указанные в спецификации либо требованиях. Этот процесс включает в себя разных участников на каждом уровне, вплоть до вице-президентов и руководителей, и создает общую ответственность за доступность в рамках всей организации. Он работает с заинтересованными сторонами для принятия решений по показателям уровня обслуживания (SLI) и целям уровня обслуживания (SLO).
Полный материал читайте по ссылке.