kakakakakku blog

Weekly Tech Blog: Keep on Learning!

SLO をベースとしたアプローチをどう組織の文化にするのか /「SLO サービスレベル目標」を読んだ

2023年7月に出版された「SLO サービスレベル目標」を読んだ❗️

SLI / SLO をベースにサービスを運用するプラクティスが紹介されていて,SLI / SLO / エラーバジェットとは?という話から,検討・計測・文化まで,サービスの信頼性と向き合うためのノウハウが凝縮されていた📕 読む前は SLO をテーマに 432 ページ!? と思ったけど,本当に内容は盛りだくさんだった.個人的にはもう少しコンパクトだと読みやすいのかも〜というのはある \( 'ω')/

今更ではあるけど今月「SRE 本」を読んで,SLI (Service Level Indicators) / SLO (Service Level Objectives) 回りをより実践的に学びたいな〜と思っていて,タイミング良く読めたと思う.

kakakakakku.hatenablog.com

目次

  • 第I部 : SLO の開発
    • 1章 : 信頼性スタック
    • 2章 : 信頼性についての考え方
    • 3章 : 意味のあるサービスレベル指標の開発
    • 4章 : 適切なサービスレベル目標の選択
    • 5章 : エラーバジェットの使い方
  • 第II部 : SLO の実装
    • 6章 : 同意の獲得
    • 7章 : SLI と SLO の計測
    • 8章 : SLO の監視とアラート
    • 9章 : SLI と SLO の確率と統計
    • 10章 : 信頼性を得るためのアーキテクチャ
    • 11章 : データの信頼性
    • 12章 : 適切に機能した例
  • 第III部 : SLO の文化
    • 13章 : SLO 文化の構築
    • 14章 : SLO の進化
    • 15章 : 発見可能で理解可能な SLO
    • 16章 : SLO の提唱
    • 17章 : 信頼性のレポート
  • 付録 A : SLO の定義のテンプレート
  • 付録 B : 9章の証明

信頼性スタック(SLI → SLO → エラーバジェット)

第I部「SLO の開発」では信頼性スタック(SLI → SLO → エラーバジェット)の概念を改めて学び直すことができた.SRE 本よりも深く実践的に書かれているため復習以上の収穫があった👌 また "SLO は要求ではなく導く指針である" や "SLO の目標値の末尾に 9 を増やすことが目的ではない" など,目的と手段が入れ替わっていないかを考えながら読めた.個人的には特に5章「エラーバジェットの使い方」が良かった❗️

あと6章「同意の獲得」に出てくるエラーバジェットポリシーの「銀の弾丸(1年で3回までリリース凍結を回避できる)」っていうプラクティスはちょっと笑った💡

ユーザーファースト

本書を読んでいて,繰り返し出てくるメッセージとしては,サービス提供側の都合ではなく「ユーザーの体験はどうなのかを考える」ということで,SLI / SLO を検討するときに常に「ユーザー」を第一に考える必要があると感じた.その前提で具体的にどういう SLI / SLO を設定すれば良いのかというサンプルが12章「適切に機能した例」に出てきて本当に良かった❗️本書の前半ではあまり具体的な SLI / SLO の例が出てこなくて,case by case なのはわかるけど具体例も〜と感じながら読んでいたので,後半で腹落ちできた📕

文化

本書を読みながら,SRE のプラクティスを新しく組織に組み込もうとすると理解や合意を得て・信頼を獲得して・顧客価値を大切にしながら成功体験を積み上げる必要があるな〜と感じていて,6章「同意の獲得」や13章「SLO 文化の構築」で文化の話が出てきたところは非常に現実的で良かった.

以下の利害関係者をどうやって巻き込むか(味方にするか・説得するか)という話や,どういう反対意見が出るかという話なんて本当にリアルで実際に言いそうな人が目に浮かぶこともありそう👀

  • 開発および運用
  • 製品
  • 経営幹部
  • 法務
  • QA

また「文化を移行するための戦略」として,紹介されてるマインドセットは SRE のプラクティス導入に限らず「新しい何か」をはじめるときに重要なことだった✌ そして「賛同してくれる仲間 = フォロワーが重要」だったり「批判的な仲間 = 懐疑派代表」がいたり,このあたりは「Fearless Change」を読んで実践するのも良さそう❗️

  • 初めは小さく
  • 我慢強く
  • チームと関わる
  • 振り返りながら進める

まとめ

「SLO サービスレベル目標」を読んだ❗️SLI / SLO / エラーバジェットに関してここまで実践的に書かれている本は他にはなさそうで内容も良かった〜 \( 'ω')/

ちなみに最近 Kindle で技術書を読む体験が悪くて物理本に戻るしかないか〜と悩んでたけど,オライリーサイトから Ebook (PDF) を購入して iPad と Apple Pencil で自由に書き込み(落書き)をしながら読んだら物理本に近い体験になって今のところ満足してる✌

www.oreilly.co.jp