今日は freee で開催された Tech Meetup に参加してきた.ダッシュボード厨としては最近導入した grafana-zabbix の紹介もしたいと思って「grafana-zabbix 活用術」というタイトルで LT もしてきた.懇親会でいろいろお話もできたし凄く楽しかった!
freee を支えるインフラ技術 @manabusakai
- Monyog - Monitor & optimize MySQL database performance
は知らなかった!
- 「障害が起きることを前提に」は本当に重要
- AWS Well-Architected Framework にも「コンポーネントの障害に対応するべし」と書かれてるし
- 理解はしてるけど SPOF になってしまうこともあるよなぁ…と思ったり
- 「トラッキングして見える化」も重要だなと思った
KARTE を支えるマルチプラットフォームインフラ監視 @ikemonn
- 「全員で壊しながら進む」
- AWS と GCP を使ってマルチプラットフォーム上に構築してる
- API Monitoring and Testing · Runscope API Testing & Monitoring
なんてあるんだ
- ダッシュボードを障害のレイヤーごとに作る
- ダッシュボード戦略として凄く参考になった!
対談 @manabusakai & @ikemonn
- 会場は Zabbix ユーザーが非常に多かった
- 障害が起きたときにダッシュボードを作り直したりする
- アラートの閾値を決めるのはある意味職人芸と言える
- アラートは最初多めに出して段々と減らしていく
対談を聞きながら「そうそう!そうなんだよなー!」と思ってた.モニタリングと言っても,システムによって規模も違うし,ツールも違うし,負荷の特性も違って,非常に興味深く聞いていた.対談形式の発表は凄く良いなと思った.
prometheus 監視で変わるもの @sugitak
grafana-zabbix 活用術 @kakakakakku
会場に Zabbix ユーザーが多かったため,比較的興味を持ってもらえたような気がする.
特に grafana-zabbix は Zabbix Server に影響を与えずに導入できるため,使ってみて不要だったら消せば良いし,バージョンアップも簡単だし,運用の手軽さが良いなと思う.紹介した活用術は Grafana を使ってる人であれば既知の内容だったと思うけど,Grafana は最初「どう使うんだろう?」と悩むことがあるし,機能も多いため,今後使う人の参考になれば良いなと思っている.最高のダッシュボードを作ろう!
あと「モニタリングは “Proactive” と “Reactive” に分類される」と紹介した Effective Monitoring and Alerting も是非読んでみると良いかと!

Effective Monitoring and Alerting: For Web Operations
- 作者: Slawek Ligus
- 出版社/メーカー: Oreilly & Associates Inc
- 発売日: 2012/12/07
- メディア: ペーパーバック
- この商品を含むブログを見る
grafana-zabbix はコチラから!
プロセス生存確認サービス始めました @narita-takeru
- NurseCall
- プロセス監視専用のサービスを作った
- コマンドは Golang 製 / 管理画面は Rails 製
関連記事
発表冒頭に紹介した CyberAgent Developers Blog に僕が書いた記事も是非合わせて見て頂けると!