オブザーバビリティ成熟度モデルをGitHub公開!明日から使える評価フレームワーク

サムネイル

はじめに

こんにちは。ITインフラ本部 SRE部の庭野です。

  • 「障害時の対応は属人化していて不安だけど、どこから手をつければいいか分からない」
  • 「監視ツールを導入したものの、チーム全体で活用できているのか評価する基準がない」
  • 「他社と比べて、自分たちの取り組みは遅れているのか、進んでいるのか分からない」

こうした悩みを抱えている組織は多いのではないでしょうか。

このたび公開した「オブザーバビリティ成熟度モデル」を活用することで、組織の現在地を明確に可視化し、次に取るべき具体的なアクションを特定できます。実際に、私たちは約50サービスで評価を実施し、チームごとの強みと課題を明確にしたうえで、段階的な改善を進めてきました。これまでの取り組みの集大成として、このフレームワークを実践経験とともにGitHubで完全公開しました。

この記事では、なぜ公開に踏み切ったのか、どのように活用できるのか、そして今後どのように役立てていただきたいのかについてご紹介します。

これまでの取り組みの流れ

このオブザーバビリティ成熟度モデルは、以下のような段階を経て進化してきました。

第1段階:社内での実践と評価

2025年2月から社内で本格的な成熟度評価を開始し、DMM全体のオブザーバビリティ実践を体系的に評価してきました。約50サービスからフィードバックを得て、現状の可視化と改善の方向性を明確にできました。

この取り組みについては、以前のブログ記事で詳しく紹介しています:
📖 社内評価の詳細はこちら(DMM全体のオブザーバビリティ成熟度評価の結果と考察)

第2段階:外部カンファレンスでの知見共有

2025年10月27日に開催された「Observability Conference Tokyo 2025」に登壇し、この取り組みを外部に発信しました。参加者の皆さまから多くの質問やフィードバックをいただき、同様の課題を抱える組織が多いことを実感しました。

登壇の詳細はこちらの記事をご覧ください:
📖 登壇レポートはこちら(Observability Conference Tokyo 2025での発表内容と参加者からのフィードバック)

第3段階:GitHubでの完全公開

そして今回、これまでの実践知をまとめたフレームワークとして、GitHubでの完全公開に至りました。

GitHubリポジトリhttps://github.com/dmm-com/observability-maturity-model

社内実践から外部発表、そして公開へ——この一連の流れを通じて、私たちの取り組みは「DMM内の改善活動」から「業界への知見共有」へと発展しました。

なぜ公開したのか

Observability Conference Tokyo 2025での登壇を通じて、同様の課題を抱える組織が多いことを実感しました。私たちが約50サービスでの評価を通じて得た実践知を公開することで、以下の価値を提供できると考えました。

1. 外部への貢献:明日から使える実用的なツール

このモデルは、理論だけでなく実際の運用経験に基づいて作られています。

  • DMM全体での評価実施経験(約50サービス)
  • 評価を通じて得られた現場の実態
  • 成熟度向上のための段階的な指針

これらの実践知を含めたフレームワークとして公開することで、「明日から使える」実用的なツールを提供できます。

2. 自社への学び:多様な視点からの発展

社内だけでの実践には限界があります。多様な業界、規模、技術スタックを持つ組織での活用事例を知ることで、私たち自身も学び、モデルをさらに発展させることができます。各組織での活用事例がそれぞれのブログやカンファレンス等で発信されることで、業界全体の知見として蓄積され、より多くの組織の参考となります。

公開したフレームワークの特徴

CMMI準拠の5段階評価

能力成熟度モデル統合(CMMI: Capability Maturity Model Integration)の考え方をベースに、レベル1(初期)からレベル5(最適化)まで、明確な成長パスを提供しています。

※ CMMIは、ソフトウェア開発やサービス運用のプロセス改善を体系化したフレームワークで、多くの組織で採用されている国際的な標準です。

  • レベル1(初期):属人的で場当たり的な運用
    例:障害対応が担当者の経験に依存し、手順が文書化されていない状態

  • レベル2(管理):基本的な管理プロセスの確立
    例:アラートルールとエスカレーションフローが定義され、一定の再現性が確保される

  • レベル3(定義):組織全体での標準化とプロセス適用
    例:複数チーム間で共通の監視基準とダッシュボードテンプレートが使用される

  • レベル4(定量的管理):定量的測定と統計的制御
    例:MTTR(平均復旧時間)やエラー率などを定量的に測定し、統計的に管理する

  • レベル5(最適化):継続的改善が組織文化として定着
    例:データに基づく自動的な改善提案と、それを実行するフィードバックループが確立

多くの組織はレベル1や2からスタートし、段階的にレベル3を目指すことが現実的です。

6つの包括的な評価軸

技術的側面と組織的側面をバランス良くカバーする6つの評価項目を定義しています。

評価軸 解決する主な課題 改善で得られる効果
1. データ収集と可視化 ログやメトリクスが分散していて全体像が見えない システムの状態を一元的に把握
2. システムの信頼性管理 障害対応が属人化している 標準化された対応プロセスの確立
3. 開発・運用プロセスの整備と最適化 リリース時の障害が多い 安全で迅速なデリバリーを実現
4. アラート最適化と障害対応 アラートが多すぎて重要な通知を見逃す 精度の高いアラート設計
5. ユーザー行動の理解と最適化 ユーザーへの影響が分からない ユーザー体験を基にした改善
6. 継続的な改善と最適化 改善活動が場当たり的 データに基づいた組織的な改善サイクル

初めての方へ:まずはここから始めましょう

6つの評価軸すべてを一度に評価するのは負担が大きいかもしれません。初めて成熟度評価を行う場合は、以下の順序で取り組むことをお勧めします:

第1優先:データ収集と可視化
システムの状態を把握するための基盤となる項目です。まずは「どのようなデータを収集し、どう可視化しているか」を評価することで、現状の全体像が見えてきます。

第2優先:アラート最適化と障害対応
日々の運用に直結する項目です。アラートの精度や障害対応のプロセスを評価することで、短期的な改善効果を実感しやすいです。

第3優先:その他の項目
上記2つの評価を終えた後、残りの4つの項目について段階的に評価を進めてください。

具体的な実装例と改善アクション

各レベルには実践的な具体例を記載しており、「このレベルはどういう状態か」が明確に理解できるようにしています。

また、現在のレベルから次のレベルへ進むための具体的な改善アクションプランも用意しており、「次に何をすべきか」が明確になります。

誰でもカスタマイズ可能

リポジトリをForkすることで、自社の状況に合わせてモデルをカスタマイズできます。評価基準を調整したり、独自の観点を追加したりすることで、より自組織に適したフレームワークとして活用できます。

リポジトリの活用方法

GitHubリポジトリには、すぐに活用できる2種類のPDFドキュメントが用意されています。

GitHubリポジトリの構成とドキュメント

1つ目は「成熟度モデル(PDF)」で、6つの評価軸について現在のレベルを評価するためのチェックリストです。2つ目は「改善アクションプラン(PDF)」で、各レベルから次のレベルに進むための具体的なアクションが記載されています。

まずは「成熟度モデル」で現状を評価し、その後「改善アクションプラン」で具体的な改善策を検討するという流れで活用できます。

基本的な使い方:3つのステップ

📊 ステップ1:現状評価

成熟度モデル(PDF)をダウンロードし、各評価項目について組織の現在のレベルを評価します。

チーム内で議論しながら評価することで、メンバー間の認識のずれを解消し、共通理解を形成できます。

📋 ステップ2:改善計画の策定

改善アクションプラン(PDF)をダウンロードし、次のレベルに進むために必要なアクションを確認します。

現在のレベルから一段階上のレベルに焦点を当てることで、無理のない改善計画を立てることができます。

🔄 ステップ3:段階的な実施

優先度の高い項目から順に改善アクションを実施し、継続的に成熟度を向上させます。

定期的に評価を繰り返すことで、改善の進捗を可視化し、次のステップを明確にできます。

💡 今すぐ試してみませんか?
GitHubリポジトリにアクセスして、まずは成熟度モデルのPDFをダウンロードしてみましょう。

カスタマイズして利用する場合

自社用にカスタマイズして利用したい場合は、以下の手順で進めることができます。

  1. リポジトリをFork
  2. CSVファイルを編集csv/ディレクトリのCSVを自社の状況に合わせて編集
  3. ドキュメント生成:編集したCSVから、表計算ソフト(Google Sheets、Excelなど)を使用してPDFやMarkdownファイルを生成
  4. 活用:自社専用の成熟度モデルとして活用

コミュニティへの期待と呼びかけ

多くの組織での活用を期待して

このモデルを実際に活用された方がいらっしゃいましたら、各組織のブログやカンファレンス等で事例を発信していただけると、他の組織にとっても貴重な参考情報となります。

※本リポジトリは情報公開を目的としており、Issue・Pull Requestは受け付けておりません。ご了承ください。

スター・Forkのお願い

このプロジェクトが役に立つと感じていただけた場合は、GitHubでのスター⭐をいただけると嬉しいです。スターは私たちの活動の励みになるとともに、多くの方にこのフレームワークを知っていただくきっかけにもなります。

また、自社用にカスタマイズして利用される場合は、ぜひForkしてご活用ください。

GitHubリポジトリhttps://github.com/dmm-com/observability-maturity-model

まとめ

社内での実践から始まったオブザーバビリティ成熟度モデルは、Observability Conference Tokyo 2025での発表を経て、今回の公開により、多くの組織に活用していただけるフレームワークへと発展しました。

一貫して大切にしてきた考え方

この取り組みを通じて、「評価は出発点である」という哲学を大切にしてきました。成熟度評価の本質的な価値は、スコアの高低ではなく、「自分たちは今どこにいて、どこに向かいたいのか?」を考えるためのコンパスとして機能することにあります。

提供できる価値

  • 組織の現状を可視化する共通の物差し
  • 段階的な改善を進めるための具体的なロードマップ
  • 実践知を共有し、業界全体で学び合える場

これはゴールではなく新たなスタートです。多くの組織に活用していただき、それぞれの環境でカスタマイズしながら、オブザーバビリティ向上に役立てていただければ幸いです。


SRE部では、一緒に働く仲間を募集しています。ご興味のある方は、ぜひ採用ページをご覧ください!
dmm-corp.com