DevOps 指標

DevOps の成功を測定する理由、対象、方法

Tom Hall 氏は DevOps アドボケートかつ実践者であり、熱心な読書家、そしてアマチュアピアニストでもあります。過去 20 年間にわたる実績には、Novell、EMC、VMware、AWS の認定が含まれます。2016 年にアトランタで DevOpsDays の企画をサポートして以降、テキサス州オースティンの開催を何年もサポートしてきました。

Compass を無料で試す

開発者のエクスペリエンスを向上させ、すべてのサービスをカタログ化し、ソフトウェアの健全性を高めましょう。

無料で試す

測定できないものは改善できないという古い格言は、他のプラクティスと同様に DevOps にも当てはまります。より高品質の製品をより速くリリースするという DevOps の約束を果たすには、チームは多数の指標を収集、分析、測定する必要があります。これらの DevOps 指標から、DevOps チームが開発パイプラインを可視化して制御するために必要な重要なデータが得られます。

DevOps 指標とは

DevOps 指標とはデータポイントであり、DevOps ソフトウェア開発パイプラインのパフォーマンスを直接明らかにして、プロセスのボトルネックをすばやく特定して除去するのに役立ちます。これらの指標は、技術的能力とチームプロセスの両方を追跡するために使用できます。

DevOps の本質は、開発チームと運用チームの境界をぼかして、開発者とシステム管理者のコラボレーションを強化することに重点を置いています。これらの指標によって、DevOps チームはコラボレーションワークフローを測定して評価し、品質の向上、リリースサイクルの短縮、アプリケーションパフォーマンスの向上など、目標達成の進捗状況を大まかに追跡できます。

4 つの重要な DevOps 指標

DevOps のパフォーマンスを測定するために使用される指標は多数あります。すべての DevOps チームが測定するべき 4 つの主要指標を次に示します。

1. 変更のリードタイム

追跡する重要な DevOps 指標の 1 つは、変更のリードタイムです。サイクル期間 (後述) と混同しないでください。変更のリードタイムは、コード変更がトランクブランチにコミットされてからデプロイ可能な状態になるまでにかかる時間です。たとえば、コードが必要なすべてのプレリリーステストに合格するまでの時間です。

2. 変更エラー率

変更エラー率とは、本番運用後にホットフィックスまたはその他の修復を必要とするコード変更の割合です。これは、テストで検出されてコードがデプロイされる前に修正されたエラーを測定するものではありません。

3. デプロイ頻度

DevOps の成功を理解するには、新しいコードが本番環境にデプロイされる頻度を把握することが重要です。多くの実践者は、本番運用前のステージング環境にリリースされるコード変更を意味して「デリバリー」という用語を、本番環境にリリースされるコード変更を意味して「デプロイ」という用語を使用しています。

4. 平均復旧時間

平均復旧時間 (MTTR) は、部分的なサービス中断または全体的な障害からの復旧にかかる時間を測定するものです。これは、中断が最近のデプロイの結果であるのか、単独のシステム障害の結果であるのかにかかわらず、追跡するべき重要な指標です。

DevOps 指標を測定、使用、改善する方法

DevOps ライフサイクルの他の要素と同様に、継続的改善の文化が DevOps 指標にも適用されます。開発の各フェーズで迅速なフィードバックを受け取れる環境にあること、そこにフィードバックを実装するスキルと権限が伴うことは、パフォーマンスの高いチームの特長です。DevOps に関する書籍『Accelerate (Lean と DevOps の科学)』では、上記の 4 つのコア指標は、パフォーマンスの高いソフトウェアチームが採用する 24 の機能によって支持されていると言及されています。以下では、これらの機能のほとんど (CI/CD、テストの自動化、小規模バッチにおける作業、監視、継続的な学習) をカバーしていますが、これらのプラクティスを裏付ける研究をより深く掘り下げるには、ぜひ『Accelerate (Lean と DevOps の科学)』をご一読ください。

変更のリードタイム

通常、パフォーマンスの高いチームはリードタイムを時間単位で測定しますが、パフォーマンスが中程度のチームや低いチームは、リードタイムを日単位、週単位、さらには月単位で測定します。

テストの自動化、トランクベース開発、小規模バッチにおける作業は、リードタイムを改善するための重要な要素です。これらのプラクティスに従うことで、開発者は、コミットしたコードの品質に関するフィードバックをすばやく受け取って、欠陥を特定して修正できます。開発者が別々のブランチに存在する大規模な変更に取り組んで、手動テストに頼って品質管理を行っている場合は、ほぼ間違いなくリードタイムが長くなります。

変更エラー率

パフォーマンスの高いチームの変更エラー率は 0 ～ 15% の範囲です。

リードタイムの短縮を実現するプラクティス (テストの自動化、トランクベース開発、小規模バッチでの作業) は、変更エラー率の低下にも関連しています。これらのすべてのプラクティスに従うことで、欠陥の特定と修復がはるかに容易になります。

変更エラー率の追跡と報告は、バグの特定と修正のためだけでなく、新しいコードリリースがセキュリティ要件を満たしていることを確認するためにも重要です。

デプロイ頻度

パフォーマンスの高いチームはオンデマンドで変更をデプロイして、1 日に何度も繰り返すこともよくあります。パフォーマンスの低いチームは、多くの場合は、週に 1 回または月に 1 回のデプロイが限界です。

オンデマンドでデプロイするには、前のいくつかのセクションで言及した自動テストおよびフィードバックメカニズムを組み込んで、人間の介入の必要性を最小限に抑える自動デプロイパイプラインが必要です。

平均復旧時間

パフォーマンスの高いチームはシステム障害から迅速に復旧 (通常は 1 時間未満) する一方で、パフォーマンスの低いチームは障害からの復旧に最長で 1 週間かかる場合があります。

障害から迅速に復旧できるかどうかは、障害の発生を迅速に特定して、修正をデプロイしたり、障害の原因になった変更をロールバックしたりする能力によって決まります。これは通常、システムヘルスを継続的に監視して、障害発生時に運用スタッフに警告することによって行います。運用スタッフは、インシデントを解決するために必要なプロセス、ツール、権限を持っている必要があります。

MTTR では、平均故障間隔 (MTBF) に焦点を当てるという従来の慣習からシフトすることに重点を置いています。これは、最新のアプリケーションでは複雑さが増して、それに伴って障害予測値が上昇したことを反映しています。また、継続的な学習と改善の実践を強化します。障害を回避するためにデプロイが「完璧」になるまで待つ (したがって、古い MTBF スコアボードをリセットする) のではなく、チームはデプロイ作業を何度も繰り返します。MTTR では「完璧な」MTBF レコードを台無しにしたことを非難するのではなく、チームがアップストリームのプロセスとツールを改善できるように、誰も責めることなくふりかえりを実施することが奨励されています。

その他の関連指標

もう 1 つの関連指標にサイクル期間があります。これは、リリースの準備が整うまでチームが対象アイテムに費やす作業時間のことです。開発の世界では、開発者がコミットしてから本番環境にデプロイされるまでの時間を指します。DevOps のこの主要指標は、プロジェクトリードやエンジニアリングマネージャーが開発パイプラインで何がうまくいっているかを的確に理解するのに役立ちます。結果として、関係者や顧客の期待に沿った作業を行って、チームの迅速なリリースを約束できます。

サイクル期間レポートによって、プロジェクトリードは開発パイプラインのベースラインを確立できます。これは、将来のプロセスを評価するために使用できます。チームがサイクル期間に対して最適化を図ると、通常、開発者の進行中の作業が減って、非効率的なワークフローが少なくなります。

リーンプロダクトマネジメントでは、バリューストリームマッピングに重点を置いています。これは、製品または機能のコンセプトからデリバリーまでの流れを視覚化したものです。DevOps 指標は効果的なバリューストリームマッピングと管理のための重要なデータポイントの多くを提供しますが、真のエンドツーエンドな評価を行うためには、他のビジネス指標と製品指標によって補強する必要があります。たとえば、スプリントバーンダウンチャートは見積と計画の各プロセスの有効性に関するインサイトを提供するのに対して、ネットプロモータースコアは最終成果物が顧客のニーズを満たしているかどうかを示します。

結論

継続的な改善は、DevOps を実践するチームの中核的な信条です。変更のリードタイム、変更エラー率、デプロイ頻度、MTTR から全体的なパフォーマンスを測定して追跡できると、チームはベロシティを加速させて品質を向上させられます。

アトラシアンの Open DevOps では、チームにとってソフトウェアの開発と運用に必要となるものがすべて提供されます。チームは、大手ベンダーや Marketplace アプリとの統合によって、DevOps ツールチェーンを自由に構築できます。今すぐ試してみましょう。

推奨

おすすめのアプリ

Atlassian Collections

ユースケース別

チーム別

サイズ別

業界別

サポート

リソース

Jira

Confluence

Jira Service Management

ユースケース別

チーム別

サイズ別

業界別

Jira

Confluence

Jira Service Management

ユースケース別

チーム別

サイズ別

業界別

DevOps 指標

DevOps 指標とは

4 つの重要な DevOps 指標

1. 変更のリードタイム

2. 変更エラー率

3. デプロイ頻度

4. 平均復旧時間

DevOps 指標を測定、使用、改善する方法

変更のリードタイム

変更エラー率

デプロイ頻度

平均復旧時間

その他の関連指標

結論

推奨

DevOps コミュニティ

DevOps ラーニングパス

無料で始める

おすすめのアプリ

Jira

Confluence

Jira Service Management

ユース ケース別

チーム別

サイズ別

業界別

Jira

Confluence

Jira Service Management

ユース ケース別

チーム別

サイズ別

業界別

DevOps 指標

DevOps 指標とは

4 つの重要な DevOps 指標

1. 変更のリード タイム

2. 変更エラー率

3. デプロイ頻度

4. 平均復旧時間

DevOps 指標を測定、使用、改善する方法

変更のリード タイム

変更エラー率

デプロイ頻度

平均復旧時間

その他の関連指標

結論

推奨

DevOps コミュニティ

DevOps ラーニング パス

無料で始める

ユースケース別

ユースケース別

1. 変更のリードタイム

変更のリードタイム

DevOps ラーニングパス