統計指標に基づくベンチマーキングによる信頼性・生産性向上へのアプローチ

2016/8/29 SEC セミナー統計指標に基づくベンチマーキングによる信頼性生産性向上へのアプローチプログラム 2&3 統計指標に基づくベンチマーキング実践例 1

プログラム 2 統計指標に基づくベンチマーキング実践例 1 プロジェクト計画の妥当性評価 1. はじめに 2. 白書等を活用したベンチマーキングの指針 3. プロジェクト計画の妥当性評価例 2

1. はじめに 1.1 背景 IPA/SEC は多数の完了プロジェクトデータに基づく公開ベンチマークとしてソフトウェア開発データ白書を定期的に発行して定量的管理 ( 特にベンチマーキング ) の普及促進を図っているしかしながら現状ではソフトウェア開発データ白書等を利用したベンチマーキングに関して主に次の問題があると認識している (1) SECセミナー ( データ白書関連 ) の受講後アンケートによれば定量的管理を自組織で取り組むのに 63% が力不足又は能力上の懸念があると回答している (2) 現状代表的なベンチマーキングシーンは主に見積りの妥当性評価であってベンチマーキング本来の改善を目的としたベンチマーキング特に品質マネジメント推進のためのベンチマーキングについては普及しているとは言い難い (3) ベンチマーキング方法を具体的に説明した手引書がまだ無いまたベンチマーキングの国際標準 ISO/IEC29155ではベンチマークとの比較結果を改善につなげるという肝心な部分の標準化がなされていない 3

1. はじめに ( つづき ) < 定量的管理の実施状況 ( SEC セミナーのアンケートから )> 定量的管理に取り組んでいるのは 58% に過ぎない 63% が自組織で取り組むことについて力不足あるいは能力上の何らかの懸念があると回答している組織における定量的管理に関する必要性組織における定量的管理に関する能力取り組む必要は無い 1% 分からない 2% 取り組みには力不足 14% 分からない 2% 今後取り組む必要がある 39% 既に取り組んでいる 58% 懸念事項がある 49% 取り組みは可能 35% N=178 N=176 4

< ベンチマーキングの狙いについて > 品質マネジメント等の改善を図ることが主眼 ( 主なフィードバック先は組織及び標準類 ) しかしそのようなベンチマーキングは普及しているとは言い難い組織のマネジメントのやり方組織のプロジェクトマネジメントのやり方開発プロセスプロジェクトマネジメント関連の標準類開発プロセス関連の技術標準類個々のプロジェクトマネジメント個々のプロジェクトマネジメント個々のプロジェクトマネジメント計画 (P) 計画組織のマネジメント関連の標準類組織の技術標準類要件定義インプロセス計測データ測定 (D) 基本設計詳細設計分析予測 (C) 製作結合テスト改善のフィードバック改善のフィードバックプロジェクトプロジェクト内の定量的管理の PDCA サイクル ( 工程毎に ) 対策 (A) 総合テストプロジェクトプロジェクト改善のフィードバック / フィードフォワード分析ポストプロセス計測データ完了プロジェクトの実績データ運用保守のデータ運用保守ベンチマーキング比較改善検討内部ベンチマーク人の作業入出力作業の流れ改善のフィードバック外部 ( 公開 ) ベンチマーク改善のフィードバックベンチマーキング比較改善検討 ( 妥当性評価 ) 5

< ソフトウェアベンチマーキングの標準化状況について > ISO/IEC29155-1 Information technology project performance benchmarking framework の Part 1:Concepts and definitions の Figure 2 IT project performance benchmarking framework インポートリポジトリを維持管理する維持管理参照外部リポジトリ提出ベンチマーキングリポジトリ外部ベンチマーク取出しデータを提出するベンチマークを参照取出し組織外の参照情報 IT プロジェクトを計測する IT プロジェクトデータ維持管理 / 参照ベンチマークとの比較結果に基づいて改善を図るという肝心な部分の標準化がなされていないまたベンチマーキング方法を具体的に説明した手引書が見当たらないベンチマークを発行する供給内部ベンチマークベンチマークを参照取出しベンチマーキング情報ベース道具立てを整備する支援活動利用 / 参照供給ツール手法ガイドベンチマーキングの道具類利用 / 参照ベンチマーキングを実施する ( 比較する ) 結果報告ベンチマーキング結果を活用する ( 改善を図る ) ベンチマーキングの中核活動 6

1. はじめに ( つづき ) 1.2 課題 (1) 品質マネジメント等の改善に向けたベンチマーキングの強化 (2) ベンチマーキングの具体的手引きの提供 1.3 課題解決に向けたアプローチ IPA/SEC が運営している高信頼性定量化部会の委員 ( 品管管理推進等の経験者 ) の方々の協力を得ながら次のように進めた (1) 完了プロジェクトデータを利用した品質マネジメントの主要なシーンとして15 シーンを取り上げて品質改善に向けたメッセージを検討したプロジェクト計画の実現性を高めるために計画の妥当性を評価するシーンプロジェクトマネジメントの改良を推進するシーン組織の改善 / 成熟度向上に向けたマネジメントを推進する 7 シーン

1. はじめに ( つづき ) (2) ソフトウェア開発データ白書等を利用した具体例 (19 例 ) に加えて委員の方々から品質改善の知見を含む事例 (13 例 ) を収集した IT 企業の事例については IT 企業内で実践し品質改善に効果があった事例を掲載したソフトウェアデータ白書を利用した具体例については品質管理スタッフの経験知見から品質改善に効果が期待できるものを掲載した (3) ベンチマークとの比較結果を品質マネジメント等の改善に繋げる部分を具体的に記述した 8

1. はじめに ( つづき ) 1.4 期待する効果 (1) 品質改善に関する知見 ( ヒント / 目安 ) として参考にできる ( 例 1) 上流工程での不具合摘出比率を高めることによって信頼性向上を図ることができる ( 例 2) 経済性を勘案した設計レビュー工数の強化目標として約 10 人時 /KSLOC が目安になる ( 例 3) 計画工期が厳しいと ( 標準的工期より短くて開発工程の重なりがあると ) 信頼性が低下する (2) IT 企業各社において自社データに基づくベンチマーキングのための手引きとしても利用できる IPA/SEC の公開ベンチマーク ( ソフトウェア開発データ白書 ) を用いたベンチマーキング方法及び具体例を示しているが各社の内部ベンチマークを用いたベンチマーキングにおいても同様のベンチマーキングが可能また IT 企業のベンチマーキング事例についても各社で同様のベンチマーキングが可能 9

1. はじめに ( つづき ) 1.5 公開統計指標に基づく品質マネジメント実践集として本年 7 月に IPA の Web サイトに公開した URL: http://www.ipa.go.jp/sec/reports/20160701.html 10

2. 白書等を活用したベンチマーキングの指針 2.1 ベンチマーキングの基本的な考え方外部ベンチマーク IPA/SEC 公開の外部ベンチマーク ( 白書等 ): ソフトウェア開発データ白書主に統計情報ソフトウェア開発データが語るメッセージ 2015 品質マネジメントの指針等 IT 企業の各組織での開発活動マネジメント活動ベンチマーキングの実施 ( 比較 ) ( ベンチマークと比較して学ぶ ) IT 企業の各組織でのベンチマーキング <ベンチマーキングの中核活動 > 内部ベンチマーク組織のマネジメントの改善検討プロジェクトマネジメントの改善検討プロジェクト計画の妥当性評価比較結果の活用 ( 改善検討 ) フィードバックフィードバックフィードバック組織のマネジメント関連の標準類改善 ( 信頼性 / 生産性向上 ) プロジェクトマネジメント関連の標準類改善 ( 信頼性 / 生産性向上 ) プロジェクト計画改善 ( 実現性向上 ) 手引の対象範囲本書 ( 手引 ) ベンチマーキングガイド ( 仮称 ) 適用 11

2. 白書等を活用したベンチマーキングの指針 2.1 ベンチマーキングの基本的な考え方 ( つづき ) < 要点 > (1) 自組織のデータを用いたベンチマーキングが基本である組織内でプロジェクトデータを収集しベンチマーキングリポジトリを構築し内部ベンチマークを作成した上で内部ベンチマーク ( 又はベンチマーキングリポジトリ ) を利用してベンチマーキングを実施することが基本である自組織のデータを用いたベンチマーキングをまだ実施していない組織においても実施できる部分から開始することが望ましい (2) 参考情報として必要に応じて外部の公開ベンチマークを参照することも有意義であるプロジェクトの実績データが蓄積されていない場合の代替情報として目安にする国内 IT 業界水準との差異を把握するために参照する IPA/SEC が提供している公開ベンチマークとしてソフトウェア開発データ白書及びソフトウェア開発データが語るメッセージ ( 以降白書等 ) がある

2. 白書等を活用したベンチマーキングの指針 2.1 ベンチマーキングの基本的な考え方 ( つづき ) < 要点 >( つづき ) (3) 収集データ及びメトリクスは目的に応じて選定する目的を想定せずに多種多様なデータを収集するのは現実的でないし意義が薄いまた既に明白になっていることに関してデータ収集するのはもはや意味が無い ( 参考 )GQM 手法目的指向のメトリクス選定に関する代表的な枠組みとして GQM 手法がある計測モデルを Goal 層 ( 概念レベル ) Question 層 ( 運用レベル ) 及び Metric 層 ( 定量レベル ) の 3 層で定義する手法である (4) ベンチマーキングの実施結果 ( すなわちベンチマークとの差異 ) を活用して改善を進めることが肝要である

2. 白書等を活用したベンチマーキングの指針 2.1 ベンチマーキングの基本的な考え方 ( つづき ) < ベンチマーキングの解釈について > 本稿ではベンチマーキングについて次のような解釈を前提にする (1) ベンチマークと対比する特性としては単に製品 ( プロダクト ) の信頼性実績や生産性実績だけでなくそれらの要因となっている可能性のある開発プロセスマネジメントプロセス組織の特性等を含む (2) ベンチマーキングとして行う活動には良い成績を収めているプロジェクト群のやり方 ( 開発プロセスマネジメントプロセス組織の特性等 ) を参考にして自組織のやり方の改善を図ることを含む (3) ベンチマーキングは定量的管理のうちポストプロセス計測データ ( 完了プロジェクトの実績データ ) を用いたものを言うインプロセス計測データ ( 開発プロジェクト実行中のデータ ) を用いた定量的管理は含まない

2. 白書等を活用したベンチマーキングの指針 2.2 白書等を参考にしたベンチマーキングのメリットベンチマーキングの経験が浅い組織ではベンチマーキングの導入や理解のための参考情報として白書等の公開ベンチマークを利用することができる既にベンチマーキングを実践している組織においてもベンチマーキングを更に進めるために白書等の公開ベンチマークが以下のように有用な参考情報となる (1) 国内 IT 業界における自組織のパフォーマンスや強み / 弱みを把握するため白書等の統計情報は国内 IT 業界におけるソフトウェアの信頼性実績生産性実績開発プロセスの実施実績等の一つの相場観を呈示している ( 注 ) 白書等の統計情報は定量的管理されたプロジェクトの統計情報と見るのが妥当であって世間相場観よりも良い値を示している可能性があることに留意した上で目安として参考にされたい

2. 白書等を活用したベンチマーキングの指針 2.2 白書等を参考にしたベンチマーキングのメリット ( つづき ) 自組織のソフトウェアの信頼性実績生産性実績開発プロセスの実施実績等の統計情報と白書等の統計情報とを比較し自組織のパフォーマンスや強み / 弱みを把握することが重点的に改善すべき対象領域を検討特定する契機となる ( 例 ) 白書等の統計情報と比較して信頼性実績が低い ( 発生不具合密度 ( 規模あたりの稼働後に発生した不具合数 ) が高い ) ことが分かったまたその要因となっている可能性がある品質保証プロセスに着目すると設計文書化密度 ( 規模あたりの設計書ページ数 ) 及び設計レビュー工数密度 ( 規模あたりの設計レビュー工数 ) が白書等の統計情報と比較して低いことが分かったこれらのことから設計書の充実と設計レビュー強化 ( 設計レビュー工数の増強と設計レビュー効率向上 ) によって信頼性向上を図ることを重点課題として検討することにした

2. 白書等を活用したベンチマーキングの指針 2.2 白書等を参考にしたベンチマーキングのメリット ( つづき ) (2) 自組織の信頼性 / 生産性向上に向けたプロジェクトマネジメントや組織改善のマネジメントの見直しのため白書等の分析結果 ( 傾向 ) 及びメッセージをヒントにすることができる ( 具体的なマネジメントアクションの指針として参考にすることができる ) ( 例 1) 白書等には IPA/SEC 白書データベースから読み取れる変動要因とそれらの変動要因による変動の程度が具体的に示されている必要に応じて自組織の変動要因が何かを探り直す時にそれらを参考にすることができる信頼性 / 生産性が向上する方向に変動要因を制御できると信頼性 / 生産性が向上すると期待できることから組織改善のマネジメントにおいて自組織の変動要因を把握することが重点改善領域の検討特定に役立つ

2. 白書等を活用したベンチマーキングの指針 2.2 白書等を参考にしたベンチマーキングのメリット ( つづき ) ( 例 2) 白書等のメッセージには経済的に信頼性を確保するための具体的なマネジメントアクションの指針としてレビューやテストにどの程度注力すると良いのかが IPA/SEC 白書データベースに基づいて定量的に示されている自組織のプロジェクトマネジメントに関する標準類 ( 管理基準等 ) の見直しの際に白書等のメッセージに示されたマネジメント指針をヒントとして参考にすることができるまた白書等のメッセージに示された数値を目安として参考にすることができる (3) 自組織のベンチマーキングの方法を見直すため目的に応じて白書等のデータ項目メトリクス及び分析方法を参考にすることができる

2. 白書等を活用したベンチマーキングの指針 2.3 ベンチマーキングの主なシーン (1) プロジェクト計画の妥当性を評価するシーン開発者 ( 開発プロジェクトのプロジェクトマネジャー及び担当者 ) がプロジェクト計画の策定時にプロジェクト計画の実現性を高めるために以下のような観点からプロジェクト計画の妥当性を評価するシーン ( 開発組織のマネジャー層 PMO 及び品質マネジメント推進部門がプロジェクト計画をレビューし助言 / 支援するシーンを含む ) 信頼性目標及び品質保証プロセス ( 文書化レビューテスト等 ) の妥当性開発総工数及び生産性目標の妥当性成果物量及び単位成果物量あたりの工数の妥当性工期の妥当性工程別の工数比率及び工期比率の妥当性

2. 白書等を活用したベンチマーキングの指針 2.3 ベンチマーキングの主なシーン ( つづき ) 開発者 ( 開発プロジェクトのプロジェクトマネジャー及び担当者 ) プロジェクト計画書を作成し自己レビューするレビュー結果を反映するベンチマーキングによるプロジェクト計画の妥当性評価プロジェクト計画書 ( レビュードラフト ) プロジェクト計画書 ( より実現性の高い計画書へ ) 内部ベンチマーク外部ベンチマーク統計情報変動要因開発組織のマネジャー層 PMO 及び品質マネジメント推進部門プロジェクト計画書をレビューし助言 / 支援するベンチマーキングによるプロジェクト計画の妥当性評価

2. 白書等を活用したベンチマーキングの指針 2.3 ベンチマーキングの主なシーン ( つづき ) < 要点 > ベンチマーク中の統計情報の一定の妥当な範囲 ( 例えば P25 から P75 の範囲等 ) と比較するただし一定の妥当な範囲についてはベンチマーク中の変動要因情報を参照し変動要因によって上方 / 下方修正した上で比較することが望ましい比較の結果範囲外となる場合範囲外となる合理的理由が無ければ計画を見直す ( 注 1) 自組織に妥当性評価の管理基準が設定されていればそれに従う ( 注 2) より高い信頼性目標 / 生産性目標を目指して改善を図るケースについては開発組織のマネジャー層用のベンチマーキングの主なシーンの方を参照されたい

< 妥当性評価の留意事項 > 一定の範囲に収まっていないというだけで妥当でないと評価するのは早計であるどういうプロジェクトなのかによっては変動要因による変動を始めとして一定の範囲に収まらなくなる合理的な理由が存在する可能性がある評価対象プロジェクトに該当する変動要因によって生じる変動幅を勘案して所定の妥当な範囲を上方修正 / 下方修正しながら妥当性評価することが望ましいその結果においても妥当な範囲外となりかつ変動要因以外の合理的な理由がない場合には計画や見積りを見直すことが望ましい自組織の生産性変動要因群箱ひげ図規模当りの成果物量成果物量当りの工数 P75 P25 評価対象プロジェクト変動要因による変動を勘案評価対象プロジェクトの生産性変動要因群 ( 所定の範囲に収まらない合理的な理由の一つ ) < 例 > システムの criticality クラスや業種に応じて適宜補正信頼性要求レベルが高い設計文書化密度を高く設定テスト密度を高く設定 22

2. 白書等を活用したベンチマーキングの指針 2.3 ベンチマーキングの主なシーン ( つづき ) (2) 開発組織のマネジャー層用のベンチマーキングの主なシーン主に開発組織のマネジャー層が以下のような観点からプロジェクトマネジメントの改善や組織の改善のためのマネジメントを推進するシーン (PMO 及び品質マネジメント推進部門がマネジメントを支援するシーンを含む ) 1 プロジェクトマネジメントの改善を推進するシーン品質保証プロセス関連標準類の見直しユーザの関与度の向上要求仕様の明確化等 2 組織の改善のためのマネジメントを推進するシーン体制の整備信頼性変動要因分析結果に基づく重点強化領域の特定業種等のドメイン別マネジメント信頼性 / 生産性の推移を踏まえた中長期計画の策定等

2. 白書等を活用したベンチマーキングの指針 2.3 ベンチマーキングの主なシーン ( つづき ) 開発組織のマネジャー層 ( スタッフとして支援する PMO 及び品質マネジメント推進部門を含む ) ベンチマーク中の信頼性 / 生産性向上に資する知見 ( 良い成績を上げているプロジェクト群の良いやり方 ) と開発組織の現状とを対比しながらマネジメントの改善を検討する変動要因に着目して重点改善領域を検討特定する信頼性 / 生産性向上に向けたプロジェクトマネジメント及び組織の改善のためのマネジメントのベンチマーキングによる改善検討開発組織のより良いマネジメントの方針標準類内部ベンチマーク外部ベンチマーク統計情報変動要因データ分析によって得られた信頼性 / 生産性向上に資する知見 ( ヒントや目安として参考にする )

2. 白書等を活用したベンチマーキングの指針 2.3 ベンチマーキングの主なシーン ( つづき ) < 要点 > 内部ベンチマークの信頼性 / 生産性向上に資する知見 ( 良い成績を上げているプロジェクト群の良いやり方 ) と開発組織の現状とを対比しながらマネジメントの改善を検討することが基本であるまた変動要因に着目して重点改善領域を検討特定することが望ましい外部の公開ベンチマークは必要に応じて国内 IT 業界水準との差異を把握するためなどに参照する改善検討結果は開発組織のマネジメントの方針及び標準類に反映するなお内部ベンチマークについては PMO 及び品質マネジメント推進部門が作成し定期的に更新することを想定している

2. 白書等を活用したベンチマーキングの指針 2.4 白書等を利用したベンチマーキングの留意事項白書等の統計情報を参考にする場合には次の点に留意して目安として参考にされたい (1) 白書等の分析結果は基本的に種々の組織業種プロファイル等が混在したサンプルデータ集合から得られたものである信頼性生産性等の評価にあたっては妥当な水準 / 範囲が業種品質要求レベルを始めとする種々の変動要因によって変動することを勘案する必要がある一般にシステムはその重要性や停止時の影響の大きさによってクラス分けされるメッセージに示さた推奨値についてはシステムのクラスや変動要因に応じて適宜補正した上で目安として利用されたい

2. 白書等を活用したベンチマーキングの指針 2.4 白書等を利用したベンチマーキングの留意事項 ( つづき ) (2) 白書等で用いているサンプルデータ集合には定量的管理が行われている組織のプロジェクトのデータが多く含まれていることから白書等の統計情報は定量的管理されたプロジェクトの統計情報と見るのが妥当である従って白書等の生産性 / 信頼性に関する統計値は世間相場観よりも良い値を示している可能性がある (3) 今後新しい開発プロジェクトのデータが追加されて行くことに伴って統計値や傾向が変化する可能性がある特にサンプルデータ数がまだ少ない分析項目については統計値や傾向が今後変化する可能性が高い (4) 白書等に記載された回帰式を利用するにあたっては白書の 3.4 節回帰式利用上の注意事項をご覧ください

2. 白書等を活用したベンチマーキングの指針 2.4 白書等を利用したベンチマーキングの留意事項 ( つづき ) (5) 分析項目によっては分析に必要なデータ項目群が異なることデータ項目ごとにデータ欠損しているプロジェクト群が異なることから各分析項目の対象プロジェクト集合は必ずしも同一でないことに注意されたい (6) 開発規模のメトリクスとしてファンクションポイント (FP) を採用しているプロジェクト集合とプログラムコード行数 (SLOC) を採用しているプロジェクト集合とは異なる集合であることに注意されたい

2. 白書等を活用したベンチマーキングの指針 2.5 ベンチマーキングのポイント (1) 改善 / 改革を図ることが目的そのためには模範となる優れたものと比較しそのやり方に学ぶことが肝要備考信頼性実績生産性実績といった結果指標の値を比較するだけでなく開発プロセスや組織の特性等の要因についても比較することによって信頼性 / 生産性向上に向けたヒントを得ることができる例えば良い信頼性実績を達成しているプロジェクト群では品質保証プロセス ( 文書化レビューテスト等 ) により注力している傾向が見られる特に設計レビューに注力することが効果的であることが実証されている一方テストで信頼性を確保しようとする作戦は実現性が薄い

2. 白書等を活用したベンチマーキングの指針 2.5 ベンチマーキングのポイント ( つづき ) (2) やり方を真似るだけでは不十分優れたもののやり方をヒントにして自組織の実態に応じてやり方をアレンジすることが重要備考 1 ベンチマーキングの標準的プロセスとして SPDLI というプロセスが提唱されている S(Strategy 戦略策定 ) P(Plan 計画 ) D(Do 情報収集 ) L(Learning 情報学習 ) I(Innovation 経営革新 ) 備考 2 例えばレビューテストともにやればやるほど不具合の検出能率は低下して行くいきなり高いプロセス目標を設定するのは得策でない自組織の実態や経済性を勘案して当面の効果的なプロセス目標を設定する方が良い

3. プロジェクト計画の妥当性評価例 3.1 信頼性目標及び品質保証プロセスの妥当性評価 (1) 目的プロジェクト計画におけるプロダクト目標 ( 信頼性目標 ) 及びプロセス目標 ( 信頼性目標達成のための品質保証プロセスの目標 ) が信頼性を確保するために妥当な水準に設定されているか否かを評価し必要に応じて調整するプロジェクト計画の実現性を高める (2) ベンチマーク信頼性及び品質保証プロセスに関する白書等の統計情報を目安として参考にする 1 信頼性 (SLOC 発生不具合密度 ) の統計情報 2 品質保証プロセス関連の統計情報設計レビュー工数密度テスト密度設計文書化密度上流工程での不具合摘出比率等 31

3.1 信頼性目標及び品質保証プロセスの妥当性評価 < メトリクス > SLOC 発生不具合密度稼働後 ( 最長 6ヶ月以内 ) に発生した不具合数開発規模 (KSLOC) 設計レビュー工数密度基本設計から製作までの設計レビュー工数開発規模 (KSLOC) テスト密度 ( 結合テストケース数 + 総合テスト ( ベンダ確認 ) ケース数 ) 開発規模 (KSLOC) 設計文書化密度 ( 基本設計書のページ数 + 詳細設計書のページ数 ) 開発規模 (KSLOC) 上流工程での不具合摘出比率基本設計から製作までのレビュー指摘数 ( 基本設計から製作までのレビュー指摘数 + 結合テストから総合テスト ( ベンダ確認 ) までの検出不具合数 ) 32

3.1 信頼性目標及び品質保証プロセスの妥当性評価信頼性目標に関するベンチマーク : 業種別発生不具合密度発生不具合密度 ( 件 /KSLOC) 0.25 業種別発生不具合密度 ( 新規開発 ) 0.20 0.15 0.10 0.05 信頼性 0.00 高全体 F: 製造業 H: 情報通信業 J: 卸売小売業 K: 金融保険業 R: 公務業種発生不具合密度 ( 件 /KSLOC) 大業種 N 最小 P25 中央 P75 最大平均標準偏差全体 373 0.000 0.000 0.014 0.063 2.413 0.081 0.204 F: 製造業 45 0.000 0.000 0.048 0.165 1.013 0.123 0.200 H: 情報通信業 43 0.000 0.000 0.000 0.098 0.483 0.066 0.112 J: 卸売小売業 34 0.000 0.003 0.021 0.058 2.413 0.127 0.416 K: 金融保険業 128 0.000 0.000 0.009 0.035 1.117 0.044 0.134 R: 公務 ( 他に分類されないもの ) 51 0.000 0.000 0.007 0.056 1.269 0.114 0.265 33

3.1 信頼性目標及び品質保証プロセスの妥当性評価品質保証プロセス関連のベンチマーク : 業種別設計レビュー工数密度業種別設計レビュー工数密度 ( 新規開発主開発言語グループ開発 5 工程有り ) 人時 /KSLOC 25 設計レビュー工数密度 ( 新規開発 ) 20 15 10 5 0 全体 F: 製造業 K: 金融保険業 R: 公務 ( 他に分類業種されないもの ) 設計レビュー工数密度人時 /KSLOC) 業種 N 最小 P25 中央 P75 最大平均標準偏差全体 104 0.08 1.73 4.13 10.96 1559.36 34.11 173.07 F: 製造業 16 0.53 1.83 4.39 8.27 55.63 10.10 14.87 K: 金融保険業 39 0.08 2.92 5.49 12.20 1559.36 70.85 274.66 R: 公務 ( 他に分類されないもの ) 23 0.20 1.20 3.36 13.74 17.54 6.74 6.39 H: 情報通信業 5 データ不足 J: 卸売小売業 5 データ不足 34

3.1 信頼性目標及び品質保証プロセスの妥当性評価品質保証プロセス関連のベンチマーク : 業種別テスト密度業種別テスト密度 ( 新規開発主開発言語グループ開発 5 工程有り ) 180 160 140 120 100 80 60 40 20 テスト密度 ( 新規開発 ) 0 全体 F: 製造業 H: 情報通信業 J: 卸売小売業 K: 金融保険業 R: 公務 ( 他に分類業種されないもの ) テスト密度 ( ケース /KSLOC) 業種 N 最小 P25 中央 P75 最大平均標準偏差全体 509 0.0 13.5 31.1 59.8 1703.3 65.4 146.1 F: 製造業 66 0.2 10.8 22.9 44.5 302.8 43.9 59.9 H: 情報通信業 87 0.4 21.2 41.9 68.2 970.7 64.5 111.5 J: 卸売小売業 42 0.5 14.4 31.7 42.0 587.1 49.1 95.0 K: 金融保険業 162 0.2 14.1 32.3 83.5 1703.3 94.1 225.2 R: 公務 ( 他に分類されないもの ) 58 0.0 12.3 35.4 49.8 698.5 59.4 101.2 35

3.1 信頼性目標及び品質保証プロセスの妥当性評価品質保証プロセス関連のベンチマーク : 業種別設計文書化密度業種別設計文書化密度 ( 新規開発主開発言語グループ開発 5 工程有り ) ページ /KSLOC 100 90 80 70 60 50 40 30 20 10 0 設計文書化密度 ( 新規開発 ) 全体 F: 製造業 J: 卸売小売業 K: 金融保険業 R: 公務 ( 他に分類業種されないもの ) 設計文書化密度 ( ページ /KSLOC) 業種 N 最小 P25 中央 P75 最大平均標準偏差全体 160 0.3 9.2 17.4 33.1 1527.9 39.2 130.4 F: 製造業 24 0.3 11.8 23.0 44.4 109.9 33.6 30.7 J: 卸売小売業 14 4.0 9.4 16.7 36.6 97.3 30.5 31.5 K: 金融保険業 68 2.0 13.6 21.7 37.7 1527.9 61.3 196.8 R: 公務 ( 他に分類されないもの ) 24 0.7 9.1 11.1 17.1 47.1 13.5 8.9 H: 情報通信業 3 4.5 6.2 7.9 17.7 27.4 13.3 12.4 36

3.1 信頼性目標及び品質保証プロセスの妥当性評価品質保証プロセス関連のベンチマーク : 業種別上流工程での不具合摘出比率業種別上流工程での不具合摘出比率 ( 新規開発主開発言語グループ開発 5 工程有り ) 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 上流工程での不具合摘出比率 ( 新規開発 ) 全体 F: 製造業 J: 卸売小売業 K: 金融保険業 R: 公務 ( 他に分類業種されないもの ) 上流工程での不具合摘出比率 (%) 業種 N 最小 P25 中央 P75 最大平均標準偏差全体 133 1.7% 50.7% 74.6% 88.3% 97.6% 65.9% 27.5% F: 製造業 24 10.8% 44.8% 73.4% 84.0% 95.2% 63.2% 26.6% J: 卸売小売業 10 6.9% 15.0% 41.7% 57.2% 93.3% 40.9% 28.6% K: 金融保険業 41 1.8% 64.4% 86.8% 93.5% 97.6% 74.0% 27.7% R: 公務 ( 他に分類されないもの ) 27 1.7% 51.5% 67.7% 86.7% 89.7% 62.1% 28.1% H: 情報通信業 6 66.3% 71.3% 75.0% 83.1% 89.5% 76.9% 8.9% データ不足 37

3.1 信頼性目標及び品質保証プロセスの妥当性評価 < ベンチマークに関する備考 ( 考察 )> 1 特に金融保険業では業種間比較において相対的に次のような傾向が見られる信頼性要求品質保証プロ信頼性が高いレベルが高いセスが手厚い生産性は低い次のような因果関係が推察される信頼性要求品質保証プロレベルが高いセスが手厚い信頼性が高い生産性は低いひいては一般に信頼性要求レベルが高いソフトウェアの開発にはそれ相応の品質保証の工数が必要と考えられる 2 業種が信頼性や品質保証プロセスの主要な変動要因になっていることから業種別ドメインに分けてベンチマーキングすることが推奨される 38

3.1 信頼性目標及び品質保証プロセスの妥当性評価 (3) ベンチマーキング方法 1 自組織が金融保険業の業種ドメインに該当するのであれば妥当と評価できる範囲を白書等の金融保険業の各統計情報の 25 パーセンタイル (P25) から 75 パーセンタイル (P75) までの範囲とするメトリクス単位 P25 P75 SLOC 発生不具合密度件 /KSLOC 0.000 0.035 設計レビュー工数密度人時 /KSLOC 2.92 12.20 テスト密度ケース /KSLOC 14.1 83.5 設計文書化密度ページ /KSLOC 13.6 37.7 上流工程での不具合摘出比率 % 64.4 93.5 39

3.1 信頼性目標及び品質保証プロセスの妥当性評価 < ベンチマーキング方法 > 2 P25~P75 の範囲内に収まっているか否かを判定するただし信頼性変動要因 ( 信頼性要求レベル等 ) に応じて妥当と評価できる範囲を調整 ( 上方修正 / 下方修正 ) しながら評価することが望ましい 3 P25~P75 の範囲外となる場合評価対象プロジェクトの特性を勘案しながら範囲外となる合理的な理由が無いか検討する合理的な理由が有れば妥当と評価し合理的な理由が無ければ目標の見直しを検討する 40

3. プロジェクト計画の妥当性評価例 3.2 工期の妥当性評価 (1) 目的プロジェクト計画における工期 ( 月数 ) が妥当な範囲に収まっているか否かを評価し必要に応じて調整する (2) ベンチマーク工数と工期に関するベンチマーク ( 白書等 ) の統計情報を目安として参考にする 41

実績月数 ( 開発 5 工程 ) [ 月 ] 3.2 工期の妥当性評価 < ベンチマーク > 開発 5 工程の工数と工期の関係 ( 新規開発 )( 信頼区間 50% 95% 付き ) 35 30 y(50%) y(95%) N=787 y(-50%) y(-95%) 25 20 15 10 5 0 0 50,000 100,000 150,000 200,000 250,000 300,000 実績工数 ( 開発 5 工程 ) [ 人時 ] Copyright IPA SEC 42

3.2 工期の妥当性評価 < ベンチマーキング方法 > (3) ベンチマーキング方法 1 工数と工期 ( 月数 ) の散布図と信頼区間を基にして工期 ( 月数 ) の一定の妥当な範囲を信頼区間 50% の範囲の工期 ( 月数 ) に設定する 2 評価対象プロジェクトの工期 ( 月数 ) が一定の妥当な範囲内に収まっているか否かを判定する 3 評価対象プロジェクトが一定の妥当な範囲外となる場合評価対象プロジェクトの特性を勘案しながら範囲外となる合理的な理由が無いかどうか検討する合理的な理由が有れば妥当と評価し合理的な理由が無ければ目標の見直しを検討する特に信頼区間 95% の下限値を下回る場合は工期 ( 月数 ) を見直す ( 信頼区間 95% の下限値を下回ったプロジェクトは今まで僅かしか無かったことから実現可能性が極めて低いと考えられる従って工期短縮限界の一つの目安となる ) 43

3.2 工期の妥当性評価 ( 厳しさの評価 ) (1) 目的プロジェクト計画における工期 ( 月数 ) が妥当な範囲に収まっているか否か ( 特に信頼性を確保できないほど厳しい工期になっていないかどうか ) を評価し必要に応じて調整するプロジェクト計画の実現性を高める (2) ベンチマーク白書のデータによると工期が厳しいと信頼性が低下する傾向が見られる計画工期の厳しさを計画工期が短く ( 標準工期に対する計画工期の比率が低く ) かつ各工程の工期が重なっている程度で評価する計画工期の厳しさ =( 標準工期に対する計画工期比率 ) ( 計画工期の重複度 ) 工期の重複度 = 各工程の計画工期 ( 計画終了日 - 計画開始日で求めた日数 ) の合計値開発 5 工程全体の計画工期 ( 日数 ) 44

発生不具合密度 ( 件 /KSLOC) 3.2 工期の妥当性評価 ( 厳しさの評価 ) < ベンチマーク > 計画工期が厳しい領域 ( 工期の厳しさが 1 未満の領域 ) には発生不具合密度が高いものが現れている工期の厳しさが 1 未満の場合信頼性を確保できないリスクが高まると言える 0.6 計画工期の厳しさと信頼性との関係 ( 新規開発主開発言語グループ ) 0.5 計画工期が厳しい領域には発生不具合密度が高いものが現れている 0.4 0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 計画工期の厳しさ ( 標準工期に対する計画工期比率と計画工期の重複度 ) 45

3.2 工期の妥当性評価 ( 厳しさの評価 ) < ベンチマーキング方法 > (3) ベンチマーキング方法 1 評価対象プロジェクトの計画工期及び工程計画から工期の厳しさを算出する 2 評価対象プロジェクトの工期の厳しさが 1 未満の場合計画工期及び工程計画の実現性を再検討し必要に応じて見直す 46

3. プロジェクト計画の妥当性評価例 3.3 開発総工数及び生産性目標の妥当性評価 (1) 目的工数見積りの妥当性を評価し ( 具体的にはプロジェクト計画における開発総工数及び生産性目標が妥当な水準に設定されているか否かを評価し ) 必要に応じて調整するプロジェクト計画の実現性を高める (2) ベンチマーク開発総工数及び生産性に関する白書等の統計情報を目安として参考にする 47

実績工数 ( 開発 5 工程 ) [ 人時 ] 3.3 開発総工数及び生産性目標の妥当性評価 ( つづき ) 1FP 規模と工数の統計情報の例 FP 規模と工数 ( 新規開発 IFPUG グループ )( 信頼区間 50% 付き ) 300,000 250,000 y(50%) y(-50%) N=386 200,000 150,000 100,000 50,000 0 Copyright IPA SEC 0 2,000 4,000 6,000 8,000 10,000 12,000 14,000 16,000 FP 実績値 ( 調整前 )[FP] 48

FP 生産性 [FP/ 人時 ] 3.3 開発総工数及び生産性目標の妥当性評価 ( つづき ) 2FP 生産性の統計情報の例 FP 規模別 FP 生産性 ( 新規開発 IFPUG グループ ) 400FP 未満 400FP 以上 1,000FP 未満 FP 規模 1,000FP 以上 3,000FP 未満 3,000FP 以上 49

FP 生産性 [FP/ 人時 ] 3.3 開発総工数及び生産性目標の妥当性評価 ( つづき ) 業種別 FP 生産性 ( 新規開発 IFPUG グループ ) F: 製造業 H: 情報通信業 J: 卸売小売業 K: 金融保険業 R: 公務業種 ( 大分類 ) 50

実績工数 ( 開発 5 工程 ) [ 人時 ] 3.3 開発総工数及び生産性目標の妥当性評価 ( つづき ) 3SLOC 規模と工数の統計情報の例 SLOC 規模と工数 ( 全開発種別主開発言語混在 )( 信頼区間 50% 付き ) 拡大図 (SLOC 規模 500,000& 工数 200,000) 200,000 180,000 160,000 y(50%) y(-50%) N=1,698 Copyright IPA SEC 140,000 120,000 100,000 80,000 60,000 40,000 20,000 0 0 100,000 200,000 300,000 400,000 500,000 実効 SLOC 実績値 [SLOC] 51

SLOC 生産性 [SLOC/ 人時 ] 3.3 開発総工数及び生産性目標の妥当性評価 ( つづき ) 4SLOC 生産性の統計情報の例 SLOC 規模別 SLOC 生産性 ( 新規開発主開発言語グループ ) 40KSLOC 未満 40KSLOC 以上 100KSLOC 未満 SLOC 規模 100KSLOC 以上 300KSLOC 未満 300KSLOC 以上 52

SLOC 生産性 [SLOC/ 人時 ] 3.3 開発総工数及び生産性目標の妥当性評価 ( つづき ) 業種別 SLOC 生産性 ( 新規開発主開発言語グループ ) F: 製造業 H: 情報通信業 J: 卸売小売業業種 ( 大分類 ) K: 金融保険業 R: 公務 53

3.3 開発総工数及び生産性目標の妥当性評価 ( つづき ) (3) ベンチマーキング方法 1 妥当と評価できる範囲を白書等の各統計情報の 25 パーセンタイル (P25) から 75 パーセンタイル (P75) までの範囲とする業種別の統計情報が有る場合には自組織が情報通信業の業種ドメインに該当するのであれば妥当と評価できる範囲を情報通信業の各統計情報の 25 パーセンタイル (P25) から 75 パーセンタイル (P75) までの範囲とする <P25~P75 の範囲の例 ( 開発規模が SLOC で金融保険業の新規開発の場合 )> メトリクス単位 P25 P75 FP 生産性 FP/ 人時 0.031 0.070 SLOC 生産性 SLOC/ 人時 2.5 6.8 54

3.3 開発総工数及び生産性目標の妥当性評価 ( つづき ) 2 評価対象プロジェクトの開発総工数及び生産性に関する目標が例えばそれぞれの P25~P75 の範囲内に収まっているか否かを判定するただし評価対象プロジェクトに該当する生産性変動要因を勘案して妥当と評価できる範囲を調整 ( 上方修正 / 下方修正 ) しながら評価することが望ましい生産性変動要因については白書等の知見をヒントとして参考にされたい 3 評価対象プロジェクトが P25~P75 の範囲外となる場合評価対象プロジェクトの特性を勘案しながら範囲外となる合理的な理由が無いかどうか検討する合理的な理由が有れば妥当と評価し合理的な理由が無ければ目標の見直しを検討する 55

3. プロジェクト計画の妥当性評価例 3.4 企業事例 : 信頼性要求水準に着目した工数予測モデル (1) 目的プロジェクト計画における工数計画値が妥当な水準に設定されているか否かを信頼性要求水準で層別した工数予測モデルを用いた予測工数と比較することによって評価し必要に応じて調整するプロジェクト計画の実現性を高める < 考え方 > 信頼性要求水準で層別して工数予測モデルを構築する方がより適切であることが分かった 56

( ) 3.4 企業事例 : 信頼性要求水準に着目した工数予測モデル ( つづき ) < 工数予測モデル ( 層別無し )> R = 0.81 開発工数人時 50% 予測区間上限回帰曲線 ( 開発工数 = α 開発規模 ) 50% 予測区間下限開発規模 (SLOC) 57

( ) 3.4 企業事例 : 信頼性要求水準に着目した工数予測モデル ( つづき ) < 工数予測モデル ( 信頼性要求水準で層別 )> R = 0.82 : 通常信頼性要求水準 : 高度信頼性要求水準開発工数人時開発規模 (SLOC) 58

3.4 企業事例 : 信頼性要求水準に着目した工数予測モデル ( つづき ) (2) ベンチマーク信頼性要求水準で層別した次の工数予測モデルの 50% 予測区間をベンチマークとして採用する 1 通常の信頼性要求水準の場合開発工数 = α 通常開発規模 β (α 通常 = exp(b 通常 ), β = A ) 2 高度な信頼性要求水準の場合開発工数 = α 高度開発規模 β (α 高度 = exp(b 高度 ), β = A ) 指数 β は信頼性要求水準によらず共通 59

3.4 企業事例 : 信頼性要求水準に着目した工数予測モデル ( つづき ) (3) ベンチマーキング方法この信頼性要求水準を加えた予測モデルを用いて開発するシステムの信頼性要求水準に応じた見積規模に対する開発工数の 50% 予測区間内に開発工数計画値が入っていれば妥当性が高いという目安にする 50% 予測区間内に開発工数計画値が入っていない場合評価対象プロジェクトの特性を勘案しながら範囲外となる合理的な理由が無いかどうか検討する合理的な理由が有れば妥当と評価し合理的な理由が無ければ目標の見直しを検討する < 参考ポイント > 妥当性評価の精度を高めるには業種別アプリケーション種別品質要求レベル等によって層別したベンチマークを用意して評価対象プロジェクトが該当するカテゴリのベンチマークを用いて妥当性評価することが望ましいこの例は品質要求レベル ( 信頼性要求水準 ) によって層別したベンチマークを採用した妥当性評価のベンチマーキング方法の事例として参考になると考えられる 60

3. プロジェクト計画の妥当性評価例 3.5 成果物量及び単位成果物量あたりの工数の妥当性評価 (1) 目的成果物量に着目して工程ごとに工数見積りの妥当性を評価し ( 具体的にはプロジェクト計画における各工程の成果物量及び単位成果物量あたりの工数が妥当な水準に設定されているか否かを評価し ) 必要に応じて調整するプロジェクト計画の実現性を高める (2) ベンチマーク工程別の成果物量と工数に関する白書等の統計情報を目安として参考にする白書等での各工程の成果物量は次のとおり要件定義基本設計詳細設計製作結合テスト開発工程成果物量 ( 実績 ) 総合テスト ( ベンダ確認 ) 要件定義書ページ数基本設計書ページ数詳細設計書ページ数コード行数 (SLOC) 結合テストケース数総合テスト ( ベンダ確認 ) ケース数 61

3.5 成果物量及び単位成果物量あたりの工数の妥当性評価 ( つづき ) 新規開発の場合開発規模 (FP 規模又は SLOC 規模 ) と各工程の成果物量との間及び各工程の成果物量と各工程の工数との間には強い ( 又は中程度の ) 正相関が見られるまた分析対象プロジェクトを特定の業種例えば金融保険業のプロジェクトに絞るとより強い相関が見られる ( 備考 ) これらの相関はソフトウェア開発データ白書のデータにおいて業種を始め様々なプロファイルのプロジェクトデータが混在した中でも見られる傾向であることから各組織において同種のソフトウェア開発を行うドメインの中ではより強い相関が見られると考えられる 62

3.5 成果物量及び単位成果物量あたりの工数の妥当性評価 ( つづき ) 1 各工程の開発規模あたりの成果物量及び成果物量あたりの工数の中央値の例開発規模あたりの成果物量及び成果物量あたりの工数の中央値の一覧 ( 新規開発主開発言語グループ ) 開発工程要件定義基本設計詳細設計製作結合テスト総合テスト ( ベンダ確認 ) データ数 74 137 131 535 324 328 開発規模当りの成果物量の中央値 KSLOC 当りの要件定義書ページ数 ( ページ /KSLOC) KSLOC 当りの基本設計書ページ数 ( ページ /KSLOC) KSLOC 当りの詳細設計書ページ数 ( ページ /KSLOC) KSLOC 当りの結合テストケース数 ( ケース /KSLOC) KSLOC 当りの総合テストケース数 ( ケース /KSLOC) 1.22 6.39 12.10 32.20 9.00 成果物量当りの工数の中央値要件定義書ページ当りの要件定義工数 ( 人時 / ページ ) 基本設計書ページ当りの基本設計工数 ( 人時 / ページ ) 詳細設計書ページ当りの詳細設計工数 ( 人時 / ページ ) KSLOC 当りの製作工数 ( 人時 /KSLOC) 結合テストケース当りの結合テス工数 ( 人時 / ケース ) 総合テストケース当りの総合テス工数 ( 人時 / ケース ) 10.90 4.57 2.49 52.20 1.04 2.39 63

3.5 成果物量及び単位成果物量あたりの工数の妥当性評価 ( つづき ) 開発規模あたりの成果物量及び成果物量あたりの工数の中央値の一覧 ( 新規開発 IFPUG グループ ) 開発工程要件定義基本設計詳細設計製作結合テスト総合テスト ( ベンダ確認 ) データ数 86 127 93 184 192 229 開発規模当りの成果物量の中央値 FP 当りの要件定義書ページ数 ( ページ /FP) FP 当りの基本設計書ページ数 ( ページ /FP) FP 当りの詳細設計書ページ数 ( ページ /FP) FP 当りの KSLOC 実績値 (KSLOC/FP) FP 当りの結合テストケース数 ( ケース /FP) FP 当りの総合テストケース数 ( ケース /FP) 0.118 0.558 1.050 0.075 1.830 0.663 成果物量当りの工数の中央値要件定義書ページ当りの要件定義工数 ( 人時 / ページ ) 基本設計書ページ当りの基本設計工数 ( 人時 / ページ ) 詳細設計書ページ当りの詳細設計工数 ( 人時 / ページ ) KSLOC 当りの製作工数 ( 人時 /KSLOC) 結合テストケース当りの結合テスト工数 ( 人時 / ケース ) 総合テストケース当りの総合テスト工数 ( 人時 / ケース ) 9.43 4.46 2.37 71.30 1.15 3.00 64

3.5 成果物量及び単位成果物量あたりの工数の妥当性評価 ( つづき ) 2 各工程の開発規模あたりの成果物量及び成果物量あたりの工数の基本統計量の例 KSLOC あたりの要件定義書ページ数 ( 新規開発主開発言語グループ ) ( ページ /KSLOC) N 最小 P25 中央 P75 最大平均標準偏差 74 0.02 0.57 1.22 2.78 21.41 2.37 3.18 要件定義書ページあたりの要件定義工数 ( 新規開発主開発言語グループ ) ( 人時 / ページ ) N 最小 P25 中央 P75 最大平均標準偏差 74 1.1 4.9 10.9 21.3 588.0 29.5 76.1 65

3.5 成果物量及び単位成果物量あたりの工数の妥当性評価 ( つづき ) (3) ベンチマーキング方法 1 妥当と評価できる範囲を白書等の各統計情報の 25 パーセンタイル (P25) から 75 パーセンタイル (P75) までの範囲とする 2 評価対象プロジェクトの開発規模あたりの成果物量及び成果物量あたりの工数に関する設定が例えばそれぞれの P25~P75 の範囲内に収まっているか否かを判定するただし評価対象プロジェクトに該当する生産性変動要因を勘案して妥当と評価できる範囲を調整 ( 上方修正 / 下方修正 ) しながら評価することが望ましい生産性変動要因については白書等の知見をヒントとして参考にされたい 3 評価対象プロジェクトが P25~P75 の範囲外となる場合評価対象プロジェクトの特性を勘案しながら範囲外となる合理的な理由が無いかどうか検討する合理的な理由が有れば妥当と評価し合理的な理由が無ければ目標の見直しを検討する 66

プログラム 3 統計指標に基づくベンチマーキング実践例 2 プロジェクト / 組織のマネジメントの改善 4. プロジェクトマネジメントの改善例 5. 組織の改善例 67

4. プロジェクトマネジメントの改善例 4.1 品質保証プロセス関連標準類の見直し 4.1.1 信頼性向上に向けた自組織のマネジメント方針検討例 (1) 目的ベンチマーク中の信頼性向上に資する知見 ( 良い信頼性実績を上げているプロジェクト群の品質保証プロセスにおける良いやり方 ) と自組織の現状とを対比しながら信頼性向上に向けてプロジェクトマネジメント ( 特に品質マネジメント ) の改善を検討する検討結果を踏まえて品質マネジメント関連の標準類を見直す < ニーズの例 > 自組織のソフトウェアの SLOC 発生不具合密度の実績はソフトウェア開発データ白書の SLOC 発生不具合密度の統計情報と比較して相対的に高い ( 信頼性が低い ) 位置に分布している関連事業のニーズから言ってもソフトウェアの信頼性向上が課題と認識している品質保証プロセスについて重点強化方針を検討したい 68

4.1 品質保証プロセス関連標準類の見直し 4.1.1 信頼性向上に向けた自組織のマネジメント方針検討例 ( つづき ) (2) ベンチマーク信頼性変動要因に関するベンチマーク ( 白書等 ) のメッセージをヒントとして参考にする発生不具合密度が 0.02 件 /KLSLOC 未満のプロジェクトを良群 0.02/KLSLOC 以上のプロジェクトを否群に分けて分析すると良群に次の傾向が見られる設計レビュー工数密度 ( 設計レビュー工数開発規模 ) が高い上流工程での不具合摘出比率が高いテスト検出不具合密度 ( テスト検出不具合数開発規模 ) が低いテスト検出能率 ( テスト検出不具合数テストケース数 ) が低い 69

4.1 品質保証プロセス関連標準類の見直し 4.1.1 信頼性向上に向けた自組織のマネジメント方針検討例 ( つづき ) これらのことは要約的に次のことを示唆している上流工程での設計レビューを強化することによって信頼性が向上するテストで信頼性を高める ( 作込み品質の低さを挽回する ) のは困難である ( 相対的にテストで見つかる不具合が少ないプロジェクトの信頼性実績は良くテストで見つかる不具合が多いプロジェクトの信頼性実績は良くない ) 70

4.1 品質保証プロセス関連標準類の見直し 4.1.1 信頼性向上に向けた自組織のマネジメント方針検討例 ( つづき ) 人時 /KSLOC 設計レビュー工数密度 ( 新規開発主開発言語グループ ) 16 14 12 10 8 6 4 中央値に 3 倍の開き 2 0 良群 ( 発生不具合密度 <0.02) 否群 ( 発生不具合密度 >=0.02) 信頼性 ( 発生不具合密度 ) 71

4.1 品質保証プロセス関連標準類の見直し 4.1.1 信頼性向上に向けた自組織のマネジメント方針検討例 ( つづき ) % 100% 上流工程での不具合摘出比率 ( 新規開発主開発言語グループ ) 90% 80% 70% 60% 中央値に 1.3 倍の開き 50% 40% 30% 20% 10% 0% 良群 ( 発生不具合密度 <0.02) 信頼性 ( 発生不具合密度 ) 否群 ( 発生不具合密度 >=0.02) 72

4.1 品質保証プロセス関連標準類の見直し 4.1.1 信頼性向上に向けた自組織のマネジメント方針検討例 ( つづき ) 件 /KSLOC テスト検出不具合密度 ( 新規開発主開発言語グループ ) 4.0 3.5 3.0 2.5 2.0 1.5 中央値に 1.2 倍の開き 1.0 0.5 0.0 良群 ( 発生不具合密度 <0.02) 信頼性 ( 発生不具合密度 ) 否群 ( 発生不具合密度 >=0.02) 73

4.1 品質保証プロセス関連標準類の見直し 4.1.1 信頼性向上に向けた自組織のマネジメント方針検討例 ( つづき ) 件 / テストケーステスト検出能率 ( 新規開発主開発言語グループ ) 0.16 0.14 0.12 0.10 0.08 0.06 中央値に 1.5 倍の開き 0.04 0.02 0.00 良群 ( 発生不具合密度 <0.02) 否群 ( 発生不具合密度 >=0.02) 信頼性 ( 発生不具合密度 ) 74

4.1 品質保証プロセス関連標準類の見直し 4.1.1 信頼性向上に向けた自組織のマネジメント方針検討例 ( つづき ) (3) ベンチマーキング方法 1 自組織の品質保証プロセスの現状を上記 (2) の傾向に照らしてみると次のように見える設計レビュー工数密度が相対的に低い( 中央値が3 人時 / KSLOC 程度であり否群の分布に近い ) テスト検出能率が相対的に高い( 中央値が0.07 件 / テストケース程度であり否群の分布に近い ) またテストで検出した不具合や稼働後の不具合の要因の傾向からも設計レビューが足りないことを実感している 2これらのことから設計レビュー強化を自組織のマネジメントの重点方針とする設計レビュー工数を増やすとともに設計レビューのパフォーマンス向上を図るパフォーマンス向上に向けては設計書の書き方レビュー手法レビューチェックリストの改良などを幅広く検討する 75

4.1 品質保証プロセス関連標準類の見直し 4.1.2 経済性を勘案した設計レビュー強化策の検討例 (1) 目的設計レビュー強化のマネジメント方針に沿って自組織の設計レビューの現状を睨みながら近未来の現実的な設計レビュー強化目標を検討し設定する検討には品質確保の観点だけでなく経済性の観点を加える (2) ベンチマーク設計レビューとその経済性に関するベンチマーク ( 白書等 ) のメッセージをヒントとして参考にする 1 不具合を十分になくすための設計レビュー工数はどの程度かという品質確保の観点で見ると設計レビュー工数比率が7% 以上になると発生不具合密度が0に近くなっている一方 2% 未満では発生不具合密度が高いプロジェクトが多数存在している 76

4.1 品質保証プロセス関連標準類の見直し 4.1.2 経済性を勘案した設計レビュー強化策の検討例 ( つづき ) 発生不具合密度 ( 件 /KSLOC) 0.50 0.45 0.40 設計レビュー工数比率と発生不具合密度との関係 ( 新規開発 ) 拡大図特に設計レビュー工数比率が 2% 未満の領域では発生不具合密度が 0.05 件以上 /KSLOC と高い ( 相対的に信頼性が低い ) ものが増えている 0.35 0.30 信頼性高 0.25 0.20 0.15 0.10 0.05 0.00 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 設計レビュー工数比率 (%) 設計レビュー工数比率が 7% 以上の領域では発生不具合密度が 0.05 件以上 /KSLOC のものは見られない 77

4.1 品質保証プロセス関連標準類の見直し 4.1.2 経済性を勘案した設計レビュー強化策の検討例 ( つづき ) 2 レビュー工数の投資対効果という経済性の観点で見ると設計レビュー工数を増やすほど設計レビューで指摘される件数の割合が低下して行く ( 設計レビュー工数密度を高くするほど設計レビュー検出能率が低下して行く ) 特に設計レビュー工数密度の P75 あたり (9.8 人時 /KSLOC) で設計レビュー検出能率が下げ止まる傾向が見られることからそこが経済性の高い設計レビュー工数のかけ方の目安になるなお設計レビュー工数密度 P75(9.8 人時 /KSLOC) は設計レビュー工数比率のおよそ 5.5% に相当する 78

4.1 品質保証プロセス関連標準類の見直し 4.1.2 経済性を勘案した設計レビュー強化策の検討例 ( つづき ) 設計レビュー指摘密度 ( 件 /KSLOC) 25 20 15 設計レビュー工数密度と設計レビュー指摘密度との関係 ( 新規開発 ) 設計レビュー工数密度が高くなるにつれて設計レビュー指摘密度が高くなる傾向が見られる設計レビュー工数密度が P75 より大きい領域では P25 以下の領域と比較して設計レビュー指摘密度の中央値が約 4.8 倍大きくなっている 10 5 0 P25(1.51) 以下 P25~ 中央値 (3.96) 中央値 ~P75(9.84) P75 より大設計レビュー工数密度 ( 人時 /KSLOC) 79

4.1 品質保証プロセス関連標準類の見直し 4.1.2 経済性を勘案した設計レビュー強化策の検討例 ( つづき ) 設計レビュー検出能率 ( 件 / 人時 ) 12 11 10 9 8 7 6 5 4 3 2 1 0 P25(1.51) 以下 P25~ 中央値 (3.96) 中央値 ~P75(9.84) P75 より大設計レビュー工数密度と設計レビュー検出能率との関係 ( 新規開発 ) 設計レビュー工数密度が高くなるにつれて設計レビュー検出能率が低下する傾向が見られる設計レビュー工数密度が P75 より大きい領域では P25 以下の領域と比較して設計レビュー検出能率の中央値が約 1/2.7 倍に低下している設計レビュー工数密度 ( 人時 /KSLOC) 80

4.1 品質保証プロセス関連標準類の見直し 4.1.2 経済性を勘案した設計レビュー強化策の検討例 ( つづき ) 設計レビュー検出能率 ( 件 / 人時 ) 16 14 中央値設計レビュー工数密度と設計レビュー検出能率との関係 ( 新規開発 ) 拡大図 P75 3.96 9.84 12 10 8 目安として設計レビュー工数密度が P75 (9.84) より大きい領域では設計レビュー検出能率が下げ止まっていると見られる 6 4 2 0 y = 2.119x -0.416 0 5 10 15 20 25 設計レビュー工数密度 ( 人時 /KSLOC) 81

4.1 品質保証プロセス関連標準類の見直し 4.1.2 経済性を勘案した設計レビュー強化策の検討例 ( つづき ) (3) ベンチマーキング方法 1 設計レビュー強化に向けて近未来の設計レビュー工数密度の目標を 10 人時 /KSLOC 以上に設定する設計レビュー工数比率 7% 以上は現状とのギャップが大きくハードルが高すぎるので近未来の目標としては現実的ではないと判断した経済性の高い設計レビュー工数のかけ方として設計レビュー工数密度の P75(9.8 人時 /KSLOC) が目安として示されていることからこの目安を参考にして設計レビュー強化を図ることとする ( 注 1) 内部ベンチマーク中に同様の知見が示されている場合内部ベンチマークにおける設計レビュー工数密度の P75 の値を採用する方向で検討することが望ましい ( 注 2) 計画したレビュー項目のレビューが済んでいない場合はこの限りではない ( 備考 ) 設計レビュー能力のある要員が不足していると設計レビュー工数を増やすこともままならない設計レビュー能力のある要員を増やすべく体制を強化することも併せて検討する必要がある 82

4.1 品質保証プロセス関連標準類の見直し 4.1.2 経済性を勘案した設計レビュー強化策の検討例 ( つづき ) 2 設計レビュー強化のためには設計レビュー工数を増やすだけでなく設計レビューのパフォーマンス向上も図る設計レビューのパフォーマンスに向上に向けて次のことも検討する設計書の充実 ( 設計文書量の増強等 ) 設計書作成標準の改良 / 整備レビューチェックリストの改良 / 整備レビュー手法等の改良 / 整備解析ツールの改良 / 整備また設計文書量を増やすことによって設計レビュー効果が向上する傾向が見られることから設計文書化密度 ( 設計書ページ数開発規模 ) をその中央値約 15.8 ページ /KSLOC を目安にして増強することを併せて検討する 83

4.1 品質保証プロセス関連標準類の見直し 4.1.2 経済性を勘案した設計レビュー強化策の検討例 ( つづき ) 設計レビュー指摘密度 ( 件 /KSLOC) 25 20 設計文書化密度と設計レビュー指摘密度との関係 ( 新規開発 ) 設計レビュー指摘密度の中央値に約 1.8 倍の差が見られる 15 10 5 0 低い (15.8 以下 ) 高い (15.8 より大 ) 設計文書化密度 ( ページ /KSLOC) 84

4.1 品質保証プロセス関連標準類の見直し 4.1.3 企業事例 : ベンチマーキングよる企業のプロセス改善事例 (1) 目的成熟度が高いシステム開発組織のプロセス指標群をベンチマークにして自組織の課題を発掘し成熟度向上に向けた改善アクションプランを検討策定する < 考え方 > 当事例は改良開発中心の組織の事例である改良開発が中心の場合同じシステムを一般に同じメンバーで対応することが多いこのため知識やノウハウの継承がしやすいという長所があるがいったん作業スタイルが確立すると特に大きな問題が発生しない限り自分たちのスタイルを意図的に変えることは少ない傾向があるしかし現場のメンバーは課題を認識しておりそれらの課題は往々にして当たっていることが多い必要なのは変化へのトリガーであろう定量データは客観的かつ多面的に仕事のやり方を見直すことができる有効なトリガーになるまたマネジャー層との合意形成を後押しする有力な手段となる 85

4.1 品質保証プロセス関連標準類の見直し 4.1.3 企業事例 : ベンチマーキングよる企業のプロセス改善事例 ( つづき ) (2) ベンチマークプロセス改善の推進品質指標の基準値策定等を目的に品質管理部門が各部門の案件実績データを取りまとめ白書による開発プロセスの可視化に取り組んできた白書には指標単位のシステム別最新測定結果や経年変化の状況を掲載している a SYSTEM 指標 XX ( イメージ ) n-6~n-4 年 n-5~n-3 年 n-4~n-2 年 n-3~n-1 年 n-2~n 年かねてより自部門の仕事の進め方に課題を感じていたK 部部長は定量データによる他部門との比較を通して組織課題の発掘と改善を行いたいと考え品質管理部門がそれを支援することになったそこで成熟度が高いaシステムをベンチマークにして K 部所管のbシステムと比較することにした 86

4.1 品質保証プロセス関連標準類の見直し 4.1.3 企業事例 : ベンチマーキングよる企業のプロセス改善事例 ( つづき ) (3) ベンチマーキング方法 1 カルテの作成実際の指標値や分布は白書で確認できるので開発プロセス全体を俯瞰してベンチマークと比較するカルテを作成したなお a システムと K 部所管の b システムは同じ開発標準を適用しており開発環境も同じである比較は中央値で行うこととし俯瞰して比較できるように各指標の中央値を変換した a システムの各指標の中央値をすべて一定の値に変換し比較対象システムの各指標の中央値を一定値との相対比で表した a SYSTEM BENCHMARK 比較対象システムの中央値 ( カルテのイメージ ) a システムの中央値指標 1 指標 2 指標 3 指標 4 指標 5 指標 6 指標 7 指標 8 指標 9 指標 10 指標 11 指標 12 指標 13 指標 14 指標 15 指標 16 指標 17 指標 18 指標 19 指標 20 指標 21 87

4.1 品質保証プロセス関連標準類の見直し 4.1.3 企業事例 : ベンチマーキングよる企業のプロセス改善事例 ( つづき ) 2 カルテに基づく自組織の課題の分析このカルテを受けて b システムを担当する K 部のラインマネジャーは指標の差と自チームの作業実態から次のように分析した b システムのマネジャーの分析着目した指標指標設計レビュー率 ( 設計工程におけるレビュー工数の割合 ) レビュー指摘密度 ( 設計資料ページあたりの指摘数 ) 検証比率 ( 製作工程工数に対する検証工程工数の比率 ) 検証レビュー率 ( 検証工程におけるレビュー工数の割合 ) テスト密度 (KLOC あたりのテストケース数 ) a システム比やや低いかなり高いかなり高い高い高い 88

4.1 品質保証プロセス関連標準類の見直し 4.1.3 企業事例 : ベンチマーキングよる企業のプロセス改善事例 ( つづき ) 分析結果設計レビューにかける時間が少なくレビューでの指摘件数が多いサブマネジャーのプレレビューが不十分であり成果物の完成度が低いケースがある本来はレビューまでに解消すべき不備をレビューの場で指摘している可能性がある担当 SE やサブマネジャーにレビューで指摘してもらえばよいという意識があり成果物の完成度を高める努力が足りないのではないか ( サブマネジャーは担当 SE の成果物 ( 設計資料やプログラム仕様書 ) を事前にレビューする運用 ) 検証工程に時間がかかりすぎているテスト方針やテスト方法のすり合わせが不十分なままテストを実施しておりテストのやり直しや過剰なテストを行っている検証レビュー率が高いのはやり直しによる再レビューの結果の可能性が高い担当 SE サブマネジャーとも余分な作業の結果検証工程の工数が多いのではないか 89

4.1 品質保証プロセス関連標準類の見直し 4.1.3 企業事例 : ベンチマーキングよる企業のプロセス改善事例 ( つづき ) 3アクションプランの策定上記の分析結果に基づいて自組織に適した改善アクションプランを検討策定設計工程におけるプレレビューの徹底サブマネジャーがプレレビューを承認した設計資料のみをレビュー対象とするレビューアによる設計資料の事前チェックレビューアが事前に設計資料を確認し一定のレベルに達したものをレビュー対象とする指摘数の上限設定レビューで指摘数が一定数を超えた場合いったんレビューを中断し再レビューとするテスト方針方法の認識合わせ担当 SEとサブマネジャーの間でよく話し合ってテスト方針や目的テスト方法結果チェックの視点を合わせる例えばテスト方法であれば DBの加工方法エビデンス取得範囲デグレード検証の方法等を確認しあうテストレビューの強化担当 SEとサブマネジャーの認識やテスト方針方法の齟齬がないことを確認するとともにテスト範囲や視点の適切性を精査し過剰検証を抑制する基本的に設計レビュー時にテスト計画やテストケースレビューを行うまたテスト終了後にテスト結果レビューを行う 4 効果の確認 ( 割愛 ) 90

4.1 品質保証プロセス関連標準類の見直し 4.1.3 企業事例 : ベンチマーキングよる企業のプロセス改善事例 ( つづき ) 4 効果の確認設計レビュー率は中央値が約 5ポイント増加しバランスがとれてきたまたプレレビューの徹底により成果物の品質が向上しレビュー指摘密度は大きく減少した検証比率は減少し全体的に工数の圧縮が図られているまたテスト密度のばらつきは小さくなっており念のためのテストの是正に効果があった < 参考ポイント > この例は良い成果を挙げている成熟度の高い部門の仕事のやり方 ( 開発プロセス ) をベンチマークとしそれと自組織の現状とを比較することによって自組織の課題を分析しその分析結果に基づいて自組織に適した改善アクションプランを検討策定したものであるこの例はこのように典型的なベンチマーキング方法の好例として参考になると考えられるまた定量的管理特にベンチマーキングを次のように仕事のやり方を見直すトリガーにするという点でも参考になると考えられるいったん作業スタイルが確立すると特に大きな問題が発生しない限り自分たちのスタイルを意図的に変えることは少ない傾向があるしかし現場のメンバーは課題を認識しておりそれらの課題は往々にして当たっていることが多い必要なのは変化へのトリガーであろう定量データは客観的かつ多面的に仕事のやり方を見直すことができる有効なトリガーになる 91

4.1 品質保証プロセス関連標準類の見直し 4.1.4 企業事例 : 効率的な品質改善に向けた CMMI 成熟度レベル別の要因分析 (1) 目的内部ベンチマーク中の成熟度レベル別の品質変動要因及び品質改善のポイントをヒントとして参考にし自組織の開発プロセスの現状と対比しながら品質向上に向けた自組織の重点強化領域を特定し品質マネジメント方針を検討する < 考え方 > 品質向上に向けた重点強化領域は組織の成熟度レベルによって異なると考えられるので自組織の成熟度レベルに適した重点強化領域を特定し効率的に品質向上を図るための品質マネジメント方針を検討したい 92

4.1 品質保証プロセス関連標準類の見直し 4.1.4 企業事例 : 効率的な品質改善に向けた CMMI 成熟度レベル別の要因分析 ( つづき ) (2) ベンチマーク各プロジェクトから次のデータ項目について実績データを収集した通番データ項目単位 1 開発規模 ( 計画値 ) ライン数 2 開発規模ライン数 3 全工数人時 4 上工程工数人時 5 レビュー工数人時 6 テスト工程工数人時 7 全バグ数件 8 上工程バグ数件 9 テスト工程バグ数件 10 テスト項目数件 11 上工程バグ率 % 93

4.1 品質保証プロセス関連標準類の見直し 4.1.4 企業事例 : 効率的な品質改善に向けた CMMI 成熟度レベル別の要因分析 ( つづき ) 出荷後バグ基準を達成しているプロジェクト ( 達成 ) と達成していないプロジェクト ( 未達 ) の差異の要因をロジスティック回帰分析によって分析した結果組織の成熟度レベルによって寄与している要因が次のように異なることが分かった成熟度レベル (ML) 達成と未達の差異要因達成の可能性との関係 ML1 テスト工程バグ数 /KL 低いと達成の可能性が高くなる開発規模低いと達成の可能性が高くなる ML2 上工程バグ率高いと達成の可能性が高くなるレビュー工数 /KL 開発規模低いと達成の可能性が高くなる低いと達成の可能性が高くなる ML3 テスト工程工数 /KL 低いと達成の可能性が高くなるレビュー工数 /KL テスト工程バグ数 /KL 高いと達成の可能性が高くなる低いと達成の可能性が高くなる 94

4.1 品質保証プロセス関連標準類の見直し 4.1.4 企業事例 : 効率的な品質改善に向けた CMMI 成熟度レベル別の要因分析 ( つづき ) さらに未達プロジェクト群の傾向を分析した結果を踏まえて成熟度レベル別に効率的な品質改善のためのポイントを次のように纏めたこれを内部ベンチマークとする ML 未達の要因直近の対策品質改善のポイント ML1 開発規模が大きくなると制御不可大規模開発 PJ の重点管理基本事項の実行徹底基本的な開発管理技術の整備と徹底プロジェクト遂行の差が大きく特に未達はテスト不十分テスト工数の確保 ML2 開発規模が大きくなると制御不可大規模開発 PJ の重点管理基本事項の実行徹底レビュー手法の標準化とビジネス特性に応じた最適化レビュー品質の良し悪しが出荷後品質に影響レビュー内容の確認 ML3 実績を基にした適切なマネジメントが実施されていない週次の実績データ収集とマネジメント会議開催実績に基づく週次のマネジメント 95

4.1 品質保証プロセス関連標準類の見直し 4.1.4 企業事例 : 効率的な品質改善に向けた CMMI 成熟度レベル別の要因分析 ( つづき ) (3) ベンチマーキング方法 1 自組織の成熟度レベルは 2 なので自組織の開発プロセスの現状を上記 (3) の成熟度レベル 2(ML2) の内容に照らしてみるその結果次のことが分かったレビュー工数をかけている割にはレビューの品質 ( パフォーマンス ) が悪くテスト工程でも多くのバグが検出されテスト工数もかかっているプロジェクトが多いレビュー品質の良し悪しが出荷後品質に影響していると判断できる 2 上記のことからレビュー手法の改良と標準化を自組織に適した ( 効率的な ) 品質マネジメントの重点方針とする < 参考ポイント > 信頼性変動要因と品質向上に向けた重点強化領域は組織の成熟度レベルによって異なることから自組織の成熟度レベルに適した重点強化領域を特定し効率的 / 効果的に品質向上を図るための品質マネジメント方針を検討することは理に適ったより良いアプローチと言える 96

4. プロジェクトマネジメントの改善例 4.2 テスト工程完了評価関連標準類の見直し (1) 目的ベンチマーク中にテスト完了評価方法に関する知見が有れば自組織の現状と対比しながら必要に応じて品質マネジメントのテスト工程完了評価関連の標準類に反映することを検討する ( 備考 ) ベンチマーク中のテスト完了評価方法に関する知見はポストプロセス計測データ ( 完了プロジェクト群の実績データ ) を用いた評価方法であってインプロセス計測データを用いたリアルタイムな評価方法ではない ( インプロセス計測データを用いた評価方法については必要に応じて定量的品質予測のススメ及び続定量的品質予測のススメを参照されたい ) 97

4.2 テスト工程完了評価関連標準類の見直し ( つづき ) ( 参考 ) テスト完了評価方法について一般にテスト完了評価方法ではインプロセス計測データに基づく評価基準を含めた複数の評価基準から成る総合評価方式を採っている ( 各評価基準は総合評価における必要条件の一つ一つに相当する ) 例えば次のような評価基準から成る 1 前提としてテスト関連文書がテスト関連標準類に沿って作成されそれらのレビューが実施されていることかつレビューコメントの処置が完了していること 2 前提としてテスト密度 ( テストケース数開発規模 ) が基準値を満足していること 3 前提として未テスト項目未修正項目が残っていないこと 4 テスト密度とテスト検出不具合密度 ( テスト検出不具合数開発規模 ) との関係あるいはテストケース数とテスト検出不具合数との関係等が管理基準を満足していること 5 障害 / 誤り件数の推移に収束傾向が認められること ( インプロセス計測データ使用 ) 6 障害内容 ( 障害の重大度障害の発生条件 ) の推移に収束傾向が認められること ( インプロセス計測データ使用 ) 7 障害 / 誤り件数の推移から予測した残存誤り密度が信頼性目標を満足するものであること ( インプロセス計測データ使用 ) ベンチマーク中のテスト完了評価方法に関する知見は主に上記の4に該当するまた開発組織のマネジャー層やPMO 及び品質マネジメント推進部門がポストプロセス計測データから簡便にテスト完了評価する方法に関するものと言える 98

4.2 テスト工程完了評価関連標準類の見直し ( つづき ) (2) ベンチマーク 1 ゾーン分析に関するテスト完了評価方法の知見テスト密度が高くてテスト検出不具合密度が低いのは相対的に信頼性が良い兆候の一つである一方テスト密度が低くてテスト検出不具合密度が高いのは相対的に信頼性が良くない兆候の一つであるこの見方をテストの評価項目の一つとして採用することをお勧めする 99

4.2 テスト工程完了評価関連標準類の見直し ( つづき ) 発生不具合密度 ( 件 /KSLOC) 0.14 0.12 0.10 テスト密度対テスト検出不具合密度のゾーン別発生不具合密度 ( 新規開発 ) 相対的にテスト密度が高くテスト検出不具合密度が低い集合の方が発生不具合密度が低い ( 相対的に信頼性が高い ) 傾向が見られる < 相対的にテスト密度が低くテスト検出不具合密度が高い集合との比較 > 発生不具合密度の中央値が 0.022 件に対して 0 件 /KSLOC 発生不具合密度の P75 が 1/3.3 信頼性高 0.08 0.06 0.04 0.02 0.00 テスト密度低 (30.8 以下 )& テスト検出不具合密度高 (1.60 より大 ) テスト密度対テスト検出不具合密度のゾーンテスト密度高 (30.8 より大 )& テスト検出不具合密度低 (1.60 以下 ) 100

4.2 テスト工程完了評価関連標準類の見直し ( つづき ) ( 備考 ) 考察テスト密度が高くてテスト検出不具合密度が低いのは相対的に信頼性が良い ( 稼働後の不具合発生数が少ない ) 兆候の一つであるの主な要因として次のことが考えられるテスト密度が高いのにテスト検出不具合密度が低いものはテスト開始時点の出来が良い ( 潜在不具合の密度が低い ) つまりいわゆる作込み品質が良いものと考えられるテスト検出不具合密度が高いものは発生不具合密度 ( 稼働後の不具合密度 ) も高い傾向が見られるまた ( テスト密度が低くなくて ) テスト検出不具合密度が低いものは発生不具合密度も低い傾向が見られるつまりテストに至るまでの良し悪しがテストによって逆転するケースは少ないと言える信頼性を高めるにはやはり作込み品質向上を目指すことが王道でありテストによって挽回しようという作戦の成算は薄いと考えられる 101

4.2 テスト工程完了評価関連標準類の見直し ( つづき ) 2 テスト検出能率に関するテスト完了評価方法の知見テスト検出能率がある一定のレベルまで低下しているか否かをテストの評価項目の一つとして利用することをお勧めするまた追加テストの収束性評価に利用することをお勧めする 102

4.2 テスト工程完了評価関連標準類の見直し ( つづき ) 発生不具合密度 ( 件 /KSLOC) 0.25 0.20 0.15 テスト検出能率と発生不具合密度の関係 ( 新規開発 ) テスト検出能率が低い方が相対的に発生不具合密度が低い ( 信頼性が高い ) 傾向が見られる具体的にはテスト検出能率の中央値を境にして差が見られる特に P25 以下での発生不具合密度が低い ( 信頼性が高い ) 傾向が顕著であるまたばらつきが小さい 0.10 0.05 0.00 P25(0.026) 以下 P25~ 中央値 (0.048) 中央値 ~P75(0.100) P75より大テスト検出能率 ( 件 / ケース ) 103

4.2 テスト工程完了評価関連標準類の見直し ( つづき ) ( 備考 ) 考察この結果からはテスト検出能率が 25 パーセンタイル値を目安として下回ることが望ましいと考えられる新規開発の場合はテスト検出能率の 25 パーセンタイル値は約 0.026 件 / テストケース ( これはおよそ 40 ケースのテストに対して 1 件の不具合検出に相当 ) ( 注 ) 上記の結果はテスト工程全体での累積値に基づくものテスト終盤におけるテスト検出能率を評価できればそのテスト検出能率は上記の結果よりも低くなるはずであるテスト終盤におけるテストの収束性を評価するシーンにおいてもテスト検出能率による評価が有用と考えられるテスト検出能率がテストの進捗に連れて低下して行くということは潜在している ( 残存している ) 不具合が減少して行くということを意味するテスト検出能率によってテストの収束性を評価することは理に適っていると考えられる 104

4.2 テスト工程完了評価関連標準類の見直し ( つづき ) (3) ベンチマーキング方法 1 自組織の現状のテスト完了評価方法を睨みながら当方法をテスト工程完了評価関連の標準類 ( テスト工程完了評価基準等 ) に反映 ( 追加 ) すると良いかどうかを検討する ( 備考 ) テスト終盤での収束性評価や追加テストの評価にも有用と考えられる 2 上記の検討結果を品質マネジメントのテスト工程完了評価関連の標準類 ( テスト工程完了評価基準等 ) に反映する ( 必要に応じて追加する ) 105

4. プロジェクトマネジメントの改善例 4.3 ユーザの関与 (1) 目的ベンチマーク中にユーザの関与に関する知見が有れば自組織の現状を睨みながら必要に応じて信頼性 / 生産性の向上に向けてプロジェクトマネジメント ( 特にステークホルダーマネジメント ) の改善を検討する検討結果を踏まえてステークホルダーマネジメント関連の標準類を見直す (2) ベンチマークユーザの関与に関するベンチマーク ( 白書等 ) のメッセージをヒントとして参考にするユーザ担当者の要求仕様関与が多い方が少ない方と比較して相対的に生産性信頼性ともに良い傾向が見られるユーザ担当者の要求仕様関与度合いを高めるようユーザと調整することが望ましい 106

4.3 ユーザの関与 ( つづき ) SLOC 生産性 (SLOC/ 人時 ) 25 20 ユーザ担当者の要求仕様関与と SLOC 生産性との関係 ( 新規開発 ) ユーザ担当者の要求仕様関与が多い方が少ない方と比較して相対的に SLOC 生産性が高い傾向が見られる具体的には両者の SLOC 生産性の中央値には約 1.7 倍の開きが見られる 15 10 5 高生産性 0 十分に関与または概ね関与関与が不十分または未関与ユーザ担当者の要求仕様関与の度合い 107

4.3 ユーザの関与 ( つづき ) 発生不具合密度 ( 件 /KSLOC) 0.14 0.12 0.10 0.08 ユーザ担当者の要求仕様関与と発生不具合密度との関係 ( 新規開発 ) ユーザ担当者の要求仕様関与が多い方が少ない方と比較して発生不具合密度がやや低い ( 相対的に信頼性がやや高い ) 傾向が見られる具体的には両者の発生不具合密度の中央値には約 7.9 倍の開きが見られるまた両者の発生不具合密度の P75 には約 2.4 倍の開きが見られる 0.06 0.04 0.02 信頼性高 0.00 十分に関与または概ね関与関与が不十分または未関与ユーザ担当者の要求仕様関与の度合い 108

4.3 ユーザの関与 ( つづき ) (3) ベンチマーキング方法 1 自組織の現状の標準類を睨みながらステークホルダーマネジメントに関して例えば次のことを検討するユーザ担当者の要求仕様関与度合いを高めるべくユーザとの関係の築き方ユーザの参画度の高め方ユーザとの役割分担の決め方等を検討する各プロジェクトにおいてユーザ担当者の要求仕様関与度合いを高めるべく開発組織のマネジャー層がユーザの理解と協力を取り付ける 2 上記の検討結果をスコープマネジメント関連の標準類に反映する ( 必要に応じて追加する ) 109

4. プロジェクトマネジメントの改善例 4.4 成果物スコープの明確化 (1) 目的ベンチマーク中に要求仕様の明確化に関する知見が有れば自組織の現状と対比しながら必要に応じて信頼性 / 生産性の向上に向けてプロジェクトマネジメント ( 特にスコープマネジメント ) の改善を検討する検討結果を踏まえてスコープマネジメント関連の標準類を見直す (2) ベンチマーク要求仕様の明確化に関するベンチマーク ( 白書等 ) のメッセージをヒントとして参考にする要求仕様が明確な方があいまいな方と比較して発生不具合密度がやや低い ( 相対的に信頼性がやや高い ) 傾向が見られる要求仕様を早期に明確化するようユーザと調整することが望ましい 110

4.4 成果物スコープの明確化 ( つづき ) 発生不具合密度 ( 件 /KSLOC) 0.18 0.16 0.14 0.12 0.10 要求仕様の明確さと発生不具合密度との関係 ( 新規開発 ) 要求仕様が明確な方があいまいな方と比較して発生不具合密度がやや低い ( 相対的に信頼性がやや高い ) 傾向が見られる具体的には両者の発生不具合密度の中央値には約 9.3 倍の開きが見られるまた両者の発生不具合密度の P75 には約 1.7 倍の開きが見られる 0.08 0.06 0.04 0.02 信頼性高 0.00 非常に明確またはかなり明確ややあいまいまたは非常にあいまい要求仕様の明確さ 111

4.4 成果物スコープの明確化 ( つづき ) (3) ベンチマーキング方法 1 自組織の現状の標準類を睨みながらスコープマネジメントに関して例えば次のことを検討する要求仕様を早期に明確化すべくスコープマネジメントの実施方法 ( スコープ計画プロセススコープ定義プロセス等 ) や要件定義工程のプロセスを検討する各プロジェクトにおいて要求仕様を早期に明確化すべく開発組織のマネジャー層がユーザの理解と協力を取り付ける 2 上記の検討結果をスコープマネジメント関連の標準類に反映する ( 必要に応じて追加する ) 112

4.4 成果物スコープの明確化 ( つづき ) ( 備考 ) 要求仕様の早期明確化に関しては一般に開発ベンダ側ユーザ側双方にいくつかの問題が存在することがあるこれらの問題を解決できないプロジェクトの場合これらをリスクとしてマネジメントせざるを得ないこともある 1 ベンダ側要員の業務経験業務知識が乏しくてユーザ要件を的確に把握できない 2 ユーザ側要員の業務経験業務知識が乏しいなどユーザ側の体制が弱くてユーザ要件を詰められない 3 ユーザが要件を小出しにする設計工程やテスト工程においても仕様の追加 / 変更が絶えない 4 ユーザ側の情報システム部門が現場部門のニーズを的確に把握できていないなど 113

5. 組織の改善例 5.1 組織体制の整備 (1) 目的ベンチマーク中に組織体制の整備に関する知見が有れば自組織の現状と対比しながら必要に応じて組織体制の改善を検討する検討結果を踏まえて組織体制関連の標準類や年度計画 / 中長期計画を見直す (2) ベンチマーク組織体制の整備に関するベンチマーク ( 白書等 ) のメッセージをヒントとして参考にする品質保証体制として品質保証の専門スタッフが参加しているプロジェクト群の方が参加していないプロジェクト群と比較して発生不具合密度が低い ( 相対的に信頼性が高い ) 傾向が見られる 114

5.1 組織体制の整備 ( つづき ) 発生不具合密度 ( 件 /KSLOC) 0.25 0.20 0.15 品質保証体制別発生不具合密度 ( 新規開発 ) 品質保証体制として品質保証の専門スタッフが参加している集合の方が参加していない集合と比較して発生不具合密度が低い ( 相対的に信頼性が高い ) 傾向が見られる具体的には両者の発生不具合密度の中央値には約 15.0 倍の開きが見られるまた両者の発生不具合密度の 75 パーセンタイル値には約 3.5 倍の開きが見られる 0.10 0.05 信頼性高 0.00 プロジェクトメンバが実施品質保証の専門スタッフが実施品質保証体制 115

5.1 組織体制の整備 ( つづき ) (3) ベンチマーキング方法 1 自組織の組織体制整備状況を睨みながら品質保証体制の強化に向けて組織体制関連の標準類や年度計画 / 中長期計画の見直しを検討する例えば次のことを検討するより多くの開発プロジェクトに品質保証の専門スタッフが参加できるように組織体制を強化する開発要員に対してソフトウェアの品質保証及びプロジェクトマネジメントのスキル向上を図る 2 上記の検討結果を必要に応じて組織体制関連の標準類に反映するまた年度計画 / 中長期計画を見直す 116

5.1 組織体制の整備 ( つづき ) ( 備考 ) 考察品質保証の専門スタッフがプロジェクトに参加することによって専門スタッフのスキル / 知識 / 経験が主に次のような場面で信頼性向上に向けて有効に働くと考えられるリスクの少ない ( 実現可能性の高い ) 開発計画の策定支援種々の成功 / 失敗の事例を知っていることとプロジェクトマネジメントのスキルが高いことから種々のプロジェクトリスクを予見するとともにリスク対策について助言できるレビュー及びテストに向けた効果的な助言種々の不具合事例に基づいた弱点 ( 陥りやすい誤り漏れやすい箇所 ) に関する知識が豊富なのでレビュー及びテストに対して効果的に助言できる精度の高い信頼性予測評価信頼性予測評価スキルが高いので開発時データ ( 文書化レビューレビュー指摘テストテスト時障害誤り等のデータ ) から中間成果物及び成果物の信頼性 / 収束性を精度高く予測評価できる定量的管理の推進定量的管理のスキルと豊富な経験からプロジェクトの定量的管理を指導 / 支援できる特に値を読み解く力があるので定量データの分析結果をより適切なマネジメントアクションに繋げることができる 117

5. 組織の改善例 5.2 信頼性変動要因分析と信頼性向上に向けた重点強化領域の特定 (1) 目的ベンチマーク中に信頼性変動要因に関する知見が有れば自組織に当てはまるかどうかを検討し必要に応じて信頼性向上に向けた重点強化領域を見直すその結果を踏まえて信頼性向上方策を策定し開発作業標準類管理標準類年度計画 / 中長期計画等を見直す ( 備考 ) 信頼性変動要因をコントロールできれば信頼性が向上すると期待できる従って信頼性変動要因は信頼性向上に向けて重点的に強化すると効果的な領域 ( 重点強化領域 ) を特定するための有用な情報となる信頼性向上に向けては自組織の信頼性変動要因群を踏まえて重点強化領域を特定しそれらの領域を改善する適切な方策を立てることが一つの重要かつ効果的なアプローチと言える 118

5.2 信頼性変動要因分析と信頼性向上に向けた重点強化領域の特定 ( つづき ) (2) ベンチマーク信頼性変動要因に関するベンチマーク ( 白書等 ) のメッセージをヒントとして参考にする 1 相対的に信頼性の良いグループ ( 良群 ) は相対的に信頼性の低いグループ ( 否群 ) と比較して次の傾向が見られるレビュー工数密度が高い上流工程での不具合摘出比率が高いテスト検出不具合密度が低いテスト検出能率 ( テスト項目当りの検出不具合数 ) が低い 2 参考白書 2016-2017 用プレ分析結果による信頼性変動要因候補 ( 次ページ以降参照 ) 119

参考信頼性変動要因候補の試行分析結果一覧 ( 新規開発主開発言語グループ ) ~ 白書 2016-2017 用プレ分析 ~ [ 凡例 ] :1% 有意 (Welch の t 検定の P 値が 1% 以下 ) :5% 有意 (Welch の t 検定の P 値が 1% より大きくて 5% 以下 ) :10% 有意 (Welch の t 検定の P 値が 5% より大きくて 10% 以下 ) :10% 有意には満たないが視覚的にやや差異が見られるもの : 差異が見られない ( データ数不足の場合を含む ) 通番変動要因候補有意性傾向 1 業種金融保険業は他よりSLOC 発生不具合密度がやや低い 2 信頼性の要求レベル 3 性能効率性の要求レベル 4 重要インフラタイプ 5 アーキテクチャ 6 主開発言語 120

参考信頼性変動要因候補の試行分析結果一覧 ( つづき ) 通番変動要因候補有意性傾向 7 プラットフォーム Windows 系はUnix 系よりSLOC 発生不具合密度が 8 開発フレームワークの利用 13 品質保証体制品質保証の専門スタッフが実施する方が SLOC 発生不具合密度が低い 14 設計文書化密度設計文書化密度がP75 以上の領域ではSLOC 発生不具合密度が低くなるが全体的には傾向が見られない 15 設計レビュー工数密度設計レビュー工数密度が高い方が SLOC 発生不具合密度が低い 16 設計レビュー指摘密度 10% 有意水準にはないが視覚的に設計レビュー指摘密度が高い方がSLOC 発生不具合密度がやや低い 121 低い 9 月あたりの要員数月あたりの要員数が少ない方が SLOC 発生不具合密度が低い 10 外部委託比率外部委託比率が低い方が SLOC 発生不具合密度が低い 11 PMスキル 12 テストスキル

参考信頼性変動要因候補の試行分析結果一覧 ( つづき ) 通番変動要因候補有意性傾向 17 テスト密度 18 テスト検出不具合密度テスト検出不具合密度が低い方が SLOC 発生不具合密度がやや低い 19 上流工程での不具合摘出比率上流工程での不具合摘出比率が高い方が SLOC 発生不具合密度が低い 20 要求仕様の明確さ 21 ユーザ担当者の要求仕様関与 22 定量的な出荷品質基準の有無 10% 有意水準にはないが視覚的にユーザ担当者が要求仕様に関与する方が SLOC 発生不具合密度がやや低い 10% 有意水準にはないが視覚的に定量的な出荷品質基準が有る方が SLOC 発生不具合密度がやや低い 23 テスト検出能率テスト検出能率が低い方が SLOC 発生不具合密度が低い 122

5.2 信頼性変動要因分析と信頼性向上に向けた重点強化領域の特定 ( つづき ) (3) ベンチマーキング方法 1 上記 (2) の信頼性変動要因候補が自組織の信頼性変動要因に当てはまるかどうかを検討する ( 自組織の定量データを用いて自組織の信頼性変動要因を分析することが望ましい ) 当てはまるのであれば設計及びレビューのプロセス改善を信頼性向上に向けて重点的に強化すると効果的な領域 ( 重点強化領域 ) に加えることを検討するなど重点強化領域を見直す 2 見直した重点強化領域を改善する適切な方策を策定する設計及びレビューのプロセス改善についてはレビュー工数密度 ( あるいはレビュー工数比率 ) を高めるだけでなくレビューのパフォーマンスを高めるための次の対策も検討するレビュー方式の改善レビューチェックリストの改良設計文書化密度の向上設計書作成標準の改良等 3 策定した改善方策を自組織の標準類や年度計画 / 中長期計画に反映する 123

5. 組織の改善例 5.3 生産性変動要因分析と見積り妥当性評価方法の見直し等 (1) 目的ベンチマーク中に生産性変動要因に関する知見が有れば自組織に当てはまるかどうかを検討し必要に応じて工数見積り等の妥当性評価方法を見直すまた必要に応じて生産性向上のための組織の重点強化領域を特定し生産性向上方策を検討する (2) ベンチマーク生産性変動要因に関するベンチマーク ( 白書等 ) のメッセージをヒントとして参考にする開発プロセス ( 主に品質保証プロセス ) 関連の生産性変動要因候補として次のものがあるこれらが高くなると生産性が低下する傾向が示されている設計文書化密度設計レビュー工数密度設計レビュー指摘密度テスト密度テスト検出不具合密度等 ( 注 ) プロセス以外の候補としては業種品質要求レベル等がある 124

5.3 生産性変動要因分析と見積り妥当性評価方法の見直し等 ( つづき ) KSLOC 当りの実績工数 ( 開発 5 工程 )( 人時 ) 800 700 600 設計文書化密度が高い方が KSLOC 当りの実績工数が多い ( 生産性が低い ) 向が見られる具体的には両者の中央値には約 1.6 倍の開きが見られる 500 400 300 生産性 200 100 高 0 設計文書化密度が低い設計文書化密度設計文書化密度が高い 125

5.3 生産性変動要因分析と見積り妥当性評価方法の見直し等 ( つづき ) 600 500 KSLOC 当りの実績工数 ( 開発 5 工程 )( 人時 ) 設計レビュー工数密度が高い方が KSLOC 当りの実績工数が多い ( 生産性が低い ) 向が見られる具体的には両者の中央値には約 1.4 倍の開きが見られる 400 300 200 生産性 100 高 0 設計レビュー工数密度が低い設計レビュー工数密度が高い設計レビュー工数密度 126

5.3 生産性変動要因分析と見積り妥当性評価方法の見直し等 ( つづき ) 800 700 600 KSLOC 当りの実績工数 ( 開発 5 工程 )( 人時 ) 設計レビュー指摘密度が高い方が KSLOC 当りの実績工数が多い ( 生産性が低い ) 向が見られる具体的には両者の中央値には約 1.3 倍の開きが見られる 500 400 300 生産性 200 100 高 0 設計レビュー指摘密度が低い設計レビュー指摘密度設計レビュー指摘密度が高い 127

5.3 生産性変動要因分析と見積り妥当性評価方法の見直し等 ( つづき ) 800 700 600 KSLOC 当りの実績工数 ( 開発 5 工程 )( 人時 ) テスト密度が高い方が KSLOC 当りの実績工数が多い ( 生産性が低い ) 向が見られる具体的には両者の中央値には約 1.6 倍の開きが見られる 500 400 300 生産性 200 100 高 0 テスト密度が低いテスト密度テスト密度が高い 128

5.3 生産性変動要因分析と見積り妥当性評価方法の見直し等 ( つづき ) 800 700 600 KSLOC 当りの実績工数 ( 開発 5 工程 )( 人時 ) テスト検出不具合密度が高い方が KSLOC 当りの実績工数が多い ( 生産性が低い ) 向が見られる具体的には両者の中央値には約 1.4 倍の開きが見られる 500 400 300 生産性 200 100 高 0 テスト検出不具合密度が低いテスト検出不具合密度が高いテスト検出不具合密度 129

5.3 生産性変動要因分析と見積り妥当性評価方法の見直し等 ( つづき ) ( 注 ) 差異の見方について上記の分析結果に示された両者の中央値には約 1.4 倍の開きが見られるなどの傾向については単一の変動要因によってそれだけの差異が生じているとは限らないことに留意する必要がある変動要因間には一般に依存関係があり依存関係にある他の変動要因の影響を含めた差異と見るのが妥当と考えられる従って単一の変動要因による影響の度合いは各図表に示された倍率以下と見るのが妥当と考えられる 130

5.3 生産性変動要因分析と見積り妥当性評価方法の見直し等 ( つづき ) (3) ベンチマーキング方法 1 上記 (2) に示された生産性変動要因が自組織に当てはまるかどうかを検討する当てはまるのであれば工数見積り等の妥当性評価方法を見直す具体的には評価対象プロジェクトに該当する生産性変動要因によって生じる変動幅を勘案して妥当性評価のための妥当と評価できる範囲を上方修正 / 下方修正しながら妥当性評価する方法となるように見直す 2 ベンチマーク中に生産性変動要因に関する知見が有れば自組織に当てはまるかどうかを検討し必要に応じて生産性向上のための組織の重点強化領域を検討特定する 3 見直した妥当性評価方法を自組織の標準類に反映するまた組織の生産性向上に向けて特定した重点強化領域に基づいて生産性向上方策を検討する 131

5. 組織の改善例 5.4 業種等のドメイン別マネジメント (1) 目的ベンチマーク中に業種等のドメイン間の差異に関する知見が有れば必要に応じて業種等のドメインに分けて自組織の信頼性 / 生産性をマネジメントすることを検討する (2) ベンチマーク公開ベンチマーク ( 白書等 ) の業種等のドメイン間の差異に関する知見に以下のことが示されているのでヒントとして参考にする発生不具合密度 ( 信頼性 ) 及びKSLOC 当り工数 ( 生産性 ) は業種間で差異が見られるまた信頼性要求レベルや開発プロセス関連の生産性 / 信頼性の変動要因候補においても業種間の差異が見られるマネジメントや分析を進める上で業種の影響を無視できないと判断できるので業種によってドメインを分けてマネジメントすることをお勧めする 132

5. 組織の改善例 5.4 業種等のドメイン別マネジメント ( つづき ) < 業種によって差異が見られる変動要因候補 > 設計文書化密度設計レビュー工数密度設計レビュー指摘密度テスト密度テスト検出不具合密度上流工程での不具合摘出比率 ( 備考 ) 考察特に金融保険業では他の業種より信頼性が高く生産性が低い傾向が見られるまたその要因面では他の業種より品質保証 ( 設計文書化レビューテスト ) に多くの工数をかけている傾向が見られることからシステムリスクが高い ( 信頼性公共性及び社会性の要求が高い ) ソフトウェアの開発にはそれ相応の品質保証 ( 設計文書化レビューテスト等 ) の工数が必要と考えられる 133

5. 組織の改善例 5.4 業種等のドメイン別マネジメント ( つづき ) (3) ベンチマーキング方法ベンチマークを参考にして自組織の業種等のドメイン間の差異を検討する業種等のドメイン間で差異が見られる場合ドメインに分けて信頼性 / 生産性をマネジメントすることを検討する ( 備考 ) 考察すべてのソフトウェア種を十把一絡げ ( じっぱひとからげ ) で扱う時代は去っている業種業務等の分野別にマネジメントする ( 評価分析改善等を行う ) ことが望ましいと考えられる 134

5. 組織の改善例 5.5 企業事例 : 業務アプリケーション別の基準値設定 (1) 目的開発現場に納得感の高いドメイン別の目標基準値をベンチマークとして比較検討することによって自組織の品質目標値を設定する < 考え方 > 業種をドメインとして層別し目標基準値を設定するケースは多いしかしながら同一業種であっても業務アプリケーションや顧客の特性によって取得されたデータに大きなバラツキが発生し開発現場として納得感のある設定値になることは少ないまた一方でドメインを細分化した場合サンプルデータが少なくなり統計的な手法を用いた基準値設定が困難になる多少乱暴な方法ではあるが改良開発プロジェクトを対象としてサンプルデータが少なくても開発現場が少しでも納得感が持てることを目標に基準値提供を行った 135

5. 組織の改善例 5.5 企業事例 : 業務アプリケーション別の基準値設定 ( つづき ) (2) ベンチマーク < 内部ベンチマークの設定方法 > 1 ドメインの設定ドメインの設定は業務アプリケーション顧客別に設定する 2 ドメイン別の目標基準値の設定 i) サンプルが 10 件 ~30 件対象となる過去プロジェクトのデータからの最小値と最大値を目標基準値として設定 ( 過去に発生しない値は今後も発生しないとの仮定のもとこの範囲外での目標値設定は行わない ) ii) サンプルが 30 件以上対象となる過去プロジェクトのデータから第 1 四分位と第 3 四分位の数値を目標基準値として設定 ( 過去の実績から想定し 50% のデータが分布するエリアを目標基準の設定エリアとする ) 136

5. 組織の改善例 5.5 企業事例 : 業務アプリケーション別の基準値設定 ( つづき ) (3) ベンチマーキング方法ドメイン別の目標基準値をベンチマークとして比較検討することによって自組織の品質目標値を設定する < 効果 > 統計的手法を駆使したものではないものの開発現場及びマネジメント層からも各ドメインの実力から設定された目標基準値であるとの理解を得ることができた < 参考ポイント > ベンチマーキングにおいてはできるだけ同種のソフトウェアと比較検討することが望ましく典型的には同じ業種のベンチマークを利用することが推奨されるこの例は社内において業務アプリケーション及び顧客で層別した内部ベンチマークを整備利用することによって開発現場等にとってより納得できるベンチマーキングを実現しておりドメイン別マネジメントの事例として参考になると考えられるまたサンプル数が少ない場合のベンチマークの整備方法としても参考になると考えられる 137

5. 組織の改善例 5.6 信頼性 / 生産性等の経年変化に基づく組織改善計画 (1) 目的ベンチマーク中に信頼性 / 生産性等の推移 ( 経年変化 ) が有れば自組織の信頼性 / 生産性等のマネジメントの年度計画目標 / 中長期計画目標を策定するにあたり適切な目標や改善方策を検討する時の参考にする (2) ベンチマーク公開ベンチマーク ( 白書等 ) の信頼性 / 生産性の推移 ( 経年変化 ) に以下のことが示されているのでヒントとして参考にする < 信頼性の推移 > ソフトウェア開発データ白書のデータに基づく信頼性実績ではプロジェクトデータを収集開始してから最近まで ( プロジェクトの実績終了年が2004 年から2012 年まで ) の発生不具合密度の中央値の経年変化に低下傾向 ( 信頼性向上の傾向 ) が見られる 138

5. 組織の改善例 5.6 信頼性 / 生産性等の経年変化に基づく組織改善計画 ( つづき ) 件 /KSLOC 0.025 KSLOC 発生不具合密度 ( 中央値 ) の推移 ( 新規開発 ) 信頼性向上の傾向が見られる 0.020 0.015 0.010 信頼性 KSLOC 発生不具合密度 ( 中央値 ) 3 区間移動平均 (KSLOC 発生不具合密度 ( 中央値 )) 0.005 高 0.000 2004 年 2005 年 2006 年 2007 年 2008 年 2009 年 2010 年 2011 年 2012 年終了年 ( 実績 ) 139

5. 組織の改善例 5.6 信頼性 / 生産性等の経年変化に基づく組織改善計画 ( つづき ) < 生産性の推移 > ソフトウェア開発データ白書のデータに基づく生産性実績ではプロジェクトデータを収集開始してから最近まで ( プロジェクトの実績終了年が 2004 年から 2012 年まで ) の SLOC 生産性の中央値の経年変化に生産性向上 ( または生産性低下 ) の傾向は見られない 140

5. 組織の改善例 5.6 信頼性 / 生産性等の経年変化に基づく組織改善計画 ( つづき ) SLOC/ 人時 8 7 6 5 4 3 2 1 0 高生産性 2004 年 2005 年 2006 年 2007 年 2008 年 2009 年 2010 年 2011 年 2012 年終了年 ( 実績 ) SLOC 生産性 ( 中央値 ) の推移 ( 新規開発 ) 生産性向上傾向は見られない中央値 3 区間移動平均 ( 中央値 ) 141

5. 組織の改善例 5.6 信頼性 / 生産性等の経年変化に基づく組織改善計画 ( つづき ) ( 備考 ) 考察生産性に向上傾向が見られない要因の一つとして次の可能性が考えられる複雑さ難しさが増している一方で開発要員のスキルレベルが追いついていない開発プロジェクトにとっての相対的な難易度が高まっていることの影響が考えられる少数精鋭部隊で開発していた時代は去っている次のような状況下でも如何にして要員のスキルレベルを確保 / 向上させるかまた効率的な開発方法を実現するかが課題の一つと考えられる開発すべきソフトウェアの総量が増大するのに伴ってますます大勢の開発要員が必要になっている ( 要員の資質の平均レベルが低下する ) 大半の開発プロジェクトが改良開発 ( 改修保守や拡張 ) になって来ており新規開発 ( 特にスクラッチ開発 ) によってスキルアップするチャンスが少なくなっている 142

5. 組織の改善例 5.6 信頼性 / 生産性等の経年変化に基づく組織改善計画 ( つづき ) (3) ベンチマーキング方法立案した信頼性 / 生産性の目標の実現可能性を検討する立案した目標が到達可能な目標か否かを吟味するために内部 / 外部ベンチマークにおける信頼性 / 生産性の推移 ( 経年変化 ) を参考にするその検討結果を踏まえて適切な目標や改善方策を検討する ( 備考 ) 考察ソフトウェア開発プロジェクトは低価格と短納期の強いプレッシャーに晒されることが多々あるまた予算管理や価格交渉等の場面で年率 5% の開発コスト削減や前年度比 10% のライン単価低減等が要求されるケースが散見されるしかしデータによる裏付け等の根拠が希薄であるとこのような状況は開発プロジェクトのリスク増大や品質低下を招く恐れがあるデータによる裏付けの一つとして外部ベンチマーク中の信頼性 / 生産性の推移も参考にされたい 143

ご清聴ありがとうございました