2016 IPA, All Rights Reserved Software Reliability Enhancement Center ソフトウェア開発データ白書データ活用法 ~ 白書掲載グラフデータのベンチマーキング活用例 ~ SEC セミナー資料 2016 年 11 月 2 日 独立行政法人情報処理推進機構 (IPA) 技術本部ソフトウェア高信頼化センター (SEC)
はじめに IPA/SEC では ソフトウェア開発における定量的管理の普及促進の一環として 国内の多様なソフトウェア開発のプロジェクトデータを整理 分析した ソフトウェア開発データ白書 を 2004 年より定期的に発行しています その最新版である ソフトウェア開発データ白書 2016-2017 を 2016 年 10 月 12 日に Web 上に公開しました 当セミナーでは ソフトウェア開発データ白書 2016-2017 に掲載されているグラフ作成用データのフリー統計ソフト EZR を使用した活用方法 ( 業種編 3 種含む ) について説明します グラフデータ利用に当たっては ダウンロード用グラフデータの最初のシートに記載されている はじめにお読みください に記載されている事項を遵守の上ご利用ください 今回自社用データとして用いているものは 適当に乱数を発生させたものです 実データではありません 2
本日のプレゼンテーション概要 SEC 独自の分析ツール 収集データ 抽出 グラフ作成 白書に掲載 データ提供企業 市販ソフト ( 箱ひげ図 ) グラフ作成用元データ 章別 基本は図表単位 青枠部分を SEC 分析ツールや市販ソフトではなくフリー統計用ソフト EZR でグラフ化する方法の一例を紹介 3
今回紹介する事例 本日は 以下の項目に対し EZR を使用したグラフ作成方法につき紹介する ダウンロードデータの事前編集 EZR の操作方法について紹介する 白書掲載グラフを転載 グラフの作成箱ひげ図の描き方 グラフの作成散布図での信頼区間の描き方 自社データとの比較 自社データマッピング方法白書掲載散布図に自社データを追加する方法 自社データマッピング方法白書掲載箱ひげ図と自社データと対比する方法 業種間比較 業種グラフを一つのグラフにまとめる方法 2 群の平均の差の検定 変動要因分析での検定方法 4
グラフ作成に必要な作業 今回の事例グラフデータ整備自社データ準備グラフ作成 白書掲載グラフ転載 自社データのマッピング 業種間比較 平均の差の検定 箱ひげ図 信頼区間付き散布図 散布図への自社データマッピング 箱ひげ図の比較 箱ひげ図の比較 Welch の検定 項目名簡素化変数の積み重ね 項目名簡素化信頼区間データ編集 - - 箱ひげ図作成 信頼区間つき散布図作成 項目名簡素化 自社データ準備 自社データマッピ ング散布図作成 項目名簡素化変数の積み重ね 本編 業種編データの集約変数の積み重ね 等分散の検定データを 2 分化データを対数化 自社データ準備 - - 白書と自社データ箱ひげ図作成 業種別箱ひげ図作成 ( 検定結果 ) と箱ひげ図 5
グラフデータダウンロード画面 以下の URL にアクセスし ログイン後アンケート回答をすると以下のページが表示されます グラフデータは 章単位または一括ダウンロードが可能です 白書公開お知らせページ http://www.ipa.go.jp/sec/reports/20161012.html アンケートページ http://sec.ipa.go.jp/publish/whitepaper 6
データの取り込みと項目名簡素化 ( 箱ひげ図の例 ) 1 Excel の該当シートを読み込む 2 項目名を簡素化する ファイル データのインポート Excel データをインポート の手順で該当 Excel ファイルを読み込む 3 縦に積み重ねたデータセットにする 7
箱ひげ図の描き方 4 変数と群別する変数を選択上下のひげの位置を設定 Y 軸の表示範囲を設定 ( 必要があれば ) 5 OK ボタンを押せば箱ひげ図が作成される 4 3 生産性 2 1 0 1 基本設計 2 詳細設計 3 製造 4 結合テスト 5 総合テスト 工程 8
信頼区間つき散布図の書き方 項目名簡素化白書の項目名は長く入力するには煩雑! 条件設定をする際の手間を考え簡素化が望ましい 信頼区間データ編集散布図の X 軸 Y 軸 (-50% 50% など ) データとして編集 白書と信頼区間という区分を付与する EZR によるグラフ化白書 信頼幅区分別散布図としてグラフ作成 月数 実績工数 X 軸 信頼区間下限 信頼区間上限 信頼区間下限 信頼区間上限 X 軸 実績工数 Y 軸 月数区分 白書 / 信頼区間 区分 信頼幅 白書 次ページ参照 工数月数区分 実 績工数 月数 白書 X 軸 X 軸 間信下頼限区 間信上頼限区 信頼区間 X. 拡大月数. 実績._ プロジェクト全体. 80 60 40 20 0 0 500000 1000000 1500000 2000000 X.C10050_ 実績工数. 総計人時._ プロジェクト全体. 9
データを編集するイメージ グラフデータ元ネタ EZR 用に編集 10
散布図に自社データマッピング 先程使用したデータにさらに自社データを追加 区分自社信頼幅白書白書掲載データとの比較 工数月数区分 実 績工数 月数 白書 X 軸 X 軸 自社データ工数 間信下頼限区 間信上頼限区 自社データ月数 信頼区間 自社 X. 拡大月数. 実績._ プロジェクト全体. 80 60 40 20 0 0 500000 1000000 1500000 2000000 X.C10050_ 実績工数. 総計人時._ プロジェクト全体. 11
自社データを箱ひげ図で比較 1 項目名簡素化 3 縦に積み重ねたデータセットにする 2 項目名順序化 4 グラフ作成 12
工程別工数比率自社データ比較 工程別工数比率の自社データとの比較が可能 0.8 0.6 工数比率 0.4 0.2 0.0 11 自社 _ 基本設計 1 基本設計 2.2 自社 _ 詳細設計 2 詳細設計 3.3 自社 _ 製作 3 製作 4.4 自社 _ 結合テスト 4 結合テスト 5.5 自社 _ 総合テスト 5 総合テスト 工程 13
業種間比較のためのデータ準備 本編 業種編の中から 比較したい項目が記載されている図表を選択し ひとつの Excel シートにまとめる 複数の変数を縦に積み重ねたデータセットを作成する 14
業種間比較グラフの作成 変数に発生不具合密度 群別する変数には業種を選択する 上下のひげの位置を指定する OK ボタンを押すとグラフが描ける 業種毎の発生不具合密度の比較が可能 15
生産性変動要因の分析例 まず 生産性が正規分布しているかどうか調べる ( 箱ひげ図作成 ) 正規分布でないことが分かる 16
対数化し正規化検定を行った結果 アクティブデータセット 変数の操作 連続変数を対数変換する を選択し FP 生産性を対数化する 統計解析 連続変数の解析 正規性の検定 で検定を行う 対数変換後 正規性の検定 17
箱ひげ図でも確認が可能 対数化した後の FP 生産性の数字で箱ひげ図を作成する 正規分布になったことが分かる 18
変動要因分析 ( 設計文書化密度と FP 生産性 ) アクティブデータセット 変数の操作 連続変数を指定した閾値で 2 群に分けた新しい変数を作成する を選択し 二分化する 19
設計文書化密度の閾値での生産性平均の差の検定 (Welch の t 検定 ) 統計解析 連続変数の解析 2 群間の平均値の比較 (t 検定 ) で検定を行う 20
対数で Welch の検定した結果 P<0.05 のため 平均に差がないという仮説は棄却された 21
工数比率 EZR グラフのパワーポイントなどでの活用方法 EZR のグラフを右クリックし メタファイルにコピー を選択パワーポイントなどに貼り付け 図形の編集 Microsoft office 描画オプションに変換 グループ化解除 ( 日本語が文字化けするので注意 ) 0.8 0.6 0.4 0.2 0.0 基本設計 ( 自社 ) 基本設計 ( 白書 ) 詳細設計 ( 自社 ) 詳細設計 ( 白書 ) 製作 ( 自社 ) 製作 ( 白書 ) S. SŽ ŽÐ_Œ ƒeƒxƒg SŒ ƒeƒxƒg T. TŽ ŽÐ_ ƒeƒxƒg T ƒeƒxƒg H ö 22
デモンストレーション 箱ひげ図の描き方 信頼区間付き散布図への自社データマッピング 業種編データを統合したグラフの描き方 平均の差の検定 23
ご参考 EZR について EZR (Easy R) Rcmdr のカスタマイズ機能を利用して 多彩な機能を組み込んだもの ここからダウンロード http://www.jichi.ac.jp/saitama-sct/saitamahp.files/statmed.html 24
グラフダウンロードデータイメージ 25
終わり! より良いソフトウェア開発と業界の発展のために プロジェクトデータの活用を進めましょう! より良いソフトウェア開発と業界の発展のために プロジェクトデータ提供企業募集中! ご清聴ありがとうございました IPA( 独立行政法人情報処理推進機構 ) http://www.ipa.go.jp/ SEC( 技術本部ソフトウェア高信頼化センター ) http://sec.ipa.go.jp/ 26