PowerPoint プレゼンテーション

ソフトウェア品質シンポジウム 15 継続的システムテストについての理解を深めるための開発とバグのメトリクスの分析 15/9/18 荻野恒太郎 kotaro.ogino@mail.rakuten.com Test Engineering Team Service Support Section Group Core Service Department http://www.rakuten.co.jp/

アジェンダソフトウェア品質シンポジウム 15 バックグラウンドメトリクス分析 1 分析 2 分析 3 まとめと今後の課題 2

ソフトウェア品質シンポジウム 15 バックグラウンドメトリクス分析 1 分析 2 分析 3 まとめと今後の課題 3

背景 1: 開発プロセスの変化とシステムテストウォーターフォールからアジャイルへ平鍋健児, ソフトウェア工学の分岐点におけるアジャイルの役割 SS1. 早期からのシステムテストの実施永田敦, アジャイル開発における品質保証部門によるシステムテストのアフローチ JSPIC13. 継続的システムテスト荻野ら, システムテスト自動化による大規模分散検索プラットフォームの開発工程改善 JaSST Tokyo 14. 要求 ( スコープ ) 要求 ( スコープ ) 時間分析設計実装システムテスト (ST) 時間分析設計実装 (ST) 自動化によりシステムテストを日次で実行自動化前自動化後 4

背景 2: 継続的システムテストのメリットテスト自動化に関する通説品質とコストとデリバリーはトレードオフ品質保証が開発プロセスから独立している事を仮定継続的システムテスト自動化する事でシステムテストを開発プロセスに取り込む事が可能 5

背景 2: 継続的システムテストのメリットシステムテストを開発プロセスに取り込む JaSST 14 Tokyo の発表より 6

背景 2: 継続的システムテストのメリットバグ修正日数が改善 JaSST 14 Tokyo の発表より 7

背景 2: 継続的システムテストのメリットテスト自動化に関する通説品質とコストとデリバリーはトレードオフ品質保証が開発プロセスから独立している事を仮定継続的システムテスト自動化する事でシステムテストを開発プロセスに取り込む事が可能バグ修正日数が減少 = コストとデリバリーも改善 8

本発表の目的と手法ソフトウェア品質シンポジウム 15 システムテスト自動化への疑問疑問 1: 自動化されたシステムテストは質が低い? 疑問 2: システムテストを開発プロセスに取り込むって? 疑問 3: 開発をうまく進めるのに必要な工夫は? 目的 : 継続的システムテスト環境下での開発とシステムテストへの理解を深める事手法 : 開発プロダクトとバグのメトリクスの分析 9

ソフトウェア品質シンポジウム 15 継続的システムテストのありのままの姿 1

ソフトウェア品質シンポジウム 15 バックグラウンドメトリクス分析 1 分析 2 分析 3 まとめと今後の課題 11

分析対象のメトリクスソフトウェア品質シンポジウム 15 コミットソースコードレポジトリビルドテストバグレポート開発者開発メトリクス日次のコミット数コミットサイズプロダクトメトリクス日次の LOC 変更 LOC 追加 LOC 削除 LOC 無変更 LOC 変更ファイル数追加ファイル数削除ファイル数変更なしファイル数バグメトリクス日次の検出バグ数 12

メトリクスの収集方法グループメトリクス名収集方法単位開発メトリクス日次のコミット数 git log (*1) 回数日次のコミットサイズ git log (*2) 行数プロダクトメトリクス日次の LOC cloc (*3) 行数バグメトリクス日次の変更 LOC 日次の追加 LOC 日次の削除 LOC 日次の変更無し LOC 日次の変更ファイル日次の追加ファイル日次の削除ファイル日次の変更なしファイル日次のプロダクトの検出バグ数 cloc diff (*4) cloc diff (*4) - システムテストで発見されたバグ - バグ票の作成日で集計 - 同じ欠陥に由来するモノは新しい方を削除ソフトウェア品質シンポジウム 15 行数ファイル数回数 (*1) https://www.atlassian.com/ja/git/tutorial/git-basics#!log (*2) コメント等を含む (*3) http://cloc.sourceforge.net/ (*3)(*4) 開発言語は Java コメント等を含まない 13

コミット数 35 3 25 15 1 5 分析対象のメトリクス (13 年度 1/28~1/23) コミット数とコミットサイズ Commit Commit size 時間コミットサイズ頻度 25 15 15 1 5 1 5 日次のコミット数の分布一日のコミット数変更 LOC 追加 LOC 削除 LOC 行数 1 1 1 LOC 時間頻度 25 15 1 5 日次の検出バグ数の分布 1 2 3 4 5 1 日で見つかった検出バグ数 14

開発フェーズ分析対象の開発プロジェクトの開発フェーズ大きな機能要件受け入れテスト断続的な小さな要件システムリファクタリング受け入れテスト 9 14 検出バグ数 8 7 6 5 4 累積検出バグ数累積コミット数 1 1 8 6 コミット数 3 1 4 B C 99 日間 1 日間 84 日間継続的な開発とテストが特徴 15

継続的システムテストの特徴について考察従来のシステムテスト継続的システムテスト ST の位置実装の後実装と平行して同時役割品質の門番 ( 品質の門番 ) リグレッションテストテストの追加テスト期間中のコード変更信頼度成長曲線を見ながらテスト工程でバグ修正のみユーザーストーリーとコードカバレッジを見ながら実装工程であるリファクタリング少ない多い 16

ソフトウェア品質シンポジウム 15 バックグラウンドメトリクス分析 1 分析 2 分析 3 まとめと今後の課題 17

分析 1: 自動化されたシステムテストの評価疑問 1: 自動化されたシステムテストは質が低い? 分析 1 の目的分析対象のプロジェクトのテストの質を調べるためテスト密度とバグ密度で業界標準と比較我々の開発プロセスを逐次的なミニウォーターフォールと考えバグとテスト追加の安定している下記の,B,C3 点で計測累積検出バグ数 3 月 5 月 7 月 9 月 B C 18

分析 1: 自動化されたシステムテストの評価評価指標バグ密度とテスト密度 IP が提供する業界標準の値と比較 (*1) - 最小値 P25, 中央値 P75, 最大値 P25 ~ P75 の区間が一つの目安 - 主要言語 Java の値を使用 - 新規開発と改良開発テスト密度テスト密度 = テストケース数 KLOC 5 4 3 1 IP が提供する業界標準の値新規開発改良開発バグ密度バグ密度 = 検出バグ数 KLOC 2 1.5 1.5 新規開発改良開発 (*1) ソフトウェア開発データ白書 12-13 定量データ分析で分かる開発の最新動向より 19

5 4 分析 1: テスト密度の業界標準との比較テスト密度 5 4 3 (38.76) 3 (28.71) 1 (18.64) 1 B C 本プロジェクト新規開発業界標準改良開発考察 : - テスト件数は規模に対して標準的 - テスト密度が継続して上昇フレームワークや DSL の完成後テスト追加が容易に - C の期間ではテスト密度が若干業界標準より高いシステムテストの件数やカバレッジのための指標が必要

2 分析 1: バグ密度の業界標準との比較バグ密度 2 1.5 1.5 1.5 (.74) (.8) (.31) 1.5 B C 本プロジェクト新規開発業界標準改良開発考察 : - 断続的な小さい要件の B の期間で小さいバグ密度 - 機能追加のないシステムのリファクタリングの C の期間でもバグを検出リファクタリングによるリグレッションを自動テストが検出 - 全体を通し業界標準のバグ密度バグカーブが収束するようなリグレッションテストと推察 21

ソフトウェア品質シンポジウム 15 バックグラウンドメトリクス分析 1 分析 2 分析 3 まとめと今後の課題 22

分析 2: 開発メトリクスとバグの関係疑問 2: システムテストを開発プロセスに取り込むって? 分析 2 の目的プロダクトメトリクスだけでなく開発メトリクスもバグの見つかり方と関係があるか調査する事先行研究 : プロダクトメトリクスとバグの関係を評価 - S Syed ら, Open Source, gile and reliability Measures, ISQI, 9 - 下村ら, ソフトウェアメトリクスを用いた単体テストの品質リスク評価, SQiP13. コミットソースコードレポジトリビルドテストバグレポート開発メトリクスプロダクトメトリクスバグメトリクス 23

分析 2: 開発メトリクスとバグの関係分析手法バグメトリクスとの相関を調査 - 日次の開発メトリクスプロダクトメトリクス - 週次の積算開発メトリクスプロダクトメトリクス開発メトリクスプロダクトメトリクスバグメトリクス日次データコミット数変更 LOC 検出バグ数時間時間時間週次の積算データコミット数変更 LOC 検出バグ数時間時間時間 24

分析 2: 日次データでの相関グループ説明変数相関係数開発メトリクスコミット数コミットサイズプロダクトメトリクス変更 LOC 追加 LOC 削除 LOC 無変更 LOC 変更ファイル追加ファイル削除ファイル変更なしファイル.19.6.36.17.19 -.17. -.9.6 -.19 検出バグ数 8 6 4 コミット数と検出バグ数の散布図 6 4 2 4 コミット数累積検出バグ数と変更無しファイル数の時系列データ 1 9 累積検出バグ数累積バグ数変更無しファイル数考察 : - すべてのメトリクスで相関は弱い結合バグ発見までの潜在期間 - ファイルに変更を加えない事には意味がある? 8 7 6 25

分析 2: 週次の積算データでの相関グループ説明変数相関係数開発メトリクス週次コミット数週次コミットサイズプロダクトメトリクス週次変更 LOC 週次追加 LOC 週次削除 LOC 週次無変更 LOC 週次変更ファイル週次追加ファイル週次削除ファイル週次変更なしファイル.47.33.56.42.61 -.29.66..33 -.31 検出バグ数検出バグ数 15 1 5 15 1 5 積算変更ファイル数と検出バグ数の散布図 1 積算変更ファイル数積算変更ファイルの層別分析による検出バグ数 1 以上 1 未満以下考察 : - 開発メトリクスも中程度の相関があるがプロダクトメトリクスより弱い - 積算変更ファイル数が一番高い相関 26

ソフトウェア品質シンポジウム 15 バックグラウンドメトリクス分析 1 分析 2 分析 3 まとめと今後の課題 27

分析 3: バグ曲線が緩やかに収束しなかった理由の考察疑問 3: 開発をうまく進めるのに必要な工夫は? 分析 3 の目的継続的システムテスト環境下で早くバグを見つけるには? バグ曲線が緩やかに収束しなかった理由を考察信頼度成長曲線ソフトウェア信頼性モデル, 山田茂, 1994 テスト時間と発見した欠陥数に着目潜在障害数を予測従来の開発工程継続的システムテストの開発工程累積検出バグ数継続的システムテスト従来のシステムテスト分析設計実装システムテスト時間 28

分析 3: 継続的システムテストでのバグ曲線 9 8 7 6 C 検出バグ数 5 4 3 1 累積検出バグ数 B 時間一定の傾きでバグが増えているフェーズの終了とともに急速に収束 29

1 分析 3: バグ曲線が緩やかに収束しなかった理由の考察分析手法 1 累積コミット数に対するバグ曲線による分析 ( 検出バグ数 ) 8 6 4 B C 1 時間 ( 検出バグ数 ) 8 6 4 B C 4 6 8 1 累積コミット数 3

( 検出バグ数 ) ( 検出バグ数 ) 1 8 6 4 1 8 6 4 分析 3: バグ曲線が緩やかに収束しなかった理由の考察分析手法 1 累積コミット数に対するバグ曲線による分析時間 B B C C 考察 : -,B,C 開発期間は同じ位コミット数が大きく異なる - 時間を横軸にとるとフェーズ終了前で急に収束 - コミットを横軸によるとなだらかに収束 - 小さい収束が大きな収束 4 6 8 1 累積コミット数 31

( 検出バグ数 ) ( 検出バグ数 ) 1 8 6 4 1 8 6 4 分析 3: バグ曲線が緩やかに収束しなかった理由の考察分析手法 1 累積コミット数に対するバグ曲線による分析時間 B B C C 考察 : -,B,C 開発期間は同じ位コミット数が大きく異なる - 時間を横軸にとるとフェーズ終了前で急に収束 - コミットを横軸によるとなだらかに収束コミットに含まれるバグの減少を示唆 - 小さい収束が大きな収束 4 6 8 1 累積コミット数 35

( 検出バグ数 ) ( 検出バグ数 ) 1 8 6 4 1 8 6 4 分析 3: バグ曲線が緩やかに収束しなかった理由の考察分析手法 1 累積コミット数に対するバグ曲線による分析時間 4 6 8 1 累積コミット数 B B C C 考察 : -,B,C 開発期間は同じ位コミット数が大きく異なる - 時間を横軸にとるとフェーズ終了前で急に収束 - コミットを横軸によるとなだらかに収束コミットに含まれるバグの減少を示唆 - 小さい収束が大きな収束開発者がコミット直後にバグに気づき修正 37

分析 3: バグ曲線が緩やかに収束しなかった理由の考察分析手法 2 テスト種別ごとのバグ曲線による分析システムテストスモークテストバージョンその他テスト ( 検出バグ数 ) 1 8 6 4 累積検出バグ数累積バグ累積検出バグ数累積バグ in スモークテスト in スモークテスト累積検出バグ数累積バグ in その他テスト in その他テスト 4 6 8 1 コミット数考察 : - スモークテストを壊すようなコミットがの期間では一度に集中 - C では 2 回 ( 見つかったバグの数はともに 1) - C ではスモークテストが収束した後すぐに全体も収束 B C 39

ソフトウェア品質シンポジウム 15 バックグラウンドメトリクス分析 1 分析 2 分析 3 まとめと今後の課題 44

まとめ : システムテスト自動化に関する疑問疑問 1: 自動化されたシステムテストは質が低い? 疑問 2: システムテストを開発プロセスに取り込むって? 疑問 3: 開発をうまく進めるのに必要な工夫は? まとめ : 継続的システムテストへの理解を深めるため開発プロダクトとバグのメトリクスの分析 45

まとめ : 疑問 1 への答えソフトウェア品質シンポジウム 15 疑問 1: 自動化されたシステムテストは質が低い? 答え ( 分析 1 より ): 自動化されたシステムテストは質が低いという事はないただし自動化した環境ではテスト密度は上がりやすいのでシステムテストの 5 カバレッジの指標が必要テスト密度 B C 46

まとめ : 疑問 2 への答えソフトウェア品質シンポジウム 15 疑問 2: システムテストを開発プロセスに取り込むって? 答え ( 分析 2 より ): システムテストを開発プロセスに取り込むとプロダクトメトリクスだけでなく開発メトリクスもバグの発見の仕方と関係バグの混入のされ方は変更無しファイル数や変更したファイル数等と関係検出バグ数積算変更ファイルの層別分析による検出バグ数 15 1 5 1 以上 1 以下 47

まとめ : 疑問 3 への答えソフトウェア品質シンポジウム 15 疑問 3: 開発をうまく進めるのに必要な工夫は? 答え ( 分析 3 より ): 自動化した環境では開発者に早期にフィードバックする事が重要コミットのタイプが機能追加からバグ修正へスモークテストを失敗させるような 1 コミットをイテレーションで 5 分割する事でバグを早期に発見する事が出来る ( 検出バグ数 ) 5 1 コミット数 48

今後の課題ソフトウェア品質シンポジウム 15 システムテストの評価指標継続的システムテスト下でのテストの改善 - テストケースの優先順位付け - テストの作り過ぎを防ぐ開発メトリクスの品質管理への利用開発プロセスと品質保証の相互作用的な変化 49

ソフトウェア品質シンポジウム 15 Long live testing 5