経済産業省平成 20 年度 地域イノベーション創出共同体形成事業 北海道地域イノベーション創出協働体形成事業 研究開発環境支援事業 発酵乳製品の香気特性マッピングによる 品質評価技術の開発 操作マニュアル 追補版 地域イノベーション創出共同体形成事業 研究開発環境支援事業 ( 地独 ) 北海道立総合研究機構産業技術研究本部食品加工研究センター ( 地独 ) 北海道立総合研究機構産業技術研究本部工業試験場 ( 財 ) 北海道科学技術総合振興センター
1. 官能評価解析システム (SPSS Text Analysis for Surveys) の操作
1. 準備 まず 官能試験結果をテキストデータマイニングソフト (SPSS Text Analysis for Survey)( 以下ソフト ) に入力する必要があります ソフトから直接入力することも可能ですが Excel は汎用性が高く他の統計処理等に利用出来るので ここでは Excel のデータをソフトに読み込む方法をご紹介します ) 官能評価結果をまとめます ( 下図 ) ここでは 魚肉乾燥食品の官能評価結果を事例として取り上げました A 列に通し番号 B C 列はパネルの性別 年齢をコード化した値が D ~F 列は 嗜好 塩加減 フレーバー の評点がそれぞれ示されています G 列は自由記述式の評価です このソフトで解析するために必要なデータはA 列の通し番号とG 列の自由記述式の評価です 自由記述式の評価は後から修正することが出来ません 誤字を正しい文字として認識させることは可能ですが 作業が繁雑になるためなるべく正確に入力することが大事です また 文章を確認し 日本語が誤って使用されているケースでは正しく直して入力することも必要です エクセルに入力した魚肉乾燥食品の官能試験結果 ( ファイル名 : マニュアル作成用 data.xls sheet 名 : サンプル ) :Excel2007 には対応していませんので 2003 以下のバージョンで保存して下さい
2. ソフトの起動 ソフトを立ち上げます アイコンをダブルクリック 立ち上げ画面
3. データの読み込み 準備した官能試験データをソフトに読み込みます 画面左上の インポートアイコン 押し Excel ファイル... の位置にカーソルを合わせます を インポートアイコンをクリックし そのままカーソルを移動 ファイルを選んで 開く をクリックします 官能評価を保存したシートを選択し 次へ をクリックします
変数を選択します 一意の ID は必須の変数であり 1. 準備 で説明した A 列の通し番号 が相当します 自由記述式のテキスト は G 列の自由記述式 が相当します 参照変数は その他の項目を任意に選択することが可能です 性別 年齢等によるキーワードの出現頻度を算出したい場合に使用しますが 空欄でも問題ありません 1 変数を選択 ウィンドウの左側で ANo をクリックする 2 中央の三角のアイコンをクリックします 3 一意のIDに ANo が移動します 4 同様に自由記述式のテキストに A 記述 を 参照変数に A 性別 を移動します 1 変数を選択 2 アイコンをクリック 3 変数が移動 全ての変数が移動したら 完了 をクリックします
画面が下図のように切り替わり 入力は終了です
4. テキストデータの抽出 4-1. 抽出作業 キーワードの抽出をします メニューの ツール 抽出 にカーソルを移動すると 抽出が始まります また画面左下エリアの抽出アイコンを押しても同じ操作が出来ます 抽出アイコン 下図は抽出中の画面です 多少時間がかかります
抽出が終了すると画面が下図のようになります テキストデータが品詞毎やタイプ ( 良い 悪いなど ) 毎に色分けされます 左下エリアは キーワードの累計が表示されます 抽出結果を詳しく見てみましょう 一番使われているキーワードは 思う で 10 件ありました 左下エリアの 思う にカーソルをあてると 思う-< 動詞 > が表示されます 思う をクリックすると 思う が使われている回答が右エリアに表示されます 活用形の 思い 思っ も抽出されていることが解ります
同様に 塩味 にカーソルをあてると 塩味 -< 名詞 > が表示され クリックすると 塩味 が使用されている回答が表示されます 生臭い は < 悪い - 不快 > 3 人の回答に使用されていることが解ります
4-2. 類義語の整理 抽出キーワードをよく見てみると 塩味 塩加減 塩 があり いずれも同じ様な意味で使用されています これらは同義語と見なされるので 一つにまとめる必要があります その方法を示します
メニューの ファイル ライブラリ 新規ライブラリ を選択します ライブラリ名 注釈を入力します ここではライブラリ名に 水産食品 注釈に 発酵鮭 と入力します 入力が終わったら OK を押します
画面右上の辞書エディタアイコン をクリックします 辞書エディタアイコン 画面が辞書エディタモードに切り替わります ( 下図 )
ツールバーの すべてのライブラリ を選択します 検索テキストボックスに 塩味 と入力します 検索文字列を含む文字列を検索 アイコン ツールバーの 検索 アイコンを押します 1 すべてのライブラリを選択 2 塩味 と入力 3 アイコンをクリック 4 検索をクリック 検索できませんでした: 塩味 と言うメッセージが出されるので OK を押します これは 塩味がライブラリに登録をされていないことを確認するための作業です
ツールバーのドロップダウンリストから 登録した 水産食品 を選択します 代表語セルをダブルクリック 塩味 と入力し Enter キーを押します 1 セルをダブルクリック 2 塩味 と入力 3Enter キーを押す 類義語セルをダブルクリック 塩, 塩加減 と入力します このとき 語と語の間には半角カンマ, を入力します 入力後 Enter キーを押します これで 類義語の登録作業は終了です 1 セルをダブルクリック 2 塩, 塩加減 と入力 3Enter キーを押す
類義語の登録にはもう一つの方法があるので 紹介します ちょうど良かった と ちょうど良い を ちょうど良い にまとめます 先ほどと同じ手順で ちょうど良い がライブラリに登録していないか確認します ツールバーの すべてのライブラリ を選択します 検索テキストボックスに ちょうど良い と入力します 検索文字列を含む文字列を検索 アイコン ツールバーの 検索 アイコンを押します 検索できませんでした: ちょうど良い と言うメッセージが出されるので OK を押します 1すべてのライブラリを選択 2 ちょうど良い と入力 3アイコンをクリック 4 検索をクリック 5 テキストがありません を確認 OK をクリック
画面右上のテキスト分析アイコンをクリックし 画面をテキスト分析モードに切り替えます リストアイコンをクリックし Unicode 順でソート ( 昇順 ) します を選択します 抽出したキーワードが五十音順にソートされ キーワードが探しやすくなります 1 テキスト分析アイコンをクリックし テキスト分析モードに画面を切替える 2 リストアイコンをクリックする 3Unicode 順でソート ( 昇順 ) を選択する ちょうど良かった を探して 右クリックします 類義語に追加 にカーソルを合わせ 新規類義語 を選択します 1 ちょうど良かった を右クリック 2 類義語に追加 にカーソルを合わせる 3 新規類義語 を選択
類義語の作成ダイアログボックスが立ち上がります 代表語に ちょうど良い と入力し OK ボタンを押します これで ちょうど良かった は ちょうど良い の類義語に定義されました 辞書エディタアイコン を押し 辞書エディタウィンドウで確認出来ます
これまでの作業は 類義語を整理したのみで 抽出結果には反映されていません 類義語の整理を結果に反映させるためには 再度抽出を行う必要があります 通常抽出には時間がかかるため 最後にまとめて行う場合が多いのですが ここでは これまでの変更が反映されているか確認するために 再度抽出を実行します この時 ライブラリを 水産食品 から すべてのライブラリ に戻すことを忘れないようにしましょう 1 すべてのライブラリ を選択 抽出前 塩味 (5) 塩加減 (2) 塩 (2) ちょうど良かった (1) ちょうど良い (1)
抽出後 塩味 は抽出前が 5 個だったのに対し 抽出後には 9 個に増え 類義語を整理したことが反映されています 塩味 をクリックすると右ウインドウで塩加減 塩が含まれていることが確認できます 塩味 (5) (9) に増加 塩加減 塩 が含まれる ちょうど良い ちょうど良かったについても同様です ちょうど良い (1) (2) に増加 ちょうど良かった が含まれる この作業を繰り返し 類義語をまとめ キーワードの種類を絞り込みます
4-3. 不要後の削除 抽出されたキーワードの中には 不要語が含まれることがあります ここでは どうしても を不要語ととらえ 削除する例を紹介します 辞書エディタアイコンをクリックし 画面を辞書エディタウィンドウに切り替えます ツールバーのドロップダウンリストから 登録した 水産食品 を選択します 1 辞書エディタアイコンをクリック 2 リストから 水産食品 を選択 テキスト分析アイコンをクリックし テキスト分析ウィンドウに切り替えます 左下の抽出キーワードの中から どうしても を探します どうしても を右クリックし 不要語に追加 をクリックします この作業で どうしても は不要語として登録されました 1 テキスト分析アイコンをクリック 2 どうしても を右クリック 3 不要語に追加 にカーソルを合わせる 確認方法辞書エディタアイコンをクリックし 画面を辞書エディタウィンドウに切り替えます 右表の不要語リストに どうしても が追加されたことが解ります 1 辞書エディタアイコン をクリック どうしても が不要語リストに追加
これまでの作業は 4-2. 類義語の整理 と同様に 抽出を行わないと結果に反映されませんので 再抽出を行います この時 ライブラリを 水産食品 から すべてのライブラリ に戻すことを忘れないようにしましょう ( 辞書エディタアイコンをクリックし 画面を辞書エディタウィンドウに切り替えた後 ツールバーのドロップダウンリスとから すべてのライブラリ を選択 ) 1 辞書エディタアイコンをクリック 抽出アイコンをクリックし 再抽出を行います 抽出前 1 すべてのライブラリ を選択 どうしても (1) 抽出後 リストから どうしても が削除された
5. カテゴリの作成 カテゴリは 抽出したキーワードの中で重要と思われる情報を表したものです Text Analysis for Surveys には自動的なカテゴリ化の手法が 2 つあり 言語学的手法に基づく手法 と 出現頻度に基づく手法 です ここでは 出現頻度に基づく手法を紹介します メニューの カテゴリ カテゴリを作成 出現頻度に基づく... にカーソルを移動します 1 カテゴリ をクリック 2 カテゴリを作成 にカーソルを合わせる 3 出現頻度に基づく... にカーソルを合わせる 出現頻度に基づくカテゴリの作成 ウィンドウが立ち上がるので 出現頻度に任意の数を入力します この数は 何人がこのキーワードを使用したか に相当します ここでは3 を入力します 3 人以上が使用しているキーワードを抽出することとなります 入力後 O K をクリックします 1 3 を入力 2 OK をクリック
3 回以上使用されているキーワードが左上のエリアにカテゴリとして表示されます
6. 結果のエクスポート 抽出結果をエクスポートします ここでは グラフ作成等の作業を考慮し Excel ファイル形式でエクスポートする方法をご紹介します メニューの ファイル エクスポート Excel ファイル... を選択します 1 ファイル をクリック 2 エクスポート にカーソルを合わせる 3 Excel ファイル... にカーソルを合わせる エクスポートウィンドウ が立ち上がるので ファイル名を入力し 保存 アイコンをクリックします ここでは 解析結果 のファイル名を用います 1 ファイル名 ( 解析結果 ) を入力 2 保存 をクリック
ファイルの内容を Excel にて確認すると 下図のような結果となりました どのパネルがどのキーワードを使用したかが一覧となっています Excel の関数を用いてキーワード毎の合計を算出するなどの作業が可能です
補足否定語 ない の区分け 抽出したキーワードの中には ない などの否定語が含まれています 否定語が使用される場合には 同じキーワードでも 反対の意味で使用されていることとなるので注意が必要です ( 例 : 塩味が強い と 塩味がしない は同じ 塩味 にカウントされます) 官能評価の評価項目を探る目的でテキスト分析を行う場合には ない が使用されていても パネルが評価している点と考えられますので 問題ないと考えられます 例えば 塩味がしない 文章からは パネルは 塩味 に注目しており 塩味 の評価項目は重要であると考えることが出来ます キーワードの頻度を多変量の変数と考えて解析を行う場合には 否定語が使用されているものといないものは分けて考える必要があるので ここでご紹介する作業を行うことをお勧めします 手作業でカテゴリを作成し 否定語 ない の使用されているキーワードを抽出する方法をご紹介します 1 ない をクリックして 内容を確認します 好きな味ではない 特になし 味に特徴がない の文に ない が使用されています 使用されている ない について 別途カテゴリを作成し 参考データとします 1 ない をクリック このケースでは 好き や 特徴 がカテゴリ化されていないため 否定語が使用されていても問題ないと考えられます
2 左上エリアの すべてのレコード を右クリックし カテゴリの新規作成 新規の空白カテゴリ... にカーソルを移動します 1 全てのレコード を右クリック 2 カテゴリの新規作成 にカーソルを移動 3 新規の空白カテゴリ... にカーソルを移動 3 カテゴリのプロパティ ウィンドウが立ち上がるので 名前に ない と入力し O K アイコンをクリックします 1 ない を入力 2 OK をクリック 4 カテゴリ名 ない が作成されました
5 ない のカテゴリは何もない状況ですので 続いて ない カテゴリに回答を追加する作業に移ります カテゴリの ない を右クリックし 条件規則を作成 にカーソルを移動します 1 ない を右クリック 2 条件規則を作成にカーソルを合わせる 6 上部にウィンドウが開きます 条件規則名を入力します ここでは ない and 好き と入力します 好きな味でない を ( ) & を利用して条件規則を作成します ( ) 内にはキーワードが入ります & は and の意味です ( ない )&( 好き ) と入力することにより ない と 好き が入った回答を抽出することになります その他にも :or や!:not を用いることが出来ます 条件を入力した後 条件規則をテスト アイコンをクリックします 1 ない and 好き を入力 2 アイコンを利用して ( ない )&( 好き ) を入力 3 条件規則をテスト をクリック
7テスト結果が表示され 1 件抽出されていることが解ります 右下エリアには実際の文章が表示されます 内容を確認後 問題なければ 保存して閉じる アイコンをクリックします 1 テスト結果 (1) 一件抽出 2 実際に使用された文章 3 保存して閉じる をクリック 8 カテゴリ ない に ない and 好き が加わりました 同様にして ないが使用されている文章の確認や 他の否定形に関するカテゴリ作成を行い 内容を確認します これらの結果は元のカテゴリには反映することは出来ません しかし エクスポートファイルからデータ整理を行うことが可能です 否定語が抽出されている場合には作業を行うことを勧めます