interviewscribe ユーザーズガイド ヤナセ 2012 1
1. 概要 interviewscribeは テープ起こし作業を効率的に行うためのツールです フレーズ分割 interviewscribeでは音声データを 発音している部分毎に分割し フレーズ として管理します フレーズに分割することで 数秒のフレーズ毎に聞き取り作業を進められ 再生 聞き取り テキス ト変換の一連の作業をスムーズに進めることが出来ます テープ起こし作業に特化した機能 interviewscribeでは テープ起こし作業を考慮し ダイレクトな再生位置の設定 再生速度の調整 再生音質の調整など テープ起こし作業に特化した機能を持っています システム音声入力との連携 さらに システムに備わっている音声入力機能を活用して テキスト変換を行うことも出来ます 特徴的なのは 音声入力の開始に伴ってフレーズを自動再生させることで 再生音を音声入力に入力 して テキストに変換することが出来ます この機能を使うと 良質な音声データ 例えばPodcastで配信されているニュース音声等 なら 驚 くほど簡単にテキストへ変換することが出来ます 聞き取り結果の出力 フレーズ毎に変換されたテキストを結合して 聞き取り結果テキストとして書き出すことが出来ま す フレーズテキストの結合では 発音時間や話者がわかるようなヘッダーを付けることが出来ます ま たヘッダーはsrtファイルフォーマットに準拠しているため 聞き取り結果テキストを動画の字幕テキス トとして使用することが出来ます 3
2. 聞き取りの準備 2.1. 音声ファイルを割り付ける interviewscribeを起動し 新規ドキュメントを開いたら最初に聞き取りの対象となる音声フ ァイルを[ファイル] - [音声ファイルの割付...]メニューでドキュメントに割り付けます 選択可能な音声ファイルの拡張子は.aif,.mp3,.mp4,.m4v,.m4a,.aifc,.aiff,.wav,.cafです 割り付けられた音声ファイルは そのコピーがドキュメント内に保存されますので ドキュメ ントを配布する際には 音声ファイルの権利関係を侵害しないよう ご注意下さい interviewscribe内部では 音声データを22.1kHzモノラル(L+R)として扱います 割付が行われると 初期設定状態に従ってフレーズが自動生成されます 音声データの音圧が低かったり 環境ノイズが大きくて フレーズが適切に生成されなくて も 後で調整することが出来ます 割付後は別音声ファイルを再割付することは出来ません 必要ならこのドキュメントを破棄 して 新規ドキュメントを作って下さい 4
2.2. 再生操作 音声データの再生は 出力機器を選び 一般的なプレイヤーと同様な操作で行います 再生 再生操作は[再生]メニューのショートカットキーを用いることで 効率的な作業が行えると思 います 一時停止後の再々生では 一時停止時点より指定秒 前に戻って再生を開始することが出来 ます 2.2.1. 再生開始位置と再生範囲 再生開始位置は全体音声スペクトル表示ビューおよび部分音声スペクトル表示ビューで 任意箇所をクリックして設定することが出来ます また フレーズ表示ビューおよびフレーズリストでフレーズを選択すると 選択された フレーズの先頭を再生開始位置に フレーズの末端までが再生範囲として設定されます 全体音声スペクトル表示ビューでのクリック および部分音声スペクトル表示ビューで 選択フレーズ外箇所をクリックすると フレーズの選択状態が解除され 再生範囲はデータ エンドまでとなります 5
2.4. フレーズを調整する 音声データを割り付けた時に自動生成されたフレーズが適切でない場合はフレーズを調整する ことが出来ます 2.4.1. フレーズの再生成 [フレーズの調整] タブでフレーズを再生成することが出来ます 部分音声スペクトル表示ビューのクリ ック箇所における音圧値 静寂判定値を決めるための参考用 静寂判定値 静寂の継続期間 フレーズの最短長 フレーズテキストが編集されているフレーズは再生成の対象外となります 7
2.4.4. フレーズテキストが編集されているフレーズの分割 フレーズテキストの編集は 後述の 3 聞き取り操作 にて述べますが ここではフ レーズテキストが編集されているフレーズを分割する場合の操作について説明します フレーズテキストを任意箇所で分割するには フレーズを選択し フレーズ編集タブで 編集モードにした上で 分割したい箇所に編集カーソルを移動してから [フレーズ] - [分割] メニューを指示します この操作により フレーズテキストはカーソル位置で分割されま す ① ③ ② ① フレーズを選択 ② テキスト編集モードにする ③ 分割したい箇所にカーソルを移動 2.4.5. フレーズの位置と長さを調整する フレーズビューでフレーズの両端をドラッグすることで フレーズの開始位置と長さを調 整することが出来ます 9
2.4.6. フレーズにフラグを設定する 重要なフレーズにフラグを設定することが出来ます キーを使うとフラグが設定されたフレーズを移動することが出来ます 10
3. 聞き取り操作 3.1. 対象フレーズを選択する 聞き取り操作を行うフレーズを選択します フレーズの選択は 下記操作で行います フレーズビューでフレーズをクリックする フレーズリストで対象行をクリックする キーでフレーズリストの選択行を移動させる フレーズリストがアクティブな時に有効 キーでフラグが設定されたフレーズを移動させる キーでフレーズリストを移動 11
3.3. システム 音声入力を使ってテキスト編集を行う 良質な音声データ であればMac OS 10.8の 音声入力 機能を使ってテキスト編集を効率 的に進めることが出来ます 良質な音声データとは SN比が高く 話者の滑舌が良い音声データを意味しています 3.3.1. システム 音声入力側の設定 システム環境設定 にて 音声入力と読み上げ の設定パネルを表示します ① ② ③ ① 入力機器の設定 interviewscribeで指定した出力機器からの音声が取り込める入力機器を選択します 例えば出力を内蔵スピーカーに指定した場合は内蔵マイクを入力機器として選べば音声が 取り込めます ② ショートカットの選択 interviewscribeで対応出来る下図赤線枠内のショートカットを選択して下さい ③ 言語の選択 聞き取り言語を選択します システム 音声入力はインターネットに接続出来る環境でないと使用出来ません 13
3.4. 話者を分類する 話者が複数存在する場合 質問者と回答者 または会議での発言者等 話者とフレーズを関 連づけることが出来ます 話者は 話者タブ画面にて登録 命名し フレーズリストの話者欄で選択してフレーズに関連 づけます 17
3.5. 聞き取り結果を得る 必要なフレーズのテキスト変換が終わったら聞き取り編集タブを使って 最終結果を得ること が出来ます 聞き取り結果は複数のバリエーションを持つことが出来ます 18
4. 改訂履歴 12/9/24...初版発行 12/10/25... 2.4.1 フレーズの再生成 を修正 13/5/8...ver2 による改訂 13/9/4...ver3 による改訂 20