AquesTalk10 Linux マニュアル

Similar documents
AquesTalk10 Win マニュアル

AquesTalk10 Mac マニュアル

AquesTalk10 iOS マニュアル

AquesTalk2 Linux マニュアル

AquesTalk プログラミングガイド

AquesTalk Win Manual

AquesTalk for WinCE プログラミングガイド

AquesTalk10 Android マニュアル

AquesTalk2 Win マニュアル

AquesTalk Mac マニュアル

AquesTalk2 Mac マニュアル

AquesTalk2 Win マニュアル&ライセンス規定

AqKanji2Koe Win マニュアル

AqKanji2Koe Mac マニュアル

memo

RX ファミリ用 C/C++ コンパイラ V.1.00 Release 02 ご使用上のお願い RX ファミリ用 C/C++ コンパイラの使用上の注意事項 4 件を連絡します #pragma option 使用時の 1 または 2 バイトの整数型の関数戻り値に関する注意事項 (RXC#012) 共用

農業・農村基盤図の大字小字コードXML作成 説明書

7th CodeGear Developer Camp

02: 変数と標準入出力

多言語ドメイン名の実装 mdnkit 石曽根信 ( 株 ) SRA 2001/12/04 日本語ドメイン名解説 / mdnkit 1 mdnkit 多言語ドメイン名を扱うためのツールキット 正規化 エンコード変換等を提供するライブラリとコマンド 既存アプリケーシ

<< 目次 >> 1 PDF コンバータのインストール ライセンスコードの入力 PDF にフォントを埋め込みたい場合の設定 PDF オートコンバータ EX で使用しない場合 PDF コンバータ単体で使用する場合の説明 PDF コンバータのアン

slide5.pptx

Microsoft Word - Training10_プリプロセッサ.docx

PowerPoint プレゼンテーション

memo

プログラミング実習I

02: 変数と標準入出力

演算増幅器

PowerPoint Presentation

目次 目次... 1 はじめに... 3 概要... 4 サポート環境... 5 関数... 6 MEC_OpenDevice... 7 MECDevice_Release... 8 MECDevice_GetFirmVersion... 9 MECDevice_GetCoreTemperature

PowerPoint プレゼンテーション

PowerPoint プレゼンテーション

eYACHO 管理者ガイド

バイオプログラミング第 1 榊原康文 佐藤健吾 慶應義塾大学理工学部生命情報学科

24th Embarcadero Developer Camp

PowerPoint プレゼンテーション

3.Cygwin で日本語を使いたい Cygwin で以下のコマンドを実行すると それ以降 メッセージが日本語になります export LANG=ja_JP.UTF-8 これは 文字コードを日本語の UTF-8 に設定することを意味しています UTF-8 は Cygwin で標準の文字コードで, 多

memo

Microsoft Word - Cプログラミング演習(12)

Microsoft PowerPoint pptx

本書は INpMac v2.20(intime 5.2 INplc 3 Windows7/8/8.1に対応 ) の内容を元に記載しています Microsoft Windows Visual Studio は 米国 Microsoft Corporation の米国及びその他の国における登録商標です

ご利用のコンピュータを設定する方法 このラボの作業を行うには 事前設定された dcloud ラボを使用するか 自身のコンピュータをセットアップします 詳細については イベントの事前準備 [ 英語 ] とラボの設定 [ 英語 ] の両方のモジュールを参照してください Python を使用した Spar

02: 変数と標準入出力

インテル(R) Visual Fortran コンパイラ 10.0

計算機プログラミング

2006年10月5日(木)実施

4-7.コネクト2.0_電話操作マニュアル(ZoiperFree)_v1.1.0

レベルアップ詳細情報 < 製品一覧 > 製品名 バージョン < 追加機能一覧 > 管理番号 内容 説明書参照章 カナ文字拡張対応 < 改善一覧 > 管理番号 内容 対象バージョン 説明書参照章 文字列のコピー ペースト改善 ~ 子画面の表示方式 ~ 履歴の詳細情報 ~ タブの ボタン ~ 接続時の管

Microsoft Word - CBSNet-It連携ガイドver8.2.doc

Microsoft PowerPoint ppt

昨年度までの研究紹介 および 研究計画

<4D F736F F D208D C8FEE95F18DEC90AC A B D836A B2E646F63>

目次 1 はじめに 利用条件 動作環境 アドインのインストール アドインの操作方法 アドインの実行 Excel CSV の出力 テンプレートの作成 編集 テンプレートのレイアウト変更 特記

PowerPoint プレゼンテーション

Prog1_12th

Microsoft PowerPoint - exp2-02_intro.ppt [互換モード]

講習No.9

Taro-82ADAカ.jtd

PowerPoint プレゼンテーション

ファイル入出力

02: 変数と標準入出力

<4D F736F F D20B6BCB5D7B2CCDED7D8CFC6ADB1D9315F43532E444F43>

Prog1_10th

SimLab Plugins for SketchUp 評価版インストールおよびアクティベート方法 注意事項 評価版をお使い頂くには 評価用ライセンスでのアクティベートが必要です 評価用ライセンスファイルの取得を行い 手動でアクティベートする必要があります 各 SimLab プラグインは 評価用とし

はじめに SDP Generator は オーバーレイに対応した JVC カメラに画像をインポートするデータファイル (SDP ファイル ) を生成するためのアプリケーションです 本アプリケーションを使用することで スコアボードのチーム名に チームロゴや画像化された多言語の文字をカメラ映像に表示する

ポインタ変数

操作方法 XXXTOEMF は コマンドライン形式のアプリケーションです 通常のコマンドと同じように コマンドラインからの実行やバッチファイルに組み込むことが可能です インストールについては, 別紙の KDxxxx コンバートソフトの特記事項について を参照してください ここでは 直接コマンドライン

Microsoft PowerPoint - CproNt02.ppt [互換モード]

V5.0 V4.2 から V5 への 変更点 1.1 版 2010 年 03 月 26 日

Microsoft Word - Cプログラミング演習(10)

プログラミング演習3 - Cプログラミング -

Apache-Tomcat と 冗長な UTF-8 表現 (CVE 検証レポート ) 2008 年 08 月 26 日 Ver. 0.1

Microsoft PowerPoint - kougi11.ppt

PDFオートコンバータEX

WEBシステムのセキュリティ技術

管理番号 内容仮想テーブル設定画面およびマッチング条件設定画面においてコメントを設定した場合 変換エラーが発生する マッピング情報設定画面の出力情報に固定値を選択し区分に 動的バイナリ値 を指定した場合 関数を設定す

画像ファイルを扱う これまでに学んだ条件分岐, 繰り返し, 配列, ファイル入出力を使って, 画像を扱うプログラムにチャレンジしてみよう

kiso2-03.key

プログラミングI第10回

内容 1. 仕様 動作確認条件 ハードウェア説明 使用端子一覧 ソフトウェア説明 動作概要 ファイル構成 オプション設定メモリ 定数一覧 変数一

第1回 プログラミング演習3 センサーアプリケーション

02: 変数と標準入出力

memo


PowerPoint Presentation

本資料のご使用につきましては 次の点にご留意願います 本資料の内容については 予告無く変更することがあります 1. 本資料の一部 または全部を弊社に無断で転載 または 複製など他の目的に使用することは堅くお断りいたします 2. 本資料に掲載される応用回路 プログラム 使用方法等はあくまでも参考情報で

ファイル入出力

1. 新規プロジェクト作成の準備新規プロジェクトのためのフォルダを用意して そこにプロジェクトを作成します [ 新しいフォルダー ] をクリックして希望のフォルダに新しいフォルダを作成します この例では TrST_F401N_BlinkLD2 というフォルダを作成しました TrST_F401N_Bl

OpenAM 9.5 インストールガイド オープンソース ソリューション テクノロジ ( 株 ) 更新日 : 2013 年 7 月 19 日 リビジョン : 1.8

PowerPoint プレゼンテーション

Rational Roseモデルの移行 マニュアル

プログラミング基礎

メール全文検索アプリケーション Sylph-Searcher のご紹介 SRA OSS, Inc. 日本支社技術部チーフエンジニア Sylpheed 開発者 山本博之 Copyright 2007 SRA OSS, Inc. Japan All right

JDK のインストール (2012 年 8 月時点でのバージョン ) Java の実行環境 開発環境は さまざまな企業 団体が開発 配布を行っているが 当テキストでは Java の生みの親である Sun MicroSystems 社 ( 現 Oracle 社 ) の実行環境 開発環境を使用する Ja

ポインタ変数

Microsoft PowerPoint - C++_第1回.pptx

フローチャート自動生成ツール yflowgen の使い方 目次 1 はじめに 本ツールの機能 yflowgen.exe の使い方 yflowgen.exe の実行方法 制限事項 生成したファイル (gml ファイル形式 ) の開

SimLabプラグインは各機能を15回分評価版として試用できます

Studuinoソフトウェアのインストール

F KDbarcode_CODE39 Microsoft WORD/EXCEL のアドイン製品 Kernel Computer System カーネルコンピュータシステム株式会社 本社 : パッケージ販売部 横浜市神奈川区金港町 6-3 横浜金港町ビル 6F TEL:

Transcription:

AquesTalk10 Linux マニュアル 株式会社アクエスト www.a-quest.com 概要 本文書は 音声合成ライブラリ AquesTalk10 Linux をアプリケーションに組み込んで使用するためのプログラミングの方法 注意点を示したものです AquesTalk10 は かな表記の音声記号列から WAV 音声データを生成するライブラリです AquesTalk10 は 声質パラメータを指定することで様々な声質の音声を生成できる特徴があります 本ライブラリを使用するには 開発ライセンスキーの設定が必要です このライセンスキーを設定しない場合は 評価版として動作し 以下の制限があります 評価版の制限 ナ行 マ行 を指定すると すべて ヌ と発声します また 本ライブラリをアプリケーションに組み込んで使用する際には使用ライセンス 配布には頒布ライセンスが必要です ライセンスの種類や購入方法は 弊社サイトのライセンスのページを参照してください 仕様 ライブラリ形式 so 形式共有ライブラリ 対応 OS Linux x86-64(64bit 版 )/ IA-32(32bit 版 ) 入力データ形式出力データ形式声種関数 I/F マルチスレッドライブラリサイズ外部依存ライブラリ かな表記音声記号列 (Shift JIS/UTF8/UTF16) WAV フォーマット (16KHz サンプリング,16bitPCM, モノラル ) データ * サンプリング周波数は声質パラメータにより変化 ベース音素片 3 種パラメータでユーザカスタマイズ可 C 関数呼び出し 対応 約 400KByte libc.so.6, libgcc_s.so.1

ビルド 実行 ライブラリ配置 AquesTalk10 Linux のライブラリは共有ライブラリとなっています リンク時 および実行時に本ライブラリが必要になります 以下に一例として /usr/lib に本ライブラリを配置する方法を示します これによりリンク時および実行時にライブラリにアクセスできるようになります 配置ディレクトリはお使いの環境に応じて変更してください (/usr/lib64/ や /usr/lib32 など ) また バージョン番号もライブラリの実際のファイル名に合わせてください パッケージ内の lib32 フォルダが 32bit 版 lib64 フォルダが 64bit 版となります # cp libaquestalk10.so.1.0 /usr/lib # ln -sf /usr/lib/libaquestalk10.so.1.0 /usr/lib/libaquestalk10.so.1 # ln -sf /usr/lib/libaquestalk10.so.1 /usr/lib/libaquestalk10.so # /sbin/ldconfig -n /usr/lib コンパイル リンク ライブラリを呼び出すソースコードにヘッダファイル () をインクルードしてコンパイルします リンク時には -laquestalk10 を指定してリンクしてください 次に サンプルプログラム HelloTalk.c をコンパイル リンクする方法を示します $ g++ -o HelloTalk HelloTalk.c -laquestalk10 g++ の代わりに gcc でリンクするときに undefined reference to ` gxx_personality_v0' などのエラーが出る場合は -lstdc++ を追加して指定してください サンプルプログラムの実行 次のコマンドで test.wav に音声データが生成できれば OK です エラーの場合には 文字コードやライブラリの配置が正しく行われているか確認してください echo " これわ ごーせー / お ' んせーです "./HelloTalk > test.wav 音声記号列にシェルの特殊文字が含まれているので ダブルクォーテーション ( " ) で囲むなど 適当にエスケープする必要があります 文字コードは UTF8 になっています 文字コードを変更する場合は AquesTalk_Synthe_Utf8() 部分を文字コードに応じて変更してください なお 開発ライセンスキーを設定していないので 評価版の制限で ナ行 マ行 が すべて ヌ になります プログラミングの注意 AquesTalk_Synthe() 関数で返された音声データは 使用後に AquesTalk_FreeWav() で解放してください アプリ側で free() などを使用して解放すると 異なる C ランタイムの場合にハングします

関数 API AquesTalk_Synthe かな表記音声記号列 (SJIS) から音声波形を生成します unsigned char * AquesTalk_Synthe(const AQTK_VOICE *pparam, const char *koe, int *size) pparam 声質パラメータ ( 構造体 AQTK_VOICE のアドレス ) を指定 koe 音声記号列 (SJIS NULL 終端 ) を指定 size 生成した音声データのサイズが返る [byte]( エラーの場合はエラーコードが返る ) WAV フォーマットの音声データを返す ヒープ領域を関数内部で確保するので 解放は AquesTalk_FreeWave() で行う エラー時は NULL を返す このとき size にエラーコードが設定される AquesTalk_Synthe_Utf8 かな表記音声記号列 (UTF-8) から音声波形を生成します unsigned char * AquesTalk_Synthe_Utf8(const AQTK_VOICE *pparam, const char *koe, int *size) pparam 声質パラメータ ( 構造体 AQTK_VOICE のアドレス ) を指定 koe 音声記号列 (UTF-8 NULL 終端 ) を指定 size 生成した音声データのサイズが返る [byte]( エラーの場合はエラーコードが返る ) WAV フォーマットの音声データを返す ヒープ領域を関数内部で確保するので 解放は AquesTalk_FreeWave() で行う エラー時は NULL を返す このとき size にエラーコードが設定される AquesTalk_Synthe_Utf16 かな表記音声記号列 (UTF-16) から音声波形を生成します unsigned char * AquesTalk_Synthe_Utf16(const AQTK_VOICE *pparam, const unsigned short *koe, int *size) pparam 声質パラメータ ( 構造体 AQTK_VOICE のアドレス ) を指定 koe 音声記号列 (UTF-16 NULL 終端 BOM の有無は問わないエンディアンは実行環境に従う ) を指定

size 生成した音声データのサイズが返る [byte]( エラーの場合はエラーコードが返る ) WAV フォーマットの音声データを返す ヒープ領域を関数内部で確保するので 解放は AquesTalk_FreeWave() で行う エラー時は NULL を返す このとき size にエラーコードが設定される AquesTalk_FreeWave 音声データの領域を開放 void AquesTalk_FreeWave(unsigned char *wav) wav WAV フォーマットのデータ (AquesTalk_Synthe() 等で生成した音声データ ) なし AquesTalk_SetDevKey 開発ライセンスキーを設定 音声波形を生成する前に一度呼び出すことで 以降 製品版とし動作し 評価版の制限がなくなる int AquesTalk_SetDevKey(const char *key) key 開発ライセンスキー文字列 ( 半角英数 ) ライセンスキーが正しければ 0 正しくなければ 1 が返る 不正なキーでも 0 を返す場合がある このとき制限は解除されない AquesTalk_SetUsrKey 使用ライセンスキーを設定 音声波形を生成する前に一度呼び出すことで 以降 合成音声データに含まれる透かしが使用ライセンス無しから取得済みに変化する int AquesTalk_SetUsrKey(const char *key) key 使用ライセンスキー または頒布ライセンスキーの文字列 ( 半角英数 ) ライセンスキーが正しければ 0 正しくなければ 1 が返る 不正なキーでも まれに 0 を返す場合がある このときはライセンス無しのままである

音声記号列 AquesTalk10 は かな表記の音声記号列から音声を合成します 漢字を含んだテキスト文字列から音声を合成するときは 別途 言語処理ライブラリ AqKanji2Koe を用いて漢字仮名交じりテキストから音声記号列に変換する必要があります 音声記号列の詳細は 付属の音声記号列仕様書を参照してください 声質パラメータ AquesTalk10 は声質パラメータの値を変更することで 様々な声種で合成できます 声質パラメータの種類と効果を以下に示します bas spd vol pit acc lmd fsc 声色のベースとなる基本素片 F1E,F2E,M1E のいずれかを指定 話速 値が大きいほど発話速度が速い 音量 デフォルトは 100 値が大きいほど音量が大きくなる 100 以下を指定の場合は 比例して音量が変化する 100 以上を指定した場合は コンプレッサーが機能する 声の高さがパラメータに比例する アクセントの強さ 値が大きいほどアクセントによるピッチの高低が大きくなる 主に声質の高低を表現するが より複雑な声質の変化がある 声質の高低を表現 デフォルトは 100 サンプリング周波数を変化するだけなので これに応じて話速や声の高さも同時に変化する には 声質パラメータの値をセットしたプリセット声種を複数用意しています 簡単に使う場合は これを AquesTalk_Synthe() の声質パラメータのにすることができます エラーコード表 関数が返すエラーコードの内容は 次の通りです 値 内容 100 その他のエラー 101 メモリ不足 103 音声記号列指定エラー ( 語頭の長音 促音の連続など ) 104 音声記号列に有効な読みがない 105 音声記号列に未定義の読み記号が指定された 106 音声記号列のタグの指定が正しくない

107 タグの長さが制限を越えている ( または [>] がみつからない ) 108 タグ内の値の指定が正しくない 120 音声記号列が長すぎる 121 1 つのフレーズ中の読み記号が多すぎる 122 音声記号列が長い ( 内部バッファオーバー 1) サンプルプログラム 次に示すコードは 音声記号列から音声データを生成し WAV ファイルとして出力する最も単純なプログラムです ( 同等のソースが パッケージに含まれています samples/hellotalk.cpp) 7 行目ではローカル変数 voice に プリセット声種 g_voicef1 をコピーして 8 行目で話速を 120 と少し早めに設定しています 11 行目の " こんにちわ " の部分を 任意の音声記号列に変更することで 異なるメッセーを生成可能です #include <stdio.h> #include <> // AquestTalk クラスのヘッダ int main(int ac, char **av) { // 声質パラメータ AQTK_VOICE voice = gvoice_f1; voice.spd = 120; int size; unsigned char *wav = AquesTalk_Synthe_Utf8(&voice, " こんにちわ ", &size); if(wav==0) { fprintf(stderr, "ERR %d", size); // エラー時は size にエラーコードが返る return -1; } // 生成した音声データをファイルに保存 FILE *fp = fopen("zzz.wav", "w"); fwrite(wav, 1, size, fp); fclose(fp); // Synthe() で生成した音声データは 使用後に呼び出し側で解放する AquesTalk_FreeWave (wav); } return 0;

アプリ開発ガイドライン アプリケーションの開発 ( 評価での使用を除く ) は 以下のガイドラインに従ってください ライセンスキー 本ライブラリの動作は 開発ライセンスキーと使用ライセンスキー 頒布ライセンスキーの 3 種類の関連キーに依存します これらのキーは 各ライセンス購入時に発行されるライセンス証に記載されています AquesTalk_SetDevKey() をアプリケーションの起動初期に一度呼び出します には開発ライセンスキーを指定します これにより製品版として動作し 評価版の制限がなくなります AquesTalk_SetUsrKey() をアプリケーションの起動初期に一度呼び出します AquesTalk_SetDevKey() との呼び出し順序は任意です には 使用ライセンスキー または頒布ライセンスキーを指定します この指定により 合成音声データに含まれる透かしが 使用ライセンス無しの状態から取得済みに変化します この変化による聴感上の違いはありません 頒布ライセンスによりアプリを配布する場合は 頒布ライセンスキーを指定して呼び出します それ以外の場合は エンドユーザが使用ライセンスキーを指定できるようにします なお エンドユーザが個人かつ非営利の利用の場合は使用ライセンスが不要なので 使用ライセンスキーが未指定の場合は この関数の呼び出しをスキップして構いません 関数ののチェックは必ず行い エラーの場合はエンドユーザにその旨を通知してください 声質パラメータ エンドユーザによる声質パラメータの変更機能の有無は任意です 変更可能にする場合 アプリケーション間での声質パラメータの値を共有するために 声質パラメータの値を写像しないでください 例えば 話速のパラメータの範囲は 50 から 300 ですが これを 0 から 100 の範囲にマッピングしてエンドユーザに提示しないでください エンドユーザに提示する各パラメータの名称には に記載の漢字名称 ( 話速など ) や 3 文字の構造体変数名 (spd など ) を用いるのが望ましいです 文書履歴 日付版変更箇所更新内容更新者 2017/10/12 1.0 新規作成 N.Y