DUMMY Engine (latest)

Download OpenAPI specification:Download

DUMMY の音声合成エンジンです。

クエリ作成

音声合成用のクエリを作成する

音声合成用のクエリの初期値を得ます。ここで得られたクエリはそのまま音声合成に利用できます。各値の意味はSchemasを参照してください。

query Parameters
text
required
string (Text)
speaker
required
integer (Speaker)
core_version
string (Core Version)

Responses

Response samples

Content type
application/json
{
  • "accent_phrases": [
    ],
  • "speedScale": 0,
  • "pitchScale": 0,
  • "intonationScale": 0,
  • "volumeScale": 0,
  • "prePhonemeLength": 0,
  • "postPhonemeLength": 0,
  • "pauseLength": 0,
  • "pauseLengthScale": 1,
  • "outputSamplingRate": 0,
  • "outputStereo": true,
  • "kana": "string"
}

音声合成用のクエリをプリセットを用いて作成する

音声合成用のクエリの初期値を得ます。ここで得られたクエリはそのまま音声合成に利用できます。各値の意味はSchemasを参照してください。

query Parameters
text
required
string (Text)
preset_id
required
integer (Preset Id)
core_version
string (Core Version)

Responses

Response samples

Content type
application/json
{
  • "accent_phrases": [
    ],
  • "speedScale": 0,
  • "pitchScale": 0,
  • "intonationScale": 0,
  • "volumeScale": 0,
  • "prePhonemeLength": 0,
  • "postPhonemeLength": 0,
  • "pauseLength": 0,
  • "pauseLengthScale": 1,
  • "outputSamplingRate": 0,
  • "outputStereo": true,
  • "kana": "string"
}

歌唱音声合成用のクエリを作成する

歌唱音声合成用のクエリの初期値を得ます。ここで得られたクエリはそのまま歌唱音声合成に利用できます。各値の意味はSchemasを参照してください。

query Parameters
speaker
required
integer (Speaker)
core_version
string (Core Version)
Request Body schema: application/json
required
required
Array of objects (Notes)

音符のリスト

Responses

Request samples

Content type
application/json
{
  • "notes": [
    ]
}

Response samples

Content type
application/json
{
  • "f0": [
    ],
  • "volume": [
    ],
  • "phonemes": [
    ],
  • "volumeScale": 0,
  • "outputSamplingRate": 0,
  • "outputStereo": true
}

クエリ編集

テキストからアクセント句を得る

テキストからアクセント句を得ます。 is_kanaがtrueのとき、テキストは次のAquesTalk 風記法で解釈されます。デフォルトはfalseです。

  • 全てのカナはカタカナで記述される
  • アクセント句は/またはで区切る。で区切った場合に限り無音区間が挿入される。
  • カナの手前に_を入れるとそのカナは無声化される
  • アクセント位置を'で指定する。全てのアクセント句にはアクセント位置を1つ指定する必要がある。
  • アクセント句末に(全角)を入れることにより疑問文の発音ができる。
query Parameters
text
required
string (Text)
speaker
required
integer (Speaker)
is_kana
boolean (Is Kana)
Default: false
core_version
string (Core Version)

Responses

Response samples

Content type
application/json
[
  • {
    }
]

アクセント句から音高・音素長を得る

query Parameters
speaker
required
integer (Speaker)
core_version
string (Core Version)
Request Body schema: application/json
required
Array
required
Array of objects (Moras)

モーラのリスト

accent
required
integer (Accent)

アクセント箇所

object (Mora)

後ろに無音を付けるかどうか

is_interrogative
boolean (Is Interrogative)
Default: false

疑問系かどうか

Responses

Request samples

Content type
application/json
[
  • {
    }
]

Response samples

Content type
application/json
[
  • {
    }
]

アクセント句から音素長を得る

query Parameters
speaker
required
integer (Speaker)
core_version
string (Core Version)
Request Body schema: application/json
required
Array
required
Array of objects (Moras)

モーラのリスト

accent
required
integer (Accent)

アクセント箇所

object (Mora)

後ろに無音を付けるかどうか

is_interrogative
boolean (Is Interrogative)
Default: false

疑問系かどうか

Responses

Request samples

Content type
application/json
[
  • {
    }
]

Response samples

Content type
application/json
[
  • {
    }
]

アクセント句から音高を得る

query Parameters
speaker
required
integer (Speaker)
core_version
string (Core Version)
Request Body schema: application/json
required
Array
required
Array of objects (Moras)

モーラのリスト

accent
required
integer (Accent)

アクセント箇所

object (Mora)

後ろに無音を付けるかどうか

is_interrogative
boolean (Is Interrogative)
Default: false

疑問系かどうか

Responses

Request samples

Content type
application/json
[
  • {
    }
]

Response samples

Content type
application/json
[
  • {
    }
]

楽譜・歌唱音声合成用のクエリからフレームごとの基本周波数を得る

query Parameters
speaker
required
integer (Speaker)
core_version
string (Core Version)
Request Body schema: application/json
required
required
object (Score)

楽譜情報

required
object (FrameAudioQuery)

フレームごとの音声合成用のクエリ

Responses

Request samples

Content type
application/json
{
  • "score": {
    },
  • "frame_audio_query": {
    }
}

Response samples

Content type
application/json
[
  • 0
]

楽譜・歌唱音声合成用のクエリからフレームごとの音量を得る

query Parameters
speaker
required
integer (Speaker)
core_version
string (Core Version)
Request Body schema: application/json
required
required
object (Score)

楽譜情報

required
object (FrameAudioQuery)

フレームごとの音声合成用のクエリ

Responses

Request samples

Content type
application/json
{
  • "score": {
    },
  • "frame_audio_query": {
    }
}

Response samples

Content type
application/json
[
  • 0
]

音声合成

音声合成する

query Parameters
speaker
required
integer (Speaker)
enable_interrogative_upspeak
boolean (Enable Interrogative Upspeak)
Default: true

疑問系のテキストが与えられたら語尾を自動調整する

core_version
string (Core Version)
Request Body schema: application/json
required
required
Array of objects (Accent Phrases)

アクセント句のリスト

speedScale
required
number (Speedscale)

全体の話速

pitchScale
required
number (Pitchscale)

全体の音高

intonationScale
required
number (Intonationscale)

全体の抑揚

volumeScale
required
number (Volumescale)

全体の音量

prePhonemeLength
required
number (Prephonemelength)

音声の前の無音時間

postPhonemeLength
required
number (Postphonemelength)

音声の後の無音時間

Pauselength (number) or Pauselength (null) (Pauselength)

句読点などの無音時間。nullのときは無視される。デフォルト値はnull

pauseLengthScale
number (Pauselengthscale)
Default: 1

句読点などの無音時間(倍率)。デフォルト値は1

outputSamplingRate
required
integer (Outputsamplingrate)

音声データの出力サンプリングレート

outputStereo
required
boolean (Outputstereo)

音声データをステレオ出力するか否か

kana
string (Kana)

[読み取り専用]AquesTalk 風記法によるテキスト。音声合成用のクエリとしては無視される

Responses

Request samples

Content type
application/json
{
  • "accent_phrases": [
    ],
  • "speedScale": 0,
  • "pitchScale": 0,
  • "intonationScale": 0,
  • "volumeScale": 0,
  • "prePhonemeLength": 0,
  • "postPhonemeLength": 0,
  • "pauseLength": 0,
  • "pauseLengthScale": 1,
  • "outputSamplingRate": 0,
  • "outputStereo": true,
  • "kana": "string"
}

Response samples

Content type
application/json
{
  • "detail": [
    ]
}

音声合成する(キャンセル可能)

query Parameters
speaker
required
integer (Speaker)
core_version
string (Core Version)
Request Body schema: application/json
required
required
Array of objects (Accent Phrases)

アクセント句のリスト

speedScale
required
number (Speedscale)

全体の話速

pitchScale
required
number (Pitchscale)

全体の音高

intonationScale
required
number (Intonationscale)

全体の抑揚

volumeScale
required
number (Volumescale)

全体の音量

prePhonemeLength
required
number (Prephonemelength)

音声の前の無音時間

postPhonemeLength
required
number (Postphonemelength)

音声の後の無音時間

Pauselength (number) or Pauselength (null) (Pauselength)

句読点などの無音時間。nullのときは無視される。デフォルト値はnull

pauseLengthScale
number (Pauselengthscale)
Default: 1

句読点などの無音時間(倍率)。デフォルト値は1

outputSamplingRate
required
integer (Outputsamplingrate)

音声データの出力サンプリングレート

outputStereo
required
boolean (Outputstereo)

音声データをステレオ出力するか否か

kana
string (Kana)

[読み取り専用]AquesTalk 風記法によるテキスト。音声合成用のクエリとしては無視される

Responses

Request samples

Content type
application/json
{
  • "accent_phrases": [
    ],
  • "speedScale": 0,
  • "pitchScale": 0,
  • "intonationScale": 0,
  • "volumeScale": 0,
  • "prePhonemeLength": 0,
  • "postPhonemeLength": 0,
  • "pauseLength": 0,
  • "pauseLengthScale": 1,
  • "outputSamplingRate": 0,
  • "outputStereo": true,
  • "kana": "string"
}

Response samples

Content type
application/json
{
  • "detail": [
    ]
}

複数まとめて音声合成する

query Parameters
speaker
required
integer (Speaker)
core_version
string (Core Version)
Request Body schema: application/json
required
Array
required
Array of objects (Accent Phrases)

アクセント句のリスト

speedScale
required
number (Speedscale)

全体の話速

pitchScale
required
number (Pitchscale)

全体の音高

intonationScale
required
number (Intonationscale)

全体の抑揚

volumeScale
required
number (Volumescale)

全体の音量

prePhonemeLength
required
number (Prephonemelength)

音声の前の無音時間

postPhonemeLength
required
number (Postphonemelength)

音声の後の無音時間

Pauselength (number) or Pauselength (null) (Pauselength)

句読点などの無音時間。nullのときは無視される。デフォルト値はnull

pauseLengthScale
number (Pauselengthscale)
Default: 1

句読点などの無音時間(倍率)。デフォルト値は1

outputSamplingRate
required
integer (Outputsamplingrate)

音声データの出力サンプリングレート

outputStereo
required
boolean (Outputstereo)

音声データをステレオ出力するか否か

kana
string (Kana)

[読み取り専用]AquesTalk 風記法によるテキスト。音声合成用のクエリとしては無視される

Responses

Request samples

Content type
application/json
[
  • {
    }
]

Response samples

Content type
application/json
{
  • "detail": [
    ]
}

Frame Synthesis

歌唱音声合成を行います。

query Parameters
speaker
required
integer (Speaker)
core_version
string (Core Version)
Request Body schema: application/json
required
f0
required
Array of numbers (F0)

フレームごとの基本周波数

volume
required
Array of numbers (Volume)

フレームごとの音量

required
Array of objects (Phonemes)

音素のリスト

volumeScale
required
number (Volumescale)

全体の音量

outputSamplingRate
required
integer (Outputsamplingrate)

音声データの出力サンプリングレート

outputStereo
required
boolean (Outputstereo)

音声データをステレオ出力するか否か

Responses

Request samples

Content type
application/json
{
  • "f0": [
    ],
  • "volume": [
    ],
  • "phonemes": [
    ],
  • "volumeScale": 0,
  • "outputSamplingRate": 0,
  • "outputStereo": true
}

Response samples

Content type
application/json
{
  • "detail": [
    ]
}

指定したスタイルに対してエンジン内のキャラクターがモーフィングが可能か判定する

指定されたベーススタイルに対してエンジン内の各キャラクターがモーフィング機能を利用可能か返します。 モーフィングの許可/禁止は/speakersspeaker.supported_features.synthesis_morphingに記載されています。 プロパティが存在しない場合は、モーフィングが許可されているとみなします。 返り値のスタイルIDはstring型なので注意。

query Parameters
core_version
string (Core Version)
Request Body schema: application/json
required
Array
integer

Responses

Request samples

Content type
application/json
[
  • 0
]

Response samples

Content type
application/json
[
  • {
    }
]

2種類のスタイルでモーフィングした音声を合成する

指定された2種類のスタイルで音声を合成、指定した割合でモーフィングした音声を得ます。 モーフィングの割合はmorph_rateで指定でき、0.0でベースのスタイル、1.0でターゲットのスタイルに近づきます。

query Parameters
base_speaker
required
integer (Base Speaker)
target_speaker
required
integer (Target Speaker)
morph_rate
required
number (Morph Rate) [ 0 .. 1 ]
core_version
string (Core Version)
Request Body schema: application/json
required
required
Array of objects (Accent Phrases)

アクセント句のリスト

speedScale
required
number (Speedscale)

全体の話速

pitchScale
required
number (Pitchscale)

全体の音高

intonationScale
required
number (Intonationscale)

全体の抑揚

volumeScale
required
number (Volumescale)

全体の音量

prePhonemeLength
required
number (Prephonemelength)

音声の前の無音時間

postPhonemeLength
required
number (Postphonemelength)

音声の後の無音時間

Pauselength (number) or Pauselength (null) (Pauselength)

句読点などの無音時間。nullのときは無視される。デフォルト値はnull

pauseLengthScale
number (Pauselengthscale)
Default: 1

句読点などの無音時間(倍率)。デフォルト値は1

outputSamplingRate
required
integer (Outputsamplingrate)

音声データの出力サンプリングレート

outputStereo
required
boolean (Outputstereo)

音声データをステレオ出力するか否か

kana
string (Kana)

[読み取り専用]AquesTalk 風記法によるテキスト。音声合成用のクエリとしては無視される

Responses

Request samples

Content type
application/json
{
  • "accent_phrases": [
    ],
  • "speedScale": 0,
  • "pitchScale": 0,
  • "intonationScale": 0,
  • "volumeScale": 0,
  • "prePhonemeLength": 0,
  • "postPhonemeLength": 0,
  • "pauseLength": 0,
  • "pauseLengthScale": 1,
  • "outputSamplingRate": 0,
  • "outputStereo": true,
  • "kana": "string"
}

Response samples

Content type
application/json
{
  • "detail": [
    ]
}

その他

base64エンコードされた複数のwavデータを一つに結合する

base64エンコードされたwavデータを一纏めにし、wavファイルで返します。

Request Body schema: application/json
required
Array
string

Responses

Request samples

Content type
application/json
[
  • "string"
]

Response samples

Content type
application/json
{
  • "detail": [
    ]
}

テキストがAquesTalk 風記法に従っているか判定する

テキストがAquesTalk 風記法に従っているかどうかを判定します。 従っていない場合はエラーが返ります。

query Parameters
text
required
string (Text)

判定する対象の文字列

Responses

Response samples

Content type
application/json
true

Initialize Speaker

指定されたスタイルを初期化します。 実行しなくても他のAPIは使用できますが、初回実行時に時間がかかることがあります。

query Parameters
speaker
required
integer (Speaker)
skip_reinit
boolean (Skip Reinit)
Default: false

既に初期化済みのスタイルの再初期化をスキップするかどうか

core_version
string (Core Version)

Responses

Response samples

Content type
application/json
{
  • "detail": [
    ]
}

Is Initialized Speaker

指定されたスタイルが初期化されているかどうかを返します。

query Parameters
speaker
required
integer (Speaker)
core_version
string (Core Version)

Responses

Response samples

Content type
application/json
true

Supported Devices

対応デバイスの一覧を取得します。

query Parameters
core_version
string (Core Version)

Responses

Response samples

Content type
application/json
{
  • "cpu": true,
  • "cuda": true,
  • "dml": true
}

Get Presets

エンジンが保持しているプリセットの設定を返します

Responses

Response samples

Content type
application/json
[
  • {
    }
]

Add Preset

新しいプリセットを追加します

Request Body schema: application/json
required
id
required
integer (Id)

プリセットID

name
required
string (Name)

プリセット名

speaker_uuid
required
string (Speaker Uuid)

キャラクターのUUID

style_id
required
integer (Style Id)

スタイルID

speedScale
required
number (Speedscale)

全体の話速

pitchScale
required
number (Pitchscale)

全体の音高

intonationScale
required
number (Intonationscale)

全体の抑揚

volumeScale
required
number (Volumescale)

全体の音量

prePhonemeLength
required
number (Prephonemelength)

音声の前の無音時間

postPhonemeLength
required
number (Postphonemelength)

音声の後の無音時間

pauseLength
number (Pauselength)

句読点などの無音時間

pauseLengthScale
number (Pauselengthscale)
Default: 1

句読点などの無音時間(倍率)

Responses

Request samples

Content type
application/json
{
  • "id": 0,
  • "name": "string",
  • "speaker_uuid": "string",
  • "style_id": 0,
  • "speedScale": 0,
  • "pitchScale": 0,
  • "intonationScale": 0,
  • "volumeScale": 0,
  • "prePhonemeLength": 0,
  • "postPhonemeLength": 0,
  • "pauseLength": 0,
  • "pauseLengthScale": 1
}

Response samples

Content type
application/json
0
0

Update Preset

既存のプリセットを更新します

Request Body schema: application/json
required
id
required
integer (Id)

プリセットID

name
required
string (Name)

プリセット名

speaker_uuid
required
string (Speaker Uuid)

キャラクターのUUID

style_id
required
integer (Style Id)

スタイルID

speedScale
required
number (Speedscale)

全体の話速

pitchScale
required
number (Pitchscale)

全体の音高

intonationScale
required
number (Intonationscale)

全体の抑揚

volumeScale
required
number (Volumescale)

全体の音量

prePhonemeLength
required
number (Prephonemelength)

音声の前の無音時間

postPhonemeLength
required
number (Postphonemelength)

音声の後の無音時間

pauseLength
number (Pauselength)

句読点などの無音時間

pauseLengthScale
number (Pauselengthscale)
Default: 1

句読点などの無音時間(倍率)

Responses

Request samples

Content type
application/json
{
  • "id": 0,
  • "name": "string",
  • "speaker_uuid": "string",
  • "style_id": 0,
  • "speedScale": 0,
  • "pitchScale": 0,
  • "intonationScale": 0,
  • "volumeScale": 0,
  • "prePhonemeLength": 0,
  • "postPhonemeLength": 0,
  • "pauseLength": 0,
  • "pauseLengthScale": 1
}

Response samples

Content type
application/json
0
0

Delete Preset

既存のプリセットを削除します

query Parameters
id
required
integer (Id)

削除するプリセットのプリセットID

Responses

Response samples

Content type
application/json
{
  • "detail": [
    ]
}

Speakers

喋れるキャラクターの情報の一覧を返します。

query Parameters
core_version
string (Core Version)

Responses

Response samples

Content type
application/json
[
  • {
    }
]

Speaker Info

UUID で指定された喋れるキャラクターの情報を返します。 画像や音声はresource_formatで指定した形式で返されます。

query Parameters
speaker_uuid
required
string (Speaker Uuid)
resource_format
string (Resource Format)
Default: "base64"
Enum: "base64" "url"
core_version
string (Core Version)

Responses

Response samples

Content type
application/json
{
  • "policy": "string",
  • "portrait": "string",
  • "style_infos": [
    ]
}

Singers

歌えるキャラクターの情報の一覧を返します。

query Parameters
core_version
string (Core Version)

Responses

Response samples

Content type
application/json
[
  • {
    }
]

Singer Info

UUID で指定された歌えるキャラクターの情報を返します。 画像や音声はresource_formatで指定した形式で返されます。

query Parameters
speaker_uuid
required
string (Speaker Uuid)
resource_format
string (Resource Format)
Default: "base64"
Enum: "base64" "url"
core_version
string (Core Version)

Responses

Response samples

Content type
application/json
{
  • "policy": "string",
  • "portrait": "string",
  • "style_infos": [
    ]
}

Version

エンジンのバージョンを取得します。

Responses

Response samples

Content type
application/json
"string"

Core Versions

利用可能なコアのバージョン一覧を取得します。

Responses

Response samples

Content type
application/json
[
  • "string"
]

Engine Manifest

エンジンマニフェストを取得します。

Responses

Response samples

Content type
application/json
{
  • "manifest_version": "string",
  • "name": "string",
  • "brand_name": "string",
  • "uuid": "string",
  • "url": "string",
  • "icon": "string",
  • "default_sampling_rate": 0,
  • "frame_rate": 0,
  • "terms_of_service": "string",
  • "update_infos": [
    ],
  • "dependency_licenses": [
    ],
  • "supported_vvlib_manifest_version": "string",
  • "supported_features": {
    }
}

Get Portal Page

ポータルページを返します。

Responses

音声ライブラリ管理

Downloadable Libraries

ダウンロード可能な音声ライブラリの情報を返します。

Responses

Response samples

Content type
application/json
[
  • {
    }
]

Installed Libraries

インストールした音声ライブラリの情報を返します。

Responses

Response samples

Content type
application/json
{
  • "property1": {
    },
  • "property2": {
    }
}

Install Library

音声ライブラリをインストールします。 音声ライブラリのZIPファイルをリクエストボディとして送信してください。

path Parameters
library_uuid
required
string (Library Uuid)

音声ライブラリのID

Responses

Response samples

Content type
application/json
{
  • "detail": [
    ]
}

Uninstall Library

音声ライブラリをアンインストールします。

path Parameters
library_uuid
required
string (Library Uuid)

音声ライブラリのID

Responses

Response samples

Content type
application/json
{
  • "detail": [
    ]
}

ユーザー辞書

Get User Dict Words

ユーザー辞書に登録されている単語の一覧を返します。 単語の表層形(surface)は正規化済みの物を返します。

Responses

Response samples

Content type
application/json
{
  • "property1": {
    },
  • "property2": {
    }
}

Add User Dict Word

ユーザー辞書に言葉を追加します。

query Parameters
surface
required
string (Surface)

言葉の表層形

pronunciation
required
string (Pronunciation)

言葉の発音(カタカナ)

accent_type
required
integer (Accent Type)

アクセント型(音が下がる場所を指す)

word_type
string (WordTypes)
Enum: "PROPER_NOUN" "COMMON_NOUN" "VERB" "ADJECTIVE" "SUFFIX"

PROPER_NOUN(固有名詞)、COMMON_NOUN(普通名詞)、VERB(動詞)、ADJECTIVE(形容詞)、SUFFIX(語尾)のいずれか

priority
integer (Priority) [ 0 .. 10 ]

単語の優先度(0から10までの整数)。数字が大きいほど優先度が高くなる。1から9までの値を指定することを推奨

Responses

Response samples

Content type
application/json
"string"

Rewrite User Dict Word

ユーザー辞書に登録されている言葉を更新します。

path Parameters
word_uuid
required
string (Word Uuid)

更新する言葉のUUID

query Parameters
surface
required
string (Surface)

言葉の表層形

pronunciation
required
string (Pronunciation)

言葉の発音(カタカナ)

accent_type
required
integer (Accent Type)

アクセント型(音が下がる場所を指す)

word_type
string (WordTypes)
Enum: "PROPER_NOUN" "COMMON_NOUN" "VERB" "ADJECTIVE" "SUFFIX"

PROPER_NOUN(固有名詞)、COMMON_NOUN(普通名詞)、VERB(動詞)、ADJECTIVE(形容詞)、SUFFIX(語尾)のいずれか

priority
integer (Priority) [ 0 .. 10 ]

単語の優先度(0から10までの整数)。数字が大きいほど優先度が高くなる。1から9までの値を指定することを推奨。

Responses

Response samples

Content type
application/json
{
  • "detail": [
    ]
}

Delete User Dict Word

ユーザー辞書に登録されている言葉を削除します。

path Parameters
word_uuid
required
string (Word Uuid)

削除する言葉のUUID

Responses

Response samples

Content type
application/json
{
  • "detail": [
    ]
}

Import User Dict Words

他のユーザー辞書をインポートします。

query Parameters
override
required
boolean (Override)

重複したエントリがあった場合、上書きするかどうか

Request Body schema: application/json
required
additional property
object (UserDictWord)

辞書のコンパイルに使われる情報

Responses

Request samples

Content type
application/json
{
  • "property1": {
    },
  • "property2": {
    }
}

Response samples

Content type
application/json
{
  • "detail": [
    ]
}

設定

Setting Get

設定ページを返します。

Responses

Setting Post

設定を更新します。

Request Body schema: application/x-www-form-urlencoded
required
cors_policy_mode
required
string (CorsPolicyMode)
Enum: "all" "localapps"

CORSの許可モード

allow_origin
string (Allow Origin)

Responses

Response samples

Content type
application/json
{
  • "detail": [
    ]
}