投稿日:2008-04-29 Tue
どうやら、歌声合成の原音には声を鍛えている人の声の方が良いようです。UTAUと相性が良いという意味でも。
プロの声優の釘宮理恵さんの声なんかは、あんなにサンプルが短いのに、結果は聞いての通り。
欠点といえばUTAUの側の問題で、総合では一番良い結果を出していると思います。
発声が安定しているんですね。
次点がAquesTalk。
実績ある合成音声で、声質が歌向きかはともかく、安定度は抜群です。
合成された声を合成しなおしているので、UTAUの出力そのままだと
「何ともいえない」歌声になりますが、出力後、エフェクトを駆使すればある程度何とかなります。
こんなことを言い出した根拠は、
実は肉声を使ったフリーの読み上げ系ソフトがいくつかあって、
それに付属していた音声ファイルを使って試したことがあるんです。
「主婦の声」とか、子供の声とか。
で、判ったのは明らかに素人の声(素人でもわかるような素人の声)だと、品質に限界があるってこと。
(一つの発声の中で)声量が不安定・ピッチのぶれが大きい・発音が不明瞭となると、もうツールではどうにもなりません。
特筆すべきはloli.com氏の声。
いわずと知れた「炉利音コム」(元祖の音声ファイルの方)のことです。
そんなにしっかり声を出しているようには聞こえないのに、
各ファイル2秒くらいの録音は妙に安定していて、
UTAUで歌わせてみても、ちゃんと「割と気合の入ってない声」で綺麗に歌ってくれます。
流石に、使ってみようという人は少ないでしょうが。
関係しているのは「鍛えてる」とかだけじゃなくて、その人の声質や発声法かな?
とりあえず、
①声優さんの出すキャラクターボイスは相性が良よさそう
②合成音声の安定性は抜群
この二つからすると、ミクとかキャラクターボーカルシリーズから声をサンプリングしたら
良い音源が出来るってことになりますが……。
意味が無いですね。
スポンサーサイト
△ PAGE UP