fc2ブログ
 
■アフィリリンク

iTunes Store(Japan)
iTunes Store(Japan)
Mac ソフトのことなら act2.com
act2.com
リンクシェア アフィリエイト紹介プログラム

■プロフィール

飴屋/菖蒲

Author:飴屋/菖蒲
(あめや・あやめ)
「UTAU」の作者です。

■アクセスカウンタ

08/10/20設置

■リンク
■ブログ内検索

■最近の記事
■カテゴリー
■最近のコメント
■月別アーカイブ
■RSSフィード
■Amazon

アソシエイトリンク

母音結合とは
先ずは注意。
今まで「音素」と呼んでいた「あ」とか「か」とかのひらがな約一文字に相当する単位は正確には「音節」と呼ぶそうで、今後は表記を改めますからご注意ください。

さて今回は、“音節オーバーラップ”で私が使っている割と重要なテクニックを紹介します。
「母音結合」と呼んでいるそれは、母音「あ」「い」「う」「え」「お」及び「ん」を前の音節の最後とオーバーラップさせて滑らかに繋がって聞こえるようにするというものです。
何でもかんでも母音は繋げれば良いってものでもありませんが、このテクニックは上手く使うと歌を自然に聞かせるのにとても有効です。
通常の音節オーバーラップとの違いはオーバーラップの長さと、エンベロープの操作です。

やり方はそんなに難しくありません。
基本は母音側のオーバーラップを100位に設定し、先行発声をその半分にして、そしてエンベロープは母音側の立ち上がりと、手前の音節のリリースをオーバーラップの長さと同じにします。
[母音側]
母音側
※↑または↓。デフォルトからだと上の方が判りやすいですが、下の方が応用が利きます。
母音側その2
[手前の音符]
手前の
緑で囲ったところが設定する場所です。
このオーバラップの数値は登場する場面によっては調整する必要があります。特に音が短い場合、パラメータの異常で音が抜けてしまうこともあるので注意が必要です。
あと、独立した音でなく余韻のように聞かせたい場合、母音側の音量を7割~半分くらいま下げると自然に聞こえるようです。

実例を示しましょう。
母音ではなく「ん」の例ですが、実際に使ったプロジェクトから「ハト」の「でん」の調整例です。
結合前
ハト-処理前
before.mp3
結合後
ハト-処理後
after.mp3
この例では「ん」の音量を70~75位に下げています。
微妙にリズムが狂って聞こえますね。調整する必要がありそうです。
オーバーラップのタイミングは音符の長さを変えても出来ますが、微調整ならば先行発声の数値を変えるという手もあります。ただしあまり大きく外れるとエラーして音が抜けますからご注意ください。

ところで、これは音程が変化していない例でしたが、前後で音程が変わっている場合は、オーバーラップだけ設定すると、重なった部分が和音になって響いてしまいます。
なので、その場合ピッチカーブで前後を合わせてやる必要があります。
・「もお」の例
pitchsamp.png
このピッチ合わせですが、実は「ハト」や「LostMyMusic」の時は全部手動で手間をかけてやってました。
それがあまりに面倒だったので、曲線表示機能とオートピッチを作成したんですが、ここは母音側を選択してオートピッチで処理してください。

解説は以上です。

・引用曲
「ハト」泰野さん http://www.nicovideo.jp/watch/sm1817563
・音源
「重音テト」の音声をお借りしました。

UTAUマニュアル | 19:56:52 | Trackback(0) | Comments(6)
コメント
管理人のみ閲覧できます
このコメントは管理人のみ閲覧できます
2008-05-16 金 22:18:59 | | [編集]
UTAUの機能要望に関して
UTAUに関しての要望なんですが、文字を普通に読み上げる(普通に喋る)ような機能を追加してくれませんか?(ローゼンが音声合成で普通に喋る「アリスプロジェクト」のようなものです。)

でなければ、文字を普通に読み上げるように(UTAUソフト側が)自動でチューニングや設定してくれる機能の追加でもいいです。

普通に読み上げる機能を搭載することによって歌の最初や途中でなんか喋るシーンがあるじゃないですか? あれができるようになればクオリィティも上がりますし、おもしろいなと思います。

又、ラジオ番組などで、音楽を掛けながらその間にDJが喋るみたいなこともできたらおもしろいなあと思います。

ぜひよろしくおねがいします。
2008-05-17 土 15:40:16 | URL | あやる [編集]
ご意見ありがとうございます
そんな機能が実現できたら素敵ですね。
ところがです。
あやるさんはご存知無いかもしれませんが、人が何気なく行っている「普通に話す」ってことなんですけど、実はこれが、機械で実現するのは結構難しいことなんですよ。
これは音声学といってかなり昔から学問の一分野が出来てしまうくらい研究されてきた分野なんです。
「そんな昔から研究されてきたのなら簡単に実現できるのでは?」
と、お思いになるかもしれませんが、実は未だにこの分野は発展途上にあって、本当に自然に話してるように聞こえる合成音声が出てきたのは比較的最近のことなんです。
もし検索して調べることが出来るなら、文字を読み上げてDJみたいなことが出来るソフトがあるかどうか探してみてください。

すこし専門的なことをいいますと、
話し声をプログラムで合成する方法はいろいろあるんですが、例えば、「あ」とか「い」という単位。これを「音節」というそうですが、これらをあらかじめ用意して、文章に従って繋いでいくことで一応文字を読み上げたようなことが出来ますよね?
これなら、UTAUでも音符を適当に並べて文字を割り当てていけば出来るはずです。
でも、やってみれば判ると思いますが、それを聞いて「普通に喋ってる」という人はいませんよね?
それは何故かといえば、抑揚やアクセントが無いからだということは判ると思います。
それらを調整するパラメータは「歌わせる」為のパラメータとは全く違う体系で、量的にもはるかに多く必要となることは判っていただけますでしょうか?
つまり結論を言うと、「文字を読んで普通に喋る機能」をつけるということは“機能を追加”なんていう生易しいものじゃなくて、UTAU以上に複雑で規模の大きいソフトを新たに作り上げるような話になるので、現状では無理なんです。
すみません。

ついでに言うと、歌唱合成ソフトである初音ミクであたかも台詞を喋っているような声を作る人がいますが、同じ手法でUTAUで「喋らせる」ことは可能です。
ただ「初音ミク」でもUTAUでもそうですが、それは大変な手間とセンスが要求される作業であることは変わりません。

これで回答になったでしょうか?
2008-05-17 土 21:38:29 | URL | 管理人 [編集]
なるほど・・・・
歌を合成しているので普通に喋る音声合成は簡単かなと思っていたんですが、本当に自然に話してるように聞こえるようにするのは結構難しいですね・・・

でも、本当に自然に話してるように聞こえなくてもいいので、「あ」とか「い」
という単位「音節」というのをあらかじめ用意して、文章に従って繋いでいくこと
で一応文字を読み上げるような機能はいいかなと思ってますができますか?
(コンピュータっぽい喋りでもおもしろいのではないかと思います。)

又、「抑揚」とか「アクセント」は「ピッチ」とかで代用できそうな気がするんですが、
「ピッチ」とかでも代用できますか?

「抑揚」とか「アクセント」だけでも(手動で設定できる機能)
を追加することは可能ですか?
2008-05-17 土 22:44:22 | URL | あやる [編集]
それなら
UTAUは、「あ」とか「い」 という単位の「音節」というのをあらかじめ用意しておいて、歌詞に従って繋いでいくことで歌を歌わせるソフトです。
ここでピンと来たらもう説明する必要は無いのですが、
実際にUTAUを使ってみましたか?
応用が利くなら、判ると思いますが、例えば「おはよう」と発話させたかったら、実際のイントネーションを手本にして「おはよう」と歌わせれば良いのです。
あやるさんのおっしゃる「本当に自然に話してるように聞こえなくてもいい」というレベルで良ければ、ピッチを使えば十分出来ますし、既にその機能はあります。
まあ、試行錯誤が必要だと思いますが、もともとUTAUは歌わせるソフトですし
というわけで、普通に喋るように「歌わせる」にはどうしたら良いかについてはご自身で研究してみてください。
歌も普通の喋りも、「発音」と「音程」と「声の大きさ」から出来ていますから、不可能では無いはずです。
2008-05-18 日 01:01:18 | URL | 管理人 [編集]
わかりました。
分かりました。 ありがとうこざいます。

ところで、「抑揚」とか「アクセント」は「ピッチ」に相当すると考えていいのですか?
2008-05-18 日 15:53:04 | URL | あやる [編集]
コメントの投稿

管理者にだけ表示を許可する