投稿日:2009-02-18 Wed
私がやっている手法を紹介します。まずこんな歌詞・音符があったとします。

音源は手持ちのテトライブラリ。テンポ150の16分音符です。
これだと「さ」の先行発声が103msに対して16分音符の長さが100msなので、
二番目の「さ」が手前の「て」を完全につぶしてしまいます。
sassate.mp3
「さ」のエンベロープはこんな感じ。

これをこうします。

オーバーラップを思い切って大きくして(先行発声よりは小さい値に)、
次にp0をぐっと右に持って行きます。オーバーラップの線(水色)は越えない方が良いでしょう。
細かい説明は省きますが、画像を見て研究してください。
こんな風になります。

音はこちら→satesate.mp3
さてさて。
このケースでは先行発声が手前の音符の長さからあまりオーバーしてなかったので、これでなんとかなりましたが、もし大幅に超えてしてしまっていたら?
私は超高速な歌は余り歌わせないんですが、こうしたらいかがでしょう?

原音の設定を「複製」して(※複製すると上の方に現れます。不便なので改良中)、
エイリアスを「さs」とでもして、

こうして高速用のエントリを作成してしまいます。
そうすれば、テンポ240の16分音符でもこの通り。

sate-kousoku.mp3
高速な歌には皆さん苦心して工夫を凝らしているようなので参考までに。
スポンサーサイト
投稿日:2008-09-28 Sun
『ぐるぐる大航海』の調声を動画にしました。gオプションを曲の途中で変えるのは諸刃の剣で、
判らない人には多用してほしくなかったので、「中級者以上」としました。
ちなみにgオプションの使い方は
・全部に指定して、単純に声を変えるのに使う
・声の濁りを防ぐためにワンポイント的に使う
・この動画のように歌手が意図的に“ふとましく”唄ったような効果を狙う
等が考えられます。
投稿日:2008-09-12 Fri
お分かりの方はお分かりかと思いますが、オートピッチ
母音結合
オートビブラート
おま☆かせ
これらのツールは全て私の調声法の一部をツール化したものです。
なので既に独自の調声を確立しつつある諸氏には、「なんだこれ」なものに見えたかもしれません。
他に汎用的に使えるテクニックがあればツール化して行きたいのでご提案お待ちしてます。
※というかそのためのプラグイン仕様なので作れる方は作ってください。
ここまでは前フリ。
それでは本題です。
原音のピッチ変動とそれを残した場合の問題点について。
まだ言及していない点が残っているのでそのあたりを書きたいと思います。
ではまずはこれをご覧ください。

これは「重音テト」の ま.wav のF0の周波数遷移グラフです。
(縦の水色の線は0.1秒毎で、薄い横線は半音毎です)
赤い横線がこの原音の基準となる音程です。(モジュレーションが0に近づく程、各点はこの基準に近づきます)
見れば判ると思いますが、
ほぼ1音下から始まって、すぐに半音弱下まで上昇後、そのまま一旦安定、そして非常に緩やかに上昇をはじめ、0.3秒付近でようやく、基準より高めの音程で安定します。
ここで原音設定のGUIで波形を見てみると、

音程と波形の振幅がほぼ対応していることが判ります。
これは、何を表しているかというと、声が大きくなるにつれ、音程が上ずっているんですね。
まあこの事実は今回の話と関係ないのでここまでですが。
今回解説したいのは、このように音程が安定せず徐々に変化していく原音を
モジュレーションの設定なしに使おうとした場合に起こる問題点についてです。
UTAUが“切り張りツール”であることを考えれば自ずと判ることなのですが、
この「ま.wav」の周波数遷移ですと、UTAUで出力した場合、
必ず約1音下からのポルタメントがかかり、
・短い音符だと音程が上がりきらず、
・長く伸ばすと上がりすぎで、
・0.2秒ぐらいの音符だと何とか合っているように聞こえる。
つまり殆どの場合、音程が外れて聞こえます。つまり「音痴」です。
これは原音の設定で有効部分(白い範囲)を上手く音程が合っている所に設定すれば
よさそうに思うかもしれませんが、それはある程度長い音符の話で、
固定部分(ピンクの範囲)より短い音符は依然として音程が上りきらない
「歯がゆい」発声になってしまいます。
対策はいくつか考えられます。
あくまで原音の変動を生かすなら、
・tフラグで音階を微調整する。
※Fragsのtオプションは10cent単位でその音符の音程を平行移動します。
・ピッチ曲線で音符の後半が差し引きでちゃんと目的の音程に達するように調整する。
※※いずれにしても絶対音感が必須。もしくはそれに代わる分析ツールとそれを使いこなすスキル。
やはり一番現実的なのは、
・モジュレーションを小さな値(一桁以下)にしてピッチ曲線で表情付けをする。
でしょうか?
あと、私は試したことがありませんが、
後処理で、AutoTuneやGSnap等の音程補正系のボイスエフェクトをかけて
音痴を直すって手もあるかもしれません。
以上。
投稿日:2008-09-09 Tue
良い曲なのに、良い曲なのにぃぃぃ!
前者はbakerさんの強く印象の残る演奏に加えて本家を重音テトに置換したPVが秀逸!
後者はkzさんの透明感あるイントロから始まる神オケが……。
だからこそ!
テト声が「その領域に及ばず」なのが口惜しいやらもったいないやら。
もちろん難しい課題に挑むチャレンジャーの方々には敬意を表さない理由がありません。
じりじりと、確実に向上していて、とても良い感じになってるのは確かです。
これはこれで先行きが楽しみでなりません。
あくまでこれは私見ですが、
テト耳で無い人が「ズコー」となるのは、テト声独特のピッチ変動が耳にさわるから
ではないでしょうか?
今までの投稿経験からすると、声質を最大限気にする人も居るようですが、
大多数は同じ割合で声の濁り(ノイズ)がある場合と、「テト音痴」がある場合とでは
後者のほうが圧倒的に気になるようです。
となるとその「ズコー」を防ぐには、モジュレーション=0にして歌唱の癖を全て
ピッチカーブで描画すれば良いんじゃないかなと。
いや、だって、テト声は音によって抑揚が上向きだったり下向きだったりして
コントロールしずらいじゃないですか。
(「だがそれが良い」という向きもあるかと思いますが、論点はあくまで「ズコー」対策です)
もしくは、どうしても原音のピッチ変動をそのまま生かすというのなら、
UTAUでは見ることの出来ない原音のピッチカーブを意識しつつピッチ曲線を引いて、
その特徴を残しながら音痴に聞こえないように微調整するしかないでしょう。
(なんという職人芸)
最後に開発者としての立場から。
残念ながら現在のUTAUのエンジンの、原音のキー(代表する音階)を設定する処理は
完全ではなく、特にピッチが変動する原音だと、その設定値はその音に対して
人間の耳で「そのキーだ」と感じる周波数に必ずしも一致していません。
どうなるのかというと、歌わせたときにその分音痴になります。
なので、ピッチ変動のある原音に対してはモジュレーションを小さな値(10未満)に
することが推奨されます。
ちなみに余談だけど、
皆さん、モジュレーションってマイナスに出来ること知ってますか?
投稿日:2008-05-22 Thu
実はすっぴん調教からヒントを得た調声処理の実験は、公開されているVSQが丁度良い具合だったので、同じはやや〆さんの「夢みることり」を題材にしてたんです。でも、テト支援で頑張ってる人がいるのに横やりを入れるようで気が引けて、完成後に「ぴんぽんだっしゅ!」に変更してやり直したっていう経緯がありました。
まあでも、お陰で今の方法で元になるVSQがあれば素早くあのレベルまで持っていけることが確認できたので良しとします。
引っ込めた「夢みることり」はフルであるんですが、こんなのを作ってみた。
忙しい人の為の重音テトによる「夢みることり」
さてそれでは本題の調声の解説に入ります。
今回解説するのは基本だけで、ほとんどが音節の種類によって決め打ちで処理できる内容です。
一応重音テトの音声に特化した調声も述べてみます。
□母音と「を」、「ん」
フレーズの頭にある母音はデフォルトのままにします。
それ以外は手前に「っ」(つまり休符)が無い限り全て母音結合処理をします。
これは録音された母音の原音はほぼ全てが喉で、大げさに言えば咳をするような(「声門破裂音」と呼ぶらしい)発音で、それが語中にあると不自然に聞こえてしまうからです。
ただしフレーズの中程でも単語の頭にあって強調する場合や、一音一音区切ったように発音する場合等、例外もあります。
□か行、た、て、と、が行、だ、で、ど、ば行、ぱ行(先行発声、オーバーラップしない音)
最終処理まで行うと(主にリバーブで)発音が不明瞭になる場合、音の前に64分休符を挿入すると聞き取りやすくなるようです。
この短い休符の挿入は、音程の差にもよりますが、オートピッチ処理後に行った方が良いようです。つまり音程の滑らかな繋ぎの途中にブランクを入れる事になります。
□つ、ち系(「ちゃ」とか「つぁ」とか)
基本的に原音設定がちゃんとしてれば問題は無いはずですが、
最終的に「す」、「し」に聞こえてしまう場合、先行発声の更に前に隙間をあける必要があります。
現状のUTAUでは結構面倒です。次の方法が考えられます。
a.手前に先行発声よりちょっとだけ長い休符を入れる(その分手前の音符は短くなる)
b.原音の設定で頭にブランクを残すようにする。
※bの場合は不可能ですが、aで手前の音符が無くなってしまうor短すぎて不自然になる場合、前回おまけで説明したstpを設定して先行発声の長さを切り詰める必要があります。
ちなみに音符の長さはUTAU画面の右下、左から二番目に選択部の長さが秒単位で表示されるのでそれを1000倍すれば、設定数値(msec単位)と比較できます。
□さ行、は行、「ふぁ」系
基本的に原音設定がちゃんとしてれば問題は無いはずです。
これも原音の設定で先行発声が手前の音符の長さ以上になってしまう場合、stpの設定をする必要が出てきます。
又は音符自体が短い場合、あえて先行発声を小さな値にして無声化してしまう方が良い場合もあります。この場合先行発声の値や原音の波形を参考にして音符内の発声を子音部だけにします。
これは前項の「つ」、「ち」系でも同じことが言えます。
□ほかの種類の音節は音符側に特に調整項目は無かったと思います。(思い出したらまた書きます)
■重音テトに特化した調声
重音テトの音声は全般的に子音が弱く、立ち上がりがゆっくりです。
なのでUTAUで短い音符にすると必ず尻上がりの横倒し台形エンベローブになってしまいます。
これはこれで独特の聴感なのですが、やっぱりこのままでは不自然です。
そこでそれを少しでも緩和するために、私は出来る限り頭を強調して終りに向かって傾斜しているエンベロープにしています。
ただ先行発声の頭から強調するとリズムがおかしくなるかもしれないのでピークは本当の音符の頭になるようにします。
とりあえず思いつくのはこれくらいです。
また思い出したり、補足事項が出てきたら記事にします。
それでは。
△ PAGE UP