UTAUはVB6.0とVC++(VS6.0のコンパイラ)で出来ています
UTAU Ver0.1.79 リリースしました。

ダウンロードページ(直通)

【6/1 23:50 追記】
Ver0.1.79のインストーラー版のダウンロードリンクが今までVer0.1.77になっていました。
リンクを直しましたので、Ver0.1.79のインストーラー版を既にダウンロードした(と思っている)方は再度ダウンロード願います。
お手数をおかけして申し訳ありません。
【/追記ここまで】


主にバグフィックスです。
インターフェースの変更は殆どありません。
エンジン部はまた少し改良しました。音質が若干変わっているかもしれません。
その他細かい修正内容はまた別途記事を用意します。

※あと、スクリプトの下位互換性修正をしました。
 リスク込み・自己責任でもWin98(SE)・WinMEで動かしたいという方は「続きを読む」からどうぞ。

続きを読む >>
UTAU | 01:51:13 | Trackback(0) | Comments(4)
いきなりレベル高っ!
ちょっと前の記事ですが「UTAU」で検索してて見つけました。

UTAUに挑戦してみた。

ここでブログ主さんがUTAUのデフォルト音声で「AXIA〜かなしいことり〜」を歌わせたのを公開されているんですが、これが「デフォルト音声でここまで出来るのか!?」って思うくらいいきなり高レベルなんです。(少なくとも私の耳には)
初音ミクをお使いになる方のようで、ミク用に作成したVSQをインポートされて、UTAU側では特に調整せずDAW側で「初音ミク用のDAWの設定から、さらにEQをかっちりかけるというアプローチで調整した」そうです。「これではまだ大々的に公開できる水準じゃない」んだそうですが、この方がタイミングの調整とかピッチ操作までこなすようになられたら(いろいろな意味で)大変なことになりそうです。

って、ブログを良く見たら『すっぴん調教』の人じゃないですか!

前に「DTMな人がUTAUに興味を持って使いこなしだしたら、私は足元にも及びません」みたいなことを書きましたが、どうやらそれが現実化しつつあるようです。

……とりあえずEQの使い方を勉強しようかな。


UTAU | 00:32:41 | Trackback(0) | Comments(2)
もう一つ忘れてた
Ver0.1.77で、一部には割と影響の大きい修正をしたのを忘れていました。
設定画面V1.77
「レンダリング時にファイルの存在チェックを行い、なるべく音抜けしないようにする」
prefix.mapを設定している場合のみ関係するオプションです。
チェックを入れると、レンダリング時にファイルチェックを行い、プリフィックス付きの音階でも原音ファイルが無かった場合、プリフィックス無しの原音ファイルを採用します。
その分再生時やwavファイル作成時のバッチファイル作成時間(「外部プロセス実行中」のダイアログが出るまでの待ち時間)が若干長くなります。

不完全なライブラリをご使用の際などにご活用ください。


UTAU | 20:50:23 | Trackback(0) | Comments(0)
UTAUをWin98系で使うには(まだ使えない)
「UTAUをWin98系で使う方法」について情報提供がありました。
(あったのは数日前でして、記事にするのが遅くなってしまいました)

実は以前に「WinMEで使えないか?」という問い合わせをいただいたことがありまして、
WAVを作る為のバッチファイルスクリプトをWin2000以降のコマンドプロンプト用から、
Win98とかでも動く形式に改めようとしたことがありました。
ただ、その時はどうしても上手く行かなくて変更は半端に終わったんですが。
実はそれが0.1.75以降に搭載されています。
もちろん、2000やXP以降での動作は変わりません。

で、その半端なスクリプトをWin98で検証してくださった方がいまして、上手く行かない原因を究明してくださいました。(ありがとうございます)
正常に動かすにはUTAU側のプログラムを修正する必要があるのですぐにというわけにはいきませんが、次回版リリース時には「非推奨・自己責任」ながら、Win98、WinMEで動作させる方法をアナウンスできると思います。

検証してくださったのは、バッチファイルのコマンド修正からexeのバイナリ修正までこなす方で、現状の0.1.75をバイナリエディタで修正して対応させる方法までを書いた丁寧な解説文をいただいているのですが、
作者が自ら最新版のバイナリ修正を推奨するわけには行きませんので、情報提供者さまには申し訳ないのですが、こういう形での返答とさせていただきました。

というわけで、次回のバージョンアップは早めにしようと思います。


UTAU | 22:48:56 | Trackback(0) | Comments(7)
ピアノロールの訳
DTM界隈で一瞬叩かれたりするようになったのは、良いことなのか悪いことなのか。
本当に「一瞬」ですけどね。
というか、もともとUTAUは相手にされなくて当然のソフトですから(そもそも「素人の実験」というカラーが強い)、あまり真っ当なDTMの場で名前を出すと恥をかきますよ?
(というのが作者の見解ですが、評価してくださるのはありがたく思っています)
名前だけ一人歩きして性能が追いついていない状況ですから。
って、私のせいじゃん!

と、前置きはこのくらいにして、UTAUのインターフェースがボーカロイドエディタに似ているそうです。
一部では「クローン」とまでいわれているそうですが、持っている方、どう思われますか?
そんなに似ていますか?
私は持っていないので何とも言えませんが、ぶっちゃけるとUTAUのGUI(ピアノロール)の元ネタはこれです。
Cherry
MIDI Sequencer Cherry
私がピアノロールエディタというものに触れたのもこれが最初でした。
このピアノロール画面、今でこそ一般的になった(?)感がありますが、初めて触った時はとても扱いにくい印象をもったものでした。といっても当時も今も楽譜もろくに読めない音楽素人ですが。
それはそれとして要は『慣れ』。Cherryは動作が軽いので今では音程を耳コピするのに重宝しています。
で、MIDIシーケンサーとWAV切り張りツールでは概念が全く違うんですが、「ピアノロールで音階を編集できたら便利かな」と思ったのはこのソフトが頭にあったからでした。
そして、ピアノロール部だけ作ってあとは『人力』でやっていたことや使ってみて「あったらいいな」と思った機能を詰め込んでいったのが今の形です。

さて、ご質問があったのでお答えすると、
ロールの基本
基本は四分の四拍子固定で、1から2の間が一小節、青い縦線はその四分の一なので四分音符一個分になっています。

今回特にオチはありません。
それでは。

UTAUネタ | 00:00:28 | Trackback(0) | Comments(3)
オートピッチツール
オートピッチツールも色々追加していたことを忘れていました。
新オートピッチ
・先ず上部に「保存」「読込」「削除」
左のボックスに名前を入れて「保存」で画面の数値が保存されます。
読込みはドロップダウンリストから選んで「読込」。
いらないエントリは選んで「削除」です。
ただし「削除」を使った直後に読み込もうとすると偶にエラーを起こしますのでご注意ください。(おいおい)
また、選択した状態で「保存」すると若干不可解な動作をしますが、これはバグとして確認しています。
次期バージョンまでにはなんとかする予定です。すみません。

・「音符にパラメータを保存する」
 チェックを入れると音符のプロパティのOthersに「開始」と「幅」が保存されます。
・「保存したパラメータを優先する」
 チェックすると上記のオプションで保存された数値が優先されます。
※これらは先行発声を変えた等でピッチ曲線がずれることがありますが、そんなとき、チェックを入れて実行すると画面の数値が前と違っていても前に実行した時の数値で曲線が設定できるという機能です。
※※ですので、数値を変えて色々試す場合は下のチェックを外してください。


UTAUマニュアル | 13:50:51 | Trackback(0) | Comments(0)
UTAU 0.1.77 リリース
ダウンロードはダウンロードページから。
また例によってinfoseek支部にアップしました。

エンジン部を若干改良しました。
少しだけ安定性が増してるかもしれません。
目に見える修正点は以下の通り。

・LengthにL64までを追加。
length

・母音結合をツール化しました。(「母音結合とは 」を参照のこと)
 選択範囲内の対象となる音符に対して設定します。
 メニューの「ツール」→「母音結合...」から使えます。
  母音結合
 画面はこれ。
  自動母音結合1
 あと、自動エンベロープもこの画面に隠してあります。
  自動エンベロープ
 が、実装が暫定(私のしている作業を半自動化しただけ)なので、偶然出す方法を見つけても(割と簡単ですが)自己責任で使用してください。(サポート・解説はしません)

・ピッチエディタに追加。
新ピッチエディタ(0.1.77)
v-zoom「+」「-」
 縦方向のズームボタンです。
modeに「F」ボタン
 フリードローモードになります。
「T」ボタン
 テキストが出ます。変更して閉じると反映します。主に他の音符からのコピペ用です。
縦スクロールバー
 まあ、見ての通りです。
※「T」ボタンで出るのはこれです
ピッチテキスト
【追記】↑プラグインの受け渡し形式やustファイル内と違い、区切り文字が半角スペースになっていることにご注意ください。

以上。

UTAUマニュアル | 03:04:56 | Trackback(0) | Comments(2)
出た!UTAU用女声ライブラリ「百音(ももね)」
タイトルは某ブログの真似です。すみません。

こちらの動画でUTAU用の女声素材を配布すると宣言しておられたこの動画のUP主さまですが、
ついに、ライブラリ名『百音』と名づけて5/22の0:00から配布を開始されました。
該当ブログによると、配布直前にトラブルに見舞われたようで、現在「あいうえお」のように五音づつ繋がったファイルの配布となっているようです。
早速ダウンロードして分割したり、UTAUに入れたりしてみました。
ノイズがちょっと多めで音量がもう少しだったり「ふぁ」「ふぉ」等が無かったりと若干不完全な所もありますが、十分使えます。日本語的に基本的な音節は一通り揃ってますし、これをもって「新ライブラリ『百音』の登場」といって良いでしょう。
で、“UTAUで使えるライブラリが一つ増えた記念”にひとつ歌ってもらいました。
eigyouchu1.mp3 (曲はくちばしP氏の『本日営業中』 )
(最低限の調声だけしたバージョンで、まだまだ調声が足りませんが)

追記
5/24より「桃音」(名前は「桃音」に改めたそうです)は分割版がver1.1として配布されています。
「桃音」配布サイト

UTAU | 19:54:33 | Trackback(0) | Comments(0)
そして音符のプロパティ
実はすっぴん調教からヒントを得た調声処理の実験は、公開されているVSQが丁度良い具合だったので、同じはやや〆さんの「夢みることり」を題材にしてたんです。
でも、テト支援で頑張ってる人がいるのに横やりを入れるようで気が引けて、完成後に「ぴんぽんだっしゅ!」に変更してやり直したっていう経緯がありました。
まあでも、お陰で今の方法で元になるVSQがあれば素早くあのレベルまで持っていけることが確認できたので良しとします。
引っ込めた「夢みることり」はフルであるんですが、こんなのを作ってみた。
忙しい人の為の重音テトによる「夢みることり」

さてそれでは本題の調声の解説に入ります。

今回解説するのは基本だけで、ほとんどが音節の種類によって決め打ちで処理できる内容です。
一応重音テトの音声に特化した調声も述べてみます。

□母音と「を」、「ん」
フレーズの頭にある母音はデフォルトのままにします。
それ以外は手前に「っ」(つまり休符)が無い限り全て母音結合処理をします。
これは録音された母音の原音はほぼ全てが喉で、大げさに言えば咳をするような(「声門破裂音」と呼ぶらしい)発音で、それが語中にあると不自然に聞こえてしまうからです。
ただしフレーズの中程でも単語の頭にあって強調する場合や、一音一音区切ったように発音する場合等、例外もあります。

□か行、た、て、と、が行、だ、で、ど、ば行、ぱ行(先行発声、オーバーラップしない音)
最終処理まで行うと(主にリバーブで)発音が不明瞭になる場合、音の前に64分休符を挿入すると聞き取りやすくなるようです。
この短い休符の挿入は、音程の差にもよりますが、オートピッチ処理後に行った方が良いようです。つまり音程の滑らかな繋ぎの途中にブランクを入れる事になります。

□つ、ち系(「ちゃ」とか「つぁ」とか)
基本的に原音設定がちゃんとしてれば問題は無いはずですが、
最終的に「す」、「し」に聞こえてしまう場合、先行発声の更に前に隙間をあける必要があります。
現状のUTAUでは結構面倒です。次の方法が考えられます。
a.手前に先行発声よりちょっとだけ長い休符を入れる(その分手前の音符は短くなる)
b.原音の設定で頭にブランクを残すようにする。
※bの場合は不可能ですが、aで手前の音符が無くなってしまうor短すぎて不自然になる場合、前回おまけで説明したstpを設定して先行発声の長さを切り詰める必要があります。

ちなみに音符の長さはUTAU画面の右下、左から二番目に選択部の長さが秒単位で表示されるのでそれを1000倍すれば、設定数値(msec単位)と比較できます。

□さ行、は行、「ふぁ」系
基本的に原音設定がちゃんとしてれば問題は無いはずです。
これも原音の設定で先行発声が手前の音符の長さ以上になってしまう場合、stpの設定をする必要が出てきます。
又は音符自体が短い場合、あえて先行発声を小さな値にして無声化してしまう方が良い場合もあります。この場合先行発声の値や原音の波形を参考にして音符内の発声を子音部だけにします。
これは前項の「つ」、「ち」系でも同じことが言えます。

□ほかの種類の音節は音符側に特に調整項目は無かったと思います。(思い出したらまた書きます)

■重音テトに特化した調声
重音テトの音声は全般的に子音が弱く、立ち上がりがゆっくりです。
なのでUTAUで短い音符にすると必ず尻上がりの横倒し台形エンベローブになってしまいます。
これはこれで独特の聴感なのですが、やっぱりこのままでは不自然です。
そこでそれを少しでも緩和するために、私は出来る限り頭を強調して終りに向かって傾斜しているエンベロープにしています。
ただ先行発声の頭から強調するとリズムがおかしくなるかもしれないのでピークは本当の音符の頭になるようにします。

とりあえず思いつくのはこれくらいです。
また思い出したり、補足事項が出てきたら記事にします。
それでは。

UTAU調声 | 12:49:56 | Trackback(0) | Comments(2)
まずは原音側の設定を
さる場所を覗いてみると調声にかなり手間取っている様子が伝わってきます。
そこで、調整方法を私なりにまとめてみようと思います。

先ず原音の設定ですが、中テンポ(120〜160程度)の曲で、設定を確定させて、あとは殆どいじらないのが本来の使い方(そういうつもりで作った)です。

いろいろパラメータが多すぎて既に混乱が生じているようですが、
私の原音設定方法が固まってきたのでここに晒しておきます。

※固定部分、最初・終りのブランクは共通事項なので略して先行発声とオーバラップのみ記述します。
□あ〜お:
  先行発声・オーバラップ共に設定しません。
□か〜こ:
  先行発声・オーバラップ共に設定しません。
  ※か行は発声前に少しでも無音部分が無いとリバーブ等で発音が潰れてしまうことがあるので頭にブランクを残してその分先行発声を設定しても良いと思います。
□さ〜そ:
  先行発声の値は子音部分の真ん中より右寄りに設定。オーバーラップは先行発声から左に50msec位に設定します。(エディタの目盛り0.0〜0.1の半分くらい)
□た、て、と、てぃ、とぅ:
  先行発声・オーバラップ共に設定しません。
  ※か行と同じく発声前に少しでも無音部分が無いとリバーブ等で発音が潰れてしまうことがあるので頭にブランクを残してその分先行発声を設定しても良いと思います。
□つ、つぁ、つぃ、つぇ、つぉ、
□ち、ちゃ、ちゅ、ちぇ、ちょ:
  先行発声は値は子音部分の真ん中より右。オーバーラップは設定してはいけません。
  ※これらは先行発声しつつもその直前に一瞬無音部分が必要な子音で、ハイテンポな曲の時調声に苦労します。(「ぴんぽんだっしゅ!」で「つ」が「す」に聞こえるのはこれでした)
□な〜の:
  先行発声は値は頭から20〜25msec程度のところに設定。(エディタの0.0〜0.1の4分の1くらい)
  オーバーラップは頭の立ち上がり分くらい。
□は、ひ、へ、ほ、
□ふ、ふぁ、ふぃ、ふぇ、ふぉ:
  さ行と一緒ですが、先行発声の値は子音部分の真ん中より右寄り、サ行よりも母音部の頭に接近にさせて設定。オーバーラップは先行発声から左に50sec位に設定します。(エディタの目盛り0.0〜0.1の半分くらい)
□ま〜も:
  な行と同じ。先行発声は値は頭から20〜25msec程度のところに設定。(エディタの0.0〜0.1の4分の1くらい)
  オーバーラップは頭の立ち上がり分くらい。
□や、ゆ、よ、いぇ:
  発声状態によって違いますが、とりあえず「ま行」「な行」と一緒。
□わ:
  発声状態によって違いますが、とりあえず「ま行」「な行」と一緒。
□ん:
  母音(あ〜お)と同じ。
□が〜ご・だ・で・ど・ば〜ぼ・ぱ〜ぽ
 「か行」とかと同じ。

■残りは研究中。

ついでにおまけ
ハイテンポな曲等で直前の音符の長さよりも先行発声の方が長くなってしまうとその音符がまともに発音しなくなります。
そんなときは、原音の設定を変えるのではなく、音符のプロパティの「others」に「stp=」を設定して、その分、同じ値だけ先行発声を減らすという手が使えます。
原音設定の「先頭のブランク」は処理前に無用部分をカットしますが、音符のプロパティにある「stp」は処理の最後に先頭から設定値(msec)だけをカットします。
こうすると子音部が切り詰められた形になり、VocaloidでVELを高く(だと思う。逆だったかな?)したような効果が擬似的に得られます。
ただし長さだけで強調はしてくれないので、その分は別の方法で補う必要があります。
この方法が有効なのは、以下の音節です。(多分。間違っていたらごめんなさい)
 さ、し、す、せ、そ、
 つ、つぁ、つぃ、つぇ、つぉ、
 ち、ちゃ、ちゅ、ちぇ、ちょ、
 は、ひ、ふ、へ、ほ、
 ふぁ、ふぃ、ふぇ、ふぉ


UTAU調声 | 18:58:10 | Trackback(0) | Comments(0)
テト声の調整に本腰が入った理由
前にちょっと触れて「あとで述べます」と書いた話題です。
結論を先に言うと、“くぎゅボイス”の使用を自重する方向に行くためです。

というのは、気にする人は気にしますし、ツール作者自身がこういうもの(ある意味MAD作品)を率先して製作しているようでは、真っ当にUTAUを使ってくださる方に迷惑がかかってしまうかもしれないからです。

くぎゅボイスの「何処がどの位いけないのか」については、誤解の生じやすい微妙な話題も含んでいるので、ここでそれを論じるのは避けて、今後どうするのかだけを述べます。

色々検討した結果、
1.今後は、くぎゅボイスを使用したUTAU作品の新たな公開はしない。
2.既に公開しているものについては、「問題の無い音源」を用いたものに順次リプレイスしていく。
という結論に達しました。
2番は時間がかかると思いますが、解説動画その2あたりから手をつけようと思っています。

あと、可能性はほぼ無いと思いますがもし万が一、くぎゅボイスの問題がクリアになれば(権利元が条件を提示する等)この処置は撤回されるものとします。

これらは、あくまで私の自主規制であって、決して他人に推奨しているものではありません。
作品の製作・公開は各自の判断と責任にのっとって行ってください。


さて、それで「今後は重音テトメインで行くのか?」と聞かれればそうでもありません。
問題なく使える音声があれば何でも使っていくつもりです。
というか「UTAU+くぎゅボイス」を超える魅力的な音声ライブラリが登場することを願って止みません(釘宮病w)


その他 | 18:34:57 | Trackback(0) | Comments(5)
ぴんぽん☆だっしゅ!
「ボーカロイドをトレースするソフトじゃないか?」というご意見を頂きましたが、ボーカロイドのトレースしかできないのは作者の方です。クリエイティブな才能が無くてすみません。

さて、前回の記事で製作した「ぴんぽんだっしゅ!」ですが、更に調整を進めて、コーラスとか合の手まで全部テトにして公開しました。

(ニコニコのアカウントが無い方は「>>続きを読む」からどうぞ)
あれから「すっぴん調教」の処理のところVSTを入手したりKRISTALという個人・非営利ならフリーのVST対応ソフトを使ってみたりといろいろやってみたんですが、なかなか満足な結果を出すのが難しく(主に私のスキル不足が原因ですが)、結局、動画のコメントにも書きましたが、この曲ではコンプレッサー二種とリバーブはお手軽で結果も無難だったSoundEngineFreeのものを使っています。
動画の画面の方は、ちょっと忙しいですが、曲線表示モードの画面を曲に合わせて(手動で)スクロールさせましたので調声の参考にしていただければと思います。

PS.今回は滑舌(「かつぜつ」で何故か変換できないIME)も頑張ってみました。
……が、どうしても「つ」が「す」に聞こえるんですよね。何でだろう? 今後の課題です。

続きを読む >>
動画 | 00:12:15 | Trackback(0) | Comments(2)
これはつかえる
ちょっと前の初音ミクみくの記事から知ったんですが、

これ、UTAUの調声に応用出来そうです。

方針としては、
1.すっぴんボカロレベル(に近いところ)まで持っていく
2.あとは「すっぴん調教」と同じ。

実際にやってみます。
(画像が多いのでご注意ください)

続きを読む >>
UTAU | 18:15:31 | Trackback(0) | Comments(3)
母音結合とは
先ずは注意。
今まで「音素」と呼んでいた「あ」とか「か」とかのひらがな約一文字に相当する単位は正確には「音節」と呼ぶそうで、今後は表記を改めますからご注意ください。

さて今回は、“音節オーバーラップ”で私が使っている割と重要なテクニックを紹介します。
「母音結合」と呼んでいるそれは、母音「あ」「い」「う」「え」「お」及び「ん」を前の音節の最後とオーバーラップさせて滑らかに繋がって聞こえるようにするというものです。
何でもかんでも母音は繋げれば良いってものでもありませんが、このテクニックは上手く使うと歌を自然に聞かせるのにとても有効です。
通常の音節オーバーラップとの違いはオーバーラップの長さと、エンベロープの操作です。

やり方はそんなに難しくありません。
基本は母音側のオーバーラップを100位に設定し、先行発声をその半分にして、そしてエンベロープは母音側の立ち上がりと、手前の音節のリリースをオーバーラップの長さと同じにします。
[母音側]
母音側
※↑または↓。デフォルトからだと上の方が判りやすいですが、下の方が応用が利きます。
母音側その2
[手前の音符]
手前の
緑で囲ったところが設定する場所です。
このオーバラップの数値は登場する場面によっては調整する必要があります。特に音が短い場合、パラメータの異常で音が抜けてしまうこともあるので注意が必要です。
あと、独立した音でなく余韻のように聞かせたい場合、母音側の音量を7割〜半分くらいま下げると自然に聞こえるようです。

実例を示しましょう。
母音ではなく「ん」の例ですが、実際に使ったプロジェクトから「ハト」の「でん」の調整例です。
結合前
ハト−処理前
before.mp3
結合後
ハト−処理後
after.mp3
この例では「ん」の音量を70〜75位に下げています。
微妙にリズムが狂って聞こえますね。調整する必要がありそうです。
オーバーラップのタイミングは音符の長さを変えても出来ますが、微調整ならば先行発声の数値を変えるという手もあります。ただしあまり大きく外れるとエラーして音が抜けますからご注意ください。

ところで、これは音程が変化していない例でしたが、前後で音程が変わっている場合は、オーバーラップだけ設定すると、重なった部分が和音になって響いてしまいます。
なので、その場合ピッチカーブで前後を合わせてやる必要があります。
・「もお」の例
pitchsamp.png
このピッチ合わせですが、実は「ハト」や「LostMyMusic」の時は全部手動で手間をかけてやってました。
それがあまりに面倒だったので、曲線表示機能とオートピッチを作成したんですが、ここは母音側を選択してオートピッチで処理してください。

解説は以上です。

・引用曲
「ハト」泰野さん http://www.nicovideo.jp/watch/sm1817563
・音源
「重音テト」の音声をお借りしました。

UTAUマニュアル | 19:56:52 | Trackback(0) | Comments(6)
【再録】音符の編集の基本操作
前の記事だと判り難いのでマニュアル用にリライトしてます。

UTAU v0.1.75現在の仕様を解説します。

音符の右端の方へマウスカーソルを持っていって、カーソルが「左右矢印」になったところで、マウスボタンを押し込み、ドラッグ(ボタンを押したままマウスを移動)すると音符の長さを変更できます。

このとき、
1.対象の音符の次が音符の場合
 ・音符が短くなる方向へ変更すると、以下のように隙間に休符が現れます。
音符の編集1
 ・また、音符が長くなる方向へは変更出来ません。
音符の編集2

2.対象の音符の次が休符の場合
 ・音符が短くなる方向へ変更すると、次の休符がその分伸びます。
note-edit03.png

 ・音符が長くなる方向は、次の休符の長さ分まで伸ばすことが出来ます。
note-edit04.png

以上が基本動作ですが、このままでは次に音符があった場合、それ以上音符を伸ばすことができません。
このときSHIFTまたはCTRLキーを押しながら操作することで次の音符の位置より先に音符を伸ばすことが出来ます。

3.SHIFTを押しながら操作すると、
 次が音符か休符かに関わり無く、伸ばしても縮めても長さ変更分だけ、操作した音符以降が全てずれます。
音符の編集1

4.CTRLをを押しながら操作すると、次が音符か休符かに関わり無く、その長さが短縮されます。
 この場合、長さを伸ばす限界は次の音符(or休符)の長さ分で、限界まで伸ばすと次の音符が無くなってしまいます
音符の編集3

文章では判りづらいとおもうので、一通り読んだ後、実際に操作して確認してみてください。

UTAUマニュアル | 18:00:00 | Trackback(0) | Comments(0)
テトはくぎゅボイスでは無いです。
なんでわざわざこんなことを記事にしなければならなくなったのかというと、
ボカロ界隈では割と有名ブログな初音ミクみくさんに、「くぎゅボイス=重音テト」みたいなことが書かれていてそれで(5/15 01:44 問題の記述の削除を確認しました。みくミク管理人さま、素早い対応ありがとうございます)誤解が広がっているみたいだからです。
重音テトの声は有志の方が声を提供なさっています。
考えてみれば、上がっている動画だけ見てる人の中にそう思ってしまう人がいても当然だったのですが、ちょっと失念していました。
なので、初音ミクみくの記事に驚いて、慌てて記事を書いた次第です。

【23:48 追記】
ちなみに、私は重音テトコミュニティ(ってあるのか?)には直接関わっていません。
活発に使ってくださる方が集まってるという意味で時々見に行きますが。
やはり技術者は技術者らしくエンジンの改良等、ソフトウエアの開発に力を入れるべきかなと。
時々「僕が一番UTAUをうまく使えるんだ」的に動画を上げたりするのは、まあその一環と思ってください。
でもDTM的センスは殆ど無いので、DTMerな方がこのクセ有るツールを使いこなしだしたら、おそらく私なんかは足元にも及びません。
もっとも、そういう方にとってUTAUの出力は「聞くに堪えない」もののようなので、当面はこの状況が続きそうですが。
ですから、そうですね。UTAUを使ってやろうと思って下さる方はそんな私の上げる動画を「ライバル視」していただければベストではないでしょうか?
(というか「うぬぼれるなよ、お前の力で勝ったのではない。UTAUの性能(を一番理解しているというだけ)のおかげで勝ったのだ」とか言われそうだ)


UTAU | 22:57:42 | Trackback(0) | Comments(0)
森之宮先生☆ガチ
「森之宮神療所☆」歌わせちゃいました。
(ニコニコのアカウント無い方は下の「続きを読む>>」へどうぞ)

重音テト(CV小山乃舞代)・くぎゅ・デフォ妹の豪華メンバー(?)です。

実験段階の新エンジンで歌わせています。
高音がかすれないでキンキン声になるのが特徴。(ダメじゃん)
なので、重音テトは初期の各一音のバージョンを使っています。

ちなみに新エンジンは音質に問題があったり(動画ではキツめのエコーでごまかしてます)、計算量とメモリ使用量が半端無く増えてたりと、いろいろあって当面出せないと思います。


続きを読む >>
動画 | 18:42:17 | Trackback(0) | Comments(0)
先行発声と特開2002-221978

人生は是勉学の事さんの記事からこんなのを知りました。
特開2002-221978「ボーカルデータ生成装置、ボーカルデータ生成方法および歌唱音合成装置
以下。【要約】の引用

【課題】 音節を構成する音素のうち、子音に対向する音素を音符の発生タイミングにあわせて発声することにより、伴奏に合わせたバーチャルシンガによる自然な歌唱を実現する。
【解決手段】歌詞に対応した音節毎の発音タイミングデータを含むボーカルデータを予め記憶する。再生処理を始めると、音符「ド」に対応した音節「さ」を発声させるとき、子音「s」の発声動作を音符の発音タイミングよりも前に始め、母音「a」の発音タイミングを音符「ド」の発音タイミングに合わせる。これにより、伴奏に遅れることなく、バーチャルシンガによる自然な歌唱を可能にする。


法律に詳しくないので、この「特開」ってのがどういうステータスなのか判りませんが、
技術的なことに突っ込むと、
まず、この要約ではUTAUの「先行発声」に非常に近いことを言っています。(厳密に同じではありません)
それでは「UTAUの先行発声は特許侵害なのか?」といったらそうではありません。

よく読めば判りますが、主軸となっているのは「子音−母音」という音韻があったとき、母音の発現にタイミングを合わせることで歌唱を自然にするということで、その先に書かれていることはそのためのタイミングデータ生成手段・ボーカルデータ生成手段・データ出力手段でした。

つまり、「楽譜にあわせて音素wavファイルを切り張りする時、タイミングを調整しないとリズム音痴になるからその調整手段を提供しただけ」のUTAUはこの特許にかすりもしないって事になります。
そもそも「先行発声」自体は“現象”もしくは“事実”であって“発明”ではありませんし。

ただし、先行発声に関わるプラグインを作成する方は、そのデータの作成方法に気をつける必要があるかもしれませんね。

UTAU | 00:32:28 | Trackback(0) | Comments(7)
釘宮病と重音テト 〜 原音毎の難しさ 〜
合成音声にしろ人の声にしろ、原音には個性がありますね。
それは、発声の仕方から、録音状態、エフェクトの有無等、単純な「誰々の声」という以上に個性があります。

というのは、手持ちの源音の中ではくぎゅボイスが一番色々使えるってことで殆どそればっかり使って来て、ちょっと「釘宮病」になりかかっていまして。
(あんな音源だけでも中毒性が。恐るべし釘宮Virus)
それはともかく、ちょっと思い立って、いまいち食指が動かなかった重音テトの音源を使ってみようという気になりまして、いろいろやってみたところ、勝手が違うんですよね。思うように行かない。
で、何とかここまで持ってきて、
課題曲はひぐらしの「you」(428KB)
判りました。食指が動かなかった理由が。
音が濁るのはまた別の話なのでここでは置いといて、
聞きなれた声と比べて発声にメリハリが無かったんです。そりゃプロのベテラン声優と比較してたら目劣りして当然ですよね。
もっとアタックを強めに、つまりハッキリ発音したら調教しやすくなると思います。
が、しかし、ツール作者が原音の声優さんにダメ出しするなんて技術の逆行現象(*)を許してはいけません。
そこで最初の「原音の個性」の話になるんですが、原音が違えばテクニックも変わるってことで、ここは技術でカバーです。
思い切ってアタックを強調するようにエンベロープを変えてみました。
テトで「you」その2(428KB)
……微妙?
さらにここは安易にwav出力後、エコーで誤魔化してみる。
テトで「you」その3(454KB)
時間をかければもっと上手く歌ってくれそうな気がしてきましたが、どうでしょう?

結果のustファイルはこちら。
you_teto.ust (※使う時はファイル名の.txtを.ustに変更のこと)
参考にするなり、続きを入力して公開するなり、好きに使ってください。

原音毎に調教の仕方を研究する必要があるんだなぁという、そんな話。

(*)技術の逆行現象:『本末転倒』ともいう。

UTAUマニュアル | 00:02:03 | Trackback(0) | Comments(3)
Ripplesとか
ぼかりすの衝撃はいろんなところを活性化しているみたいですね。
zhuowareさんのところで「ボーカルからピッチカーブと音量カーブを取り出しSMFで書き出す実験」をやっているのを発見したので早速DLして試してみました。
っていうかこの方、Tcl使いなんですね。Tclはさっぱり判りません。

とりあえず、以前使ってHDDに残っていたごまえーのアカペラを切り取って読み込ませてみました。
ごまえー分析
おお! ピッチと音量のカーブが表示されてます。
ピッチはどんなアルゴリズムで取得してるんでしょう?
これで、フォルマントや音量の変化から音節を推定出来れば完璧ですね。
ってそこまではやらないのか。音節は手入力のようです。

ボーカロイドシリーズに読み込ませるのが目的のようで、出力はsmf形式でした。
音符無しでCCの8番(Volume)とピッチベンドイベントばかりのファイルが吐き出されました。
流用してUTAUで何か出来ないかと思ったんですが、ちょっと難しそうです。
周波数ベースでテキスト出力とかしてくれたら、色々実験出来たのに。
Tclはさっぱりだし、やっぱ自力でやるしかないか。


その他 | 01:01:31 | Trackback(0) | Comments(4)
調整(調教)について
Q.UTAUの調教に法則はありますか?

A.あります。

もちろん聴感優先なことは前提ですが、
「感覚だけが頼り」ではいくら時間があっても足りません。
多少なりと法則を知っていれば試行錯誤の手間をかなり減らせます。

以下は私の試行錯誤や波形の観察から導き出した経験則です。
もしかしたら間違ってるかもしれませんが、参考にしてもらえれば幸いです。

まずは必須なもの
・さ行
・「ち」「つ」
・は行
これらの音は、直前の音を侵食して子音を発声させないとリズムが狂うだけでなく、
発音自体が不明瞭になってしまいます。オーバーラップも控えめにします。
※「ち」、「つ」は明らかにさ行と違うんですが、法則が良く判っていません。

有った方が自然
・な行
・や行
・ら行
発声の予備動作に母音の変化が伴うため、原音によって必要な先行にかなり差があります。
これらの音は普通音節内で直前の母音と滑らかに繋がって発音されるので適宜オーバーラップさせます。

は行とかと波形が似てるけど先行発声してはいけない音
・か行
・「た」「て」「と」
・ぱ行
※通常はオーバーラップもしません。

ところで、具体的な長さですが、音符の長さや歌詞等で変わってくるので
一概には言えません。自分で歌ってみたり、人が歌うのを聞き込んで色々試して
各自、正解を探してください。
ボーカロイド製品をお持ちなら、wav出力させて波形を比較するのも面白いかと思います。

最後に。
「いろいろ訊く前に自分で試す」が原則です。
「こうだったよ!」というご報告は歓迎ですので何か発見が在りましたら是非お知らせください。


UTAUマニュアル | 00:07:40 | Trackback(0) | Comments(0)
「夕日坂」リベンジ中
調教作業、大変すぎです。
とりあえずUTAUのユーザーインターフェースで欲しい機能は一通り全部作りました。
でも、したい調教に手が届くようになった反面、作業量はまた増えてしまいました。
機械的な反復作業を自動化して、品質を上げる作業に時間を割けるようになったってことなんですが。

今、オリジナルのボーカルを抜き出してその波形を参考に細かいレベル調整を仕込んでいます。
今まで手が出せなかった作業なので勝手が判らず、手探り状態で、エライ時間がかかります。
途中経過はこんな感じ。(アップロード制限があるので抜き出し)

「夕日坂」リベンジ中 : ここから ここまで

まだまだ未熟ですが、それよりも。
ここへ来て、ピッチを原音から大きく変動させた場合の音質を何とかしたくなってきました。
上げた場合でも下げた場合でも音が酷く濁るばかりでなく、組み合わせによっては変動が大きくなくても妙なノイズというか発振音みたいのが入るのは何とかしたい。
某、400氏もおっしゃっていたじゃないですか。「音の三要素」って。
このうち「ピッチ」と「強さ」はとりあえずコントロールできるようになりましたが、
(「強さ」はまだ「改善の余地があり」ですがとりあえず)
実は「音質」は『旅の途中』以降ほとんど進化してないんですよね。

ってところで、この記事のコメントにタイムリーに情報をいただきました。
ご存知の方もいるかと思いますが、STRAIGHTとかいう音声合成システムで、
デモを聞くとその品質の凄まじさが判ります。
ただ、計算量も膨大だそうで、その辺を解決する研究も行っているようす。
今、音質改善のヒントはないものかと、公開資料を読んでるところです。

あ、「音質改善のヒント」といっても全く違うアプローチなので、特許技術をそのまま使うようなことはしないし出来ませんから、勘違いしないでくださいね。

UTAU | 02:58:38 | Trackback(0) | Comments(0)
ぼかりすとか仕様書の間違いとか
休んだ分、更新頻発中。

先ず、UTAUプラグイン仕様で、格納ディレクトリの名前が「plugin」になってましたが
正解は「plugins」でした。お詫びして訂正いたします。
というかzip版にはpluginsディレクトリに実装例(ソース付き)が入っているので判ると思いますが。

というわけで話題の「ぼかりす」

すごく気になるわけですが。なんか楽しそうだし。
件の後藤氏だっけ?
音高検出関連で結構特許出願しているようです。
というか、競合勢力が少なそうなんで、DCTとかFFTとかACFとか自己相関とかWavletとか、
基本技術さえ知ってれば、割と普通に思いつきそうなことまで、特許にされてそうで
ちょっと怖かったり。

ちなみにUTAUのエンジンの音高検出は“特許文書風”に書くと、
【課題】
入力である単音の音声信号(ファイル)に対して、短い時間単位で高精度に音高推定を行うための装置である。
【解決手段】
入力信号を短いブロックに分け、それらに対して信号処理(モデル化)を行い、音声波形の周期の複数の候補を抽出する。次に高調波の存在に着目した重み付け評価値を算出し、各ブロック毎に有力候補を推定する。
この時、可能な音声の基本周波数範囲内に候補が無かった場合、そのブロックを無声子音部分としてマークする。
次にブロック毎に推定された有力候補から周波数を算出し、そこから一定の範囲内で周波数成分を精細に分析し、ここで最終的な精度で音高の推定値を決定する。
この後、無声子音部以外で不連続に大きく外れた推定値を除外するため、連続性に着目しつつもう一度、最終的な精度の分析を行い推定値の補正を行う。(以下略

とか。

全然“特許風”じゃないかも。
難しく書いてるけど要は力技です。被ってないと思う。
2-passで検出するのがアイデアといえばアイデアだけど、
こんな誰でも思いつく発想を権利化しようなんて思いませんから(ていうかするな)
上記文書を元にプログラムでもなんでも好きに作ってください。


UTAU | 00:23:21 | Trackback(0) | Comments(2)
だれだ産技研タグつけたのは
さて、話題が前後してすみません。
5日ほどPCから離れていたわけですが、
「ボカロ耳」でしたっけ?
私も「UTAU耳」になっていたようです。
作っているときは「なかなかの出来」なんて思ってたんですが、
今聞くとなんか不自然さが目立ちまくりで恥ずかしい。
プレビューしまくってると、耳が慣れて違和感に気づかなくなってしまうようです。
今後はちゃんと耳休めにインターバルを置くことにします。

いつの間にか「P名タグ」が付いてますね。
ありがとうございます。
(わからない方は「P名」で検索)
でも、おなじPでも私の場合、プログラマのPでしょう。

動画 | 00:10:10 | Trackback(0) | Comments(0)
UTAUの再配布を禁止
「禁止」なんていうと重く感じますが、フリーで配布してますので、
ダウンロードすれば済みます。
不特定多数に向けてコピーをばら撒くのを禁止するだけです。
こんな物ばら撒くのは一箇所からで十分です。

というか、主に雑誌掲載の依頼対策なんですが。
実はどういう風に取り上げてもらえるのか興味がないこともないんですが、
ツールの現状として、かなりディープに使ってもらわないとまともな結果が
出ない気がするので、「ボーカロイドみたいに歌わせることが出来るフリーツール」として
気軽に紹介されるのには抵抗があります。

それに基本技術が未完成ってこともありますし、ツールの完成形も見えてきませんので
(そんなものあるのか?)
今後はお問い合わせいただいてもそういう回答になります。

※歌わせるツールならこれとかの方がずっとボーカロイドだと思いますよ?

【08/5/15追記】
※既にメールで許可を出した分に関しては許可した時点でのバージョンのみ再配布を可能とします。



UTAU | 19:22:39 | Trackback(0) | Comments(0)