■プロフィール

Author:飴屋/菖蒲
(あめや・あやめ)
「UTAU」の作者です。

■アクセスカウンタ

08/10/20設置

■リンク
■ブログ内検索

■最近の記事
■カテゴリー
■最近のコメント
■月別アーカイブ
■Amazon

アソシエイトリンク

(募)英語要員
もちろん見返りはありません。
それでも、UTAU事情にあるていど精通していて、
私がexcite翻訳を宥めすかしながら、英文を作成するより、
上手に速く英語圏の方とコミュニケーション可能な方いませんか?

ちなみに私の基本性能は中学英語程度。
なので、ちょっと複雑な概念などを伝えようとすると
とても手間や労力がかかってしまいます。

私はもともと返信を書くのにとても時間がかかる人なので、
上記の事情により海外の方への返信には一日のUTAU関連に
使える時間の殆どを消費してしまいます。
(それでもなかなか先へ進めません)

「私が」という方、もしいましたら、
ここで名乗り出る必要はありません。
交流掲示板へ行って直接相手をしてあげてください。



UTAU | 16:30:22 | Trackback(0) | Comments(0)
♪ぷれ、ぷっれぱ
毎回絵で困るんですが、
今回はトレースで頑張ってみました。


元絵はこれ。
とらドラ!オープニングテーマ
プレパレード

あ、↑これはアフィリリンクなのでクリックするとアマゾンに飛びますよ。
(アフィリリンクなら画像出しても文句なかろう)

さて、今回製作に使ったフリーソフト(UTAU以外)をリストしておきます。
・DAW
 Reaper Ver0.999
・VSTエフェクト
 BLOCKFISH
 GSnap
 Classic Chorus
 Classic EQ
 Classic Reberv
 Kristal EQ(kristalの付属品)
 mda RoundPan
 LinearPhaseGraphicEQ
 BuzMaxi3
・VSTi
 AquesTone
 Ugo Rez
 Texture
 Sonata
 MinimogueVA
 Synth1
 AZR3
 FMHeaven
 Mini DrumZ
 Drumatic 3

絵とか動画製作ソフトの方は省略。
こんなところで。

動画 | 20:44:38 | Trackback(0) | Comments(0)
オーディオ出力をLAN経由でルーティングしてみるテスト
こんどはMIDIじゃなくてオーディオ出力をLAN(“隣のPCレベル”のローカル)に
乗せてみるテストをしてみたいと思ったんですが、
仮想オーディオデバイスドライバを作成するような話になって
「ちょっとやってみた」ではすまないので、もっと時間があるときにします。
※16bit・44.1k・ステレオなら1.4Mbpsなので可能なはず。

……というか、私ってJava/.NET系の業務プログラマじゃなかったっけ?


その他 | 20:13:20 | Trackback(0) | Comments(3)
MIDI出力をLAN経由でルーティングしてみるテスト
UTAUとはちょっと遠い話。

ふと、MIDI→LAN LAN→MIDI なことが出来たら面白いかも?

と、思い立って検索してみたら、OSXにはもう実装されていたり、
(参考:http://av.watch.impress.co.jp/docs/20050530/dal192.htm)
他にもWINDOWSやLINUXで動くものもいくつかあるようです。
(これはWindows:http://www.dtmm.co.jp/dtmmnews/200209/news200209091.shtml)
でも殆どが有料なんですよね。

そこで考えました。
・アプリケーション層でMIDI入出力なら比較的簡単にプログラミング出来る。
・LAN通信プログラムなら作ったことあるし、UDPにすれば、実装もそんなに面倒じゃない。
・シーケンサ等との接続はMIDI Yokeに任せればデバドラ作らなくてすむ。
ってわけで、
なんだかいけそうだったので、作ってみました。
こんなの。
midi-lan.png

テストその1
PC1でMIDIを再生して、音はPC2で鳴らす。
[PC1]
Domino
  ↓out
MIDI Yoke
  ↓in
LMC(自作アプリ)
  ↓lan

[PC2]
  ↓in
LMC(自作アプリ)
  ↓out
MGCS(XPに付属のMIDIソフトシンセサイザ)

[結果]
結構いい感じ。
Dominoでは結構音数の多いMIDIファイルを再生してみたんですが、
殆どローカルと変わりなく再生できました。

テストその2
DAWを使ってWAVは全部ローカル、MIDIは一部リモートPCで音を出してみた。

[PC1]
Reaper 0.999 (一部を外部MIDI出力)
  ↓out
MIDI Yoke
  ↓in
LMC(自作アプリ)
  ↓lan

[PC2]
  ↓in
LMC(自作アプリ)
  ↓out
Reaper 2.53 v2.53Trial
  ↓
 VSTiを色々。

[結果]
反応が遅いみたいでいまいちでした。
確認のため、Reaperでローカルとリモートで同時に同じメロディも
流してみたんですが、聞いて判るくらい遅れてました。
聞いた感じ、30〜40msくらいかな? 
やっぱアプリケーション層でやるとソフトシンセとCPUリソース取り合っちゃってダメっぽいです。
あとReaper自体も重いみたいだ。

というか、MIDIイベント丸投げする必要はないのか。
(「MIDI同期」というのがあることを知りました)
要は製作中に同期して再生できれば最後にそれぞれのPCでWAV出力後、
MIXすればいい話だし。
使えるかもしれないのでもう少し研究してみます。

今回の実験はこれまで。


その他 | 20:18:36 | Trackback(0) | Comments(3)
UTAUタグが1000件を超えてた件
いつの間にかニコニコ動画のUTAUタグの付いた動画が1000件を超えていました。
提供された原音の数も、デフォルト等、AquesTalk起源の3つを加えればもう20超えてますし。

で、今回は、これだけ音源提供者がでてきた今だから言える、音源の品質に関する「馬鹿げた提案」をしてみたいと思います。
その、「馬鹿げた提案」の前に、UTAUにこれから実装したい機能を紹介します。

実装したい機能:
原音に関わるパラメータを増設して、
prefixmapのようなシステムで、原音を音階とこのパラメータの二次元にマップするような仕組み。

つまり
あ↑弱.wavあ↑.wavあ↑強.wavあ↑叫.wav
あ弱.wavあ.wavあ強.wavあ叫.wav
あ↓弱.wavあ↓.wavあ↓強.wavあ↓叫.wav

みたいに原音を用意したら、音程とそのパラメータの数値で二次元的に
自動で切り替えられるようにしようかと。
もちろん、全部を均質に録音なんて難しいでしょうから、設定は各音毎に。
どういう仕様にするかが固まってないのでまだ先の話ですが。

これが今回の「馬鹿げた提案」の出所です。
と書けばもうおわかりと思います。

で、ここからが、本題の「馬鹿げた提案」

今まで品質向上に開発者的には「プログラムの改良」という言ってみれば“小手先の技”を繰り出していた訳ですが、ここらで、一旦基本に立ち戻ってみたいと思います。

すなわち、“人力ボーカロイド”の基本。
それは「力技」です。

サンプリング系シンセサイザでは大量サンプリングによるリアルな音質再現(つまりはこれも力技)が今の主流だと聞きますが、同じことをUTAUでやればどうだろう?
というのが今回の提案。

でも、ただ、“大量”といわれても、どう声を出したら良いのか判らないと思うので、
指針みたいなものを提示したいと思います。この辺が今回の肝。

音階を「低音」「中音(1,2)」「高音」「高高音(ウラ声?)」等の4〜5種類。
これだけでファイル数は540〜675にもなってしまいますが、
このクラスの音源は既にありますからこの程度で「大量サンプリング」なんて言えません。

これらを更に、「ささやく」「小さく」「普通」「大きく」「叫ぶ」という風にリアルに強さを
変えた分用意します。
イメージ的には、
・低音でささやく
・中音でささやく
・高音でささやく
・高高音でささやく(出来るのか?)
・低音で小さく
・中音で小さく
・高音で小さく
・高高音で小さく
・低音で普通に
・中音で普通に
・高音で普通に
・高高音普通に
・低音で大きく
・中音で大きく
・高音で大きく
・高高音で大きく
・低音で叫ぶ
・中音で叫ぶ
・高音で叫ぶ
・高高音で叫ぶ
という風に、(この例では)一人で20以上のファイルセットを用意することになります。
(※マッピングがあるので全部必須ではない。出ない声の分は当然作らなくても良い)
(※※これは「話し声」では大した差が出ないかもしれませんが、「歌い声」や「声優風声」ならばちゃんと違う声質になると思います)

ファイル数が3000とかありえない数になりますし、
録音自体もちゃんとした録音環境がないと無理でしょうが、
これなら「大量サンプリング」と呼べるのでは?

ここまでやれば、これだけ多くの音源が公開される中、
他の音源との差別化も可能でしょう。

もちろん中の人の負担も半端ではないので、他人が軽々しく要求なんてしないこと。
あくまで「やってやろう」という気概のある中の人が徒労も覚悟の上で挑戦するようなことです。


マッピングの設定や原音調整も半端ない手間です。
流石、元「人力ボーカロイド支援」ですね。上を目指すユーザーに要求する労力が尋常じゃない。

でもね。

世間のサンプリング音源はそれくらいやってますよ?
普通に計算すれば、一音1秒モノラルで全部で300メガバイト弱といったところ。
一つの楽器でサンプリングが300メガバイト程度の音源なら今の時勢ごろごろしてると思うし。
(このクラスになるのは生楽器系の高級音源らしい)
CDに焼いて配るような話になりそう。DLなら分割か?
ここまでやったら金取って良いよ。
原音調整完璧にしてキャラ絵のブックレット付けて同人系のマーケットで売りなさい。
それでUTAUもハンドルしてマージンうちにもまわしてください。
……とまあこれは半分冗談にしても。

脱線しましたが、容量の話でしたっけ。
まあ、無駄も多くなるので、
容量を節約するには、「普通」で「中音」のセットのみ全音そろえて、
後は良く使う音のみにするって手があります。
また、母音のみ全部パターン用意して、後は合成してそれっぽくするって手もあります。
外国語を歌わせようとしている方からすでに提案があったのですが、
原音設定レベルで合成した音を一音扱いするような仕組みも実装を考えていますから、それも有りでしょう。


とここまで妄想してみたわけですが、(←ここ、「妄想かよ!」と突っ込む所)

前提となる「二次元マッピング」と「合成音を一音扱いする仕組み」がまだ構想段階なので、
「俺は次世代のボーカロイドになる!」とか思っている中の人がいてもあまり先走り過ぎないように。


以上。


【追記】
中の人キターー!!

というか律儀に突っ込んでくれる皆様には泣けてきます(いろんな意味でw)

ということで、もう少しヒントを出しますと、
VOCALOIDの“ダイナミクス”を人力でやろうという発想です。
なので考えているのは、エディタ上で音を小さくすると、
自動的に小さな声のサンプリングが使われて、
大きな声にすると大声のサンプリングが使われるという仕組みです。
こうやって出音のリアルさを増そうという。

差別化と書きましたが、小さい声をどう出すか、大きな声はどう出すか等で、
その音源の個性が決まると思います。
(ハスキー、甘え声、逞しい声、等々。逆に言うと「小さい声はこう」という風に統一した方が…)

記事でも書きましたが、とても大変(しかも未知の領域なのでハイリスク)なので、
挑戦してみるのでしたら、
先に「あいうえお」だけ全パターン録音してみてUTAUでどんな感じになるか
試してみることをお勧めします。(これだけでも結構な量になりますよね)
この時点で公開してUTAU使いの方々の意見を聞いてみるのも良いかと。
なにしろ未知の領域なので情報は欲しいです。


UTAU | 14:20:49 | Trackback(0) | Comments(15)
次のページ