fc2ブログ
 
■アフィリリンク

iTunes Store(Japan)
iTunes Store(Japan)
Mac ソフトのことなら act2.com
act2.com
リンクシェア アフィリエイト紹介プログラム

■プロフィール

飴屋/菖蒲

Author:飴屋/菖蒲
(あめや・あやめ)
「UTAU」の作者です。

■アクセスカウンタ

08/10/20設置

■リンク
■ブログ内検索

■最近の記事
■カテゴリー
■最近のコメント
■月別アーカイブ
■RSSフィード
■Amazon

アソシエイトリンク

UTAUタグが1000件を超えてた件
いつの間にかニコニコ動画のUTAUタグの付いた動画が1000件を超えていました。
提供された原音の数も、デフォルト等、AquesTalk起源の3つを加えればもう20超えてますし。

で、今回は、これだけ音源提供者がでてきた今だから言える、音源の品質に関する「馬鹿げた提案」をしてみたいと思います。
その、「馬鹿げた提案」の前に、UTAUにこれから実装したい機能を紹介します。

実装したい機能:
原音に関わるパラメータを増設して、
prefixmapのようなシステムで、原音を音階とこのパラメータの二次元にマップするような仕組み。

つまり
あ↑弱.wavあ↑.wavあ↑強.wavあ↑叫.wav
あ弱.wavあ.wavあ強.wavあ叫.wav
あ↓弱.wavあ↓.wavあ↓強.wavあ↓叫.wav

みたいに原音を用意したら、音程とそのパラメータの数値で二次元的に
自動で切り替えられるようにしようかと。
もちろん、全部を均質に録音なんて難しいでしょうから、設定は各音毎に。
どういう仕様にするかが固まってないのでまだ先の話ですが。

これが今回の「馬鹿げた提案」の出所です。
と書けばもうおわかりと思います。

で、ここからが、本題の「馬鹿げた提案」

今まで品質向上に開発者的には「プログラムの改良」という言ってみれば“小手先の技”を繰り出していた訳ですが、ここらで、一旦基本に立ち戻ってみたいと思います。

すなわち、“人力ボーカロイド”の基本。
それは「力技」です。

サンプリング系シンセサイザでは大量サンプリングによるリアルな音質再現(つまりはこれも力技)が今の主流だと聞きますが、同じことをUTAUでやればどうだろう?
というのが今回の提案。

でも、ただ、“大量”といわれても、どう声を出したら良いのか判らないと思うので、
指針みたいなものを提示したいと思います。この辺が今回の肝。

音階を「低音」「中音(1,2)」「高音」「高高音(ウラ声?)」等の4~5種類。
これだけでファイル数は540~675にもなってしまいますが、
このクラスの音源は既にありますからこの程度で「大量サンプリング」なんて言えません。

これらを更に、「ささやく」「小さく」「普通」「大きく」「叫ぶ」という風にリアルに強さを
変えた分用意します。
イメージ的には、
・低音でささやく
・中音でささやく
・高音でささやく
・高高音でささやく(出来るのか?)
・低音で小さく
・中音で小さく
・高音で小さく
・高高音で小さく
・低音で普通に
・中音で普通に
・高音で普通に
・高高音普通に
・低音で大きく
・中音で大きく
・高音で大きく
・高高音で大きく
・低音で叫ぶ
・中音で叫ぶ
・高音で叫ぶ
・高高音で叫ぶ
という風に、(この例では)一人で20以上のファイルセットを用意することになります。
(※マッピングがあるので全部必須ではない。出ない声の分は当然作らなくても良い)
(※※これは「話し声」では大した差が出ないかもしれませんが、「歌い声」や「声優風声」ならばちゃんと違う声質になると思います)

ファイル数が3000とかありえない数になりますし、
録音自体もちゃんとした録音環境がないと無理でしょうが、
これなら「大量サンプリング」と呼べるのでは?

ここまでやれば、これだけ多くの音源が公開される中、
他の音源との差別化も可能でしょう。

もちろん中の人の負担も半端ではないので、他人が軽々しく要求なんてしないこと。
あくまで「やってやろう」という気概のある中の人が徒労も覚悟の上で挑戦するようなことです。


マッピングの設定や原音調整も半端ない手間です。
流石、元「人力ボーカロイド支援」ですね。上を目指すユーザーに要求する労力が尋常じゃない。

でもね。

世間のサンプリング音源はそれくらいやってますよ?
普通に計算すれば、一音1秒モノラルで全部で300メガバイト弱といったところ。
一つの楽器でサンプリングが300メガバイト程度の音源なら今の時勢ごろごろしてると思うし。
(このクラスになるのは生楽器系の高級音源らしい)
CDに焼いて配るような話になりそう。DLなら分割か?
ここまでやったら金取って良いよ。
原音調整完璧にしてキャラ絵のブックレット付けて同人系のマーケットで売りなさい。
それでUTAUもハンドルしてマージンうちにもまわしてください。
……とまあこれは半分冗談にしても。

脱線しましたが、容量の話でしたっけ。
まあ、無駄も多くなるので、
容量を節約するには、「普通」で「中音」のセットのみ全音そろえて、
後は良く使う音のみにするって手があります。
また、母音のみ全部パターン用意して、後は合成してそれっぽくするって手もあります。
外国語を歌わせようとしている方からすでに提案があったのですが、
原音設定レベルで合成した音を一音扱いするような仕組みも実装を考えていますから、それも有りでしょう。


とここまで妄想してみたわけですが、(←ここ、「妄想かよ!」と突っ込む所)

前提となる「二次元マッピング」と「合成音を一音扱いする仕組み」がまだ構想段階なので、
「俺は次世代のボーカロイドになる!」とか思っている中の人がいてもあまり先走り過ぎないように。


以上。


【追記】
中の人キターー!!

というか律儀に突っ込んでくれる皆様には泣けてきます(いろんな意味でw)

ということで、もう少しヒントを出しますと、
VOCALOIDの“ダイナミクス”を人力でやろうという発想です。
なので考えているのは、エディタ上で音を小さくすると、
自動的に小さな声のサンプリングが使われて、
大きな声にすると大声のサンプリングが使われるという仕組みです。
こうやって出音のリアルさを増そうという。

差別化と書きましたが、小さい声をどう出すか、大きな声はどう出すか等で、
その音源の個性が決まると思います。
(ハスキー、甘え声、逞しい声、等々。逆に言うと「小さい声はこう」という風に統一した方が…)

記事でも書きましたが、とても大変(しかも未知の領域なのでハイリスク)なので、
挑戦してみるのでしたら、
先に「あいうえお」だけ全パターン録音してみてUTAUでどんな感じになるか
試してみることをお勧めします。(これだけでも結構な量になりますよね)
この時点で公開してUTAU使いの方々の意見を聞いてみるのも良いかと。
なにしろ未知の領域なので情報は欲しいです。


スポンサーサイト



UTAU | 14:20:49 | Trackback(0) | Comments(17)