fc2ブログ
 
■アフィリリンク

iTunes Store(Japan)
iTunes Store(Japan)
Mac ソフトのことなら act2.com
act2.com
リンクシェア アフィリエイト紹介プログラム

■プロフィール

飴屋/菖蒲

Author:飴屋/菖蒲
(あめや・あやめ)
「UTAU」の作者です。

■アクセスカウンタ

08/10/20設置

■リンク
■ブログ内検索

■最近の記事
■カテゴリー
■最近のコメント
■月別アーカイブ
■RSSフィード
■Amazon

アソシエイトリンク

UTAUタグが1000件を超えてた件
いつの間にかニコニコ動画のUTAUタグの付いた動画が1000件を超えていました。
提供された原音の数も、デフォルト等、AquesTalk起源の3つを加えればもう20超えてますし。

で、今回は、これだけ音源提供者がでてきた今だから言える、音源の品質に関する「馬鹿げた提案」をしてみたいと思います。
その、「馬鹿げた提案」の前に、UTAUにこれから実装したい機能を紹介します。

実装したい機能:
原音に関わるパラメータを増設して、
prefixmapのようなシステムで、原音を音階とこのパラメータの二次元にマップするような仕組み。

つまり
あ↑弱.wavあ↑.wavあ↑強.wavあ↑叫.wav
あ弱.wavあ.wavあ強.wavあ叫.wav
あ↓弱.wavあ↓.wavあ↓強.wavあ↓叫.wav

みたいに原音を用意したら、音程とそのパラメータの数値で二次元的に
自動で切り替えられるようにしようかと。
もちろん、全部を均質に録音なんて難しいでしょうから、設定は各音毎に。
どういう仕様にするかが固まってないのでまだ先の話ですが。

これが今回の「馬鹿げた提案」の出所です。
と書けばもうおわかりと思います。

で、ここからが、本題の「馬鹿げた提案」

今まで品質向上に開発者的には「プログラムの改良」という言ってみれば“小手先の技”を繰り出していた訳ですが、ここらで、一旦基本に立ち戻ってみたいと思います。

すなわち、“人力ボーカロイド”の基本。
それは「力技」です。

サンプリング系シンセサイザでは大量サンプリングによるリアルな音質再現(つまりはこれも力技)が今の主流だと聞きますが、同じことをUTAUでやればどうだろう?
というのが今回の提案。

でも、ただ、“大量”といわれても、どう声を出したら良いのか判らないと思うので、
指針みたいなものを提示したいと思います。この辺が今回の肝。

音階を「低音」「中音(1,2)」「高音」「高高音(ウラ声?)」等の4~5種類。
これだけでファイル数は540~675にもなってしまいますが、
このクラスの音源は既にありますからこの程度で「大量サンプリング」なんて言えません。

これらを更に、「ささやく」「小さく」「普通」「大きく」「叫ぶ」という風にリアルに強さを
変えた分用意します。
イメージ的には、
・低音でささやく
・中音でささやく
・高音でささやく
・高高音でささやく(出来るのか?)
・低音で小さく
・中音で小さく
・高音で小さく
・高高音で小さく
・低音で普通に
・中音で普通に
・高音で普通に
・高高音普通に
・低音で大きく
・中音で大きく
・高音で大きく
・高高音で大きく
・低音で叫ぶ
・中音で叫ぶ
・高音で叫ぶ
・高高音で叫ぶ
という風に、(この例では)一人で20以上のファイルセットを用意することになります。
(※マッピングがあるので全部必須ではない。出ない声の分は当然作らなくても良い)
(※※これは「話し声」では大した差が出ないかもしれませんが、「歌い声」や「声優風声」ならばちゃんと違う声質になると思います)

ファイル数が3000とかありえない数になりますし、
録音自体もちゃんとした録音環境がないと無理でしょうが、
これなら「大量サンプリング」と呼べるのでは?

ここまでやれば、これだけ多くの音源が公開される中、
他の音源との差別化も可能でしょう。

もちろん中の人の負担も半端ではないので、他人が軽々しく要求なんてしないこと。
あくまで「やってやろう」という気概のある中の人が徒労も覚悟の上で挑戦するようなことです。


マッピングの設定や原音調整も半端ない手間です。
流石、元「人力ボーカロイド支援」ですね。上を目指すユーザーに要求する労力が尋常じゃない。

でもね。

世間のサンプリング音源はそれくらいやってますよ?
普通に計算すれば、一音1秒モノラルで全部で300メガバイト弱といったところ。
一つの楽器でサンプリングが300メガバイト程度の音源なら今の時勢ごろごろしてると思うし。
(このクラスになるのは生楽器系の高級音源らしい)
CDに焼いて配るような話になりそう。DLなら分割か?
ここまでやったら金取って良いよ。
原音調整完璧にしてキャラ絵のブックレット付けて同人系のマーケットで売りなさい。
それでUTAUもハンドルしてマージンうちにもまわしてください。
……とまあこれは半分冗談にしても。

脱線しましたが、容量の話でしたっけ。
まあ、無駄も多くなるので、
容量を節約するには、「普通」で「中音」のセットのみ全音そろえて、
後は良く使う音のみにするって手があります。
また、母音のみ全部パターン用意して、後は合成してそれっぽくするって手もあります。
外国語を歌わせようとしている方からすでに提案があったのですが、
原音設定レベルで合成した音を一音扱いするような仕組みも実装を考えていますから、それも有りでしょう。


とここまで妄想してみたわけですが、(←ここ、「妄想かよ!」と突っ込む所)

前提となる「二次元マッピング」と「合成音を一音扱いする仕組み」がまだ構想段階なので、
「俺は次世代のボーカロイドになる!」とか思っている中の人がいてもあまり先走り過ぎないように。


以上。


【追記】
中の人キターー!!

というか律儀に突っ込んでくれる皆様には泣けてきます(いろんな意味でw)

ということで、もう少しヒントを出しますと、
VOCALOIDの“ダイナミクス”を人力でやろうという発想です。
なので考えているのは、エディタ上で音を小さくすると、
自動的に小さな声のサンプリングが使われて、
大きな声にすると大声のサンプリングが使われるという仕組みです。
こうやって出音のリアルさを増そうという。

差別化と書きましたが、小さい声をどう出すか、大きな声はどう出すか等で、
その音源の個性が決まると思います。
(ハスキー、甘え声、逞しい声、等々。逆に言うと「小さい声はこう」という風に統一した方が…)

記事でも書きましたが、とても大変(しかも未知の領域なのでハイリスク)なので、
挑戦してみるのでしたら、
先に「あいうえお」だけ全パターン録音してみてUTAUでどんな感じになるか
試してみることをお勧めします。(これだけでも結構な量になりますよね)
この時点で公開してUTAU使いの方々の意見を聞いてみるのも良いかと。
なにしろ未知の領域なので情報は欲しいです。


UTAU | 14:20:49 | Trackback(0) | Comments(17)
コメント
妄想かよ!
突っ込んでおきます
2008-11-22 土 16:08:56 | URL | [編集]
テンポが速く激しい曲はテトで、スローでほんわかした曲は桃音で、など
曲の感じで音源の方を変えて対応してきたので(エンベロープやベロシティーを調整するスキルが低いのでorz)この構想は実現できれば自由度はかなり高くなりそうですね。
まだ詳細は公表できないのですが、私共からもいくつかの試みを提唱していきたいと
思っていますのでよろしくお願いします。

2008-11-22 土 16:25:10 | URL | ken [編集]
妄想かよ!

と、とりあえず突っ込んでおきますが、その「馬鹿げた」提案が実現出来れば、UTAUを本格的なサンプリング系シンセとして売り出す事が出来るので、是非実現して欲しいなと思います。(勿論今のUTAUも十分に活用できる素晴らしいソフトだと思っていますが)

あと、原音の収録もUTAUへの新機能の実装も大変な労力がかかると思いますので、原音だけなく、UTAUのバージョンアップ版も冗談抜きで有料にしていいと思います。
2008-11-22 土 16:38:43 | URL | kenchan [編集]
妄想かよっ!!

突っ込ませていただきましたw

非常に面白い試みだと思います。
時間があれば録音に挑戦してみたいなと思っています。
2008-11-23 日 00:24:36 | URL | 三日月(みこぜ) [編集]
まとめて失礼します
>妄想かよ
突っ込み一番乗りおめでとうございます。

>私共からもいくつかの試みを提唱していきたいと思っていますのでよろしくお願いします。
……気になります。

>有料化
……こっちも別の意味で気になります。

>挑戦してみたいなと
おお、勇敢な方が。
三日月さんのことは歌い手でありながら音源提供だけでなく
自ら積極的にUTAUを使われている方ということで、
動画は一通りチェックさせていただいてました。
(記事の追記もご参照ください)
2008-11-23 日 01:54:10 | URL | あめや [編集]
初めまして。
ScientistBと申します。
さらに手間をかけるような提案で恐縮なんですが、音符の長さによっても元のファイルを変えてはいかがでしょう?
さ行など子音部分が比較的長い音は、短い音符にするとほとんど子音が聞こえなくなる、などがよくありますので。(現在それで苦労しています)
そんな必要のない音も多いので、特定のものだけでいいと思いますが。
2008-11-23 日 15:37:40 | URL | ScientistB [編集]
ここで横レスはOKでしょうか?
私も「さ」行の短い音符では苦労していて、原音をコピーして別の
ラベルを付け、オフセットを大きく取って先行発声を切り詰めて
(普通のテンポの時はこのファイルは使いません)使っていますが、
もっとよい方法があるかもしれませんね。
もちろん専用ファイルがあればその方がよいのは確かです。
2008-11-23 日 23:31:29 | URL | ken [編集]
【追記】について
飴屋様の【追記】について、ちょっと突っ込ませて頂きたいと思います。

>エディタ上で音を小さくすると、
>自動的に小さな声のサンプリングが使われて、
>大きな声にすると大声のサンプリングが使われるという仕組みです。

ダイナミクスを複数の原音を使い分けて、よりリアルに表現するとアイデアはとても面白いと思います。
また、同じような考えで、音程も複数の原音を使い分けるというやり方も考えられます。

ただ、以前複数の音程(高音・中音・低音)が揃っている音源を使って、音程の高さにより、使い分ける方法を試したところ、、原音の音程の種類を変えたところで明らかに声質が変わってしまい、かえって不自然に聞こえてしまいました。(小生の調整が悪かったのかもしれません)

同じような問題が、ダイナミクスの場合にも起こるかもしれません。ただ、実際にやってみなければ確実な事は言えませんが・・・

楽曲の種類、または1つの楽曲のパートごとに原音を使い分けるのであれば、サンプリングが大量にあるのはとても有効だと思います。原音の使い分けを自動で行うかどうかは、ユーザーが選択できるようにした方が良いかなと思います。
2008-11-24 月 00:26:55 | URL | kenchan [編集]
使い手的回答:
今まさに、BPM160で16分音符のサ行とか「つ」とかやってますけど、
私はオフセットはそのままに先行発声を0~10の小さい値にして、逆に有声部を音符から追い出してしまってますが。(無声化)

作り手的回答:
おそらくミクで言うところの「ベロシティ」の話になります。
高くすると子音を速く短く発音するパラメーターです。
音符の長さに適用するのは感心できませんが、
判りやすく高速詠唱用ファイルに(もしくは原音の設定を複数持って)切り替える手段はあってもよいかもしれません。

そういえば、私自身はマイリストの最初にある「ハナマル☆センセイション」以来早い歌やってなかったですね。
2008-11-24 月 00:43:57 | URL | あめや [編集]
タイミングがかぶってしまいましたね
こちらはkenchanさんへ
ご意見ありがとうございます。

>音程も複数の原音を使い分けるというやりかた
これがprefix.mapです。
ただ、仕組みが大雑把なので、あえて使わない人も多いみたいです。
あと説明不足も。
http://utau2008.blog47.fc2.com/blog-entry-15.html
 ここにちょっと書いてあるだけ。もともとは“炉利音コム”用の機能でした)

>かえって不自然に聞こえてしまいました
これはもう、音源の状態によって使い分けていただく他はありません。
作り手的には“手段を提供する”だけですので。

>ユーザーが選択できるようにした方が
もちろん、prefix.mapがオプションであるように、それが大前提と考えています。
2008-11-24 月 01:13:29 | URL | あめや [編集]
使い手的回答の追記
子音化できるのは「う段」(「す」とか「つ」とか)と「ち」だけでしたね。
前言撤回。
子音化出来ないのはエンベロープの一番左の点をゼロのまま右に持ってきて対処しました。
(判るかな?)
2008-11-24 月 01:44:34 | URL | あめや [編集]
遅ばせながら
此方にコメントするのははじめましてですが、

妄想かよっ!

と突っ込みを入れさせて頂いきます。
挑戦を考えているチャレンジャーな中の人が自分だけでは無いことに安心しております。

需要の少ない(と思われる)男声音源で歌ってみた出身でもない私が生き残るにはこれしかない!と思いました。
act2(仮調整版)の区切りがつき次第、徐々に環境を整えて挑戦してみたいと思います。
2008-11-25 火 12:50:16 | URL | 乃駆 [編集]
妄想かよっ!

突っ込み損なっていたので便乗させていただきます。
このスレが伸びていくと、

現実だよっ!とか、挑戦するよっ!とかが増えて来そうですね。

ループポイントを見つけやすい音源が増えると、長い音符が作りやすくなるかも。感情ごとのバンクも良さそう・・・(こっそり妄想を追加して置きますね

音の大きさで別の原音、の所は、テストだけならドラムのプラグインで実験できそうですね。(無料のであったかな・・)
無かったら、音の大きさごとに別トラック、後からミックスでも行けるかも。
2008-11-25 火 18:42:24 | URL | つくね [編集]
妄想かよっ!

みんなやってるのでww

それはすごいですねぇw UTAUの音源で、あの中に入ってる、テキストを録音して、音源を作るので、大変だったのに、更にそれ以上をww
でも、同時にやってみたい気持ちもありますねぇw
でも、その前にオーディオインターフェース買わなきゃw
2008-11-26 水 15:09:05 | URL | 汰弥 [編集]
ツッコんでいないのは私だけですねorz
ノリは悪い方ではないのですがある意味マジで似たようなことを考えて
いたのでorz
中間音のファイルが有効なことはある程度実証しましたので省きます。
以前テトの小山乃さんに超低音ファイルの試作をお願いしたことがあって、「テトの声にならない」という結果でした。既にある原音に何らかの
加工をして(プレエンファシスの様な感じで)UTAUのエンジンを通すとかそういうのできませんか?


2008-11-29 土 01:55:37 | URL | ken [編集]
>既にある原音に何らかの加工をして
VSTエフェクトに対応とかそういう話になってきますかね?

原音→エフェクト1→エンジン→エフェクト2→出力

2008-12-03 水 16:48:02 | URL | あめや [編集]
もしくは
原音→エンジン1(熟練者による低音パラメーター設定)→原音2
(供給者サイド)

原音2→エフェクト→出力
(使用者サイド)

みたいな感じです。
2008-12-25 木 17:29:03 | URL | ken [編集]
コメントの投稿

管理者にだけ表示を許可する