投稿日:2008-05-07 Wed
休んだ分、更新頻発中。先ず、UTAUプラグイン仕様で、格納ディレクトリの名前が「plugin」になってましたが
正解は「plugins」でした。お詫びして訂正いたします。
というかzip版にはpluginsディレクトリに実装例(ソース付き)が入っているので判ると思いますが。
というわけで話題の「ぼかりす」
すごく気になるわけですが。なんか楽しそうだし。
件の後藤氏だっけ?
音高検出関連で結構特許出願しているようです。
というか、競合勢力が少なそうなんで、DCTとかFFTとかACFとか自己相関とかWavletとか、
基本技術さえ知ってれば、割と普通に思いつきそうなことまで、特許にされてそうで
ちょっと怖かったり。
ちなみにUTAUのエンジンの音高検出は“特許文書風”に書くと、
【課題】
入力である単音の音声信号(ファイル)に対して、短い時間単位で高精度に音高推定を行うための装置である。
【解決手段】
入力信号を短いブロックに分け、それらに対して信号処理(モデル化)を行い、音声波形の周期の複数の候補を抽出する。次に高調波の存在に着目した重み付け評価値を算出し、各ブロック毎に有力候補を推定する。
この時、可能な音声の基本周波数範囲内に候補が無かった場合、そのブロックを無声子音部分としてマークする。
次にブロック毎に推定された有力候補から周波数を算出し、そこから一定の範囲内で周波数成分を精細に分析し、ここで最終的な精度で音高の推定値を決定する。
この後、無声子音部以外で不連続に大きく外れた推定値を除外するため、連続性に着目しつつもう一度、最終的な精度の分析を行い推定値の補正を行う。(以下略
とか。
全然“特許風”じゃないかも。
難しく書いてるけど要は力技です。被ってないと思う。
2-passで検出するのがアイデアといえばアイデアだけど、
こんな誰でも思いつく発想を権利化しようなんて思いませんから(ていうかするな)
上記文書を元にプログラムでもなんでも好きに作ってください。
音声研究の分野で、音高検出の方法として結構有名なのが、現和歌山大学教授の河原英紀先生が開発したTEMPOってのがありますね。
これは特許として公開されているので閲覧してみるのもいいかもしれません。
ちなみに、TEMPOを含めた、音声合成システムのデモがここで体験できます。
http://www.wakayama-u.ac.jp/~kawahara/STRAIGHTadv/index_j.html
これは特許として公開されているので閲覧してみるのもいいかもしれません。
ちなみに、TEMPOを含めた、音声合成システムのデモがここで体験できます。
http://www.wakayama-u.ac.jp/~kawahara/STRAIGHTadv/index_j.html
2008-05-07 水 22:07:58 |
URL |
[編集]
すげえ。
音声合成は検索していろいろ調べていましたが、これは知りませんでした。
デモの音声とか自然すぎます。
音声合成は検索していろいろ調べていましたが、これは知りませんでした。
デモの音声とか自然すぎます。
2008-05-08 木 02:36:11 |
URL |
管理人
[編集]
△ PAGE UP
