投稿日:2008-05-07 Wed
休んだ分、更新頻発中。先ず、UTAUプラグイン仕様で、格納ディレクトリの名前が「plugin」になってましたが
正解は「plugins」でした。お詫びして訂正いたします。
というかzip版にはpluginsディレクトリに実装例(ソース付き)が入っているので判ると思いますが。
というわけで話題の「ぼかりす」
すごく気になるわけですが。なんか楽しそうだし。
件の後藤氏だっけ?
音高検出関連で結構特許出願しているようです。
というか、競合勢力が少なそうなんで、DCTとかFFTとかACFとか自己相関とかWavletとか、
基本技術さえ知ってれば、割と普通に思いつきそうなことまで、特許にされてそうで
ちょっと怖かったり。
ちなみにUTAUのエンジンの音高検出は“特許文書風”に書くと、
【課題】
入力である単音の音声信号(ファイル)に対して、短い時間単位で高精度に音高推定を行うための装置である。
【解決手段】
入力信号を短いブロックに分け、それらに対して信号処理(モデル化)を行い、音声波形の周期の複数の候補を抽出する。次に高調波の存在に着目した重み付け評価値を算出し、各ブロック毎に有力候補を推定する。
この時、可能な音声の基本周波数範囲内に候補が無かった場合、そのブロックを無声子音部分としてマークする。
次にブロック毎に推定された有力候補から周波数を算出し、そこから一定の範囲内で周波数成分を精細に分析し、ここで最終的な精度で音高の推定値を決定する。
この後、無声子音部以外で不連続に大きく外れた推定値を除外するため、連続性に着目しつつもう一度、最終的な精度の分析を行い推定値の補正を行う。(以下略
とか。
全然“特許風”じゃないかも。
難しく書いてるけど要は力技です。被ってないと思う。
2-passで検出するのがアイデアといえばアイデアだけど、
こんな誰でも思いつく発想を権利化しようなんて思いませんから(ていうかするな)
上記文書を元にプログラムでもなんでも好きに作ってください。
スポンサーサイト
△ PAGE UP