市來健吾の日記

プログラマ、(元)物理屋(ナノテク、流体)

ずっと気になっていた phase vocoder (wikipedia) について勉強


  • 名前が悪いよな、 phase vocoder って。 ロボット・ボイスを作る奴じゃなくて、こいつは Fourier 解析を施して、 周波数ごとの強度と位相の情報をもとに信号を復元するプロセスのこと。

  • 波数空間でデータに細工したりできるのがポイント。 何もしなけりゃ、Fourier 変換して Fourier 逆変換するだけなので、何も起きない訳で。

  • 応用に、復元する時の time base を延ばしたり縮めたりすることで 音程は変化させずにゆっくりとかはやくとか再生できる。

  • これまで WaoN がらみで、 power spectrum だけ見ていて、 phase について考えたこともなかった。 これが、 short time FFT でも低音成分がそれなりに残るミソなのかな? まだよく分かっていない。

  • 応用レベルでは未だに色々と議論というか改良の余地があるようだな。

  • 1/24/2007: 活用中 (実際には soundtouch という library に付いて来る soundstretch を使ってる)

  • 2/10/2007: gWaoN に実装。 visualize してその威力に驚く