音楽情報処理

1. オーディオ指紋に基づく音楽検索/同定システムの研究開発

オーディオ指紋と呼ばれる音楽特徴量に基づき、楽曲の断片から元の楽曲の曲名やアーティスト名を自動的に検索するシステムの研究開発を行っております。SN比が-5程度(楽曲よりもノイズのほうが多い)でも98.5%以上の精度という非常に頑健なシステムであり、実用化に向け研究開発を進めています。

2. 楽曲のインデックスのコンパクト化に関する研究

3. 歌声からの楽曲検索システムの研究開発

曲の一部を歌うことで、大量の曲データから目的の曲を検索するシステムを開発しています。 まずは歌声から歌詞を高精度に認識し、その結果から候補を絞り込みます。 その後、メロディー情報を用いてスコアの再計算を行い、最終的な検索結果を得ます。 現在は、歌詞認識の高精度化や、歌詞があいまいだった場合への対処などを研究しています。

検索アルゴリズムの概要
  1. 入力歌唱を音声認識し,複数の認識結果候補を出力
  2. 各認識結果候補に対して
    1. 単語の区切り時刻を推定
    2. 歌詞と音符の対応表から,各音符の区切り時刻を推定
    3. 各音符ごとに音の高さ,長さを計算
    4. メロディの一致度スコアを計算
    5. 音声認識スコアとあわせ,その曲に対する最終スコアを計算
  3. 最終スコアが最も高かった曲を出力