ノイズを含む音響信号からの音楽演奏情報の抽出と演奏の再現
井口研究室 下条 敬洋
1. はじめに
昨今の音楽メディアは、CDやDATのようにディジタル化された音響信号を扱うも
のが主流となっている。しかしながら今までに残された貴重な音楽資料の中には、ろ
う管レコードやSPレコードのように、ノイズが多く鑑賞や利用が困難なものが数多
く存在している。
そういった背景の中で、低品質な音源として記録・保存されている音楽資産を、その
演奏表現をできるだけ忠実に残したままディジタル化してアーカイブとして保存する
ことにより、古い音楽メディアの再利用が可能となり、貴重な音楽資料を多くの人が
共有できるようになると考えられる。
そこで、そのような低品質な音ソースから楽譜情報を用いて音楽情報の抽出を行い、
その情報を用いて、演奏者の表現に忠実な演奏を再現する手法を提案することを本研
究の目的とする。
2. 演奏再現までの概要
まず、低品質音源のメディアの音をアナログフィルタを通すことでディジタル化し、
楽器モデルを用いて適切なノイズ除去、あるいは軽減を行う。ここで用いる楽器モデ
ルは、ピアノのモデルであり、本研究ではピアノ独奏を対象としている。
その後、得られた音響信号に対しFFTをおこない、楽譜情報を用いたトップダウン的
な音楽情報抽出を行う。抽出する情報は、以下の3つとする。
- ピッチ(音高)
- ベロシティ(音量)
- ノートオン、オフの時間
このようにして得られた音楽情報を用いることにより、MIDI 機器で演奏を再現する。
3. 楽譜情報を用いた情報抽出法
楽譜情報として得られる情報には、ピッチとおおよその拍節(音符の長さ)がある。
それを用いた具体的なトップダウン処理としては
- 楽譜から得られる、音の出現順の採譜処理
- 音符の長さからの次音の位置推測
- 採譜された音列のフィードバックによる音の位置の補正
をあげることができる。
4. 実験結果
本システムの評価をするため、筆者が MIDI 機器で演奏をおこない、その演奏に軽度
のノイズを加えた音響信号をシステムに解析させた結果と、もとの演奏データとの比
較をおこなった。その結果、音の立ち上がり時間の真値とのずれは最大で約10[ms]と
なった。人間が音の時間的なずれを認識するのは、10 〜 30[ms]といわれている。ゆ
えに良い結果を得たということができる。ベロシティについても同様に良い結果が得
られた。
5. 結論
本システムにより、音を聞き取ることが困難な音響信号からも、楽譜を用いることで
音楽演奏情報の抽出が可能となることを示した。しかしながら、まだ完全なシステム
とはいえず、テンポの速い曲や極端にテンポが変わる曲など、あらゆる楽曲に対応し
たシステムの構築が望まれるところである。