「小説を音楽にする」をコンセプトとするユニットYOASOBIの楽曲「アイドル」について、PhytonのライブラリLibrosaを使用して音響分析する方法を解説します。LibrosaはPythonの音響信号処理ライブラリであり、音楽データを様々に分析することができます。
音声認識AIの記事を読んでると、必ず出てくるワード。 「MFCCを抽出して...」 「メル周波数ケプストラム係数で特徴量を...」 「librosa.feature.mfcc()で...」 は?MFCCって何? しかも名前が長い。「メル周波数ケプストラム係数」って、どう考えても呪文だろ。
低周波数の部分は解像度高い、高周波数は粗めというのがメル周波数のような対数周波数の特徴。ただし元々のスペクトルが線形なので、フィルタバンクかけても結果はご覧の通り。 今回は振幅を対数を取って表示した(ちなみに)。上のスペクトログラム ...