早見沙織のフォルマント解析

MikuHatsune2015-06-23

駄目絶対音感の続き。
ボイスサンプルからひたすら母音だけ抽出してフォルマントが分離できるかがんばってみた話。
 
「はやみさおりです」と言っているスペクトログラム。「さ」と「す」がものすごい高周波数である。
「は」「や」「さ」の母音は/a/なので、この発音は見た感じ似ているっぽい。

 
あいうえおを頑張って分離して、これらについてフォルマントを計算した。本来ならクラスタになるはずだったが、「あ」「い」「う」は分離してしまった。たぶん、話し言葉の最中に音源をとると、語と語のつなぎ方がたぶんうんぬんかんぬんでボーカロイド的な技術がうんたらかんたら。

 
SPADEをやってみた。
「あ」は分布範囲が広い。これはcoplotでもそうである。
「い」は一部、「あ」と同じところに存在しているので枝の上のほうにもいるが、基本的には右の枝にぐしゅぐしゅっと存在している。
「お」の分布はF1が500-600Hz, F2が1200Hzのところだけなので、「い」の右の枝にほとんどかぶっているが上のほうには分布しない。
「う」はほとんどが左下の枝。一部、「あ」や「い」と同居している。
「え」はcoplot上ではひとつのクラスタでしか存在しないので、左横の枝に分布している。
 
なんとか頑張ってあいうえおを抽出したが、できればもう少しサンプル数を増やして、かつ厳密に「あいうえお」だけ言っているサンプルが欲しかった。
こちらにはサンプルボイスやPraatの使い方がある。しかし、サンプルボイスは声優ではない。

 
ボイスサンプルからがんばって母音を抽出したとしても、同一の母音で複数のクラスタが生まれうるっぽいことがわかったので、声優同士のフォルマント分布を比較しようにも母音の差異の影響を考慮しないと難しい感じがわかった。