くぁwせdrftgyふじこlp を可視化する

MikuHatsune2018-02-03

ゆるキャン△東山奈央くぁwせdrftgyふじこlp発音したのが話題になっていた。

これから音を抽出して使ってみる。
 
スペクトログラムをかいて実際にどうなっているのか見てみる。
ミキサーソフトでひたすら声を聴きながら語の切れ目を確認しただけなので、特別な解析はしていない。
 
スペクトログラムだけ眺めてみると、せdrft の部分はだいぶ適当な感じがして(聞き取りがそもそも難しすぎてよくわからない)、gy はかろうじて ジュ という感じに聴こえる。
lp はまんま らぴ と言っている。
「うわなにをする」の箇所を、「なにを」でループさせるとイケない気持ちになるが、統計解析のためであって断じてイケない気持ちからここで切ったわけではない。

library(seewave)
library(tuneR)

w <- readWave("qawsed.wav")

txt <- "うわなにをするくぁwせdrftgyふじこlp"
txt <- c("", "う", "わ", "息", "な", "に", "を", "す", "る", "息", "qa", "w", "se", "d", "r", "f", "t", "gy", "ふ", "じ", "こ", "l", "p", "息")

# seewave の取り込みと実際の音源が微妙に長さが違うようである
ti <- c(0.259, 0.397, 0.582, 0.894, 0.994, 1.099, 1.324, 1.422, 1.595, 1.752,   1.862, 1.937, 2.069, 2.246, 2.447, 2.503, 2.625, 2.808, 2.947, 3.041, 3.078, 3.221, 3.629, length(w@left)/w@samp.rate)
ti <- c(0, ti -(3.840 - length(w@left)/w@samp.rate))

yl <- c(0, 6)
png("qaws.png", 1200, 300)
spectro(w, flim=yl, widths = c(15,1), osc=TRUE, cexlab=1.2, cexaxis=1.5)
for(i in 2:(length(ti)-1)){
  abline(v=ti[i], lty=3)
  p <- par()$usr
  text(mean(ti[(i-1):i]), p[4], txt[i-1], pos=1, xpd=TRUE, font=2, cex=1.5)
}
dev.off()