くぁwせdrftgyふじこlp を可視化する - 驚異のアニヲタ社会復帰の予備

MikuHatsune2018-02-03

ゆるキャン△で東山奈央がくぁwせdrftgyふじこlp を発音したのが話題になっていた。

これから音を抽出して使ってみる。
　
スペクトログラムをかいて実際にどうなっているのか見てみる。
ミキサーソフトでひたすら声を聴きながら語の切れ目を確認しただけなので、特別な解析はしていない。
　
スペクトログラムだけ眺めてみると、せdrft の部分はだいぶ適当な感じがして（聞き取りがそもそも難しすぎてよくわからない）、gy はかろうじてｼﾞｭという感じに聴こえる。
lp はまんまらぴと言っている。
「うわなにをする」の箇所を、「なにを」でループさせるとイケない気持ちになるが、統計解析のためであって断じてイケない気持ちからここで切ったわけではない。

library(seewave)
library(tuneR)

w <- readWave("qawsed.wav")

txt <- "うわなにをするくぁwせdrftgyふじこlp"
txt <- c("", "う", "わ", "息", "な", "に", "を", "す", "る", "息", "qa", "w", "se", "d", "r", "f", "t", "gy", "ふ", "じ", "こ", "l", "p", "息")

# seewave の取り込みと実際の音源が微妙に長さが違うようである
ti <- c(0.259, 0.397, 0.582, 0.894, 0.994, 1.099, 1.324, 1.422, 1.595, 1.752,   1.862, 1.937, 2.069, 2.246, 2.447, 2.503, 2.625, 2.808, 2.947, 3.041, 3.078, 3.221, 3.629, length(w@left)/w@samp.rate)
ti <- c(0, ti -(3.840 - length(w@left)/w@samp.rate))

yl <- c(0, 6)
png("qaws.png", 1200, 300)
spectro(w, flim=yl, widths = c(15,1), osc=TRUE, cexlab=1.2, cexaxis=1.5)
for(i in 2:(length(ti)-1)){
  abline(v=ti[i], lty=3)
  p <- par()$usr
  text(mean(ti[(i-1):i]), p[4], txt[i-1], pos=1, xpd=TRUE, font=2, cex=1.5)
}
dev.off()