ゆるキャン△で東山奈央がくぁwせdrftgyふじこlp を発音したのが話題になっていた。
スペクトログラムをかいて実際にどうなっているのか見てみる。
ミキサーソフトでひたすら声を聴きながら語の切れ目を確認しただけなので、特別な解析はしていない。
スペクトログラムだけ眺めてみると、せdrft の部分はだいぶ適当な感じがして(聞き取りがそもそも難しすぎてよくわからない)、gy はかろうじて ジュ という感じに聴こえる。
lp はまんま らぴ と言っている。
「うわなにをする」の箇所を、「なにを」でループさせるとイケない気持ちになるが、統計解析のためであって断じてイケない気持ちからここで切ったわけではない。
library(seewave) library(tuneR) w <- readWave("qawsed.wav") txt <- "うわなにをするくぁwせdrftgyふじこlp" txt <- c("", "う", "わ", "息", "な", "に", "を", "す", "る", "息", "qa", "w", "se", "d", "r", "f", "t", "gy", "ふ", "じ", "こ", "l", "p", "息") # seewave の取り込みと実際の音源が微妙に長さが違うようである ti <- c(0.259, 0.397, 0.582, 0.894, 0.994, 1.099, 1.324, 1.422, 1.595, 1.752, 1.862, 1.937, 2.069, 2.246, 2.447, 2.503, 2.625, 2.808, 2.947, 3.041, 3.078, 3.221, 3.629, length(w@left)/w@samp.rate) ti <- c(0, ti -(3.840 - length(w@left)/w@samp.rate)) yl <- c(0, 6) png("qaws.png", 1200, 300) spectro(w, flim=yl, widths = c(15,1), osc=TRUE, cexlab=1.2, cexaxis=1.5) for(i in 2:(length(ti)-1)){ abline(v=ti[i], lty=3) p <- par()$usr text(mean(ti[(i-1):i]), p[4], txt[i-1], pos=1, xpd=TRUE, font=2, cex=1.5) } dev.off()