バーストモデル

データの観測を続けているとき、ある時刻から急にデータが増えることがある。これをバーストといい、この瞬間を検出する手法があるらしい。
Rではburstsパッケージでできる。
データは時系列の累積和になっていて、時刻t_it_j間(隣り合わなくてもよい)でのバースト具合が計算できる。
新聞記事では世間の出来事に応じて記事中の言葉がかわるので、トピックのバースト具合がわかる(こちら)。

library(bursts)
offsets <- c(seq(0, 400, 100), seq(410, 450, 5), seq(451, 470, 2), seq(480, 600, 5), 700, seq(710, 800, 5), 900, 1000)
bursts <- kleinberg(offsets)
plot(offsets, seq(offsets), type="s")
plot.bursts(bursts)