Local outlier factor

この問題を解くのに最もいいのはLOF(論文)らしい。ある点近傍の点の数をパラメータにして、外れ値ならまわりが少ないのではないかという…

library(Rlof)
lof0 <- lof(data0, 5:10)
plot(lof0[,1], pch=16, col=cols)
matplot(lof0, pch=16, ylab="LOF score")
abline(v=87, lty=2)

外れていない値であれば、LOFで計算されたスコアは1に近くなる。
しかし、1から離れたといって、どれだけ離れれば外れ値かは教えてくれない。
とりあえず、この問題では外れ値が1つなので、LOFスコアが最も高いものを外れ値と考えることにする。