この問題を解くのに最もいいのはLOF(論文)らしい。ある点近傍の点の数をパラメータにして、外れ値ならまわりが少ないのではないかという…
library(Rlof) lof0 <- lof(data0, 5:10) plot(lof0[,1], pch=16, col=cols) matplot(lof0, pch=16, ylab="LOF score") abline(v=87, lty=2)
外れていない値であれば、LOFで計算されたスコアは1に近くなる。
しかし、1から離れたといって、どれだけ離れれば外れ値かは教えてくれない。
とりあえず、この問題では外れ値が1つなので、LOFスコアが最も高いものを外れ値と考えることにする。