条件付き確率 その2 事前確率と真性陽性確率

MikuHatsune2010-12-04

条件付き確率の続き。
Cは、被検査者が癌であるという事象。
Aは、検査結果が癌であるという事象。
事前確率P(C)=pと、真性陽性確率P(A|C)=rをいじくってみよう。
\begin{matrix}&A&A^c\\C&r&1-r\\C^c&1-r&r\end{matrix}
P(A)=P(A\cap{C})+P(A\cap{C^c})\\\hspace{38}=P(C)P(A|C)+P(C^c)P(A|C^c)\\\hspace{38}=P(C)P(A|C)+(1-P(C))P(A|C^c)
P(C|A)=\frac{P(C\cap{A})}{P(A)}\\\hspace{55}=\frac{P(C)P(A|C)}{P(C)P(A|C)+(1-P(C))P(A|C^c)}\\\hspace{55}=\frac{pr}{pr+(1-p)(1-r)}

x<- function(p,r){
  return(p*r/(p*r+(1-p)*(1-r)))
}
p<- r<- seq(from=0,to=1,by=0.01)
theta<- 30
phi<- 20
M<- expand.grid(p,r)
PLOT<- matrix(x(M$Var1,M$Var2),nr=sqrt(nrow(M)))
persp(PLOT,col=rainbow(length(p)-1),
      xlab="prior probability",
      ylab="test reliability",
      zlab="posterior probability",
      theta=-theta,phi=phi)
library(rgl)
plot3d(row(PLOT),col(PLOT),PLOT,col=rainbow(length(p)),
       xlab="prior probability",
       ylab="test reliability",
       zlab="posterior probability")


事前確率が低ければ、ものすごい精度のよい検査でないと、本当の癌患者を見つけられない
ということでよさそう。
事前確率が1〜15%、検査精度が90〜99%までをとってくると

            [,1]       [,2]      [,3]      [,4]      [,5]      [,6]      [,7]      [,8]      [,9]     [,10]
 [1,] 0.08333333 0.09266802 0.1040724 0.1183206 0.1366279 0.1610169 0.1951220 0.2461929 0.3310811 0.5000000
 [2,] 0.15517241 0.17105263 0.1900826 0.2133028 0.2422680 0.2794118 0.3287671 0.3975410 0.5000000 0.6689189
 [3,] 0.21774194 0.23821990 0.2623574 0.2912317 0.3263889 0.3701299 0.4260355 0.5000000 0.6024590 0.7538071
 [4,] 0.27272727 0.29641694 0.3239437 0.3563218 0.3949580 0.4418605 0.5000000 0.5739645 0.6712329 0.8048780
 [5,] 0.32142857 0.34732824 0.3770492 0.4115044 0.4519231 0.5000000 0.5581395 0.6298701 0.7205882 0.8389831
 [6,] 0.36486486 0.39224138 0.4233129 0.4588816 0.5000000 0.5480769 0.6050420 0.6736111 0.7577320 0.8633721
 [7,] 0.40384615 0.43215739 0.4639769 0.5000000 0.5411184 0.5884956 0.6436782 0.7087683 0.7866972 0.8816794
 [8,] 0.43902439 0.46786632 0.5000000 0.5360231 0.5766871 0.6229508 0.6760563 0.7376426 0.8099174 0.8959276
 [9,] 0.47093023 0.50000000 0.5321337 0.5678426 0.6077586 0.6526718 0.7035831 0.7617801 0.8289474 0.9073320
[10,] 0.50000000 0.52906977 0.5609756 0.5961538 0.6351351 0.6785714 0.7272727 0.7822581 0.8448276 0.9166667
[11,] 0.52659574 0.55549390 0.5870070 0.6215067 0.6594388 0.7013423 0.7478754 0.7998501 0.8582803 0.9244482
[12,] 0.55102041 0.57961783 0.6106195 0.6443418 0.6811594 0.7215190 0.7659574 0.8151261 0.8698225 0.9310345
[13,] 0.57352941 0.60172940 0.6321353 0.6650165 0.7006881 0.7395210 0.7819549 0.8285151 0.8798343 0.9366812
[14,] 0.59433962 0.62207031 0.6518219 0.6838235 0.7183406 0.7556818 0.7962085 0.8403465 0.8886010 0.9415761
[15,] 0.61363636 0.64084507 0.6699029 0.7010050 0.7343750 0.7702703 0.8089888 0.8508772 0.8963415 0.9458599

前の問題では、事前確率0.005、検査精度0.95で、真性陽性率が0.087だった。この表では[1,5]の付近。