こんな問題を見かけた。
エントロピー的なことを考えると、離散確率分布があるとき、確率密度が等しいとエネルギー最小になりそうな予感がする。
R でやると、ディリクレ分布を利用して和が1になるけど各目の出る確率は均等に ではない仮想サイコロをたくさんつくって、実際に2回振って同じ目の個所を足し合わせてみる。
仮想サイコロ 個用意したとして、出る目6パターンの 行列を作ると、線形代数的には 番目と 番目の行列演算は 番目と 番目のベクトルだけ取り出してouter して対角成分だけ取り出して足すのと同じ(結局内積で、コーシー・シュワルツと同じことをしている)になるから、R では行列演算して対角成分を取り出すだけでよい。
p <- rep(1, 6)/6 sum(diag(outer(p, p, "*")))
[1] 0.1666667
library(MCMCpack) n <- 10 p <- rdirichlet(n, rep(1, 6)) diag(p %*% t(p))
[1] 0.2383 0.3046 0.2940 0.2679 0.2462 0.2120 0.2473 0.2462 0.2527 0.4562
より大きい。