2013-03-01から1ヶ月間の記事一覧

モデルのパラメータの信頼区間推定

数学いらずの医科統計学PART7 CHAPTER34のモデルの紹介の話。 モデルをサンプルデータに適合させると、モデルのそれぞれのパラメータに対して推定値を信頼区間が得られる。 とあって、昔苦労した記憶があるのだが、drc パッケージ中にこの面倒をやってくれる…

Rのデバッグ

debug() というデバッグ関数を勉強した。 今、連続した1の開始点を見つける関数findruns()を作ったとする。 とりあえず、テストデータで試してみると # 誤りあり findruns <- function(x,k) { n <- length(x) runs <- NULL for (i in 1:(n-k)) { if (all(x[…

転倒(担当KY)

80M 転倒 1w前 咳 3日前 息切れ 入院当日 転倒 タバコ 20*25y 酒 焼酎一合 DM HT 前立腺癌 肺炎(2y 肺炎球菌) ワクチン接種あり SU薬 ブロプレス ROS (+) 喀痰 呼吸苦(労作時) 倦怠感 (-) 意識消失 脱力 構音障害 発熱 喀血 尿量変化 しびれ 浮腫 DDx PE, pn…

心電図(担当YF)

バックナンバー

発熱(担当HA)

82F 20時頃トイレに行く時、普段はてすりで立てたが、その時は立てなかった。 22時頃、息遣いが荒いことに家人が気づいた。 その後、体が熱っぽいことに気づき、体温を測ると42度だった。 24時頃、救急要請。 救急 A:呼吸有り B:RR 32 SpO2 93% (室内気)→9…

imas1.txt

name age height weight B W H 天海春香 17 158 46 83 56 82 高槻やよい 14 145 37 74 54 78 菊地真 17 159 44 75 57 78 我那覇響 16 152 41 83 56 80 島村卯月 17 159 45 83 59 87 中野有香 18 149 40 77 57 81 水本ゆかり 15 155 42 81 56 82 福山舞 10 13…

外れ値となるアイマスメンバーを探す

Journal ClubでFRaCという機械学習を紹介した。 最後に、確認としてこんな問題を出した。 アイドル174人分のデータセットimas1.txtがある。 この中で他のメンバーとは明らかに違う特徴をもったアイドルがいる。MinPtsを10程度に設定して検出し、オレの好きな…

Rで地図 再び

日本地図を描く用事があったので昔やったようにもう一度やろうと思った。 だがしかし、Global Administrative Areaから地図データをダウンロードしてきたら、ファイル名の仕様が変わっていてちょっとてこずった。 library(spsurvey) jpn_GA <- vector("list"…

やってみる

金塊問題のデータセットをhundred.txtとして保存する。 T:決定木、R:RBF-kernel SVM、N:linear-kernel SVM、S:決定株のモデルをいくつか組み合わせてみる。 #detectスクリプトがあるfracディレクトリで python detect -X ~/Desktop/hundred.txt -Q ~/Desktop…

インストール

Rで実装できませんでした。Pythonでやります。 OSはUbuntu 12.04。 まずFRaCのサイトから、最新版のスクリプトをダウンロードして解凍する。fracというフォルダができる(と思う)が、ここで作業することにする。 LIBSVMというSVM計算を行うソフトを導入する。…

原理

個のサンプルがある教育用データセット があって、これらはすべて正常のクラスをもつとする(半教師有り学習)。 各は決まった長さ個の特徴量を持っていて、名義変数か連続変数の属性があって、混合していてもいい。 やりたいことは、引数ベクトルをひとつの実…

FRaC Feature Regression and Classification

Journal ClubネタでFRaCという外れ値検出をやる。 金塊問題では、n次元上の各点との距離を考える、SVMのようなDistance modelと、各点周辺の密度を考える、LOFのようなDensity modelとがある。 FRaCはいくつかのモデルの特徴量を組み合わせるらしい。Rで書け…

Gene Ontology

Gene Ontologyの話。 RだとFunNet, GOSim, geneListPieというパッケージがあるらしい。(GOSimはインストールがうまくいかなかったが) library(geneListPie) data(goslim.human.BP) glist <- c("ABCB7", "ABCF1", "ABHD2", "ACAD9", "ACIN1", "AMOTL1", "ANLN…

データセット

答えは87番目のデータ。 下をコピペして、半角スペース区切りで読み込む。 data0 <- read.delim("clipboard", sep=" ", header=FALSE) cols <- rep(1, nrow(data0)) cols[87] <- 2 69.613 129.070 52.111 70.670 128.161 52.446 72.303 128.450 52.853 73.75…

k-nearest neighbor

近傍法は近い点の距離を計算する。 library(FNN) #k-nearest neighbor # ??? works not well topn <- 8 alg <- c("cover_tree", "kd_tree", "VR", "CR", "brute") res <- array(0, c(nrow(data0), topn, length(alg))) for(i in seq(nrow(data0))){ for(alg0…

k-means

k-means法はもともと、「似ているものをまとめる」方法なので、「仲間はずれを探す」方法としてはよくないことがある。 今回はグダグダ。 k0 <- 2:10 kcluster <- matrix(0, nr=length(k0), nc=nrow(data0)) for(k1 in seq(k0)){ kcluster[k1, ] <- kmeans(d…

RandomForests

決定木をたくさん作るRandomForests。 library(randomForest) rf0 <- randomForest(data0) MDSplot(rf0, cols, k=3) どうプロットしたら一番わかりやすい結果が見えるかまだわかってないのでこんな図に。 答えだけを強調したらそれとなくそんな気分になる。

主成分分析 PCA

各パラメータは関係があったりすることがあるので、無関係な主成分にしてみる。 pca_score <- scale(data0) %*% eigen(cor(data0))$vectors *sqrt(nrow(data0)/(nrow(data0) - 1)) library(rgl) plot3d(pca_score, type="n", xlab="PC1", ylab="PC2", zlab="…

one-classs SVM

超平面という中二病的境界線を引く。 本当はtuningが必要らしいのだが、今回は無視。 #one class SVM library(e1071) #non-supervised svm0 <- svm(data0, type="one-classification") pred0 <- predict(svm0, data0) pred0 plot(data0, pch=16, col=(!pred0…

Local outlier factor

この問題を解くのに最もいいのはLOF(論文)らしい。ある点近傍の点の数をパラメータにして、外れ値ならまわりが少ないのではないかという… library(Rlof) lof0 <- lof(data0, 5:10) plot(lof0[,1], pch=16, col=cols) matplot(lof0, pch=16, ylab="LOF score"…

選んではいけない金塊

機械学習を用いて、選んではいけない金塊を見つけ出す問題。 設定は、100個の金塊っぽいもののうち、1つだけが真の金塊。各々の金塊っぽいものには、3つのパラメータがある。 本物の金塊を選ぶほうが実はいけない。 問題としては、100個の中から異常なデータ…

ミクパ関西

ここが画像が多くてよくまとまっている。 秘密警察きてくれたらうれしいなと思いながら、曲を聴きつつ会場入りしたらしょっぱなからきてテンション上がった。

多重検定

数学いらずの医科統計学PART5 CHAPTER22の多重検定の話。 多重検定についてはぐぐると色々出てくる。 Rではp.adjustという関数でp値を各手法で補正してくれるようだ。とりあえず全部やってみる。 set.seed(123) x <- rnorm(50, mean = c(rep(0, 25), rep(3, …

箱ひげ図にp値と棒をいっぱいかく

箱ひげ図にp値とどの群を比較したか棒をつけている図を論文でよく見かけるが、Rにはそれを楽に描いてくれるような機能がない。 というのも、多重比較に関わるから難しいし、棒をつけたらつけたでゴチャゴチャするからなのだろう… ただ、この図が描きたいとい…