2012-12-01から1ヶ月間の記事一覧

C83 コミケ

1日目 2日目 3日目

29日土曜日 東テ15-b 声優統計 第一号

今回のコミケの注目は声優統計 第一号。

みくみくにしてあげる 再び

新しいアイコンを作ろうと思った。 髪が手前と奥にあるので、透過性を指定することで色付けを工夫した。 miku0 <- as.matrix(read.csv("data_load"), header=TRUE) miku0[is.na(miku0)] <- 0 miku1 <- NULL for(i in seq(ncol(miku0))){ miku1 <- rbind(miku…

世界で一番わかりやすいROC解析

いや、世界で一番わかりやすいかはどうだろう… library(pROC) n <- 30000 #判定されるものの数 a1 <- rnorm(n, mean=0) #陰性のもの a2 <- rnorm(n, mean=2, sd=2) #陽性のもの diagnosis <- rep(0:1, each=n) #各々の判定フラグ roc1 <- roc(diagnosis, c(a…

多値判別

最後に多値判別を行う。これにはおなじみのirisを使う。 irisは4つのパラメータに3種類の種別がついている。 iris.glmnet <- glmnet(as.matrix(iris[, -5]), iris[, 5], family="multinomial") par(mfrow=c(1, 3)) plot(iris.glmnet) 同じく予測する。 iris.…

二値判別

二値判別にはmdrrデータセットを使ってみる。 Svetnik et al (2003) describe these data: "Bakken and Jurs studied a set of compounds originally discussed by Klopman et al., who were interested in multidrug resistance reversal (MDRR) agents. Th…

回帰

glmnetの引数は x:数値からなる行列 y:応答を表すベクトル family:二値判別分析、多値判別分析も可能。ポアソンとかcoxとかもある。 となっているので、これに従ってやる。 とりあえず、caretパッケージのcarsを使う。 このデータは、 data frame of the …

LASSOをやってみる

この1年の最後のほうで、LASSOというものがやたらと出てきたのでやってみる。 数式や意味などはこちらで解説されているので、実際にデータがあったらどうするかということでいつもどおりやる。 今回もいつもどおりぐぐると先生にあたるので、Rパッケージガイ…

救急でのアプローチ

General assessmentをして normal, sick, emergencyに分類 Primary assessment Airway, Breathing, Circulation, Dysfunction of CNS, Exposureの評価に入る 順番に行い、前の評価が終わらないうちに次に進んではいけない原則 A:声を出せるか、スーハー言っ…

先生はMMDに興味を持ったようです

こちらで、人体骨格の回転行列表示についての話がある。 それを見た友人が、MMDなどのボーンアニメーションの基礎であるスキニング(体の各部位ごとのポリゴンの座標が、どの変換行列にどのくらいの重みで影響されるかってのが設定されること)のアルゴリズ…

主成分分析をやる

知り合いの研究者「君って統計得意らしいね!!PCAやりたいんだけど君できるかな!?!?」 オレ「(パラクロロアンフェタミン Para-chloroamphetamine…何言ってんだk(ry」 と思って帰って調べたら主成分分析のことでした。 直交回転を用いて変数間に相関がある元…

主成分解析と多重補正

PCAによる主成分回帰Principal Component Regression (PCR) 部分最小自乗法によるPartial Least Squares Regression (PLSR) Rではplsパッケージで可能。 Dunnett's test 多重補正のひとつ。 Rではmultxpert、DTK、multcompパッケージで可能。

平均の比の検定と信頼区間

A群から取ったデータと、B群から取ったデータの比の信頼区間を求めたいんだけど… という相談を受けたので探してみると、3種類あるらしい。 Rですぐできそう、というか既にあったのはmratiosパッケージ。 そもそも平均で差がなければ比は1、差があれば1でない…

内挿

AMIA Summits Transl Sci Proc. 2011; 2011: 16–20 内挿によってデータを取っていない区間についても推定して、回帰の精度をあげるお話。 平滑化ということで取り上げられている。 シグモイドみたいな、パラメトリックに関数をおいて、観測データをぎちぎち…

臨床データの取扱い

ゲノム疫学のためのインフォマティクス2012 臨床データの取扱い 臨床データ あり-なしの2値 連続値 取りうる値 下限値?単位、範囲、時間 カテゴリ 血清中のなにかの検査値

眼球突出・皮下出血(担当EI)

3F 外傷 眼窩底骨折 内頚動脈海綿静脈洞瘻疾患 バセドウ病膿瘍 副鼻腔炎腫瘍 悪性リンパ腫虐待 問診 親ときた O:1ヶ月前くらいから。眼科受診したが経過観察 初めて 元気そうではある 発育異常はなかった お腹が張っている感じ家族歴:特になし 内服薬:便秘…

浮腫(担当KY)

62F 両側下腿浮腫 毛細血管静水圧 血漿膠質浸透圧 間質静水圧 間質膠質浸透圧 血管透過性問診 BMI 38 O:数週間前から T:朝軽いが、夕方ひどい 押したら痕がのこる 息切れなしだが、階段昇降で息切れと胸痛あり 先行感染なし 下痢なし 食事良好 学校の先生 …

Lasso (least absolute shrinkage and selection operator)

lassoという機械学習法があるらしい。 Rではlars、glmnet、penalizedが引っかかった。 library(lars) library(glmnet) library(penalized)

Japan.R#3に行ってきた

plotには matplot ts.plot ggplot2 が使える。 Rでソーシャルネットワーク分析 自殺者のSNS利用傾向など ソーシャルネットワーク:リンク、エッジ 有向ネットワーク:twitterなどのフォロー 無向ネットワーク:mixi, Facebookなどの認証相互 計算量が変わっ…