2012-01-01から1年間の記事一覧

C83 コミケ

1日目 2日目 3日目

29日土曜日 東テ15-b 声優統計 第一号

今回のコミケの注目は声優統計 第一号。

みくみくにしてあげる 再び

新しいアイコンを作ろうと思った。 髪が手前と奥にあるので、透過性を指定することで色付けを工夫した。 miku0 <- as.matrix(read.csv("data_load"), header=TRUE) miku0[is.na(miku0)] <- 0 miku1 <- NULL for(i in seq(ncol(miku0))){ miku1 <- rbind(miku…

世界で一番わかりやすいROC解析

いや、世界で一番わかりやすいかはどうだろう… library(pROC) n <- 30000 #判定されるものの数 a1 <- rnorm(n, mean=0) #陰性のもの a2 <- rnorm(n, mean=2, sd=2) #陽性のもの diagnosis <- rep(0:1, each=n) #各々の判定フラグ roc1 <- roc(diagnosis, c(a…

多値判別

最後に多値判別を行う。これにはおなじみのirisを使う。 irisは4つのパラメータに3種類の種別がついている。 iris.glmnet <- glmnet(as.matrix(iris[, -5]), iris[, 5], family="multinomial") par(mfrow=c(1, 3)) plot(iris.glmnet) 同じく予測する。 iris.…

二値判別

二値判別にはmdrrデータセットを使ってみる。 Svetnik et al (2003) describe these data: "Bakken and Jurs studied a set of compounds originally discussed by Klopman et al., who were interested in multidrug resistance reversal (MDRR) agents. Th…

回帰

glmnetの引数は x:数値からなる行列 y:応答を表すベクトル family:二値判別分析、多値判別分析も可能。ポアソンとかcoxとかもある。 となっているので、これに従ってやる。 とりあえず、caretパッケージのcarsを使う。 このデータは、 data frame of the …

LASSOをやってみる

この1年の最後のほうで、LASSOというものがやたらと出てきたのでやってみる。 数式や意味などはこちらで解説されているので、実際にデータがあったらどうするかということでいつもどおりやる。 今回もいつもどおりぐぐると先生にあたるので、Rパッケージガイ…

救急でのアプローチ

General assessmentをして normal, sick, emergencyに分類 Primary assessment Airway, Breathing, Circulation, Dysfunction of CNS, Exposureの評価に入る 順番に行い、前の評価が終わらないうちに次に進んではいけない原則 A:声を出せるか、スーハー言っ…

先生はMMDに興味を持ったようです

こちらで、人体骨格の回転行列表示についての話がある。 それを見た友人が、MMDなどのボーンアニメーションの基礎であるスキニング(体の各部位ごとのポリゴンの座標が、どの変換行列にどのくらいの重みで影響されるかってのが設定されること)のアルゴリズ…

主成分分析をやる

知り合いの研究者「君って統計得意らしいね!!PCAやりたいんだけど君できるかな!?!?」 オレ「(パラクロロアンフェタミン Para-chloroamphetamine…何言ってんだk(ry」 と思って帰って調べたら主成分分析のことでした。 直交回転を用いて変数間に相関がある元…

主成分解析と多重補正

PCAによる主成分回帰Principal Component Regression (PCR) 部分最小自乗法によるPartial Least Squares Regression (PLSR) Rではplsパッケージで可能。 Dunnett's test 多重補正のひとつ。 Rではmultxpert、DTK、multcompパッケージで可能。

平均の比の検定と信頼区間

A群から取ったデータと、B群から取ったデータの比の信頼区間を求めたいんだけど… という相談を受けたので探してみると、3種類あるらしい。 Rですぐできそう、というか既にあったのはmratiosパッケージ。 そもそも平均で差がなければ比は1、差があれば1でない…

内挿

AMIA Summits Transl Sci Proc. 2011; 2011: 16–20 内挿によってデータを取っていない区間についても推定して、回帰の精度をあげるお話。 平滑化ということで取り上げられている。 シグモイドみたいな、パラメトリックに関数をおいて、観測データをぎちぎち…

臨床データの取扱い

ゲノム疫学のためのインフォマティクス2012 臨床データの取扱い 臨床データ あり-なしの2値 連続値 取りうる値 下限値?単位、範囲、時間 カテゴリ 血清中のなにかの検査値

眼球突出・皮下出血(担当EI)

3F 外傷 眼窩底骨折 内頚動脈海綿静脈洞瘻疾患 バセドウ病膿瘍 副鼻腔炎腫瘍 悪性リンパ腫虐待 問診 親ときた O:1ヶ月前くらいから。眼科受診したが経過観察 初めて 元気そうではある 発育異常はなかった お腹が張っている感じ家族歴:特になし 内服薬:便秘…

浮腫(担当KY)

62F 両側下腿浮腫 毛細血管静水圧 血漿膠質浸透圧 間質静水圧 間質膠質浸透圧 血管透過性問診 BMI 38 O:数週間前から T:朝軽いが、夕方ひどい 押したら痕がのこる 息切れなしだが、階段昇降で息切れと胸痛あり 先行感染なし 下痢なし 食事良好 学校の先生 …

Lasso (least absolute shrinkage and selection operator)

lassoという機械学習法があるらしい。 Rではlars、glmnet、penalizedが引っかかった。 library(lars) library(glmnet) library(penalized)

Japan.R#3に行ってきた

plotには matplot ts.plot ggplot2 が使える。 Rでソーシャルネットワーク分析 自殺者のSNS利用傾向など ソーシャルネットワーク:リンク、エッジ 有向ネットワーク:twitterなどのフォロー 無向ネットワーク:mixi, Facebookなどの認証相互 計算量が変わっ…

Kashiwa.R#5に行ってきた

初めてのR エラーはいたときの対処とかで、初心者は挫折するのでここをどうにか頑張ってほしいなあ 話題 代入 データ型 atomic/factor データ構造と要素へのアクセス ディレクトリとデータ入出力 関数のデフォルト設定 開発環境(Rstudioなど) ヘルプ 初めて…

二兎追うものは一兎も得ず

P君に2人の女友達A子さん、B子さんがいる。あるとき、P君が自宅を出発してA子さんの家へ向かった。しかし、自宅からA子さんの家までの距離の1/3進んだところで、思いなおしてB子さんの家へ向かった。そして方向を変えた地点からB子さんの家までの…

行列とベクトル同士の演算

行列は、要素と、行もしくは列をいれると作ることができる。 行もしくは列どちらかが指定されれば、Rが勝手に足りない方を計算してくれる。 matrix(1:15, nr=3, nc=5) [,1] [,2] [,3] [,4] [,5] [1,] 1 4 7 10 13 [2,] 2 5 8 11 14 [3,] 3 6 9 12 15 要素は…

検査と臨床判断(担当YF)

病気である、病気でない 検査陽性である、検査陰性である としたときに、目の前の患者がある病気である事前確率が、検査をすることによってどう上がったり下がったりするかの事後確率を定量的に考える。 いま、感度、特異度の検査が陽性となったときの事後確…

エクセルにデータを渡すときのテキストエンコーディング

とある解析を頼まれて、Rで処理したあとにエクセルで見られるようにデータを渡したら、文字化けしていると言われた。 で、調べてみたら、エクセルはShift JISしか読み込まず、R(のたぶん標準)のUTF-8は対応してくれないらしいので write.csv(res, file=filen…

Hardy–Weinberg 平衡

GWASにおけるHardy–Weinberg 平衡の多重検定がいろんなところで話題になっているので少しいじろうと思ったけど、サーチでかなり引っかかるので library(GWASExactHW) library(genetics) ここらへんが使いやすそうな気がする。

構音障害(担当AM)

65M 右半身が動かしにくい 昼頃、取引先にて右半身の動かしにくくさを自覚、アクセルとブレーキの踏み間違えあり。 帰宅後、近くの車に衝突。家族が気づき、救急要請。 血管 脳出血 脳梗塞 慢性硬膜外血腫 前脊髄動脈梗塞 レビー小体 神経 腫瘍 てんかん 頚…

ハイスループット、実験データの質の管理

ゲノム疫学のためのインフォマティクス2012 ハイスループット、実験データの質の管理 1マーカー1形質テストはサンプルがランダムであることを前提とする。 GWAS用に検定結果を補正する バイアスのあるサンプル:構造化補正 テスト間の非独立性:多重性 同一…

scale free network

PLoS Genet. 2012;8(3):e1002556. Epub 2012 Mar 8.で、scale free networkを用いた解析を行なっている。 その解析にはWGCNAパッケージを使ったらしいのでインストールしてみる。 install.packages(c("dynamicTreeCut", "cluster", "flashClust", "Hmisc", "…

メタアナリシス 続き

前回の続きで、別のパッケージを教えてもらった。 install.packages("meta") install.packages("rmeta") library(meta) library(rmeta) data(catheter, package="rmeta") a <- catheter[complete.cases(catheter$col.trt, catheter$n.trt, catheter$col.ctrl…

PythonでIsotonic regression

Isotonic regressionの応用を考えているが、Rでは少し問題があるのでPythonでやってみようと思って挫折していたのだがなんか急にやる気が出てきたのでやった。 環境はUbuntu 12.04 64bit, Intel Corei5-2540M CPU 2.60 GHz * 4. まずはインストール。 sudo a…