数学いらずの医科統計学

重回帰のときに必要なデータの数はパラメータの数の10倍です

読んだ。 J Clin Epidemiol. 1995 Dec;48(12):1503-10. パラメータ数が のデータを標本数 個観測して重回帰なりなんらかの回帰分析を行うのだが、「標本数はいくつあったらいいんですか?」と聞かれることが多々ある。そういうとき、パラメータの10倍(10)あっ…

Type S error: ベイズ的多重検定

Bayesian inference completely solves the multiple comparisons problem « Statistical Modeling, Causal Inference, and Social Science にType S error (Computational Statistics (2000) 15: 373.) という論文がある。 古典的な仮説検定では を帰無仮説…

時系列データにt 検定を行う

読んだ Nature (2016) doi:10.1038/nature18294 PD1/PDL1 系の薬剤は高いので、それが良く効く患者集団を選びたいというのが最近のトレンドォ!!! 3' 側のUTR がないことで、PD-L1 の発現があがり、それによって免疫機構から逃れるPD1/PD-L1 axis がクッソすご…

医療費と心肺停止からの生存率の関係

医療費が低い都道府県では、心肺停止(CPA)してから生き残る確率が低いらしい。 BMJ Open 2015;5:e008374 著者の解説 という話を知り合いから仕入れたら、その知り合いは筆者と知り合いっぽいが、医療費と、心肺停止後から1ヶ月後に生存しているかの関係で下…

GERDに対してPPIを処方するけれども

ネキシウムというPPIがGERDの症状を改善するという話を聞いた。(Jpn. J. Med. Pharm. Sci. 68(3), 437-449, 2012.) こんな感じの図が出た。 GERDの人は1週間のうち4日は症状に悩まされているけれども、PPIを飲むと1日以下になるとか。 サンプルサイズが104人…

生存解析のサンプルサイズ

こんな感じの生存曲線を見た。 元論文では対照のマウスにある処置をすると生存期間が伸びる、ということで、それぞれ20匹のマウスを使っていた。 library(survival) # 図から再現したらこんな感じ n1 <- n2 <- 20 clp1 <- rep(c(24, 30, 42, 48), c(7,9,1,3)…

Cuzick test

読んだ。 N Engl J Med. 2014 Jun 18. N Engl J Med. 2014 Jun 18. どちらの論文も、APOC3というアポリポ蛋白の話で、これの機能欠失型変異ではTGが低めでHDLが高め、結果として血管病変や心疾患が減る… その中の解析でCuzike testというものを知った(Stat M…

対応のある分割表 McNemar検定

急性期の脊髄損傷患者にメチルプレドニゾロンを高用量投与するのが有用かどうか、DPCのデータベースからデータを取ってきてPSマッチングにより解析した論文を読んだ。 Emerg Med J. 2014 Mar;31(3):201-6. 結論としては、高用量メチルプレドニゾロン(> 5000m…

種田梨沙が出演すると百合アニメか? Propensity score match による検討

種田梨沙にはまっている。最近ではご注文はうさぎですかのリゼのバイトする姿やお着替えシーンでブヒったり、極黒のブリュンヒルデの寧子のおっぱいのほくろがどうなってんのか小一時間観察したりと楽しい日々である。 そんな種田梨沙だが、ゆゆ式の縁あたり…

Propensity score analysis の sensitivity analysis

Propensity scoreをやってみたわけだが、観察研究を事後解析的になんやかんやするので、観察して得られたパラメータしか持っていない。 その限られたパラメータから、治療が行われる確率としてPSが計算されるので、もし、このモデルに組み込まれておらず、か…

Propensity score matching をやってみたわけだがうまくいかなかった

Propensity scoreを勉強したのでやってみる。 JAMA. 1996 Sep 18;276(11):889-97.のRight heart catheterization datasetを使う。 Propensity scoreに必要なRパッケージについてと、スクリプトはそれぞれリンクから適当にパクる。 結論からいうと論文入手で…

Propensity score

Propensity Scoreというものを知った。近年Propensity scoreを使った報告がめっちゃ増えている。 医学研究において最強の比較試験と言われているのが、RCT(Randomize Control Trial)と呼ばれる研究である。 これは、研究計画のプロトコールを満足する患者が…

膠質浸透圧がTPで近似できるらしい話

読んでる。ジェネラリストのための内科診断リファレンス: エビデンスに基づく究極の診断学をめざして作者: 上田剛士,酒見英太出版社/メーカー: 医学書院発売日: 2014/02/10メディア: 単行本この商品を含むブログ (2件) を見る 非心原性肺水腫のMEMOで、膠質…

Rで始めた医学・統計学・Bioinformatics

という本を書いた。Rで始めた医学・統計学・Bioinformatics作者: Med_KU出版社/メーカー: Med_KU発売日: 2014/03/17メディア: Kindle版この商品を含むブログ (1件) を見るアマゾンKDPから買うと文字化けするため、こちらでは買わず代わりにとらのあなかMelon…

ぼくのかんがえた さいきょうの せいゆう キャスティング

声優統計第一号で、アニメの内容及びキャスティングを用いないDVD売上予測問題というのをやっていたのだが、円盤売上と声優出演データが取れたらやってみたいと思っていたところ、声優さん共演関係など解析という記事を見つけたのでやってみる。 声優統計第…

臨床試験での生存解析に必要なサンプル数と観察期間

臨床試験における生存解析では、参加登録した患者をランダムに2群に割り付け、新薬Xと旧薬Aをそれぞれの群に投与する。 新薬のMST(中央生存期間)は適当に17ヶ月、旧薬のMSTは10ヶ月。 カプランマイヤーの生存解析では、ハザード比がどの時刻においても新薬群…

サンプルサイズ

数学いらずの医科統計学PART7 CHAPTER43で、サンプルサイズについて書いてある。 パッケージならpwr、デフォルトならpower.*.test関数群でできる。 最近はやりのびっぐでーたなら、メモリに乗ってPCで解析できる分だけとにかく持っているデータを使えばいい…

反復測定分散分析

数学いらずの医科統計学PART7 CHAPTER39で、反復測定分散分析について書いてある。 ふむ、なるほどわからんと思ったが要は対応のある検定を考える。こちらのデータセットをパクってやってみる。 # 下のものをコピペ data0 <- read.table("clipboard", sep="\…

分散拡大係数 VIF

数学いらずの医科統計学PART7 CHAPTER38で、重回帰分析における過剰適合について説明しているのをみて、変数選択のシミュレーションをした。 今回は分散拡大係数 (VIF)について。 決定係数を用いて、を計算した時、10を超えているとかなり多重共線性が怪しい…

重回帰法の落とし穴

数学いらずの医科統計学PART7 CHAPTER38で、重回帰分析における過剰適合について説明している。 パラメータ取ったんならたくさん使って推定しようぜ!!というのはよくわかる気持ちだが、使い過ぎるとパラメタ間の相互作用とかなんかいろいろな都合でダメにな…

重回帰・ロジスティック回帰。比例ハザード回帰

数学いらずの医科統計学PART7 CHAPTER37で、重回帰について説明している。 従属変数を独立変数で回帰するときの話。 多重線形回帰:アウトカムが連続的であるときに用いられる。重回帰と略されることが多い。 多重ロジスティック回帰:アウトカムが二値的な…

臨床研究のデザイン

臨床研究のデザインについての研究会に行ってきたのだが、実際に携わっているわけではないので用語からあやしい。 昔こんな感じで整理したのは覚えているが、今回の話はデータ取るよりも、統計解析よりもデザインが大事ですよ、ということでわかりやすい説明…

モデル選択と最適なパラメータ数

数学いらずの医科統計学PART7 CHAPTER35で、モデルの選択について言及している。 パラメータの数が増えると、各パラメータの信頼区間が大きくなると言っているが、正直よくわからなかった。 パラメータの最適数の推定法として、AICというものが有名。Rなら回…

p値

数学いらずの医科統計学を踏まえて。 問1 新薬Xは臨床試験で有効(p=0.04)と判定された。 Xはすごくよく効く。 Xは効く。 Xは効かないこともない。 Xは効かない。 問2 新薬Xは臨床試験で有効(p=0.04)と判定された。 「Xが効く」ということが正しい確率は 0.96…

ウィル・ロジャース現象

数学いらずの医科統計学PART6 CHAPTER29の生存曲線の比較で、ウィル・ロジャース現象に触れている。 これは、2群の生存解析において、新しい検査法の出現により、悪性腫瘍がさらに早期に発見できるようになると 非腫瘍群(腫瘍が見つかっていなかった人)が、…

確率分布一覧と関係性

確率分布と関係性。 基本的には、いくつかのパラメータを用いて関数が記述され、あるパラメータを固定した時にXX分布がYY分布に等しい、みたいな正確な関係(exact relation)と、有るパラメータ(たいていn)を無限大に飛ばしたらZZ分布に等しくなる、みたいな…

報告される回数が正確ではないポアソン過程的なもの

数学いらずの医科統計学PART2 CHAPTER6で、ポアソン分布に従う事象の話がある。 そこで、それぞれの事象は1回だけ数えられないといけないのだが、飛行機のニアミスがどの程度生じたか調べた研究では、お互いの飛行機の操縦士と副操縦士合わせて4人が各々報告…

カプランマイヤー曲線のサンプル数

数学いらずの医科統計学PART2 CHAPTER2生存曲線の信頼区間を昔やったのだが、サンプル数は50程度が普通のカプランマイヤー法ではいいらしい。 けれども、第III相試験では数百〜数千の規模でデータを取っている論文がほとんどなので、50標本じゃないと対応で…

モデルのパラメータの信頼区間推定

数学いらずの医科統計学PART7 CHAPTER34のモデルの紹介の話。 モデルをサンプルデータに適合させると、モデルのそれぞれのパラメータに対して推定値を信頼区間が得られる。 とあって、昔苦労した記憶があるのだが、drc パッケージ中にこの面倒をやってくれる…

多重検定

数学いらずの医科統計学PART5 CHAPTER22の多重検定の話。 多重検定についてはぐぐると色々出てくる。 Rではp.adjustという関数でp値を各手法で補正してくれるようだ。とりあえず全部やってみる。 set.seed(123) x <- rnorm(50, mean = c(rep(0, 25), rep(3, …