Rで始めた医学・統計学・Bioinformatics

MikuHatsune2014-03-22

という本を書いた。

Rで始めた医学・統計学・Bioinformatics

Rで始めた医学・統計学・Bioinformatics

アマゾンKDPから買うと文字化けするため、こちらでは買わず代わりにとらのあなMelonbooks(審査中)で買ってください。
platexで書き始めたはいいが、電子書籍化するためにepubもしくはhtml化しようと思ったけど、epubpngしか受け付けずしかも数式、表はすべてレイアウトグダグダ、htmlはutf8にしてもKDPで文字化けがどうしても直らないので諦めた。
 
内容としてはこんな感じ。参考文献について自分周辺のものについてだけリンク貼っておいた。
 
グリコでシミュレーションと数理モデル
Rを始めたときにやったのがグリコ。そこから推移行列などで数理モデル化までやってみた初心者だったころの私。
プログラミングセミナー グリコ
京大入試数学2014
 
p値
統計のラボだったので、長らく統計について勉強させていただいた。プログラミングによるシミュレーションを併用すると理解が深まると思った。
ryamadaの遺伝学・遺伝統計学メモ マルチプルテスティングとFDR オミックス統計学入門2014
p値
サンプルサイズ
カプランマイヤー曲線のサンプル数
12/12 MIKUセミナー

数学いらずの医科統計学 第2版

数学いらずの医科統計学 第2版

 
嫁たちのスリーサイズ解析と予測
機械学習を勉強し始めてからの応用例。そのあとはバイオインフォマティクス的手法なども用いてみたり。
ラブライブ!というアニメを観ていて
ガールフレンド(仮)のキャラ分析
ボディイメージ
(^q^)「くおえうえーーーるえうおおおwwwwwwwwwwwwwwwwwwwww」
機械学習を用いて双葉杏のスリーサイズ推定問題を解く
ミス・モノクロームのプロフィール推定
ガールフレンド(仮)のキャラ分析
Wake Up, Girls!のキャラ分析
Rでフローサイトメトリー(FCM/FACS)
ryamadaの遺伝学・遺伝統計学メモ cytoSPADE
SPADEを使いやすくする
二次元キャラの分化(成長)を多次元データ解析法で真面目にやってみる
viSNEによる次元削減とプロット
アイマス, ラブライブ, WUG, GFのキャラ分析
FRaC Feature Regression and Classification
外れ値となるアイマスメンバーを探す
デンドログラムをヒートマップのまわりに描き足す
 
ぼくのかんがえたさいきょうのせいゆうキャスティング
日本声優統計学会に声をかけていただいてから、解析がさらにおもしろくなった。ベタな線形回帰を使って、声優出演情報から円盤売上予測をしようという話。本書ではデータ取りの苦労話は割愛されているのでブログを読んで欲しい。次回もし参加することになっても、忙しすぎて原稿を書く時間がなければこの章がコピペで出されると思う。
ぼくのかんがえた さいきょうの せいゆう キャスティング
データ
重回帰法の落とし穴
分散拡大係数 VIF
機械学習の精度評価
交絡
 
これならわかる Excelで楽に学ぶ多変量解析

これならわかる Excelで楽に学ぶ多変量解析

 
百合ネットワーク解析
一時期ネットワーク解析にハマって、声優統計にも書いたネタ。
pixivのタグ頻度から考えるラブライブのカップリング
GRAph ALigner Algorithm (GRAAL)
GRAph ALigner Algorithm (GRAAL) を真面目にやる
ラブライブ!各話の百合ネットワークの動的変化
ネットワークの動的進化
R+igraphではじめる生物ネットワーク解析
 
アニメキャラで考える遺伝学
統計遺伝学的な話。ベイズ的思考も取り入れて事後確率の変動をどう考えるかという話もいれた。
海の人間と陸の人間の遺伝学
伊藤誠で作成しようと思ったら沢越止のほうが鬼畜だと気づいた
ベイズ的思考な遺伝相談
遺伝統計学の基礎―Rによる遺伝因子解析・遺伝子機能解析―

遺伝統計学の基礎―Rによる遺伝因子解析・遺伝子機能解析―

 
カラー図解 基礎から疾患までわかる遺伝学

カラー図解 基礎から疾患までわかる遺伝学

  • 作者: 新川詔夫,吉浦孝一郎
  • 出版社/メーカー: メディカルサイエンスインターナショナル
  • 発売日: 2009/03/28
  • メディア: 単行本(ソフトカバー)
  • この商品を含むブログを見る
 
医師国家試験で考える勉強態度
マークシート試験で適当に解答しても合格基準を超えるのではないかという疑問があって、どれくらい勉強したらいいかを考えた。得点予想など時系列解析も含む。
試験の合格基準は6割です
試験に合格するためにぎりぎりを目指すのもいいけどどれくらいがんばればいいかわからない人に
試験問題が多いと大変ですね()
挑戦回数による合格率の変化
項目応答理論
 
線形計画法でストーキング
シンプレックス法と並列計算によるシミュレーションで、班分けを考えた話。並列計算はこのときに勉強したが、まさかこんなことで使うと思わなかったし、このときの経験が今後ものすごい活きてくるとはまったく思わなかった。
シンプレックス法を用いたコース割当シミュレーション
線形計画法を用いて当直の最適な割り当てを考える
ryamadaの遺伝学・遺伝統計学メモ 2次計画問題
安定マッチング問題
就職活動希望先の地域差
沖縄だけ絶妙に例外的に描く
 
ド素人が始めるテキストマイニング
テキストマイニングもやってみると面白かった。周りの人にはこれをやっている人は少ないけれども、この応用範囲は広くて、これ自体に興味を持っている人が多かったので勉強になったし、話のネタにもなった。
MeCabの辞書をはてなキーワードで充実させるのにものすごい苦労した話
声優統計第二号 トピックモデルを用いたニコニコ動画コメントデータの声優トピック流行推移解析
初音ミクの流行解析をDTMで
トピックモデルを使ってラブライブの歌を解析する
ラブライブ スクフェスの楽曲属性をCTMで予測する
47の心得シリーズをトピックモデルで分類する
 
声優の声に魅せられて
声優統計の音声解析に興味を持って、Rでもできるらしいと知ってやってみた。やってみたはいいがかなり難しく、これ以上の勉強が進んていないのは残念。
声優統計第三号 複数の声優によるセリフの音響的類似性の考察:不愉快です
 
RでGIS
空間的なものの処理とか統計とかそういう知識はほとんどないのだけれども、
祇園祭の山鉾の最適巡回経路
RGoogleMapでGoogleと連携してiPhone5sの繋がりやすさをプロットする
 
Rでお絵描き
Rの真骨頂は柔軟なプロット機能だと思っているので、Rでアイコンを作成することなぞ造作も無い。
みくみくにしてやんよ
みくみくにしてあげる
初音ミク関数
おっぱい関数
KABIRAの日記 3dの拡散
KABIRAの日記 3dでの拡散
細胞カウント
 
あとがき
バイオインフォマティクスといいながらあんまりバイオインフォマティクス成分がなかった件。UCSC Genome Browser をRのplotで再現するということも可能。
これからはこちらを参考にBUGSをやってみようかなと思う。とりあえず
RStanを入れないといけないっぽい。