2013-09-01から1ヶ月間の記事一覧

Directed random walk

グラフにおけるDirected random walkの話。Bioinformatics. 2013 Sep 1;29(17):2169-77. RではKEGGと組み合わせて iSubpathwayMiner というパッケージでできるらしい。

就職活動希望先の地域差

おなじみのspsurveyを使ってプロットしてみる。 とある業界の就職活動で、病院ごとに定員があって、どれだけの人が第一順位で志望を提出しているかのデータがある。 これを各都道府県ごとに、どの都道府県で人数が定員に対して足りているか(人気)というのが…

A Red Flag

NEJM. 2012 May 3;366(18):1725-30. 気管支軟化症で気管支喘息との鑑別に苦慮した話。 バックナンバー

Whistling in the Dark

NEJM. 2009 May 7;360(19):2005-10. 好酸球増加症候群で心筋に好酸球が浸潤するらしい。 バックナンバー

SPADE続き

SPADEをFCMのサンプルデータにやってみたわけだがやっただけで中身は保留。 たぶんFSC.Hで高いところ(ネットワークの赤いノード)がこんな感じに対応している。

二次元のヒストグラム

2変数のときにx軸とy軸でヒストグラムを描きたいと思った。 layoutを用いてゴリ押しもいいけど、パッケージを用いてできるらしいのでやった。 これでマイクロアレイやFCMで分布がわかりやすくなる。

Cyto Spanning tree Progression of Density normalized Events (SPADE)

SPADEという細胞分化の分岐図を描く手法を教えてもらったのでやってみる。 FCMから得られたデータを使う。 デフォルトだと出力が pdf にしかならなくてイラッ☆としたのでノードのサイズを取得して igraph でゴリ押しした。 library(spade) library(flowViz) …

路線図

駅間での繋がりやすさ(Mbps)。connect.txtのほう。 s1 s2 docomo au softbank 東京 有楽町 10.77 19.91 15.14 有楽町 新橋 2.17 14.51 19.6 新橋 浜松町 6.42 9.61 7.6 浜松町 田町 2.11 5.89 6.17 田町 品川 4.76 2.43 7.9 品川 大崎 2.69 8.99 16.84 大崎 …

データ

駅の経度、緯度、繋がりやすさ(Mbps)。yamanote.txtのほう。 station lat lon docomo au softbank 東京 35.681391 139.766103 16.85 27.41 23.33 有楽町 35.675441 139.763806 1.16 9.68 3.64 新橋 35.666151 139.758654 13.54 12.66 9.6 浜松町 35.655391 1…

RGoogleMapでGoogleと連携してiPhone5sの繋がりやすさをプロットする

注意 au iPhone5ユーザーだがパケット通信をしないのでその会社に思い入れがあるわけではない。 調査会社はauの子会社の模様(2ch調べ)らしいのでバイアスはある。 ステマではありません。 iPhone5sが発売になったわけだが、docomo, au, softbankの3キャリア…

Rでフローサイトメトリー(FCM/FACS)

フローサイトメトリー(FCM)という実験がある。これは、細胞表面に抗原があるのを抗体反応で標識して、標識された細胞に光を当てて抗体反応が起きていたか、つまりその抗原が存在するかを識別する実験である。 実験機器が許す限り、抗原標識は可能で、たいて…

新幹線駅座標・利用者データ

"lon","lat","people","station_name" 141.216955,39.960155,88,"いわて沼宮内" 140.27867,38.152259,100,"かみのやま温泉" 140.380677,38.42806,100,"さくらんぼ東根" 141.138177,38.926514,2451,"一ノ関" 139.898389,36.559246,12245,"宇都宮" 138.922798,…

新幹線隣接行列

,"博多","小倉","新下関","厚狭","新山口","徳山","新岩国","広島","東広島","三原","新尾道","福山","新倉敷","岡山","相生","姫路","西明石","新神戸","新大阪","京都","米原","岐阜羽島","名古屋","三河安城","豊橋","浜松","掛川","静岡","新富士","三島…

ネットワークの動的進化

ネットワークが変化するという話を聞いていたのだが、質問で 「それでは日本の鉄道路線でシミュレーションしたら人口的に東京が首都ではなくなってしまったりしますかね?」 と聞いたら面白そうだけどわからないと言われたのでやってみる。 全鉄道路線はめん…

反復測定分散分析

数学いらずの医科統計学PART7 CHAPTER39で、反復測定分散分析について書いてある。 ふむ、なるほどわからんと思ったが要は対応のある検定を考える。こちらのデータセットをパクってやってみる。 # 下のものをコピペ data0 <- read.table("clipboard", sep="\…

CafeMol

CafeMol はMDシミュレーションを行うツールのひとつ、らしい。CafeMol をインストールしたフォルダで作業する。 ./cafemol ./example/sh3/sh3.inp でいきなりMDシミュレーションができる。その前にインプットファイル ./example/sh3/sh3.inp を以下のように…

MEGADOCK

タンパク間相互作用はMEGADOCKを用いて計算できる。PDB ID:1PPE という複合体とかいうタンパクのドッキングをサンプルとして行う。データはこちらから入手して解凍したら tutorial というフォルダがあるのでここで作業する。 MEGADOCKはノートPCからスパコン…

必要なプログラム

sudo apt-get update sudo apt-get upgrade sudo apt-get install emacs sudo apt-get install pymol sudo apt-get install g++ sudo apt-get install gfortran sudo apt-get install python2.7-dev sudo apt-get install python-numpy sudo apt-get install…

タンパク質間相互作用と分子動力学シミュレーション

タンパク質間相互作用と分子動力学法をやるプログラムの簡単なセミナーに出たのでやってみる。 たぶん日本語のブログでは初の記事ではないかと制作者も言っていた。 必要なプログラムのインストールは一番下。推奨OSはUbuntu 12.04 LTS。 リリース 12.04 (pr…

Tokyo.R#33に行ってきた

Tokyo.R#33に行ってきたのでメモ。 Rで計量時系列分析 forecast:単変量時系列データモデリングと予測。ARIMA自己回帰和分移動平均過程 vars:多変量時系列モデリング・予測・因果性の推定。Granger因果性検定 causality tseries:単位根と見せかけの回帰 ur…

pixivのタグ頻度から考えるラブライブのカップリング

進撃の巨人を読んだことない人がデータだけでキャラを推測してみる - あんちべ!というのが面白そうだったので、毎度おなじみのラブライブ!でネットワーク解析をしてみる。 pixivの小説からタグを取ってくる。作業は pixiv というフォルダとする。 # Rで tag …

分散拡大係数 VIF

数学いらずの医科統計学PART7 CHAPTER38で、重回帰分析における過剰適合について説明しているのをみて、変数選択のシミュレーションをした。 今回は分散拡大係数 (VIF)について。 決定係数を用いて、を計算した時、10を超えているとかなり多重共線性が怪しい…

項目応答理論

項目応答理論というものを知ったのでやってみる。 試験の結果に対して使うのが一般的だが、医学的に、特に遺伝子的に何か使ってないかと思ってPubmedで探したけれども、試験結果に使ったものが多くてSNP系にはなかった。 それでどう使おうかと考えてみたわけ…

Multifactor Dimensionality Reduction (MDR)

Multifactor Dimensionality Reduction(MDR)という手法がある。意味のある組み合わせを考えたいが、組み合わせ爆発が起こるのでうまくbin化しながら考えるようなイメージだと思った。これを遺伝医学に応用した話。 Am J Reprod Immunol. 2013 Jul 31. RではM…