Rpackage

multi-armed bandit problem

multi-armed bandit problem というものがある。 元々はギャンブラーがどのスロットマシーンをやれば、利益を最大化できるかという話から始まったらしいが、最近は教科学習として流行って、webコンテンツのクリック率だとかそういう分野で使われている。 こ…

方向ベクトルと平面の内分点

とある3D オブジェクトであるうさぎを貫くベクトルがあるとする。 ベクトルは極座標表示なので、中心からある程度伸ばして、そしてxyz 座標に変換する。 うさぎ自体はmesh3d オブジェクトで、もともとは頂点オブジェクト bun.v, エッジオブジェクト bun.f か…

時系列データにt 検定を行う

読んだ Nature (2016) doi:10.1038/nature18294 PD1/PDL1 系の薬剤は高いので、それが良く効く患者集団を選びたいというのが最近のトレンドォ!!! 3' 側のUTR がないことで、PD-L1 の発現があがり、それによって免疫機構から逃れるPD1/PD-L1 axis がクッソすご…

球状の物体をメルカトル図法で2次元にする

物体をいじって球にしている。いま、球になった物体があるとして、これを2次元平面に展開して眺めたい。 地球儀が世界地図になるメルカトル図法みたいな感じ。 もとのうさぎは、各頂点の(離散)ガウス曲率にしたがって色付けしてある。正なら赤、0近くは灰色…

update したらログインできなくなるという謎仕様

windows 10 よりもさらに凶悪な仕様である。 そもそものモチベーションは、rstan を使おうと思ったらまったくインストールできない。 以前はcran に登録されていなかったので、devtools からrstan サイトを指定してうんぬんかんぬんだったが、現在ではinstal…

物体の体積と表面積

物体の体積と表面積を計算したい。 三角メッシュ化されていれば、表面の三角形を足せば表面積はどうにかなる。 問題は体積。 The GNU Triangulated Surface Library(GTS)というもので計算できるっぽい。 sudo apt-get install libgts-dev Python でも使える…

四元数の演算

四元数の内積が欲しかったのでメモ。 四元数は2つの虚数単位, , (), と4つの実数, , , を用いて と書ける。これを実数部分(スカラー部)と虚部(ベクトル部)に分けて とも書く。 いま、ふたつの四元数, について、積は となる。 計算して確かめる。三角形の面…

Kalman filter を用いてparticle tracking

読んだ。BMC Cell Biology201011:24 細胞の移動追跡を自動化してやってくれるソフトウェアTime Lapse Analyserの話。 マニュアルでやると細胞全体はもちろんチェックできないし、代表的な20細胞を選んでtracking してもらったら軒並みAMD (average mean dist…

第26羽:宝物は君の#gochiusa で呟いた瞬間

この記事はごちうさ住民 Advent Calendar 2015 の第26日目の記事です(2年連続の勝手に参加。 ネタと解析がなやましい これが私の最大限です 11月の始めころになんとなしにググっていたところ、上記のアドベントカレンダーが今年も行われることに気づいた。 …

塩基のIUPAC表記

塩基はACTG の4文字からなるが、C もしくはG のように代替パターンがあるときにS などの表記がIUPAC で決まっている。 seqinr パッケージの関数でできて、 C/G がS であることを確認するにはbma, S がC/G であることを確認するにはamb を使う。 amb(c("s")) …

Interrupted time-series analysis

Interrupted time-series analysisという解析法をやろうと思ったのでやってみたメモ。 J Clin Pharm Ther. 2002 Aug;27(4):299-309.(PDF)を読めばいい。 データとしては、次の図のような日時と処方数のデータについて、とあるイベントが起きたときのそのイベ…

ラブライブの新聞全国展開

ラブライブ劇場版の見開き広告が全国展開されて、各都道府県で違うらしい。 わかりやすくプロットしといた。 library(spsurvey) jpn_GA <- read.shape("JPN_adm/JPN_adm1.shp") # 日本全体の設定 xl <- c(129, 146) yl <- c(30.8, 45) dat <- read.delim("ne…

Bradley–Terry model

Bradley–Terry modelという、組み合わせ勝負の序列推定法が論文に使われている。 Nat Genet. 2015 May;47(5):458-68. 日本語解説 脳腫瘍はいわゆる普通の癌のような、TNM分類による悪性度 Grade X はなく、病理学的分類からWHO I 〜 IV というカテゴリになる…

Fisher's Least Significant Difference (LSD) test

Fisher's Least Significant Difference (LSD) testというpost hoc analysisを聞いた。 というのも、N群のデータでどれとどれに有意差があるか、ということを検定したいときに、単純に通りのt検定をすると多重検定補正が必要で云々、となるが、生物学や医学…

Multiple alignment

Multiple alignment してほしいんだけど、と言われて系統樹まで作った話。 遺伝的距離や系統樹についてはこちらが詳しいし、塩基配列の変化パターンによる重み付けについては昔やった。 Multiple alignment はClustal がよく言われるが、ClustalW2を使ってみ…

ハロー!!きんいろ deep learning モザイク

注意:この記事は大好評放送中のハロー!!きんいろモザイクと最近話題のDeep learning をかぶせて話題沸騰!!にしたかったけれども、きんいろモザイクに出ている声優のサンプルボイス(東山奈央)が入手できず、DNNについても結局実装が間に合わずにrandom fores…

野良研究者でもNature書きたい

某アニメのパクリだが、厳密には姉妹誌であるNature Methodsの話である。 Nat Methods. 2015 Feb 26;12(3):179-85.にp値についてわかりやすい話とおそらくRでやったと思われるシミュレーションがあるので再現してみる。 p値について理解は深まるし、どちらか…

駄目絶対音感

声優統計第四号において、駄目絶対音感の例として、レベルネオのCMの声優を日笠陽子と誤答する例が紹介されている。実際には早見沙織である。 声優の声の解析は声優統計および自分自身においても長らく滞っている分野であり、声優統計第五号がいろんなまとめ…

GF(仮)のキャラがニーソなのかどうなのかを Deep learning を使ってなんとか知りたい

GF(仮)を見てる。 クロエ・ルメールのようなニーソキャラが好きなのだが、これをどうにかキャラプロフィールから推定できないか…と思っていたら MNIST手書き文字データをdeep learnignで分類するっていう、あの有名なやつを、Rパッケージであるh2oでやる、と…

Twitterの投稿時間分布から考える声優のあれこれ

これとこれ(取り下げになってるけど)に触発されて次の声優統計ネタにしようと思ってやってみる。 Twitterの投稿時間分布が似ていれば、生活習慣が似ているだろうし、アフレコとかラジオとか仕事がちょっとはかぶっているだろうし、男と女の関係を邪推したり…

自称、統計学をやっていますとドヤ顔するものなので

赤ちゃんに保湿剤を塗るとアトピー性皮膚炎が減るらしい。 赤ちゃんに毎日保湿剤 アトピー減 生後まもない赤ちゃんの皮膚に保湿剤を毎日塗ると、アトピー性皮膚炎になるリスクを30%減らすことができたとする研究成果を、国立成育医療研究センターのグループ…

声優の誕生日のカレンダープロット

カレンダープロットなんてものを見てしまうと声優の誕生日でやってみたくなってしまう。 1月生まれが多そうな感じ。

sankey plotと声優の誕生日

sankey plotというものを見た。 RでもrCharts, googleVis, riverplotパッケージあたりでできるらしいがこれを知る前に2時間くらいかかって作った。 つなぐのはロジスティクス関数で曲線を補完する。 4つの県と6つの高校でやってみたらこんな感じ。 声優の誕…

Rstanのインストール

巷で話題のRstanをインストールだけしておいた。 OSはubuntu 12.04 LTS. なんか困ったらhttp://heartruptcy.blog.fc2.com/かAnalyze IT.を見れば問題ない。 # 依存関係 install.packages("inline") install.packages("Rcpp") install.packages("coda") # あ…

Bioinformaticsの最新手法 Wanderlust: Trajectory detectionで女の子の成長度を定量化する

Wanderlustという手法がある(Cell. 2014 Apr 24;157(3):714-25.)。Trajectory detectionともいう。どちらで呼べばいいかはようわからん。 FACSデータのような高次元データに対して、SPADEやviSNEなどのように、適当にデータ量を削減しながら、分化系統樹が作…

Propensity score analysis の sensitivity analysis

Propensity scoreをやってみたわけだが、観察研究を事後解析的になんやかんやするので、観察して得られたパラメータしか持っていない。 その限られたパラメータから、治療が行われる確率としてPSが計算されるので、もし、このモデルに組み込まれておらず、か…

Propensity score matching をやってみたわけだがうまくいかなかった

Propensity scoreを勉強したのでやってみる。 JAMA. 1996 Sep 18;276(11):889-97.のRight heart catheterization datasetを使う。 Propensity scoreに必要なRパッケージについてと、スクリプトはそれぞれリンクから適当にパクる。 結論からいうと論文入手で…

細胞カウント

細胞を使った実験をしていると、溶液中にどれくらいの細胞があるかを数えなければならないことがある。それで、プレパラートみたいなものの上に10μlくらい細胞の入った溶液を乗っけて、顕微鏡観察下でバードウォッチングの如くカチャカチャ数を数える。 プレ…

EBImageからいくつか関数が消えた

EBImageといえばこれだったが、図に文字を描けるdrawtextが使えなくなっていたのでヒートマップにゴリ押しした結果がこちら。 library(EBImage) # システムファイルからサンプルデータを読み出す。 nuc <- readImage(system.file("images", "nuclei.tif", pa…

沖縄だけ絶妙に例外的に描く

spsurveyで日本地図を描くのだが、沖縄だけ遠いから絶妙に日本海側に描く方法をゴリ押しした。 library(spsurvey) jpn_GA <- read.shape("JPN_adm/JPN_adm1.shp") # 日本全体の設定 xl <- c(129, 146) yl <- c(30.8, 45) cols <- bluered(100) lmat <- matri…