Rを使いこなす

Nonlinear Regression with R

読んだ。Nonlinear Regression with R (Use R!)作者: Christian Ritz,Jens Carl Streibig出版社/メーカー: Springer発売日: 2009/02/03メディア: ペーパーバックこの商品を含むブログを見るモデル自体は指数関数モデルや濃度曲線など簡単なものが多く、ペー…

俺の果南とルビィの仲がこんなに悪いわけがない

サンシャインメンバーのセリフ回数を調べたので、そのまま名前の呼び合いグラフを作った話。 名前を呼んでいる、愛称は可。善子が自分のことを「善子ちゃうわヨハネや」というのも両方カウントしている。 ダイヤのことを生徒会長、鞠莉のことを理事長はよそ…

Distatis: 距離行列が複数あるときに元のデータの関係性を推定する

読んだ。 Proceedings of the IEEE Computer Society: International Conference on Computer Vision and Pattern Recognition. 2005. pp. 42–47. Food Quality and Preference, 2007, 18, 627–640. 複数の距離行列が与えられたとき、元のデータの関係をMDS …

俺の果南のセリフがこんなに少ないわけがない

ラブライブ! サンシャインを見ていた。視聴前のキャラデザでは圧倒的に松浦果南、桜内梨子の圧勝だった。 13話についてはいろいろ思うところがあるだろうが、これまでに視聴していて気になったことがある。 『ラブライブ!サンシャイン!!』果南ちゃん出番な…

Rで楽しむ統計 (Wonderful R 1)

読んだ。Rで楽しむ統計 (Wonderful R 1)作者: 奥村晴彦,石田基広,市川太祐,高橋康介,高柳慎一,福島真太朗出版社/メーカー: 共立出版発売日: 2016/09/08メディア: 単行本この商品を含むブログ (8件) を見るCOI:著者のつぶやくはよく見かけるけど知り合いでは…

援助交際してそうなアニメキャラランキング2016をstanで考える

注意:本解析の結果と、実際に声優がそうであるかはまったく関係がありません。 援助交際してそうなアニメキャラランキング2015をstanで考えたことがあったのだが、2016年度版も集計されたので解析してみる。 2015年は以前にもやったが、2016年度分はスレを…

BUGS で学ぶ階層モデリング入門

読んだ。BUGSで学ぶ階層モデリング入門: 個体群のベイズ解析作者: Marc K´ery,Michael Schaub,飯島勇人,伊東宏樹,深谷肇一,正木隆出版社/メーカー: 共立出版発売日: 2016/03/25メディア: 単行本この商品を含むブログ (2件) を見るデータ置き場 階層モデリン…

Precision and Recall

機械学習の分野で分類性能の評価に適合率と再現率というものがある。 医学分野での分類には、たいてい病気/非病気のラベルの分類にはReceiver Operating Characteristic (ROC) 曲線と曲線下面積AUC を使うが、情報系ではPrecision-Recall curve (PRC) とF1 …

離散型物体データの球面調和関数展開

球面調和関数を使って.obj データを級数展開してくれるやつを後輩が書いてくれたのでやってみる。 例えばこれ(J Med Syst. 2014 May;38(5):20.)では、病気の肝臓と健康な肝臓をCT画像から構成して、球面調和関数による比較分類を行っている。 肝硬変が進んだ…

自己相関のある時系列データの分散

読んだ。Introductory Time Series with R (Use R!)作者: Paul S.P. Cowpertwait,Andrew V. Metcalfe出版社/メーカー: Springer発売日: 2009/06/09メディア: ペーパーバック購入: 2人 クリック: 2回この商品を含むブログを見るAR, MA, ARIMA, ARCH, 状態空間…

Type S error: ベイズ的多重検定

Bayesian inference completely solves the multiple comparisons problem « Statistical Modeling, Causal Inference, and Social Science にType S error (Computational Statistics (2000) 15: 373.) という論文がある。 古典的な仮説検定では を帰無仮説…

リストの中に行列があってそれをくっつけてテンソルっぽくしたい

こんな感じで、リストの中に行と列の数が等しい行列があったとする。長さは簡単のため2にしている。 a <- mapply(function(z) matrix(z, 2), list(1:6, -(1:6)), SIMPLIFY=FALSE) [[1]] [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6 [[2]] [,1] [,2] [,3] [1,] -1 …

Spike-and-slab

読んだ Nat Genet. 2016 Aug 1. 様々なデータを取ってきて、遺伝子との相関があるかを解析するわけだが、サンプルの人数、組織、遺伝子の3次元をサンプル×要素(component やfactor と呼ぶ)と要素×遺伝子の行列に分解することで、テンソル分解してデータの構…

GPU もrPython を使ってやってみる

GPUを使ってみようと思うのだが、メモリがうんたらかんたら言われて、巨大なデータを入力すると動かないので、Python でやったら実はいい感じに動くのではないかと思ってやってみる。 Python ならpycuda, gnumpy があるようだが、gnumpy のほうがnumpy ベー…

球面調和関数をrPython でやる

球面調和関数をやりたいがRではいいものがないのでPythonでやった結果をrPython を使ってRでゴリ押し計算するやり方。R を投げ捨ててPython に移行したかったが、結局R でやっちゃう。 rPython について知りたければ下にスクロール。 球面上の離散的な分布を…

rmarkdwon で出力にGIF を入れたい

plot をfor loop にいれたままうっかりrender すると、出力がすべてプロットされて縦に長いhtml ができてしまう。 せっかくだからGIF 化しよう。 こちらやこちらを参考に、fig.show="animate" を指定すればできる。 ただ、ubuntu ではffmpeg が必要だが、簡…

高次元での回転と疎行列

3次元物体を回転させたい。 2次元であれば回転行列は回転角を用いて と書ける。 高次元での回転ならば、正方対角行列(対角成分は1)について、(i, i), (i, j), (j, i), (j, j) 成分をひらすら上ので置換していけば、ある軸での回転を表す。 特に3次元では、x…

rmarkdown とknitr による文書作成

markdown 形式のrmarkdown とknitr を使って、授業資料の作成および解析結果の報告、宿題の提出などやっている。 HTML にすることでrgl の3D プロットなども出せるので、3D データを扱っているときにもよさげ。 真面目にやるならpandoc をインストールしてre…

クラスタリングしないheatmap のNeatMap

読んだ BMC Bioinformatics. 2010 Jan 22;11:45. NeatMap というパッケージで使える。 data(mtcars) # heatmap1 NeatMap::heatmap1(mtcars) # circularmap make.circularmap(as.matrix(mtcars), metric="euclidean", cluster.method="complete.linkage", nor…

3次元空間の補間 kriging

3次元空間の補間 interpolation をしたい。 空間統計学やGIS ではkriging と呼ばれる手法を用いている。 interpolation 自体はakima, kriging はpracma, kriging パッケージでできる。 pracma のkriging は、補間して推定したい点をひとつ入れれば、それに対…

3次元オブジェクトをグラフにしてみる

平均曲率を用いて、3次元オブジェクトの表面を色付けした。 凹んでいるところは赤、出っ張っているところは緑になっている。 いま、同じ色でひと続きになっている領域を仲間分けして、なおかつ、隣り合う領域がどうなっているかを調べたい。 ある頂点と、そ…

multi-armed bandit problem

multi-armed bandit problem というものがある。 元々はギャンブラーがどのスロットマシーンをやれば、利益を最大化できるかという話から始まったらしいが、最近は教科学習として流行って、webコンテンツのクリック率だとかそういう分野で使われている。 こ…

時系列データにt 検定を行うことに関してstan 神の解析がやばい

時系列データにt 検定を行うことに関して、すごいもにょっていたのだが、そもそもstan 神が既にモデル化してくれていた。 リンクでは2階差分と、変化点検出のコーシー分布の合わせ技を用いている。 そのままパクってやってみる。 diの95%ベイズ信頼区間が0を…

成長速度の変化点

読んだ Behav Ecol Sociobiol. 2007 Dec;62(2):245-253 dimorphic allometry という二形性の成長を見ていて、その変化点らしきところを推定する。 論文ではT. dichotomus septentrionalis と呼ばれる、いわゆるカブトムシの体の大きさ(body) と角(horn) につ…

update したらログインできなくなるという謎仕様

windows 10 よりもさらに凶悪な仕様である。 そもそものモチベーションは、rstan を使おうと思ったらまったくインストールできない。 以前はcran に登録されていなかったので、devtools からrstan サイトを指定してうんぬんかんぬんだったが、現在ではinstal…

Kalman filter を用いてparticle tracking

読んだ。BMC Cell Biology201011:24 細胞の移動追跡を自動化してやってくれるソフトウェアTime Lapse Analyserの話。 マニュアルでやると細胞全体はもちろんチェックできないし、代表的な20細胞を選んでtracking してもらったら軒並みAMD (average mean dist…

離散曲面上のガウス曲率

3次元メッシュ上の点のガウス曲率を求める。 これとかこれ (PDF)とかに載っている。 あるvertex の周辺に の点がある。これはよく1-ring と書かれている。 結論から書くと、青で示された面積, で囲まれる三角形のの角度を用いて で定められる。曲面について…

RでGPU を使う

RでGPUを使う時がきたようだ。 しかし、使える環境を整備するだけで1日潰れた。 OS はubuntu 14.04 メモリは 32GB CPU は Intel(R) Xeon(R) CPU E5-1620 v3 @ 3.50GHz GPU は GeForce GTX 750 Ti が2枚 NVIDIA の準備 GTX 750 Ti のドライバーは361だが、apt…

四元数とベクトルとメッシュと面積と

3次元物体をあつかっている。 3次元座標を四元数で扱うと回転や行列計算などが簡単らしい。 いま、頂点が三角メッシュ化されて表面が形成されている.obj のうさぎがいるとする。 いま、表面の各三角形の面積の合計が、四元数と疎行列を用いてこんな感じで計…

Deep learning を使ったグラム染色画像の細菌同定システム

Deep learning を使って、グラム染色で見えている細菌がなんの菌なのかを判定しようという試み。 実際は半年以上前に手をつけていたけど、プレリなところで終わっていて、データ取りをするのにめんどくさかったのでもうやめたので誰かやってみたらいいんじゃ…