2016-01-01から1年間の記事一覧

確率的グラフィカルモデル

読んだ。確率的グラフィカルモデル作者: 鈴木譲,植野真臣,黒木学,清水昌平,湊真一,石畠正和,樺島祥介,田中和之,本村陽一,玉田嘉紀出版社/メーカー: 共立出版発売日: 2016/07/23メディア: 単行本この商品を含むブログ (2件) を見るCOI:ラボにあった。編集者…

Distatis: 距離行列が複数あるときに元のデータの関係性を推定する

読んだ。 Proceedings of the IEEE Computer Society: International Conference on Computer Vision and Pattern Recognition. 2005. pp. 42–47. Food Quality and Preference, 2007, 18, 627–640. 複数の距離行列が与えられたとき、元のデータの関係をMDS …

俺の果南のセリフがこんなに少ないわけがない

ラブライブ! サンシャインを見ていた。視聴前のキャラデザでは圧倒的に松浦果南、桜内梨子の圧勝だった。 13話についてはいろいろ思うところがあるだろうが、これまでに視聴していて気になったことがある。 『ラブライブ!サンシャイン!!』果南ちゃん出番な…

重回帰のときに必要なデータの数はパラメータの数の10倍です

読んだ。 J Clin Epidemiol. 1995 Dec;48(12):1503-10. パラメータ数が のデータを標本数 個観測して重回帰なりなんらかの回帰分析を行うのだが、「標本数はいくつあったらいいんですか?」と聞かれることが多々ある。そういうとき、パラメータの10倍(10)あっ…

Rで楽しむ統計 (Wonderful R 1)

読んだ。Rで楽しむ統計 (Wonderful R 1)作者: 奥村晴彦,石田基広,市川太祐,高橋康介,高柳慎一,福島真太朗出版社/メーカー: 共立出版発売日: 2016/09/08メディア: 単行本この商品を含むブログ (8件) を見るCOI:著者のつぶやくはよく見かけるけど知り合いでは…

援助交際してそうなアニメキャラランキング2016をstanで考える

注意:本解析の結果と、実際に声優がそうであるかはまったく関係がありません。 援助交際してそうなアニメキャラランキング2015をstanで考えたことがあったのだが、2016年度版も集計されたので解析してみる。 2015年は以前にもやったが、2016年度分はスレを…

球面調和関数をR でやる

球面調和関数をrPython でやっていたが、R だけで完結するほうが、rPython に投げてやりとりするより圧倒的に高速かつ安定なので、頑張ってR でやった。 ゴールとしては、 となる係数 を求めることだが、これはルジャンドル陪関数が直交するという性質を利用…

Python機械学習プログラミング 達人データサイエンティストによる理論と実践

読んだ。 (読んでた)Python機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)作者: Sebastian Raschka,株式会社クイープ,福島真太朗出版社/メーカー: インプレス発売日: 2016/06/30メディア: 単行本(ソフトカバー)こ…

BUGS で学ぶ階層モデリング入門

読んだ。BUGSで学ぶ階層モデリング入門: 個体群のベイズ解析作者: Marc K´ery,Michael Schaub,飯島勇人,伊東宏樹,深谷肇一,正木隆出版社/メーカー: 共立出版発売日: 2016/03/25メディア: 単行本この商品を含むブログ (2件) を見るデータ置き場 階層モデリン…

Precision and Recall

機械学習の分野で分類性能の評価に適合率と再現率というものがある。 医学分野での分類には、たいてい病気/非病気のラベルの分類にはReceiver Operating Characteristic (ROC) 曲線と曲線下面積AUC を使うが、情報系ではPrecision-Recall curve (PRC) とF1 …

離散型物体データの球面調和関数展開

球面調和関数を使って.obj データを級数展開してくれるやつを後輩が書いてくれたのでやってみる。 例えばこれ(J Med Syst. 2014 May;38(5):20.)では、病気の肝臓と健康な肝臓をCT画像から構成して、球面調和関数による比較分類を行っている。 肝硬変が進んだ…

vim の設定

というよりPC 環境全般の話。 スクリプトを書いている。 しかし、マウスGUI ユーザーなので残念ながら腱鞘炎になってしまった。 通常のマウスをやめてトラックボールにしたが、母指IP 関節が半端無く痛い。 というわけで利き手とは逆の手にマウスもおいてい…

自己相関のある時系列データの分散

読んだ。Introductory Time Series with R (Use R!)作者: Paul S.P. Cowpertwait,Andrew V. Metcalfe出版社/メーカー: Springer発売日: 2009/06/09メディア: ペーパーバック購入: 2人 クリック: 2回この商品を含むブログを見るAR, MA, ARIMA, ARCH, 状態空間…

医学・生命科学研究に使える遺伝統計関連のデータベース

遺伝統計夏の学校というものに来ている。 データベースが増えすぎていてすべてはもちろんわからないので、知った時に知識を増やしておこう。 スライドより一覧。 ゲノム・遺伝子情報のWebツール UCSC Genome Browser https://genome.ucsc.edu/cgi-bin/hgGate…

Type S error: ベイズ的多重検定

Bayesian inference completely solves the multiple comparisons problem « Statistical Modeling, Causal Inference, and Social Science にType S error (Computational Statistics (2000) 15: 373.) という論文がある。 古典的な仮説検定では を帰無仮説…

リストの中に行列があってそれをくっつけてテンソルっぽくしたい

こんな感じで、リストの中に行と列の数が等しい行列があったとする。長さは簡単のため2にしている。 a <- mapply(function(z) matrix(z, 2), list(1:6, -(1:6)), SIMPLIFY=FALSE) [[1]] [,1] [,2] [,3] [1,] 1 3 5 [2,] 2 4 6 [[2]] [,1] [,2] [,3] [1,] -1 …

声優統計の統計 C90版 & Q&A

声優統計第八号は完売しました。 IF は自己引用していたのが自分だけだったので、0.67 と1 を切ってしまいました。しかし、アニメ動画の音声とキャスト情報を用いた声優認識 (PDF)に声による既婚声優の判別問題が引用されるという謎現象が発生したのがC89-C9…

声優統計第八号:声優しりとり

声優統計第八号で声優しりとりについて書いた。 最長しりとり問題は既に最長しりとり問題の解法という論文があるし、ポケモンでやってみたという修士論文がある。 codeiqではC の予約語34語でやってみるという問題が出ている。実装はRuby でされている。 今…

Spike-and-slab

読んだ Nat Genet. 2016 Aug 1. 様々なデータを取ってきて、遺伝子との相関があるかを解析するわけだが、サンプルの人数、組織、遺伝子の3次元をサンプル×要素(component やfactor と呼ぶ)と要素×遺伝子の行列に分解することで、テンソル分解してデータの構…

GPU もrPython を使ってやってみる

GPUを使ってみようと思うのだが、メモリがうんたらかんたら言われて、巨大なデータを入力すると動かないので、Python でやったら実はいい感じに動くのではないかと思ってやってみる。 Python ならpycuda, gnumpy があるようだが、gnumpy のほうがnumpy ベー…

球面調和関数をrPython でやる

球面調和関数をやりたいがRではいいものがないのでPythonでやった結果をrPython を使ってRでゴリ押し計算するやり方。R を投げ捨ててPython に移行したかったが、結局R でやっちゃう。 rPython について知りたければ下にスクロール。 球面上の離散的な分布を…

球面上に均等な点を配置したい

球面上に均一な点を配置したい。約N個ならばこんな感じでやれるが、厳密にN 個おきたい。 実装が簡単なこれをやってみる。 そもそも、なぜ均一な点を球面上に配置したいかというと、基準点集合として扱えるからである。計算機では3次元データは離散的に持っ…

rmarkdwon で出力にGIF を入れたい

plot をfor loop にいれたままうっかりrender すると、出力がすべてプロットされて縦に長いhtml ができてしまう。 せっかくだからGIF 化しよう。 こちらやこちらを参考に、fig.show="animate" を指定すればできる。 ただ、ubuntu ではffmpeg が必要だが、簡…

高次元での回転と疎行列

3次元物体を回転させたい。 2次元であれば回転行列は回転角を用いて と書ける。 高次元での回転ならば、正方対角行列(対角成分は1)について、(i, i), (i, j), (j, i), (j, j) 成分をひらすら上ので置換していけば、ある軸での回転を表す。 特に3次元では、x…

rmarkdown とknitr による文書作成

markdown 形式のrmarkdown とknitr を使って、授業資料の作成および解析結果の報告、宿題の提出などやっている。 HTML にすることでrgl の3D プロットなども出せるので、3D データを扱っているときにもよさげ。 真面目にやるならpandoc をインストールしてre…

クラスタリングしないheatmap のNeatMap

読んだ BMC Bioinformatics. 2010 Jan 22;11:45. NeatMap というパッケージで使える。 data(mtcars) # heatmap1 NeatMap::heatmap1(mtcars) # circularmap make.circularmap(as.matrix(mtcars), metric="euclidean", cluster.method="complete.linkage", nor…

3次元空間の補間 kriging

3次元空間の補間 interpolation をしたい。 空間統計学やGIS ではkriging と呼ばれる手法を用いている。 interpolation 自体はakima, kriging はpracma, kriging パッケージでできる。 pracma のkriging は、補間して推定したい点をひとつ入れれば、それに対…

アレのサイズの自己申告に基づくデータに見られるheaping をrstanで解析する。

rstan神がやっている人口ピラミッドのAge Heapingを階層ベイズで補正するという解析について、自己申告に基づくデータにheapingが見られるという別の話があったので、3番煎じだがrstanを使わねば!! 上記のブログにある分布は、ギザギザしすぎているし、デー…

ラブライブ! サンシャイン!! のAqours メンバーがラブライブのμ's の誰に相当するか考える。

ラブライブ!サンシャイン!が始まりそうである。 無印ラブライブの時はまったく注目していなかったので、アニメが始まってから(なんだこれ…)と思いながら見ていたが、3話くらいになると(ブヒィ)とか言ってた。 ラブライブは9人、サンシャインも(たぶんメンバー…

はじめての 統計データ分析 ―ベイズ的〈ポストp値時代〉の統計学―

COI:筆者とはなんの関係もありません。 読んだ。はじめての 統計データ分析 ―ベイズ的〈ポストp値時代〉の統計学―作者: 豊田秀樹出版社/メーカー: 朝倉書店発売日: 2016/06/02メディア: 単行本(ソフトカバー)この商品を含むブログ (11件) を見る細かいと…