COI:筆者とはなんの関係もありません。
読んだ。
はじめての 統計データ分析 ―ベイズ的〈ポストp値時代〉の統計学―
- 作者: 豊田秀樹
- 出版社/メーカー: 朝倉書店
- 発売日: 2016/06/02
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (11件) を見る
まとめ
・具体例がたくさんあり、解釈の仕方も丁寧に書いてあるので、買い。
・新時代の統計の教科書には な り え な い と思う。(辛口)
・初心者向け(大嘘
良い点
・具体的
これに尽きると思います。
サイトからスクリプトが入手できるように、全部自分の環境で再現できる。
また、各章の解析で、RQ(Research Question)を設定しているが、例えば
RQ.2 第1群と第2群の平均値の差の点推定。平均値の差の推定。
(ダイエットプログラムに参加した人と参加前の人では平均値に何kg の差がありますか。またその原料はどの程度の幅で確信できるでしょう。95% の確信で答えてください。)
p97 対応のある2群の差と相関の推測
RQ.4 平均値の差が基準点 より大きい確率。
(ダイエットプログラムは有料だし、参加すると辛いこともあるので、痩せても少しではベイしません。たとえばダイエットプログラムに参加した人と参加前の人の平均値 が2kg より大きい確率が70% より大きいならば参加したいです。参加すべきでしょうか、あるいは見送るべきでしょうか。)
p97 対応のある2群の差と相関の推測
という問題は、かなり、自然な思考回路であり、データ解析上、よく思うことだと思います。
古典的なt検定だと、かということはわかるけれども、それ以上というかこれ以外のことは(厳密には)証明しにくいので、いいと思う。
また、分割表でも
連言命題が正しい確率
表6.5 の確率は、2つのカテゴリの比率の確率としてはそのまま解釈可能です。ただし複数の比較が同時に成り立つ確率とは異なります。
手始めに、研究上の問い「「友達」は他の誰よりも相談される比率が高い」が正しい確率を求めてみましょう。
(中略)
次に、研究上の問い「「先生」は他の誰よりも相談される比率が低い」を考えてみましょう。
(以下略)
p145 比率とクロス表の推測
というように、古典的なχ二乗検定だと、全体がだいたい同じか、何かが違うか、ということがぼんやりわかるだけで、「どことどこが比較して」とか、「組み合わせてどうか」が直接わかりやすいので、いいと思う。
悪い点
・「はじめての」という大嘘
初級者が読めるとは到底思えない。
この本は初めて統計学に入門する学生のための教科書です。
まえがき
筆者がそういうのなら、まあ、そうだと信じよう。しかし、
統計データ分析に関する予備知識はいっさい仮定していません。
うーん、まあ、本当に予備知識が0 なら難しい。分布とか、統計量とか、ベイズの定理(条件付き確率程度)とか、そういうことは少なからず必要。
とあるように、確かに、これらの記述がない。かわりに、ベタに書き下した記述があるし、確率としてみたいな記述は頻発する。
数学の知識0 でやるのも、ぶっちゃけ言うと、不可能。
・R はなんだかんだで難しい
たぶん、R 初心者でいきなりrstan を始める人はいないと思うが、rstan は簡単にベイズ推定ができるとはいえ、初心者がこの本だけでいろいろやるのは難しいので、みんなググラビリティをあげよう。
・アンチは本当はファンじゃないのか
この本は実はアメリカ統計学会のp値はクソ記事から始まるのだが、ベイズ的な統計学をp値的な統計と対比させて本書が進むので、やはりp値的な解析の問題点や限界を知ったうえで読むべきなのである。という点では、p値はクソだと言いながらp値に理解のある大人な本なのである。
(ファンとか儲とかアンチの定義が違うと言われたらアレだが、まあ、適当)
前も言ったように、われわれの業界では、なんだかんだでp値派なので、
たぶん、お偉い人たちががんばってp値以外の他の統計量や指標、モデル、考え方を流布してくれると思うので、当面は「p値いいっすね〜(アヘ顔」って上司にいい顔をしながら、その他の手法について勉強するしかないんじゃないかな(適当
となる。ベイズ派が優勢となるまで隠れて爪を研いでいたらいいんじゃないかな(適当
なので、勉強会などで引っ張りだこになるが、p値がベイズに置き換わるのは少なくとも10年はなさそうなので、その頃にはもっと、いい教科書になりうる良書がでてるんじゃないかな(適当