OPSホーム>救急の周辺>151227どうしても検定したい人へ

これで上司も市民も納得! 基礎からの統計教室8



どうしても検定したい人へ

例題
この連載は統計や検定について説明するものです。しかし、未だ具体的な検定方法は一つも出て来ないばかりか、「その検定は必要ない」とまで言っています。これに対して「月刊消防」同じ東京法令出版社から出ている「プレホスピタル・ケア」ではχ二乗・正規分布・t検定や順位和検定など具体的な検定方法が解説されています。
この全12回連載も半分を過ぎていますのでそろそろ具体的な検定方法を解説してもらいたいとあなたは考えています。ではどんな検定方法が知りたいでしょうか。

解説
世の中にはもっと知りたいという向学心に溢れた人たちがいます。この連載は以前月刊消防に連載を持っていた島根県江津消防の天野忠好救命士からの提案で始まったもので、当初は平均値から始まってt検定なども紹介しようと思っていました。しかし過去の記事を読み返すと寄り道ばかりしていましたので、この辺りで代表的な検定方法に触れておきます。


-----------

(図はfaxで入稿したため手元にありません)


皆さんはどんな検定方法を知っていますか。多分、全く知らないでしょう。例題のように質問されても答えようがないと思います。念のために書いておきますが、これは読者を馬鹿にしているのではありません。必要がないのに覚えるのはエネルギーの無駄遣いだと思うからです。医者である私が「もやい結び」の結び方を知らないのと同じです。
何回も書きますが、多くの検定は計算自体は簡単です。エクセルに関数が用意されているものもありますし、用意されていなくても表計算ソフトがあれば簡単に計算できます。英語論文に載っているような聞いたこともない検定であっても専用のソフトに数値を吸い込ませればだいたいは出てきます。
今回は検定の意味と、代表的な検定方法を解説します。

1.検定の裏に願望あり

検定が必要なのは論文にほぼ限られます。論文は筆者が自分の考えを主張する場ですから、検定の裏には必ず筆者の意図があります。お役所の文書で検定が使われている場合にも、「差があればいいな」「差を見せつけて住民を説得しよう」と思っているお役人の気持ちが込められています。

2.論文と検定

先月号でお伝えしたように、見た目に差がある時には検定はする必要なありません。それでも論文で検定が求められるのは、本当に差があることのお墨付きが必要なためです。ただ単に「差がある」というより「t検定を行ったところp<0.001であり有意な差が認められる」と言った方がそれらしく見えます。
逆の目的もあります。ちゃんとした差が出ていないのに、検定方法を選べば有意差を吐き出せることがあります。そうすればしめたもの。堂々と論文として発表できます。ほとんどの人はその検定方法が正しいか分からないので、数字で出てくれば間違いない気分になるからです。

3.検定の道筋

前回も書きました。検定は「お前の意見が正しい確率は5%未満だ!だからお前は間違っている!!」という、人格を否定するような話の持っていき方をします。
例として、4月号に挙げた白玉と赤玉の箱を考えます。

1)仮説を立てる(図1)
「箱の中には赤玉と白玉が同じ数だけ無限に入っている(無限に:取り出している最中で玉が無くなったら困るので)」
この仮説を帰無仮説と言います。検定がうまくいった後に無に帰る仮説だからです。

2)有意水準(p)を決める
一般的な5%未満(p<0.05)としておきます。仮説が成立する確率が5%未満だと「だからお前は間違っている!!」と宣言します。

3)玉を取り出す(図2)
1回目、白。赤と白は同数入っていると仮定しているので白の出る確率は1/2=0.5
2回目、白。2回続けて白が出る確率は1/2 x 1/2 = 0.25
ずっと続けて
6回目、白。6回続けて白が出る確率は 1/2 x 1/2 x 1/2 x 1/2 x 1/2 x 1/2 =1/32 = 0.03125 (3.125%)

4)有意水準を下回る
6回も白が出続ける確率は3%しかありません。

5)仮説を棄却する(図3)
意図通りになりました。「箱の中には赤玉と白玉が同じ数だけ無限に入っている」とする仮説が成立する確率は5%未満です。そこで「この仮説は間違っている!!」と宣言します。

6)結論を得る
仮説は間違っていました。つまり赤玉と白玉が同じ数だけ入ってはいません。今回の結果では白玉が赤玉より有意に多い、という結論になります。

4.注意点

全ての検定に共通する注意点が2つあります。

1)単なる確率であること
今まで6回続けて白玉でした。しかし、7回目以降何度やっても赤玉しかでなかったらどうでしょう。この結論は間違っていることになります。これは、結論が確率に頼っているためです。本当のことは全数検査をしない限り分かりません。

2)有意水準を下回らなければ何も言えない(が実際は等しいと見なすことも多い)
計算しても5%未満にならない時は何も言えません。よく「2つは同じなんだ」と解釈する人がいますが間違いです。差があるとも差がないとも言えません。もっとやれば差が出るかも知れないし、結局同じかも知れない。
前述の箱の話では、5%を下回らない場合でも「赤と白が同じ数だけある」とは考えないでしょうが、それは簡単なモデルだからです。複雑なモデルで有意差が出ないと「両方は同じ」と思いがちです。

5.代表的な検定方法

1)t検定(図4)
有名な検定なので来たことがある人も多いでしょう。二つの群があって、その平均値に差があるかどうか調べる場合に使います。前提として、データが正規分布になっていると仮定できる場合に用います。さらに詳しく書くと、二つの分散が等しいと見なせる場合にはStudent-t検定、見なせない場合には Welch-t検定が行われます。
正規分布とは大雑把に言えば、中心の値を取る標本数が多く、値から外れるほど標本数が減少する分布のことです。健康診断での身長・体重・血液データなどが当てはまります。

2)ウイルコクソンの順位和検定・マンホイットニーのU検定(図5)
世の中には正規分布ではないものを比較することがあります。例えば、徒競走で二つのチームのどちらが速いか。このチームの優劣を比較するのに最も簡単な方法は、用意ドン!で走らせて、ゴールで順番を付けることです。ストップウオッチも不要です。これを検定としたのが順位和検定でありU検定です。輪投げをした時の棒と輪の距離を測る、弓道の射手2人の得点を比較する時も使えます。
この二つの検定とも、標本数が増えてくれば標本は正規分布を示すようになり、t検定と差がなくなってきます。

3)カイ二乗(自乗)検定(図6)
比率に差があるか見る時に使います。例えば、A消防とB消防の職員の男女比を比べる、出動件数中の高齢者の割合を比べる、などです。


6.回答
t検定、カイ二乗検定の2つを知っていれば日常の業務に不自由することはないでしょう。平均を比べるのがt検定、比率を比べるのがカイ二乗検定です。目の前のデータの性質からどちらの検定方法を選ぶか決めて下さい。具体的な方法はネットで探すとすぐ出てきます。
もっと難しい検定は必要になった時点で勉強して下さい。

7.まとめ
・実務で必要な検定はt検定とカイ二乗検定くらい
・有意差が出なければ確かなことは何も言えない


OPSホーム>救急の周辺>151227どうしても検定したい人へ


http://ops.umin.ac.jp/

15.12.27/10:22 AM