[過去ログ] 【統計学】統計好きでも意外と知らない「p<0.05」の本当の意味<p値ハッキング> [すらいむ★] (25レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
1(2): すらいむ ★ 2024/04/05(金)20:51 ID:HURuvpJv(1) AAS
【統計学「p値」の謎】統計好きでも意外と知らない「p<0.05」の本当の意味<p値ハッキング>
● 「p値」を理解するための例え
p値の概念は必ずしも直感的ではない。そこで、統計学者が大好きなたとえを使ってみよう。
私はコインの入った袋を持っていて、「コインをめくるとすべて表が出る確率が高いだろう」と考えているとしよう。そして実際、コインを1枚取り出して5回めくるとすべて表が出た。これは何かおかしなことが起きているという、それなりに説得力のある証拠になるだろう。
では次に、最初のコインで5回のうち表が出たのは3回だけで、2回は裏が出た場合を考えてみよう。これは、私の理論の証拠としてはよろしくない。
省3
2: 2024/04/05(金)20:56 ID:4qxxHehM(1/2) AAS
字数稼ぎの薄くて回りくどい文章
3: 2024/04/05(金)21:06 ID:8xAjcT9G(1) AAS
意外と知らないどころか今時 p値ハッキングなにそれ?ってやつはヤバイだろ
4: 2024/04/05(金)21:08 ID:YJA+nDHA(1) AAS
「サンプルが増えれば「偶然」の確率も上がる」との見出しだけでヤバい記事なのがわかる。(確率は変わりません。発生回数が増えるだけです)
5: 2024/04/05(金)21:21 ID:LSC6lDei(1) AAS
P値ハッキングどころか、そもそもサンプルした標本データの確率分布を確認して仮定とするモデルと同じ正規分布に従っているかを確認しないといけない。そもそも正規分布に従っても無いのにP値で仮定が正しいか行うこと自体が無意味。確率分布を確認するにはサンプルとして取るデータは何万、何十万と必要だろう。せめて数千ぐらいは取りたいが、実際はこのようなことをしていない。サンプルデータが12個だけという最初から論文にならない論文も沢山見受けられる。にも関わらず査読ではねないのは、査読するものが統計処理を理解していないから。結論を言うと、次のパターンによる誤りだらけ。
1)論文執筆者自身が統計処理を理解していないので機械的にP値検定で結論づけてしまう誤り。物理と数学以外の理系の論文はこれが多いので、結論に全く信憑性がない。地球温暖化も怪しいとノーベル物理賞受賞学者が否定するのも当然。
2)サンプルデータそのものが少ない。20や50程度しか取れない。医学系や生物学系に多いパターン。当然結論は信頼できない。
3)論文執筆者が意図してp値ハッキングする。論外。結論は見る価値もない。
6(1): 2024/04/05(金)21:48 ID:m3GhNOeE(1) AAS
論文の数が10000あったらそのうちの500はP値が偶然5%以下になるがそれはいいのかな?
7: 2024/04/05(金)22:24 ID:4qxxHehM(2/2) AAS
>>6
だから(という訳では無いが)論文のメタ解析というのがある
8: 2024/04/05(金)23:18 ID:mgPwfd6W(1) AAS
>>1は、一昨年昨年に全国大学に量産された「データサイエンス担当教員」(ほぼ全員、文学研究者か、データサイエンスの講義は受けたことのないIT屋)に、ぜひ読ませたい記事だ
悶麩蚊顎症が唯一、文系私大で認めたデータサイエンスの重点大学のカリキュラムと講義内容と教員たちをよく知っているのだが、
>>1の内容どころか、Rを知らないどころか、excelのマクロを使えないため、
学生に解析させて無償で巨大企業に提供して大学が稼ぐデータを、すべて手作業で処理している
学生への教育が、数年すれば使えなくなる目先のテクニックだけなのはいうまでもないが、これが、
大学の経営者(資産家で大手企業の株主様)や、紋武火画苦笑の高級官僚(灯台学部の落ちこぼれの成れの果て)には大受けしているらしい
富裕層がどうなろうと折れの知ったことではないが、学生にマトモなデータサイエンス教育が施されるには、
データサイエンス担当教員つまり文学者や市井のIT屋が、>>1の記事を読んで、内省することが不可欠だとおもう
9: 警備員[Lv.8][新][苗] 2024/04/06(土)09:59 ID:TvgrVBof(1) AAS
科学板にダイヤモンドソースでスレ立てするなよ…
10: 2024/04/06(土)12:31 ID:VIqpT3IO(1) AAS
何が本当で何が偽物化があやふや院なる
全ての論文該当しそうなのですが・・・
今の科学も確率論で一番再現率の高いものを使用している
でも真実は再現できていないもありうるのですね
全員統合失調症の幻覚!とあるとなることも考慮する必要がある
11: 2024/04/06(土)12:49 ID:xlDMQBcj(1) AAS
p値
木兆
12: 2024/04/06(土)14:11 ID:CY8mZcOA(1) AAS
統計つかうなら知らない奴いないだろ
13: 2024/04/06(土)14:25 ID:s9p0JNoY(1) AAS
>>1
数式が無くてチンプンカンプンだ
戯言の領域を出ていない主張、記事
14: 2024/04/06(土)14:27 ID:9+Zem2hU(1) AAS
フィッシャーが一生のうち一回くらい間違えてもいいよね。ってくらいの発想だから
15: 2024/04/06(土)15:10 ID:94gUuz0Q(1) AAS
この手の「p値だけを見るのは危険」って言うやつってたいてい効果量まで言及しないよなぁ
雑魚ばっか
16: 2024/04/06(土)16:26 ID:Jw3ra2HB(1) AAS
世の中n=1とか因果関係と相関関係の区別できない奴とか
ゴロゴロしてるからp値とか早すぎる
17: 2024/04/06(土)18:41 ID:DsRueQlY(1) AAS
今の日本の理系としては
この記事をできるだけ多くの理系学生に読んでほしいと思うは
教員がこれを知らないというのが現在の日本の大学のデフォルトなので
18: 2024/04/07(日)00:41 ID:47zP5UEe(1) AAS
ノンパラ検定やればいいだけじゃね?
19: 2024/04/07(日)01:34 ID:QDmanLPw(1) AAS
事象Aが有であったときに事象Bであった
事象Aが有であるのに事象Bがなかった
事象Aが無であるのに事象Bであった
事象Aが無である時に事象Bもなかった
知らんけど
20: 2024/04/07(日)01:55 ID:uIZKU3Pp(1) AAS
ピーチク
ビーチク
21: 2024/04/07(日)09:40 ID:NjDB5D3B(1) AAS
最近はp値使ってる論文は受け付けませんってジャーナルもあるんでしょ
22: 2024/04/07(日)14:20 ID:q+15G9wl(1) AAS
3試合連続
23: 2024/04/07(日)21:15 ID:Jqdp1ufL(1) AAS
なぜ検定では5%水準とか1%水準を使うのか、それらの数字の根拠を述べよ。(5点)
24: 2024/04/10(水)20:00 ID:Prt5q7cr(1/2) AAS
なぜ配点が5点なのか
25: 2024/04/10(水)20:04 ID:Prt5q7cr(2/2) AAS
two one-sided testでも、許容できる誤差は自分で決める
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.256s*