Bayesの卵を割らずにBayes流オムレツを作る?? 〜1930年論文で読む信頼区間 vs 推測区間〜

お断り この記事で書かれている内容は,かなり特殊ななものです.通常の信頼区間を知らない人は読まないことを勧めます. はじめに このブログ記事では,Neyman流の信頼区間と,Fisher流の推測区間(fiducial interval)の違いを,次の2点に注目して解説してい…

Fisherだけに5%閾値の責任を負わせるのは少し酷な気がする

以下,記憶だけで書いたいい加減な話. 5%閾値を広めた責任者は,K.Pearson, Fisher, Neyman, Snedecor,そして,統計分析のハウツー本の著者ら,さらに,私自身も含めた統計関連従事者(←統計家や統計学者ではない)ではないだろうか.Fisherだけに責任を負…

歪度が共に0かつ平均が同じ状況で,分散が極端に異なる場合に,Wilcoxon検定の検出力はどれぐらい? (計算を間違えているかも)

以下,間違えているかもしれませので,適当に流し読みしてください. 2023/2/12追記:このブログ記事は,同順位がない場合(応答データが連続データである場合)で各群の標本サイズが等しい場合しか扱っていません. 入門的な教科書では,Wilcoxon検定の検出…

t検定を並び替え検定とみなし,その帰無仮説を「2つの母集団分布は同じ」とすべきという私の主張について

昨日,Twitterにて,(ある程度,標本サイズが大きければ)通常のt検定は並び替え検定として解釈して,その時の帰無仮説は「2つの母集団分布は同じ」とした方がいいだろう,と私が呟きました. 以下の引用リツイートを,黒木さんからしていただきました. #…

二項確率の「正確」信頼区間における保守性を,背後に一様分布を想定することで直感的に理解する

お断り この記事はすぐに削除するかもしれません. このブログ記事の目的 このブログ記事では,二項分布の確率に対する「正確」信頼区間が保守的になることを,二項分布の背後に一様分布を想定することで,直感的に分かりやすくなることを狙っています. 設…

メモ:<Fisherの有意性検定では,対立仮説を設定しない>という説明について

現代統計学史での統計的検定の紹介で,<Neyman-E.S.Pearsonの仮説検定では対立仮説を設けるが,R.A. Fisherの有意性検定では単一の帰無仮説しか立てなかった>と説明されることがあります. まず,私自身がたびたびそのように説明してきました(口頭でしか…

メモ:分割表のPearsonカイ2乗検定が行和も列和も固定して導出されている件について 〜 2つの独立な二項分布を例にして〜

このブログ記事では,2つの独立な二項分布を例にして,分割表に対する統計量が,行和および列和の両方を固定した上で導出されていることを説明します.ここでは,次の3つの導出を紹介します. 多変量正規分布で近似して,多変量正規分布の条件付き分布から導…

<95%信頼区間の「95%」は確率ではない>と主張するとしたら,どのような理由があるか考えてみました

このブログでは,TJOさんによる以下の記事を踏まえて,<95%信頼区間の「95%」は確率ではない>と主張するとしたら,どのような理由が挙げられるかをちょっとだけ考えてみました. 95%信頼区間の「95%」の意味 - 渋谷駅前で働くデータサイエンティストのブロ…

<「統計学は科学の文法である」とKarl Pearsonは言った>および<K.Pearson=記述統計 vs R.A.Fisher=推測統計>という言説に関して

(SAS Institute Japan株式会社/JMPジャパン事業部) 小野裕亮 このブログ記事のすべての責任は小野個人だけにあります.所属組織には一切の責任はありません.また,Theodore Porter先生およびStephen Stigler先生の許可を得て,両先生のメールを公開して…

マグネロ[文]ルーン[絵]『マンガ 統計学入門』日本語訳で個人的にほんの少しだけ気になった点

このブログ記事の責任はすべて筆者個人(小野裕亮)だけにあります.所属組織は一切,関わっておらず,いかなる責任も負いません. はじめに マグネロ[文] ルーン[絵]神永正博[監訳]井口耕二[訳]『マンガ 統計学入門:学びたい人のための最短コース…

スティグラー著『統計学の7原則』日本語訳で個人的にほんの少しだけ気になった点

この記事の内容に対する責任は,すべて筆者個人(小野裕亮)だけにあります.所属組織は,一切関わっておらず,いかなる責任も負いません. はじめに スティグラー著(森谷博之・熊谷善彰・山田隆志訳)『統計学の7原則:人びとが築いた知恵の支柱』では,統…

日本語で読める統計学史に関する書籍(途中:日本の統計学史に関するものは省いています.)

取り急ぎ,日本語で読める統計学史に関する書籍を,いくつか紹介します. 統計学史の専門家が書いた専門書だけではなく,軽めの啓蒙書や伝記も含めます. 書籍だけを挙げることにして,論文は取り上げません. 翻訳書や廃版になっている書籍も取り上げます.…

単純対応分析におけるいくつかの同時布置図について

著者:Tarotan (@BluesNoNo: 小野裕亮) 同ブログにおける記事の責任はすべて筆者個人だけにあり,所属企業は一切の責任を負いません. 1. はじめに 1.1 このブログ記事を書くきっかけ このブログ記事では,単純対応分析(simple correspondence analysis)…

正規逆カイ2乗分布の乱数生成方法の一例

正規線形モデルにおけるパラメータ()に対する共役事前分布は,正規逆カイ2乗分布(normal inverse chi-square distribution)であることが知られています(Hagan and Forster 2004: pp.305-307, 繁桝 1985: pp.176-177). 正規逆カイ2乗分布の乱数を生成…

『多重対応分析』(オーム社)での「雲」という訳語について

小野裕亮・大隅昇 (2021年12月13日) はじめに 翻訳書『多重対応分析』(オーム社)での「雲」という訳語について,Twitterにおいて相澤真一先生から以下のようなコメントをいただきました. 対応分析のcloudの訳語を大隅昇先生らの共訳書『多重対応分析』…

E[Y11 Y22] = ψ E[Y12 Y21]を確認してみよう!

McCullagh, P. and Nelder, J.A. (1st ed.:1983, 2nd ed.:1989) Generalized Linear Models, Chapman & Hall の問題9.10における最初の問い(推定関数の期待値がゼロとなることを確認してくださいね,という問い)を考えてみました. もっとエレガントな解き…

厳しいテストについての私の拙い理解(久馬巌さんへの返答)

このブログ記事の内容は,他のブログ記事と同様,筆者だけに責任があり,所属組織は一切の責任を負いません. このブログ記事は,以下の久馬巌さんのつぶやきに対する個人的なリプライです. ちなみにTarotanさんはMayoのError Statistics についてはどうや…

1970年代赤池先生の I ≈ Jに対する意見について

このブログ記事に対しては,他のブログ記事と同様,筆者個人にすべての責任があります.所属組織は,一切,関与していません. このブログ記事は,黒木さんによる以下のつぶやきに続く一連のスレッドに対する応答です.長くなりましたので,Twitterでのリプ…

K. Pearsonの「記述」は,「記述統計学」の「記述」とは異なるだろう(たぶん)

執筆者:小野裕亮 2022年4月4日追記:統計学史の専門家から聞いた意見とアドバイスを,以下のブログ記事に述べています. <「統計学は科学の文法である」とKarl Pearsonは言った>および<K.Pearson=記述統計 vs R.A.Fisher=推測統計>という言説に関して -…

TwitterでのNeyman(1934)に対する事実誤認の訂正

Twitterで私が呟いた以下のスレッドが,事実誤認の可能性が非常に高いので訂正いたします. (1/11) 信頼区間についてまったく理解できていないので,検討外れでしょうけれども…内容を覚えておらず,いま該当の1文を読んだだけですが,「信頼区間」という言葉…

巷の慣習や教科書での統計的検定の扱いに対する先行研究

このブログ記事に対する責任は私個人だけに記します.所属組織は一切の責任を負いません. このブログ記事は,次に黒木さんの呟きに対するリプライです. 学部生向けの売れ線の教科書を引用して、それを単純に根拠とすると、ひどくミスリーディングな内容に…

検定や信頼区間の前提が満たされない状況に対して,テキストはどう助言してきたか?

このブログ記事は,他の記事と同様,筆者個人の意見であり,すべての責任は筆者個人だけにあります.所属組織は,一切の責任を負いません. このブログ記事は,履歴を残さず変更するかもしれません. 検定や信頼区間を導出したときに仮定した前提は,実場面…

Akaike (1982) On the Fallacy of the Likelihood Principle を読んで

はじめに このブログ記事では,以下の論文に対する個人的な感想を述べます. Akaike, H. (1982). On the Fallacy of the Likelihood Principle, Statistics and Probability Letters, 1, 75-78 同論文は,以下の論文集(pp.357-360)にも掲載されています. …

「もしも『十分原理』および『弱い条件付け原理』に私が従うならば,『強い尤度原理』にも私は従うことになる」ってどういう意味なの?(暫定版)

12/26(土):このブログ記事は,理解があやふやのまま書いています.大幅に変更する可能性が高いです.また,数学の訓練も正式に受けていないため,論理や表現がおかしい箇所が沢山あると思います.正確な議論を知りたい場合には,原論文をお読みください.…

Fisherの紅茶実験は実話なのか?

R.A. Fisherの紅茶実験に対する3つの説について このブログ記事では,Fisher(1935a)の第2章で登場する紅茶実験が実話かどうかについて述べます. Fisher(1935a)の紅茶実験は,"Lady Tasting Tea"という名称でも知られており,英語の Wikipediaでも項目が…

Can "Bayesian" calculate "the probability that a studied hypothesis is true"?

I asked to Prof. Wasserstein if the #2 in ASA's p-value statement implicitly suggests that "Bayesian" can calculate "the probability that a studied hypothesis is true", and Prof. Wasserstein kindly replied to the question. I come to have t…

カイ2乗検定の自由度って,どうして(r-1)×(c-1)になるの?

以下のPDFファイル(35頁,862KB, Google Drive)にて,カイ2乗検定の自由度が,一元表のときはr-1,二元表のときは(r-1)×(c-1)になる理由を考えてみました. drive.google.com まあ,よく知られたことだとは思いますが... 既存の文献はあまり確認していませ…

The Phrase "Random Chance" for Explaining P-values

In the ASA p-value statement in 2016 (Wasserstein and Lazar, 2016), the following explanation is written in #2. 2. P-values do not measure the probability that the studied hypothesis is true, or the probability that the data were produced …

反省文:p値を<データが偶然で生じる確率>と思うのはやめます

はじめに 統計学のハウツー本を読んでると,p値を<データが偶然で生じる確率>や<データが偶然だけによって起きた確率>と解説しているものを時々,見かけます.私自身も,長い間,p値をそのように解釈して,また,お客様や同僚に説明してきました. 2016…

What are Two ANCOVA models for Lord's paradox?

In the comment in the blog (Stephen Senn: Rothamsted Statistics meets Lord’s Paradox (Guest Post) | Error Statistics Philosophy), Prof. Senn wrote that we could assume two different ANCOVA models for Lord's paradox. Although I have not use…