K. Pearsonの「記述」は,「記述統計学」の「記述」とは異なるだろう(たぶん)

執筆者:小野裕亮

2022年4月4日追記:統計学史の専門家から聞いた意見とアドバイスを,以下のブログ記事に述べています.

<「統計学は科学の文法である」とKarl Pearsonは言った>および<K.Pearson=記述統計 vs R.A.Fisher=推測統計>という言説に関して - Tarotanのブログ

 

このブログ記事では,伊勢田(2021)での大塚(2021)のP.19に対する指摘に関係するかもしれない情報として,現段階で私が知っている限りことですが,次の2点を紹介したいと思います.

 

  1. K.Pearson『科学の文法』における「記述」は,現在のハウツー本で紹介される「記述統計学」の「記述」とは違う意味で使われているだろう.
  2. <「統計学は科学の文法だ」by K.Pearson>とのネット情報をたまに見るが,少なくとも『科学の文法』の中で,少なくとも直接的には,K. Pearsonはそんなことを言ってはいないだろう.

 

1. に関しては,日本特有の現象であり,戦後における推計学派や,私自身が身を置くポピュラー統計学業界による啓蒙活動の悪影響ではないかと私は思っています.

ただし,竹内(2018)では,K. PearsonとFisherとの間の「個人的対立や感情的軋轢」により,FisherがK. Pearsonを「強く批判ないし否定」したことから,「断然が強調されるようになった」と見ています.

また,竹内(1976)でも,増山元三郎や北川敏男によるK. PearsonとFisherの対比がおかしいことを指摘しながら,「思想的な断絶が強調されたのは、むしろ、カール・ピアソンとフィッシャーの間の個人的jな対立からでしょう。」(竹内 1976,p.109)と述べられています.

竹内(2018, 1976)の見立てが正しいならば,日本以外の国でも似たような対比が見られるはずですが,アメリカとイギリスの一部だけしか私が見ていないせいか,「記述統計学」と「推測統計学」との対比は見かけるものの,その対比をK. PearsonとFisherとの対比に結び付けるのは(アメリカやイギリスでは)私は見たことがありません.

 

2.に関しては,どこからこの話が湧いてきたのか,まったく私は分かっていません.

 

お断り

私自身は,統計学関連の営利民間企業に勤める会社員です.哲学や統計学史について専門教育を受けたことはありません.

統計学自体も,統計学専門の教育を受けていないのですが,(廃止された)RSS/JSS Graduate Diplomaという資格は所有しています.

このブログ記事の責任は,すべて私個人だけに帰します.所属企業は一切の責任を負いません.

 

1の「K. Pearson=記述統計学」という説について

恥ずかしながら私は最近知ったのですが,社会統計学系の研究者(たとえば,上藤一郎 1999・長屋政勝 1982)が,K.Pearsonの『科学の文法』での<記述 vs 説明>の「記述」は,数理統計学や戦後推計学での<記述統計学 vs 推測統計学>の「記述」とは異なることを20〜40年前に指摘しています.科学史専門家などには周知の事実だったようで,有賀(2012)でも,いくつかの別の文献が紹介されています.

 

統計学史での先行研究はあったのに,想像するに,(私自身も含めた)統計学業界の啓蒙者たちやインストラクターたちは,それらの先行研究を見逃し,すでに普及している説明やフレーズを流用してきたのだと思います.

 

K. Pearsonの「記述」が現在の「記述統計」を意味していなかったことについては,私が知っている限りでも,いくつかの証拠と思われるものがあります.3点だけ述べます.

  1. The Grammar of Science(1911; 第3版)のp.161で,<現代の数理統計学での中心的話題として標本抽出論がある>と述べられています.もしも,『科学の文法』における「記述」が「推測」に対比されるものならば,標本抽出論を好意的に紹介することはないでしょう.
  2. K.Pearsonは,Biometrikaにおいて,標本抽出理論に基づく推測統計の(応用および数理に関する)文献を数多く残しています.たとえば,Pearson(1903)などです.K. Pearsonの統計学には,当初から,推測統計学の枠組みが組み込まれていたと見る方が穏当だと思います.
  3. データを無作為標本とみなしていただけでなく,調査においても無作為抽出を推奨しています.優生学に関する講演(Pearson 1912, pp.6-7)において,K. Pearsonは学校での健康診断に関して,全数調査によって特定の年齢しか調べていないことを嘆いています.そして,K. Pearsonは,標本抽出によって得られた生徒一人一人を詳しく調べていることを推奨しています.少なくとも同講演においては,K. Pearsonは全数調査よりも無作為抽出を推奨していています.もし記述統計学を重視しているならば,調査でも全数調査を推奨することでしょう.

 

日本においては,戦後に推計学を啓蒙する過程において,<K. Pearson=記述統計学(=ドイツ社会統計学=封建的)vs. Fisher=推測統計学・推測学(=弁証法的)>という史観が広まってしまい,後戻りができなくなってしまったのだと私は思っています.

現在においても,きちんとした信頼できる文献や資料でも(たとえば日本数学史学会編(2020)の「統計と数学」でのpp.312-313の説明でも),この推計学史観(K.Pearson=記述統計 vs Fisher=推測統計)が時々,登場します.ですので,このブログ記事の書いている内容が(つまり私の述べている内容が),とんでもない勘違いをしている可能性もあります.

私自身,誰から聞いたのか忘れましたが「K. Pearsonは記述統計学だ!」と長らく信じていたので,セミナーで,居酒屋で,もしくは,どこかの説明資料やプレゼンで,そのように他人に説明したかもしれません.

 

1に関するいくつかの補足

記述と帰納の区別

isherの論文や本が浸透する前に,記述的(descriptive)と帰納的(inductive)との対比が,すでにKeyens(1921)における第27章 “The Nature of Statistical Inference”(pp.327-331., 訳書 pp.377-380)で見られます.現代の意味での「推測」と現代の意味での「記述」との対比は,Fisherが普及する前から存在していたと思われます.この点からも,Fisher以降から推測統計学の観点が普及したという見方は不自然です.

OEDでの初出確認 

オンライン版OED(Oxford English Dictionary)において,”descriptive statistics”の初出とされているのは,Von Neumann-Spallart(1885)です.オンライン版OEDには,”inferential statistics”の項目はありませんでした.

 

戦中までの日本での「記述統計」

日本では(日本でも?),当初,ドイツの社会統計学経由で「記述(的)統計」という表現は輸入されたようです.

呉(1906,p.28)において,「ゲー、リユメリンは統計の方法は是れ即ち学問なりと云ひ統計の方法を二種に分ち技術的方法記述的方法と云ひ技術的方法は統計の方法を社会的現象に応用するに方り特別の知識と技術とを要すとなし此技術と知識とに由て観察したる社会的現象は総て之を整理編纂して社会の現象を記述せざる可らす之を記述的統計と云ふと云へり」との紹介があります.

 

ドイツ社会統計学での悉皆調査(全数調査)

不勉強で文献を追っていないのですが,ドイツ社会統計学のMayrは,「代表法(標本調査)」を用いることに反対していたようです(Hertz p.221).戦中までの統計学は社会統計学が主流でしたが,その流れからか,悉皆大量観察(全数調査)のほうが推奨されていたようです(たとえば,田井 1935,p.25).このあたりの話は,日本語論文も多くあるようですが,不勉強のため,私はまったく分かっていません.

 

ドイツ社会統計学のK. Pearsonへの影響

K. Pearsonらの優生学派/生物測定学派も,ドイツ社会統計学の影響は受けており,Biometrikaの第1巻における巻頭言(Pearson 1901)では,進化を調べるには大量現象を扱う必要があると述べられています.

しかし,K. Pearsonは,悉皆大量観察(全数調査)を推奨していたわけではありません(個人的な素人考えですが,エジプト人の頭蓋骨を全部調べることや,ある地域のカニをすべて調べることや,イギリス人全員を測定することは,常識的に考えて無理なのでは?) 

 

竹内(2018)の解釈

これまで上記で述べてきたことを否定する主張もあります.私は少し混乱しています.

竹内(2018)の22章「カール・ピアソンと記述統計学」では,K. PearsonとFisherの連続性を認め,かつ,K.Pearsonが検定や推定を行なってきたことも認めながら,「…ピアソンの統計学を「記述統計学」と呼び、…「推測統計学」と対比させるのは理由のあること」と述べています(p.241).

ただし,この竹内(2018)での「記述統計学」や「推測統計学」は,現在,世間で流通している意味や用法(たとえば,記述統計学を「与えられたデータを要約するための手法」 大塚 2021, p.21とするような定義)ではないと私は解釈しています.

竹内(2018)では,「記述統計学」を,「統計的法則性や確率的法則は,現象を記述するために人間が作り上げた枠組」(竹内 2018, p.241)であるとみなす立場とし,一方,「推測統計学」を,「[統計的法則性や確率的法則は,]現象の背後にある客観的な構造を表現したものと考える」(竹内 2018, pp.241-242)立場としています.これらの定義は,「記述統計学」と「推測統計学」に対して,世間で流通している定義とは違うと思われます.

 

 

2の「統計学は科学の文法だとK. Pearsonは言った」という説について

「”Statistics is the grammar of science”, Karl Pearson」など,<統計学は科学の文法である」とK. Pearsonが述べた>と読めるようなネット情報を時々,見ることがあります.

これは,American Statistical Association(米国統計学会)のTwitterアカウントの呟き(@AmstatNews 2015)でも見られます.

他にも,日本学術会議 数理科学委員会 統計学分野の参照基準検討分科会の「大学教育の分野別質保証のための教育課程編成上の参照基準 統計学分野」報告書(2015,p.5)にて,「カール・ピアソンは、統計学を科学という言語における文法に例え、「科学の文法」とよんでいる(付録参照)。 」と書かれています(なお,「付録」では,「記述統計学」と「推測統計学」との対比が注意深く書かれていますが,前述したように,K.Pearsonの「記述」は「記述統計学」の「記述」とは違うので,このような対比でカール・ピアソンの研究を位置付けるのは曲芸的だと思われます.K. Pearsonは,相関係数標準偏差にも,当初からprobable errorを導出・計算していました.).

 

Karl Pearsonがそう思っていたこともないこともないのかもしれませんが,まずThe Grammar of Scienceの初版(1892)では統計学が扱われていないので,<「統計学は科学の文法である」とK. Pearsonは言った>とするのは,かなり曲芸的な解釈ではないかと思います.

 

この”引用”を誰が言い出したのかは,私は分かっていませんし,調べてもいません.

 

 

参考文献・参考資料

@AmstatNews, ASA (2015) Twitterでの呟き URL: https://twitter.com/AmstatNews/status/628658305167134720

Hertz, S. (2001) Georg von Mayr,  in Heyde, C.C. and Seneta, E. (ed.) Statisticians of the Centuries, Springer Seience+Business Media, 219-222

Keynes, J. M. (1921) A Treatise on Probability, Macmillan and Co.

Pearson, K. (1892: 1st ed., 1900: 2nd ed., 1911: 3rd ed.) The Grammar of Science, Walter Scott.

Pearson, K. (著者名不記載)(1902) Editorial: The Sprint of Biometrika, Biometrika, 1(1), 3-6
Pearson, K. (著者名不記載)(1903) Editorial: On the Probable Errors of Frequency Constants, Biometrika, 2(3), 273-281.

 

Pearson, K. (1912) Darwinism, Medical Progress and Eugenics (Eugenics Laboratory Lecture Series. IX.), University of London, University Laboratory for National Eugenics

Von Neumann-Spallart, F. X. (1885) Résumé of the Results of the International Statistical Congresses and Sketch of Proposed Plan of an International Statistical Association, Journal of the Statistical Society of London, Jubilee Volume (Jun. 22 - 24), pp. 284-320

 

Oxford English Dictionary(オンライン版)アクセス日: 2021-08-02

 

有賀暢迪(2012)カール・ピアソンについての邦語文献   URL: https://researchmap.jp/blogs/blog_entries/view/82550/b296f42ef7251fe85e7e132bac23f332?frame_id=664755&lang=en

伊勢田哲治(2021)大塚淳統計学を哲学する』を読む URL:http://blog.livedoor.jp/iseda503/archives/1924637.html

上藤一郎(1999)「第8章 優生学とイギリス数理統計学:近代数理統計学成立史」長屋政勝・金子治平・上藤一郎(編)『統計と統計理論の社会的形成』北海道大学図書刊行会

大塚淳(2021)『統計学を哲学する』名古屋大学出版会

呉文聡(1906)『純正統計学丸善国会図書館デジタル URL: https://dl.ndl.go.jp/info:ndljp/pid/805661/20

田井要助(1935)『統計学講義案』中央大学教務課 国会図書館デジタル URL: https://dl.ndl.go.jp/info:ndljp/pid/1274316/16

 

竹内啓(編)(1976)『統計学の未来:推計学とその後の発展』東京大学出版会

竹内啓(2018)『歴史と統計学:人・時代・思想』日本経済新聞出版社

長屋政勝(1982)「第1章 K.ピアソンと記述統計学:有意性検定前史」高崎夫・長屋政勝(編)『統計的方法の生成と展開』産業統計研究社

日本学術会議 数理科学委員会 統計学分野の参照基準検討分科会(2015)「大学教育の分野別質保証のための教育課程編成上の参照基準 統計学分野」報告書 URL: http://www.scj.go.jp/ja/info/kohyo/pdf/kohyo-23-h151217.pdf

日本数学史学会編(2020)『数学史事典』丸善出版