スティグラー著『統計学の7原則』日本語訳で個人的にほんの少しだけ気になった点

この記事の内容に対する責任は,すべて筆者個人(小野裕亮)だけにあります.所属組織は,一切関わっておらず,いかなる責任も負いません.

 

はじめに

スティグラー著(森谷博之・熊谷善彰・山田隆志訳)『統計学の7原則:人びとが築いた知恵の支柱』では,統計学の概念のうちで重要と思われる7つを取り上げ,その歴史を紹介しています.次の7つのテーマに関する歴史が,カジュアルな雰囲気で解説されています.

  1. データの要約
  2. データの情報量
  3. 尤度
  4. 内部比較(外的基準をもたずに数値を解釈する方法)
  5. 回帰
  6. (実験計画などの)計画
  7. 残差

著者のStephen M. Stigler先生は,近代統計学統計学史の第一人者の一人です.本書は,統計学を少し知っている一般の方向けに,リラックスした雰囲気で書かれています.統計学を学んだ方で,上記のような7つの概念がどこから来たのかに驚異がある方で,統計学史に足を踏み入れてみたい方には最良の書になっているのではないかと思います.

個人的に,日本語翻訳書において気になった点がありました.本ブログでは,その気になった点をいくつか挙げたいと思います.

 

いくつか断っておきたい点があります.

  • 第1に,以下に述べることはあくまで個人的な好みの問題です.
  • 第2に,世間一般において,他人の「間違い」や「誤解」を指摘する人を見かけたら,まずは,その指摘している人(つまり,私)が間違いや誤解をしていることを疑うのが無難だと私は思っています.以下の記述のほとんどが間違っている可能性もあります.
  • 第3に,たとえ間違いがあったとしても,私ぐらいの英語力であれば,日本語翻訳を読むほうがはるかに頭に入ってきます.このような面白くて刺激的で,かつ,必ずしも容易ではない本を翻訳してくださったことに,深く感謝します.
  • 第4に,私自身は,同書を翻訳できる技量を持ちあわていません.私が翻訳したら,一生終わらなかっただろうですし,訳せたとしても誤訳ばかりになっていたと思います.

以上の注意点に留意しながら,お読みください.

なお,初版第1刷をもとにしています.

 

第1章

  • P.35の「1週間ヘアブラシを無くした誰か」は,「やぶの中で1週間,道に迷った人」ぐらいの意味だと思います(”be lost in the brush”の”brush”は,やぶや雑木林ぐらいの意味だと思います).
  • P.40の「略式の検査も通さない最新の計算手続き(アルゴリズム)」は,「ちょっと見ただけでは理解できない最新のアルゴリズム」ぐらいの意味だと思います.

 

第2章

  • P.50の「効用と私たちの知識にある確率誤差の逓減費用」は,「私たちの知識における確率誤差(probable error; 蓋然誤差,公算誤差)を減らすことの効用と費用」ぐらいの意味ではないかと思います.
  • P.50の「おもりが上にあるときの実験と下にあるときの実験」は,「重いほうのおもりが上にあるときの実験と下にあるときの実験」だと思います.
  • P.52の「有効な標本数」は,原文では「effective sample size」であり,これは技術用語なので,直訳して「有効標本サイズ」/「有効サンプルサイズ」などと訳したほうが無難な気がします.
  • これは原文でもそうなのですが,P.54のFisher情報量の式は,2乗は括弧のなかに入っていた方が誤解がすくない気がします(「スコア関数の2乗」の期待値であって,「スコア関数の期待値」の2乗ではないため).
  • P.54で「data set」への訳を「データ集合」としていますが,「データセット」が定訳ではないかと思います.

 

第3章

  • P.57の「気のない慰め方をする」は,「気のない褒め方(ほめかた)をする」のタイポではないかと思われます.
  • P.58のArbuthnotの論文名における”argument”を「証明」と訳していますが,「議論」もしくは「根拠」ぐらいの意味だと思います.
  • P.59の「アーバスノットはこの神の摂理という選択肢の計算はしていない」は,「アーバスノットは,「神の摂理がある」という対立仮説のもとでの確率は計算していない」ぐらいの意味だと思います.
  • P.61の 「非常にまれな事象が生じたか、あるいは確率分布の理論が正しくないのか」における「確率分布」は”random distribution”の訳だと思いますが,「確率分布」は技術用語であり”probability function”の定訳であるため,「非常にまれな事象が生じたか,あるいはランダムな分布であるという前提が真ではないか」ぐらいに訳したほうが無難だと思います.
  • P.63の「プライスがもくろんだ(そしてまず確実にベイズの意図もそこにあった)ベイズの論文のタイトル「帰納法によるすベての結論の正確な確率を計算する方法([...])」[...]は最近になって注目された」は,「プライスは(そして,ほぼ確実にベイズも),当初,論文のタイトルを「帰納法によるすベての結論の正確な確率を計算する方法」としていた.この事実は,ごく最近になって判明した」ぐらいに訳したほうが分かりやすいと思います.
  • P.66の「一連の値の限度を定義して」は,「現在のデータよりも極端であるとみなす集合を決めて」ぐらいに意訳したほうが分かりやすいかもしれません.

 

第4章

  • P.78のStudent論文の解説で,「標本数」は「標本サイズ」としたほうがよさそうです.「標本数」でも誤解は生じないとは思いますが,数理統計学に限れば,「標本数」と「標本サイズ」は訳し分けるのが慣例だと思います.
  • P.80での「結論における正当な理由のないベイジアンという用語」は,「正当な理由なくベイズ流に結果を解釈してしまっていること」ぐらいの意味だと思います.
  • P.81で,”ratio t”を,「比率 t」と訳していますが「t比」ぐらいに訳したほうがいいと思いました(”ratio”は「比」であり,rate「率」ではないため)
  • P.82で,「1915年,フィッシャーは[…]相関係数 r を発見した」は,「1915年,フィッシャーは[…]相関係数 r の分布を発見した」のタイプミスと思われます.
  • P.82の「σへの依存からスチューデントのt分布を解放した魔術をみたが,それは数学という学問の氷山の一角にすぎないと[Fisherは]みていた」は,「σによらない形でt分布が導出されるという数理的なマジックは,数理上の氷山の一角に過ぎないと[Fisherは]みていた」
  • P.83の節名にある「分散の構成要素」の原文である”variance component”の定訳は,「分散成分」ではないかと思われます.

 

第5章

  • P.95の「種のなかの遺伝的変異のしやすさが十分にあること」は原文は”sufficient within-species heritable variability”ですが,単純に「同一種のなかで遺伝子が十分にばらついていること」ぐらいに訳したほうが分かりやすいと思います.この後のページでも,各世代における正規分布の分散が,次世代でも一定であることが論じららているので,”variation”は「変異」ではなく,「variability」は「変異のしやすさ」ではなく,両方とも統計用語の「ばらつき」や「変動」ぐらいに訳したほうが分かりやすいかもしれません.
  • PP.95-100あたりで,”population”を「母集団」と訳していますが,慣習として,生物学系の話をするときには「個体群」と日本語では訳すことが多いと思います(元々は,同じ”population”ですが,推測統計では「母集団」,生物学では「個体群」と訳し分けるのが慣習です.そのような訳しわけが難しい場合には,「集団」とだけ訳す場合もあります.)
  • P.100の「図5.7の中央から下の部分では、1つは中央、1つは右という2つの代表的集団のもつ変異のしやすさの効果を概略的に示している」は,「図5.7の中央では,身長が中ぐらいの群と身長が最も高い群を例に挙げて,それらの身長が真ん中による動きを模式的に見せている.」
  • P.110の「かれ[Galton]が取り組んだ問題は…」あたりの文章は,「Galtonは,他の誰もが問題があるとは気付いていなかったであろう問題に取り組み、そして,その問題を適切に理解すれば,そこには問題はないことを示した」ぐらいの意味だと思います.
  • P..112の「偏相関に関連した…」あたりの文章は,“principal components of variance”の適切な訳が私は分かりませんでしたが,ここでは主成分分析のことを指しているのではないので, 「偏相関や多次元最小2乗に関係した関連性指標(measures of association)や,分散成分の分解を用いて」ぐらいの意味だと思いました.
  • P.118の「測定誤差」は「推定誤差」のタイポだと思われます.

 

第6章

  • P.129の「1985年」は「1885年」のタイポと思われます.
  • P.134の”just noticeable difference”は,「最小可知差異」や「丁度可知差異」と訳されることが多いようです.
  • P.136にて,”spherical symmetry”に対して「球体対称」と「球対称」と異なる訳語が割り振られています.同一の訳語を割り振ったほうがいいと思います.
  • P.137の「キアエル」(元は”Kiaer”)は,日本語では「キエール」と記されることが多いようです.
  • P.138の「研究者が資金に余裕がないという状況もあり」は,「無作為化試験を行う余裕がないと感じる場合もあるが」という意味だと思われます.

 

第7章

  • P.155の「一般線形モデル」は,「一般化線形モデル」の誤植と思われます.

 

以上です.

繰り返しになりますが,このようなとても面白い本を日本語翻訳してくださった方々に深く感謝申し上げます.