1.経済数学

1-12 確率と統計

形、形、形


 一を持って十を知る。
 十を持って一を知る。

 全体を一とする。
 それは確率的全体である。
 何を全体とするのか、それによって百%が決まる。

 統計とは、一定の条件に従って集められた数の集まり。
 数を集める限りにおいては目的があるはずである。
 近年は、目的がなくても数を集積される。それ故に、統計と言っても目的が不明瞭なものがある。
 しかし、だからと言って統計の本質が変わるわけではない。

 統計は、総てを計ると読めるが、この意味だと全てを調査するという事が前提となる。
 統計の目的は、総てを計る事にあるわけではない。
 集めた数値をどの様に分類し、また、その性格や働きを知るかにある。
 だから、総てを計っただけでは意味がないし、大体、なぜ全てを計る意味があるのさえわかない。

 統計というのは、何らかの条件によって集められた数の集まりである。故に、集合である。
 重要なのは、条件を決める者があってはじめて統計は成り立っているという事である。
 故に、統計は、合目的的な集合である。

 統計とは集合の形を考える事である。
 集合の形は、一律一様ではない。
 集合の形から集合の性格や特徴が読み取れる。
 集合の性格や特徴には、範囲が重要になる。

 集合の形が問題となるから、最大値と最小値が鍵を握る。
 平均値。中央。最頻値が集合を測る目安となる。
 又、山の形や数。尖度。
 分散、幅等が重要となる。

 統計と確率を一括りに扱うから統計と確率、両方ともわからなくなるのである。統計と確率は、別物である。
 統計は、既に現れた事実を記述し、あるいは、既に現れた事象を元に全体を推測したり、将来を予測することを言うのに対して、確率は、何らかの事象がこれから生起するであろう比率で表した事である。
 確率を計算する為に統計を活用する事はあるが、統計と確率は別の事である。

 正規分布ありきで説明しようとするからわからなくなるのであり、正規分布を一つの基準として捉えればいいのである。
 何もかも正規分布になると訳ではない。

統計の本質は形にある。



 統計の本質は、形にある。統計とは形である。
 だからこそ、平均値とか、中央値とか、最頻値と言った代表値が問題となるのである。
 代表値は、統計の示す形を示しているからである。

 統計を考える場合、平均値だけで実体を見る事はできない。
 それはデータのバラツキを掌握できないからである。
 経済の実態を掌握するためには、平均値と中央値の差の幅を見る必要がある。
 集合の正確な形や形の働きを知るためには、平均値と中央値の関係を知る必要がある。

 平均値に代表される代表値は、集合の性格や特徴を表す。
 平均値だけが代表値なのではない。
 データの集合の形や前提、データを活用する目的等によって代表値は選ぶべきなのである。
 つまり、代表値は任意な事である。

 統計を考える場合、基礎となるのは、集合の形である。

 代表値を考える場合、時間が陰に作用しているか、陽に作用しているかによって代表値の働きや算出手段に差が出る。
 例えば、平均値では、時間が陰に作用した場合は、算術平均、幾何平均等、陽に作用した場合、移動平均等が平均として考えられる。
 この様に代表値は、集合の性格や特徴、又、集合をどの様に活用するか(目的)等によって変わる。
 集合の形を多元的に捉える事で対象の全体像捉え、原因を究明したり、将来を予測する。
 故に、統計は、確率の基礎となる。

 平均や偏差は、データの形相や構造を表す指標である。

 データに形相や構造があり、又、変化がある。
 その形相や構造の形、面積、体積のから、或いは、変化の速度からデータの性格や働きを知る事が出来る。故に、微分や積分の操作や密度の概念が重要となるのである。

 統計や確率の前提は、集合である。木から森を想定するように、部分から全体を捉えるのが統計である。
 データの全体を代表する値の一つが平均である。他の代表値に、メディアン(中央値)やモード(最頻値)がある。

 観察する対象の全体集合を母集団と言う。それに対し、標本とは、全体集団から抽出した部分集合をいう。(「まんが統計学入門」ボリン・V・ルーン著 神永正博監修 井口耕二訳)標本から全体、或いは何等かの対象の数を推測する手法を統計という。

 テレビの視聴率は、テレビの視聴者全体を母集団とする。そして、視聴者数を割り出すために、抽出したモニターが標本である。

 前提や条件の設定の仕方によって数の塊、即ち、母集団は変化、変質する。故に、前提や条件を明らかにし、充分に確認する必要がある。

 なぜならば、データには、形相があり、構造があるからである。データの形相や構造は、前提や条件によって変化する。
 本来、データ自体が合目的的な集合なのである。

 数の塊を構成する要素には、何等かの違い、差があり、その違いや差のバラツキや分布、即ち、位置を特定することによって全体像を明らかにする試みが統計である。

 その為に、塊を構成する数を何等かの命題に基づいて整理する必要がある。整理とは、位置付けである。
 数を位置付けるために塊の一部、又は、全部を何等かの前提条件によって抽出し、並び替える操作をする。その操作が統計的手法である。

 その上で、数と数とを一対一に結び付け結び付けるが基本である。

 基本的に統計は、データの集合である。故に、統計は、任意な集合であり、合目的的な集合である。統計はデータの集合であるから、前提や条件によって変化する形相や構造を持つ。

それがデータの型を規定する。データにも形や構造があるのである。

 データの形には、代数構造、位相構造、順序構造、階層構造等がある。

 データの形とで代表的なのは、正規分布である。

 統計データで重要なのは、形である。故に、データの形を可視化すると統計はわかりやすくなる。

 そして、記述統計の重要性は、データの形にある。

 形を重視するならば、密度と累積も重要となる。
 故に、確率密度関数や累積分布関数が大切なのである。


確率・統計の枠組みを見直す



 確率・統計を難しくしてしまっているのは、出鱈目な教育が横行しているからである。
 第一に、統計と確率の役割分担が不明瞭だという事である。第二に、一般に使われている分布と確率分布の意味の各文が不明瞭だという事である。 第三に、正規分布に対する正しい認識をせずに、正規分布を必要以上に重視している事である。
 確率・統計の枠組みから組み立てなおす必要がある。

 確率・統計は、合目的的な事象である。
 確率・統計は、合目的的な事象であるから、目的に応じた枠組みが必要となる。

 統計にできる事は、第一に、投票結果の予測とか、抜き取り検査等、部分から全体を推測する事。第二に、どのくらい好きかとか、好き嫌いの割合、確からしさ等、概念を数値化する事。第三に、過去のデータから未来を予測する事。第四に、仮説の検証。第五に、集合の傾向や特徴を掴む事。第六に、意思決定をする時に確率的な資料を提供する事。第七に、平均値、中央値、最頻値など集合の代表値を算出する事。第七に、集合の分布や偏りを明らかにする事。第八に、データを位置付ける事。第九に、集合の構成を知る事。第十に関係や変化を明らかにすることなどである。そして、統計にできる事は、統計の目的にも相通じる。

 確率や統計は、目的によって手段が制約される。確率や統計に対する誤解の一つが、確率や統計が何らかの統一的体系を持っていると考えられている事にある。投票結果を予測しようとするための手法と経済を分析するための手法、何らかの仮説を検証しようとするための手法、アンケート調査やマーケッティングのための手法、頻出管理のための手法は、全く違う前提や論理、アルゴリズムによる。確率統計は、目的によって制約される。それが他の数学と決定的に違う点である。

 確率・統計の目的は、意思決定のための裏付け、根拠を与える事にある。
 将来を予測したり、法則を仮定したり、選別をする際、何らかの裏付けや根拠を示す必要がある。その裏付けや根拠を保証するのが確率や統計の目的である。

 確率や統計で重要となるのは、アルゴリズムであり、過程である。
 確率や統計を成立させるための前提は、母集団の推定である。つまり、確率や統計の当座の目的は母集団の推定にある。
 ただ、母集団の意味が統計と確率では、明確に違う。
 統計上の母集団は、何らかの調査や実験に基づく実際的、実体的な集合である。それに対して確率における母集団は仮定に基づいている。

 確率や統計の目的は、将来を予測したり、法則を仮定したり、物事を選別したりする事であるが、この目的を実現するためには、いくつかの段階を経なければならない。

 まず事実を正しく認識し、その背後にある全体を把握して、そこにある法則性や規則性を割り出して予測や選別、即ち、意思決定の根拠とする。これらの段階ごとに必要とされる母集団が変化する。我々は、与えられた情報に基づいて何を明らかにしようとしているのか、分析しようとしているのかによって根拠となる母集団も変えていく必要がある。

 統計上の母集団というのは、あくまでも、調査や実験に基づく実体のある集合を指す。つまり、現実である。実際の数字に基づいて対象を分析したり、因果関係を取り扱うのが記述統計である。

 統計によって導き出された法則や因果関係を参考にして将来生起する事象を予測するのが確率である。

 故に、確率分布で前提となるのが「大数の法則」である。

 正規分布というのは、確率分布の基準となる分布である。
 日本語で正規分布と訳されている事が誤解の原因にもなっている。正規分布の正規は、英語では、normalとされる。normalという意味には、正規という以外に、標準の、規定の、正常の、常態の、一般並みの、平均の、正常な発達をしている、垂直のという意味がある。
正規分布本来の役割は、確率分布の母集団を推定する為に基準を提供する事にある。
確率分布を想定する際、平均と分散がカギを握る。その平均と分散を基にして分布を想定する際、正規分布を基にすると都合がいいのである。

 正規分布は、あくまでも確率分布である。正規分布になる現象というのは一般には稀である。滅多にない。
 ところが記述統計でいう分布と確率分布との区分を付けずに、一般の現象に正規分布が多くあるとしている教科書すらある。そして、いきなりサイコロの話になる。これでは、初心者は、記述統計にあける分布と確率分布との区別がつかなくなる。それが確率や統計を一般にわかりにくくしている最大の原因である。

 確率・統計で最終的に要求されるのは、分析結果の信憑性を保証する事である。その為に検定が必要となる。
 そして、検定で力を発揮するのが正規分布である。検定においてなぜ、正規分布が威力を発揮するのかというと、標準偏差は、正規分布を基にして想定されているからである。つまり、平均と偏差によって想定されているのが正規分布であり、正規分布を基にした方が他の分布を基にした場合より、 個々のデータの位置づけや検定をしやすいからである。

 しかし、確率分布は、正規分布だけに限られているわけではない。平均を表す確率分布として二項分布やt分布などがある。分散を表す分布としては、F分布がある。サンプリングを表す分布としては、ベルヌーイ分布、ポワソン分布等がある。

 正規分布や二項分布は、面によって分布を表している。

 記述統計等は、法則や規則、有効性などを解明、あるいは、仮説を立証するといった時間が陰に作用している事象に効果的である。それに対して予測、予実績管理といった時間が陽に作用している事象には、ベイズ統計や時系列分析などが有効となる。

 ベイズが事前確率、尤度、事後確率等を重視するのは、ベイズ統計が時間軸を含んでいるからである。

 この様に確率分布は、目的に応じて選択されるべきであり、是々非々の問題ではなく、妥当性の問題なのである。

 そして、確率分布の基準となる分布が正規分布なのである。故に、正規分布に分布する事象、よくパチンコの山などが引き合いに出されるが実際に現象として現れる事は稀である。一番、一般に用いられるのが成績の順位付け、位置づけである。それがまた、混乱を招いている。子供たちは偏差値によって振り分けられるからである。そのために、妙なところで偏差値が一般化してしまっていて本来の偏差値の意味が正しく伝わっていない傾向がある。それが、統計嫌いや統計に対する偏見を生み出す原因となっているのならば、本末転倒である。

 まず確率や統計を使う場合は、目的を明確にすべきである。
 また、確率や統計を学習させる際は、身近で切実な問題を取り上げるべきなのである。
 成績の偏差値などは、最も、切実な問題であるはずなのに、偏差値だけが独り歩きし、学生の成績の位置づけ、序列付け、進学の際の基礎資料としか使われていないのは残念な事である。
 偏差値を用いるのならば、適性や潜在的能力、学習の為の指標といった学生の可能性を引き出すための資料として使われるのならば統計本来の力をより発揮する事が出来るように思う。

 記述統計に対する出鱈目な教育は、ベイズ統計に対する正しい認識を妨げてもいる。
 ベイズ統計は、従来の統計を否定するものではない。むしろ、相互に補完し、補強するものである。この点を理解しないとベイズ統計の健全な発展も望めない。



統計や確率は合目的的な事である




 統計とか、確率がとっつきにくいのは、なぜ、統計や確率を勉強しようとするのかを明確にしないで、統計を統計、確率を確率として一つの学問として教えようとするからである。
 統計も確率も本来合目的的なのである。
 統計の目的は、部分から全体を推測する事、予測する事、分散を見る事、位置づける事、構成を見る事、確率を知ることなどである。

 今の、学校で数学というと、四則の演算や微分積分、連立方程式のようなものを指し、統計や確率は、あまり、教わらない。ところが、社会に出て、俄然、威力を発揮するが統計的確率である。しかし、統計というのは、高校でもあまり習わない。例え、大学へ行ったとしても、統計を大学で教えられるのは、限られた学部の人間だけである。
 しかも、確率も、学校で習う確率というのは、数学的確率で、社会で圧倒的に使われている統計的確率はあまり教えられない。
 学校で習う数学的な確率というのは、定義や方程式のようなものである。例えば、学校で教えられるのは、正規分布や偏差値、順列、組み合わせ、確率の定義や方程式についてである。正規分布の意義や実際的な活用法、見方などはあまり教えられない。
 我々が常日頃目に接する数値は、例えば、いろいろな経済指標や人口、犯罪率と言った社会現象に対する統計、地震の確率や天気予報と言った現実的な生きた数値である。その上に、答が一つとは限らない、多分に不確実な要素を含んだ数値である。必ずしも理論が確立されているとは限らないし、また、ある程度科学的に証明されているとはいえ、多分の不確実な要素を含んでいるものが多い。
 統計や確率が、実際にどの様に使われているのか、また、新聞やテレビで発表される統計数値は何を意味し、どの様に見るべきなのか、どの様な点を注意すべきなのかについては、学校では教えてくれない。それが、統計を難しくしている。
 選挙結果や経済的確率、天気予報も統計的確率に属している。この様な問題は、対象の捉え方や手法によって答が違ってくるのが一般的であり、これだという手段すら確定していない場合が多い。
 ところが、学校で確率というと数学的確率を指す場合が多い。与えられた設問に対して正解が用意されているような問題だという事である。
 大体、多くの人は、確率に、統計的確率と数学的確率の別があることすら認識していない。
 その為に、かえって、学校で教わったために、確率の数字に対する考え方を誤解している場合が多いくらいである。だから人々は数字に幻惑させられる。

 新聞やテレビで我々が、日頃、目にする数字の多くは、統計的確率である。統計に対する理解が欠けていると数値が一人歩きしてしまう。
 例えば、地震が起こる確率などであるが、地震が起こる確率を予測する事は、かなり難しいのに対し、地震後、津波によって海上に流された瓦礫がどの様に漂流するかの予測は、比較的立てやすい。
 それは、前提条件の違いによるのである。この様に、与えられた条件や状況によっても数値の信憑度にも差が出る。

 我々が常日頃、接する数学は、学校で習った数学とは、異質な感じがするものである。それが、社会に出てから常日頃に接する数学や数字に対するある種の違和感を与えるのかもしれない。
 しかし、我々が常日頃、数学の方が、本質なのである。それは、従来、統計と言われている確率、統計とも違う。

 ビジネスの世界では、数字は欠かせない。特に、統計の数字は欠かせない。しかし、そこで使われる数字は、我々が習ってきた数字とは異質な事のように思える。社会に出ると多くの人はそこに、戸惑いを感じる。

 確率統計なんて言うと賭け事の延長のような教え方が主流である。しかし、実際の生活で必要とされるのは、天気予報の確率であり、経済指標の動きであり、表示されている商品の品質であり、カタログに示された数値の読み方であり、金利や家賃の変化をどう読むか、失業率とはどういう意味で、何が問題なのか。犯罪率の変化が何を意味しているのか、平均気温の変化輔どう読むか、気温が上昇したらどんな変化があるのか、暑い夏には何が売れるか。投票率は、選挙結果にどんな影響を及ぼすのか。自分の一票の重さはどれくらいあるのか。肺がんの死亡率と喫煙率との相関関係はどの程度あるのか。自分の働きと給料とは見合っているのか。時速80キロ後何時間走れば目的地につけるのか。今借金をして家を買う方がいいかそれとも貸家で我慢した方が得か。
 そういう実際の商売や生活に役に立つ事と結びつけて数学を教えてはならない、学校教育では禁じ手だと考えている。
 だから、ひたすら世の中に出たら役に立たない数学ばかりを教えて、実際的で役に立つ事と数学は教えない。だから多くの人は、数学は実際の社会とは、無縁だと思い込んでいる。

 しかし、社会に出たら数字がわからなければ、まともな生活は営めない。世の中は、数字、数字、数字が氾濫しているのである。数字がわからなければ、物の価値もわからずに悪い奴に騙されるのである。
 数字は現代社会ではなくてはならない事なのである。


確率は、賭け事の延長線上にあるわけではない。



 一般に、また、学校では、平均、偏差、分散等から確率を教え始めようとする。
 確率を習い始めるとサイコロの話が引き合いに出される。サイコロの話は、とっつきは良いが、それが確率の話を代表しているかというと少しずれといると思う。
 確率は、賭け事の延長線上で発達してきたのは事実である。しかし、確率の本質は意思決定にある。博打にあるわけではない。
 日常的な物事をどう判断していいのか。重大な局面岐路にあたってどの様な判断をすべきか、そこに、確率の真骨頂がある。そうなると、確率の本筋を賭け事や投機に求めるのは間違いである。そして、それが確率に対して間違った認識を招く原因でもある。

 確率は数当てではない。確率は、意思決定を補助する事である。確率の本質は、現実にあるのである。だからこそ確率の精度が求められるのである。地震はいつ起こるのか。どうすれば事故を防げるのか。病気にかかる確率は。どうしたら病気にかからずに済むのか。不良品の数を減らすためにはどうしたらいいのか。何を売ったらいいのか。いくらで売ればいいのか。統計や確率で扱う事は、本来、切実な事なのである。
 確率で学ぶべき事は、ごく日常的で常識的な問題の判断である。
 なのに身近で切実な問題から統計や確率を教えようとはしない。生徒の身長とか、サイコロの出目の確率から教え始めるのである。だから統計や確率は自分が生きていくうえで大切な事なんて思わない。ただ目の前の試験を通るためにだけ確率や統計を学ぼうとするのである。

 この世界にある現象やこの世の出来事。
 森羅万象をどの様にとらえ、未来を予測し、決断していくか。
 その根底にあるのは、統計や確率の考え方である。

 占いや予言は、統計・確率の原型である。
 人は未来を予測し、不確かな現実を踏まえて決断していかなければならない宿命を負っている。
 故に、不確かなりに、確かな事を基礎として決断したのである。

 それが統計や確率の動機である。
 天候や獲物の数によって生きるか死ぬかが分かれるのである。
 より確かに天候を予測し、獲物の居場所を掴みたいそれが統計や確率を生んだのである。

 故に、統計ありきではない。数字に表れ事象の背後に何が隠されているかを探究するのが目的なのである。
 そして、その結果からいかに間違いのない判断をするかが大切なのである。
 記述統計が是か、非か。ベイズが是か、非かという問題ではない。
 どの様な目的で、何をしたいかの問題である。
 目的に応じて記述統計が適しているか、ベイズ統計が適しているかの問題である。

 確率の入門で袋から何色の球を出すかが問題とされる。しかし、確率を学ぼうとする者の動機とはかけ離れている。
 だから、確率や統計を不毛に感じるのである。
 現実に統計確率から学ぶ事は沢山あり、すぐに役に立つことも多くある。
 なのに、観念遊びから入るから確率や統計を学ぶ目的が理解されないのである。

 確率と統計で重要なのは、「大数の法則」である。「大数の法則」を前提として確立と統計は成り立っている。
 「大数の法則」は、ありていに言えば、なるようになるという事である。この事の持つ意味は重大である。
 人間の恣意とか、重いというものは、この世の出来事を左右できるものではない。
 何万回も回数を重ねれば、なるようになる。それが前提なのである。

 大数の法則を前提とすること自体ある種の信仰だと言える。

 部分の周辺では部分の働きや性格によって大きく動かされる。しかし、全体は、全体としての統一性が保たれる。
 この二点が民主主義の原点でもある。


確率と統計


 確率とは、任意の事象が起こりうるすべての事象に対して起こりうる割合を言う。
 つまり、確率を明らかにするためには、起こりうる総ての事象を何らかの形で想定しなければ計算できない事を意味している。
 それに必要とされるのが統計である。故に、統計と確率は切っても切れない関係にあるのである。
 人が生まれた数だけ死ぬ確率が想定されるのである。それが確率分布である。
 人が生まれた数が全体の確率分布を表している。確率の個数は、人が生まれた数を表す。
 何を確率分布と想定するかが重要なのである。
 何に対する確率なのか。何を全体とした確率なのかは、確率分布によって規定されるのである。
 確率の原則は、漏れなく、重複なく、総てである。
 だから乱数は難しい。

 確率を成り立たせているのは、統計的前提である。統計的前提というのは、確率分布を指して言う。確率分布をどう想定するかを意味しているのである。つまり、確率は、確率分布を何に基づいて設定するかによって制約されるのである。

 確率と統計は、違う概念である。
 我々は、学校で、確率統計と一緒に授業を受ける。故に、確率統計の概念を混同してしまう傾向がある。
 確率と統計は違う概念であるが、同時に、共通した部分を多く含んでいる。そのために、確率と統計の概念が混乱しないよう注意する必要がある。

 一般統計といった場合、記述統計を指し。一定の基準や目的によって集められた数値を言う。そして、確率とは、一定の条件において任意の事象が生起する割合を言う。
 確率の土台になる部分に統計は深く関与している。しかし、だからと言って統計と確率は同じ事ではない。

 確率の目的は、制御にある。統計の目的は、現実を知る事である。この二つは、密接なかかわりがある。目的の方向性を同じである。しかし、本質は違う。物事を制御をするために、現実を知り、結果を予測する。確率と統計は、補完的な事なのである。

 適切な制御をするためには、過ちを少なくすることである。確率でいう過ちとは、誤差である。

 統計でも確率でも分布や分散が重要な働きをしている。しかし、統計でいう分布と確率でいう分布は別のものである。
 統計上の分布は、集められた数値の偏りとか、数値の背後にある実体の状態などを表したことを言い、確率における分布は、確率分布であってある事象が一定の条件下で起こると思われる割合の散らばり具合を言うのである。
 確率分布というのはあくまでも想定である。むろん、確率分布の信憑性を結果と照合することで検証することは求められる。しかし、それは、あくまでも検証を目的とすることであって確率分布そのものは、想定に過ぎない。この点を理解しておかないと正規分布の意味は理解できない。
 そして、確率分布は、「大数の法則」を前提としているのである。
 大数の法則を前提としているから、出現頻度によって分布の在り様も変わってくるのである。

 確率分布を想定するためには、中心を定め、その中心との距離、偏差、誤差を測定する。そこから、その背後にある全体像をつかんで、全体を制御するのである。中心となるのは、平均値や中央値、最頻値といった代表値である。必然的に確率分布の多くは、回数を重ねると対称形になり、釣り鐘型になっていく。ただ、最初から平均値がわかっているわけではない。むしろ、全体像がつかめないのだから、平均値は、わかっている範囲でしか測定できない。
 それ故に、中心値は、任意に定めるというのは道理にかなっている。それがベイズ統計の妥当性である。しかし、この道理は、何もベイズ統計だけに有効なのではなく。全ての統計や確率に言える。要は、どの様に中心を定めるかの問題であって、平均値にしようが、仮定であろうが任意である事には変わりない。

 確率分布というのは、推定に基づいて設定される。例えば、特定のサイコロの目の出現確率が六分の一とするのは、数多くサイコロを転がしてその目が出るのが六分の一になると推定されるからである。そして、その根拠は、大数の法則である。しかも、サイコロの密度が均質であるという事が前提となる。要はなるからなるとしているのである。必ずなると断定しているわけではない。
 この点について錯覚している人が多くいる。例えば正規分布は確定的な事、正規分布は必ず成立するというのは思い込みである。

 数多くデータをとると正規分布に近づくという想定に基づいて生起する割合を計算しているに過ぎないのである。
 集められるデータに限界、少なければ、それに応じた確率分布を設定する必要が生じるのである。

 確率には、統計的前提の上に成り立っているものと数学的前提によって成り立っているものがある。
 統計的前提の上に成り立つ確率を統計的確率という。数学的前提の上に成り立つ確率を数学的確率という。
 統計的確率とは、経験的確率とも言う。数学的確率とは、先験的確率である。

 数学的確率は、想定される場合を起こる得る全ての場合で割った値である。
 統計的確率は、第一に、一定の前提条件の基に試行を繰り返すことによって得られた値を試行の回数で割った値、第二に、観察や調査によって集められた値を分析することによって得られる値、想定される場合を起こる得る全ての場合で割った値の三つを言う。(「ゼロからわかる確率・統計」深川和久著 ベレ出版)


確率の根本は不確かな事である。



 統計や確率というのは、いい加減とか、ある種の曖昧とか、出鱈目の上に成り立っている。
 いい加減で、曖昧で、出鱈目な事の上に立脚しているから統計や確率は、有効なのであり、いろいろな分野で活用することが可能なのである。そして、統計や確率の性格や独自性が発揮されるのである。逆にいえば、いい加減さやでたらめさは、他の数学と相いれない部分でもある。しかし、だからこそ、統計や確率は最も数学的だともいえる。数学本来の目的を見失っていないのである。
 数学が、数学としての整合性を追求するあまり、現実や実体の矛盾や不明なところを削ぎ落してきた。その事によって現実と数学との整合性が保てなくなってしまった部分がある。その一つがリスクの問題である。

 確率にはリスクがつきものである。
 リスクとは不確かさである。
 確率は、不確かな事の上に成り立っている。
 だから何を全体とするかによって一が決まる。

 確率統計の概念が経済学に取り入れられハイリスク・ハイリターンという言葉が飛び交うようになった。
 金融商品には、ハイリスク・ハイリターンの商品が多くあるというのだが、その割にハイリスク・ハイリターンの意味が正しく認識されておらず、いろいろな問題を引き起こしている。

 ハイリスク・ハイリターンという言葉には、リスクとリターンという二つの概念が含まれている。つまり、リスクの意味とリターンの意味を正確に知り、その上でその二つの概念を組み合わせて考えないとハイリスク・ハイリターンの真の意味は理解できない仕組みになっているのである。
 リスクは一般に危険性と訳されるが、危険性にもいろいろな意味がある。何らかの損失や被害を被る事を言う場合もあるが、リスクと言った場合被害や損失を被る事よりも被害や損失を被る可能性に言及している場合が多い。又、リスクに対する意味も経済や工学など分野によって定義が若干異なっている。
 経済的な意味でリスクとは、不確かな度合い、つまり、バラツキ、ボラティリティ(標準偏差)を意味し、リターンは、損益の確率的な平均を意味する。(「確率統計で解る金融リスクのからくり」吉本佳生著 講談社ブルーバックス)

 リスクを単純に危険性と錯覚している人がいる。むろん、リスクという言葉の中には、危険性という意味が含まれている。ただリスクという意味の根底にある危険性とは何か。その点を明らかにしないとリスクが意味する事を理解する事はできない。
 経済で言う、リスクとは、不確実なるが故の危険性を言う。リスクというのは、危険性と言うより不足なことと言う意味愛が強い。危険性とは何か。失敗したり、負けたり、損をする事、あるいは事故や災害等を意味する。事故や、災害は、不測なという意味があるがどちらかというと打撃、損失と言う事の意味合いが強い。しかし、リスクというのは、不測なと言う事であってそこで被る損害は二の次なのである。この点を勘違いすると確率の意味は理解できない。
 百%危険な事にはリスクはない。
 リスクは曖昧さの度合いである。確実に失敗すると解っていることはリスクがない。なぜならば曖昧さがないからである。失敗することがリスクなのではない。曖昧なことがリスクなのである。

 何万分の一であろうと当たった当事者にとっては百%なのであり、当たらなかった者も当たらなかったという点では百%なのである。
 結果が顕れればリスクはなくなるのである。

 物理学は、物の位置と運動と関係を探求する学問であり、科学は物質の変化の原因を探求する学問であるのに対して、数学はあくまでも論理を追求する学問である。
 決定的な違いは、物理学が重んじるのは、実証であるのに対して、数学が重んじるのは証明である。どこが違うのかと言えば、物理は現実 から離れられないのに対して、数学は、現実から離れた純粋な観念の上に成立しているという点である。
 この点は、統計や確率も同じである。
 確率は曖昧さの学問である。確率で求められる厳格さは論理に対するものである。数学の基本を論理的体系だとすると、確率や統計は最も数学的な学問といえる。

一とゼロの間



 確率は一とゼロの内にある。
 一が全て。
 百%以上の確率はない。
 事実は一つ。
 現象は一回限り。
 その一回の事象や現象が起こる可能性を推定するのが確率である。
 世界は、一つ。
 自分は一人。
 その一と一から二が生じ。
 二と一から三が生まれる。
 零は空。一は全て。
 空と全の間に自己がいる。
 億千の事象も一とゼロとの間に凝縮される。
 億千の出来事も一とゼロの内に押し込められる。
 億千の時も一瞬に凝縮される。
 一が意識の始まり。
 経済は、意識から生まれる。
 あなたは一人。
 人生は一つ。
 命は一つ。
 世界は一つ。
 宇宙は一つ。
 現象は一回限り。
 神は全て。
 神は唯一の存在。

 一つ以外は全て仮想、仮定、推測、憶測に過ぎない。

 時間は、この一瞬に凝縮される。
 生きる。

 全体は一である。
 確率の総和は一である。

 そして、百分率の世界では、一は、百を意味する。

 数は均一、平等である。
 数は、客観的で、平等な値と考えられている。しかし、重要なのは、数の背後にある実体であり、数に意味を持たせる主体である。

 一人の人間の結婚は、自由意志の問題であるが、一億人の結婚は、統計の問題である。

 一という一はない。
 一という概念は、それ自体で成り立っているわけではない。何らかの対象、実体を伴って成り立っている。
 一とは、ある対象を一とするのである。ある対象は、一個の物でも、一つの塊でも、人でも、集まりでも何でもいい。任意の対象を一とするのである。

 我々は、一は一として教えられた。
 一というのは、明確なはずなのである。
 しかし、最初から一という物が存在するわけではない。
 一というのは意識が作り出したものである。

 一というのは、一つ一つの物を言う場合がある。
 例えば、リンゴが一個、クルマが一台という場合である。
 この場合、我々は直感的に一という物を認識している。
 しかし、その場合の一は、一という対象と一という対象認識している主体と一という基準から成り立っている。
 一を一としているのは、主体である。

 この様に個々の対象から一という概念を抽出する場合もあれば、何らかの全体を一とする場合もある。
 この様な場合の一というのは、必ずしも確かな存在ではない。
 不確かな存在である。

 実体の全体を一つの混沌とした塊とする。全体を一つの塊として認識するのである。それは認識の問題であり、意識の問題である。

 この世界の全体を一つとしたら、世界は、一とゼロの間にある。
 この世界を理解する上で重要なのは分別である。
 全体を一とした重要なのは比率である。
 分別は統計の基本である。

 一、二、三と言った数の概念と数が指し示す対象、数を認識する主体からなる。数が指し示す対象は、自己の外にある存在であり、数を認識する主体は、自己の内にある。数を認識する過程で、数の概念によって自己と対象とを結びつけていくのである。

 数学というのは、外的対象の世界で作られる物的体系ではなく、内面の意識の中で構築される事的体系なのである。
 ただ、外的対象を前提とし、外的対象と結びつく事によって成り立っているのである。

 一となる対象は、本来漠然とした何ものかである。
 重要なのは、何を一とするのかの前提である。
 何を一とするのかの動機である。
 それを考えると統計というのは、最も、数の概念に近い考え方なのかも知れない。
 又、その点を理解していないと統計の持つ意味を理解できない。

 確率を構成しているのは、負でない、ゼロから一の間の数である。

カオス・混沌とした全体



 カオス、この曖昧模糊で漠然とした全体。我々が日常接している対象は、カオスである。つまり、明瞭な確実なものなど何もない。実際の事象の全体は、確率的な世界である。だから、統計が必要なのである。

 統計は、絶対的認識を最初に否定する事によって成り立っている。それは絶対的存在を前提としているからである。
 統計や確率は、信仰によって成り立っている。

 統計と確率に共通しているのは、曖昧さと不確かさである。統計や確率が出現する以前は、数学は、確かさの上に築かれていた。
 疑う余地のない自明の命題の上に矛盾のない確かな論理によって構築されたのが数学であった。統計と確率は、出現した以後は、曖昧さと不確かさの上にも数学築かれることになる。

 頻度主義かベイズ統計かと言った論争は意味がない。元々、統計や確率というのは、合目的的な手段に過ぎないのである。
ただ、頻度主義的統計は、静態的であり、ベイズ統計は動態的統計と言える。頻度統計では、時間が陰に働き、ベイズ統計では時間が陽に働いていると言える。

 実務家は、統計が主観的でない事に不満を持っているのに対し、学者は、確率が客観的でないと批判をする。

 問題や目的、前提の設定は、自己の認識に基づき。自己の認識は、主観的で不完全なものである。科学の前提は、仮説にある事を忘れてはならない。

 科学は、極力個人の主観や直感を廃し、客観的事実から出発する事を前提としている。しかし、実務家や職人にしてみれば、自分達が培ってきた経験や技能を真っ向から否定されてしまったら、たまらない。自分の人生を否定されているようなものだからである。客観的、客観的と客観性ばかりを重んじると個人の尊厳を傷つける事にもなる。大体、科学そのものが極めて主観的な学問である。個人の主観、直感に依拠するからこそ論理や実験、観察によって客観性を保とうとしているのである。
 この点は、統計に対する姿勢に如実的に現れている。

統計とは何か



 統計とは何か。
 現代の日本では、統計の本質を見誤っているように思えてならない。
 その証拠に統計や確率を義務教育期間中にしっかりと教えていない。しっかりと教えるどころか、数学では、よそ者扱いである。
 確率や統計は、正統的な数学ではないように思えるような教え方をしている。だから、学校を卒業して社会に出ても統計や確率に対する拒絶反応が出るのである。
 ところが、実社会では、微分積分や幾何学なんかよりもずっと統計や確率が幅をきかせている。統計や確率がわからないと世の中と上手くつきあっていけない程である。
 そのために、統計に対する誤った認識が横行しているように思える。

 統計は学問という視点から捉えていたら理解するのは、難しい。統計の土台となっているのは現実である。現実をどの様に捉えるか、その目的によって統計のあり方は根本的に違っていくる。統計とは、合目的的なのである。

 現実の世界はごった煮のようなものである。一定の要素に純化されている場合は少ないのである。

 統計は、もっとも、科学的な数学だと言える。つまり、仮説と検証に基づく学問だという事である。この点に統計や確率に対する誤解が生じる原因があるのだと思われる。統計は、合目的的で、立証主義的な数学なのである。

 統計の前提は、一つの仮説を立証する事にある。
 例えば調査した結果を絶対視するような学問ではない。
 全数調査したとしてもこの前提に変わりがあるわけではない。全数調査したとしてもその結果は、仮説を本としているという事である。そして、その結果から、その背後にある法則や全体像、構造、予測、関係などを導き出す事なのである。
 他の数学の多くが定義を土台として論理的に展開する事で一定の結論を導き出すという事と、この点が統計や確率は違うのである。
 統計や確率というのは、仮説に基づいた合目的的な数学なのである。
 この点をよく理解しておかないと統計に使われる概念を理解する事はできない。

 統計における分散や平均という思想は、経済の問題点と類似している。つまり、統計の概念は、経済の概念に相通じるところが大きいのである。

存在と認識



 対象を認識し分別するためには、自己と対象の存在が前提となる。存在と認識が前提となる。そして、存在と認識それぞれ独立した空間を設定するのである。
 存在は、物としての実在する空間を自己は、事としての意識によって作り出された空間をそれぞれ形成する。
 そして、統計にも物の空間と事の空間が生じるのである。
 物の空間による統計の目的は主として予測にある。それに対して事の空間による統計の目的は、予定にある。この予測と予定の関係によって人間の行いは決められていく。
 観測度数は、物的現象、期待度数は、事的事象。
 観測は、物の空間で行われ、期待は事の空間で形成される。
 観測によって収集された値の集合と期待によって形成された値の集合を引き比べてこそ対象の形相を知ることができる。

 現在の経済や社会において欠けているのは、事と物とを結ぶ手段である。つまり、予測を予定につなげる為の手段である。それが統計学本来の役割なのである。

 統計によって出た結果を見て考えさせられる事が重要である。
 人口の構成や消費の実体を生産や流通にどう結びつけていくか。そのためには、人口の平均と分散、生産財の平均と分散を、貨幣の流通量の平均と分散の歪みをどう補正するのか。そこから、経済政策や財政政策を導き出すべきなのである。
 また、実際に出た結果を予定した値と引き比べ、それに近づけてこそ意義がある事がある。
 単に統計的に出た値を分析するだけでは、意味がない事が多い。実績を予定に近づける方策を導き出してこそ意味があるのである。それが予実績管理である。
 そこで重要となるのが仮説、検定、そして、正規分布である。

 世の中には、幾つかの数や量、要素が集合して一つの実体を構成してる対象がある。
 例えば人間である。人間は、名前や性別と言った属性に加えて、身長や体重といった量、人口数と言った数と言った属性や量、数の塊、集合だと言える。
 この様な数や量、要素の中から共通の基準によって対象を選別し、依り集めた集合が統計の対象である。
 例えば、日本男性の年齢別の人口数と言ったようにである。

 統計とは、何等かの得体の知れない、数の塊、集合を前提として成り立っている。統計が対象とするのは、数の塊である。

 数の塊といっても皆、違うのである。それを一律に扱うのは間違いである。

 数の塊を分解したり、再構築することによって統計や確率は、成り立っている。値を集計したり、平均したり、分散度合いを調べたりすることによって数の塊の性格を解明するのである。だから、微分や積分は、経済を知る上で威力を発揮するのである。基本的に経済の元データは、無数の数の集積によって求められる。

 数の塊を構成する要素の分散具合を一定の基準で分類した表を度数分布表という。度数分布は、数の塊を分析するための基本的な考え方の一つである。度数というのは、特定の値の範囲の中にある要素の数を言う。

統計の基礎は集合である

 統計の元は、集合である。統計は、集合を基として成り立っている。
 統計には、母なる集合、母集団がある。

 統計とは、集合を前提として成り立っている。統計とは、集合を前提とした数値の分散を意味している。

 統計の基礎は、数値の塊である。数値の塊とは、数の集合である。数値は、数値の元となる事象と一対一に結びついている。

 我々が一般に経済データで目にするのは、意味もなく、脈絡もなく、不規則な数の塊である。その数の塊の中から、意味や脈略や規則を見いだそうとするのが、統計や確率の目的である。

 統計が、自己の外にある物の世界の事象ならば、確率とは、自己の内部にある事の世界の事象である。

 物によれば帰納法的推論になり、事に基づけば演繹法的推論になる。
 統計は、帰納法的推論であり、確率は演繹法的推論である。

 確率が成り立つ前提は、賽子(サイコロ)の目が出る確率は六分の一と定めていることである。これ自体が不確定な要素の一つである事を忘れてはならない。なぜ、賽子の目が出る確率が六分の一になるのか、それ自体、経験的な根拠に基づいているとしか言えないのである。そして、この経験的な根拠というのは、「大数の法則」を前提として成り立っている。この様な「大数の法則」は、数学的前提の根拠とされている。

 曖昧さと不確かさを前提としているが故に、統計や確率には、常に、ある種の怪しさが付きまとっている。
 統計を使って嘘をついていると言われる由縁である。又、それは統計の持つ一面を表している。

 実際、統計や確率の始まりは、賭け事や予言じみた事柄なのである。
 易も又、統計的な発想の基となっていると言える。

 一を聞いて十を知る。

 数学的な思考には流れがある。
 流れがあるという事は、方向があることを意味する。
 部分から全体へ。
 特殊から一般へ。
 全体から部分へ。
 一般から個別へ。
 十から一へ。
 統計から確率へ。

 この流れの逆の流れもある。
 思考の流れ、手順が導き出された結論を検証するために、重要な鍵となる。

 事実は、一つしかない。実際に起こる事象は一つである。しかし、起こりうる事象は複数ある。
 故に、統計では、等分が重要な意味を持つ。十進法的世界では、十等分が重要となる。何をどの様に、どのような基準で分割するかが、統計の鍵を握っている。

 現代、いろいろな数値で世の中はあふれている。しかも、必ずしも目的や根拠が明らかにされないままに、使い手に都合良く解釈され、利用されている傾向がある。それが統計をわかりにくくしている原因でもあり、誤解を生む原因ともなっている。

 多くの人は、統計や確率を分析のための手段、即ち、間接的な活用としてのみ認識しているが、統計や確率として捉えられた数値それ自体を直接活用する事も考えるべきなのである。
 例えば、ヒストグラムや階級分け、度数分布というのは社会構造そのものを設定し、或いは、設計する上で直接役に立つ。



記述統計


 統計や確率は、数学の中では、比較的目的がハッキリしている分野である。
 つまり、外的な世界と深い関わりがある分野である。数学者の思索だけで構築できる分野ではない。
 それだけに生々しい数学とも言える。
 数学は、世の中と関わりかがない、或いは、役に立たない事と決めつけている人から見ると統計は、数学の本道から外れているように見えるかもしない。
 しかし、統計こそ数学本来の形を今に留めている分野だとも言えるのである。
 統計は、何らかの事象や現象の将来を予測したり、また、何らかの対象の現状を分析したりする目的に活用される。即ち、統計や確率は、本質的に予測や推定を目的とした数学と言える。

 統計には、記述統計、推定統計、多変量解析がある。
 いずれの分野も社会現象や自然現象といった何らかの現象を数字に表した上で、将来や原因を予測、或いは推測する事を目的としている。
 全数調査と言ってもこの原則から離れるわけではない。
 全ての与件(データ)を集めると言っても、目的は基本的には、推定や推測にある以上、集められてデータの塊は、何らかの標本だという事に違いはないのである。

 記述統計、推定統計、多変量解析、いずれにも、社会的統計と生産統計がある。

 記述統計と推定統計、多変量解析は、それぞれ独立した統計学だと言える。大体、目的からして違う。記述統計は、全数調査を前提として対象の数学的な特性や構造を明らかにしようとすることを目的とし、推定統計は、部分から全体を推測したり、将来を予測することを目的としている。また、多変量解析は、集合を構成する要素間の関係を明らかにすることを目的としている。

 記述統計は、静的構造を表す。記述統計は、その時点における構造を表す。故に、記述統計で重要視されるのは、比率である。

 統計の目的は、数値の背後にある法則を見つけたり、未来を予測、推測する事にある。統計に基づいて特定の事象が生起する確率を推定するのが確率である。
 この様な目的を持った統計や確率で重要になるのは、前提と手続き、即ち、過程である。

 統計や確率に期待する目的の一つに推定や推測も予測がある事を忘れてはならない。
 最近、ビックデータが流行っているが、ビックデータは全数調査であるから推定統計はいらないみたいな事を言う者がいる。記述統計というのは、実態を分析する上では有効でも、推定や推測に対して必ずしも適しているとは限らない。
 統計や確率が推定や予測、推測を目的としているとしたら、記述統計と推定統計は、その役割や働きが違うのである。

 統計調査の結果として現れた所得格差は、景気の動向の原因ともなり得る。

 統計は、絶対的認識を最初から否定しているのである。それは絶対的認識を否定する事によって相対的認識を成り立たせている。相対的認識を前提とする事で、結論の信頼性を検定する必要が生じるのである。
 故に、統計や確率は、信頼性が重要となり、その検定手続きによって正当性が守られている。検定とは手続きの一種である。


統計とアルゴリズム



 統計で重要なのは、過程であり、手続きであり、即ち、アルゴリズムである。
 特に、検定の手続きこそ統計の本質を表している。

 そして、その過程上において、記述統計は、位置づけられる。つまり、記述統計は、特殊な事象であり、それを一般化したものが推定統計である。

 統計や確率というのは、元来、合目的的な数学である。この点を理解していないと統計や確率は、分析のための分析に陥る危険性がある。
 統計や確率は、何らかの判断を下す事を目的としているのである。そのためには、必要最小限の情報をどの様に収集するのかが重要となる。つまり、判断の基準としてどの様な要件を想定しているかによって統計の取り方は違ってくる。

 社会統計と、生産現場の統計の一番の違いは、管理が可能であるか、否かにある。本来も統計や確率は、管理や制御を目的として発達してきた分野が多い。
 社会統計では、範囲が解放されているのに対し、生産統計では、範囲が閉鎖されている。
 社会的統計も社会や経済を管理し、制御する目的が隠されている。
 世の中には、社会を、管理したり、制御する事は悪い事だと考えている者がいるが、それは、強権的な支配を怖れるからである。しかし、治安や平和を保つためには、社会を管理し制御する事は不可欠である事を忘れてはならない。そのために、統計や確率は、必要なのである。

 データの質や性格の中で重要なのは、計測可能なデータか、計測不能なデータかである。
 又、データをどのように捕捉していくかによっても、データの性格は変わる。その意味で、テータの収集の手段方法がデータの性格を決める上では決定的な役割を果たしていると言える。
 また、データの信憑性を検証するためには、再現が可能か、追跡が可能かも重要な要素となる。このことは、データの性格の一つとして考えるべきである。
 会計情報においては、追跡可能性が決定的な性格であり、また、再現性は、実証性を重んじる分野、科学や工学という分野では不可欠な性格である。

 数値というのは、元々、抽象的なものである。なかでも、統計や確率は、曖昧、不確実な対象を圧かつているという点補忘れてはならない。
 統計や確率を扱う目的によっては、速さを要求される事象と精度を要求される事象がある。速さを要求されているのか、精度を要求されているのかによって処理の仕方も、調査の手法にも差が出るのである。記述統計によるのか、推定統計によるのかは、目的の違いによるのである。

 記述統計では、データの質と性格が重要な意味を持つのである。

 記述統計とは、数の塊、集合の性格や偏り、分散を分析する手段である。推定統計とは、与えられた一部のデータから全体や将来のあり方を推測するための手段である。多変量解析というのは、二つ以上、複数のデータから、データ間の関係を分析する手段である。

 記述統計の目的とは、数の集合の性格や傾向、偏りを分析する事にある。
 統計データというのは数の塊である。故に、その数の塊の形が重要な意味を持つのである。そういった数の塊の形を分析する上には、表やグラフが絶大な力を発揮するのである。

 現実のデータは、かなり歪(いびつ)なのである。歪なデータ数学的に処理する事が可能な形に修正する。その手段の一つが標本化である。また、数学的に処理するためには、確率密度が問題となる。

 経済の実相を考える上で重要となるのは、平均、バラツキ、偏差である。これらの概念は、将に、統計学の概念である。という事は、統計学の概念を経済学は借用して発展させる事が妥当だと考えられる。

 バラツキ、中心からの距離によって測られる。中心からの距離とは、平均からの距離である。

 統計の与件(データ)は、結果を表したものなのか、それとも、原因を表したものなのか。それによって記述統計の意味も違ってくる。
 経済の実相を表す概念と統計の結果を表す概念が共通しているのならば、統計の概念を原因としてとらえる事も可能であり、そこから、記述統計を推定統計に結びつける文脈も見えてくる。
 この様な過程において記述統計と推定統計の統一性や整合性が図られる。

 部分から全体を推定する事だけが統計の働きではなく。全体から部分を推定するのも統計の働きの一つである。

 特殊な事象を一般化する過程で標本と母集団の関係と位置づけが重要となるのである。
 また同様に、正規分布と標準偏差、標本平均、中心極限定理なども重要な働きをするのである。

 経済の基本がゼロサムならば、中心極限定理が重要な意味を持つ。
 ゼロサムていう事は、ゼロが平均値だという事を意味し、ゼロを中心とした分散が重要な意味がある。
 ゼロサム関係にある要素を抽出し、それを共通の座標軸に基づいて組み立ててみる事である。それが中心極限定理に従うかどうかが問題なのである。
 単純に赤字だから悪い、黒字だかに良いと言う判断をすべきではない。
 ゼロサム関係にあるとしたら、黒字があれば赤字が存在する事を意味する。
 黒字か赤字かも重要だが、それ以上に対極に何が存在するかを見るべきなのである。例えば、経常収支の対極にあるのは、資本収支である。
 EU域内に於いてゼロサムな関係にあるのは、政府部門、民間部門、海外部門の収支はゼロになる。
 経常収支の総和はゼロサムになる。貿易収支の総和はゼロサムになる。所得収支の総和は、ゼロサムになる。資本収支と経常収支はゼロサムになる。



ビックデータ


 記述統計と推定統計の違いは、特殊と一般の違いでもある。

 この点を理解しておかないと記述統計、ひいては、ビックデータの役割と位置づけが理解できない。
 記述統計が是で推定統計は非だというわけではない。
 活用する時の目的や役割が違うのである。

 近年、ビッグデータというのが話題になっている。コンピューター技術特に、記憶容量の飛躍的な進歩によって、それまで最大の制約であった記憶量の問題から解放された。
 多くの制約を受けていた情報の記憶容量が飛躍的増大し、その結果、巨大になったデータをどの様に処理解析するかが、喫緊の課題となってきたのである。情報通信技術の問題よりも統計解析の技術の方が重要になったといえる。それは情報に対する根本的な考え方をも変更してしまうほどの影響力を持っているのである。

 ビックデータは無意味だという見解とビックデータは時代を変革するという意見がある。どちらの意見にも一理あると私は考える。なぜならばビックデータは目的や活用の仕方に左右されるというのに、目的が曖昧であったり、ビックデータの意味や性格を正しく理解していない人が沢山いるからである。巨大となったデータを活かすかどうかは、データをいかに処理するかにかかっている。それによってビックデータに対する投資は時代を切り開く決定的な手段ともなり、無駄な投資ともなるのである。

 ビックデータの対象は、雑駁な情報の塊だという事である。つまり、大多数が意味のある情報ではなく。大量な何らかの実体や行為に結びついた意味のない情報(数値化されていない情報も含む)である。例えば、ホームページにアクセスをした回数とか、電話をした回数と言った情報である。その情報から何らかの意味を見いだして意思決定に結びつけるそれがビックデータの意味である。単に情報量が多いという事を意味しているわけではない。そして、その全量から数の集合の特性を解明するのである。そして、迅速な意思決定という性格上精度よりも速度が重視される。そのために、因果関係よりも相関関係の方が重視されるのである。この点は、従前の統計とは質が違ってきていることを見落としてはならない。

 量的な変化は、質的な変化を引き起こす。これは、ビックデータにおいて顕著に表れる。

 ビックデータ、即、全数調査だと思い込むのは錯覚である。
 データが大きいからと言って、即、全数だというのは短絡的かつ早計である。

 データ量が大きいからと言って全数を表しているとは限らない。ビックデータというのは、全数調査を意味しているとはかぎらない。むしろビックデータは、巨大な標本とと捉えた方が解りやすい場合が多い。

 錯覚してはいけないのは、ビックデータや記述統計に使われているデータは全てを表しているのではないという事である。つまり、ビックデータ、記述統計、即、母集団だと確定できないという事である。この点は統計学の大前提でもある。
 統計は、絶対的認識を前提としているわけではないという事である。統計の前提は、相対的認識であり、限りなく、百パーセントに近くても百パーセントを前提としているわけではない。つまり、ビックデータも標本の一つに過ぎないという事である。だからこそ、記述統計にも歪みがあると考えるべきなのである。
 記述統計に歪みがあると言うよりも実測のデータの数が多くなればなるほど歪みも拡大する。なぜなば、測定の誤差が混入しやすくなるからである。
 ビックデータだからと言ってデータを絶対視するのは危険な事である。ビックデータといえども検定の手続きは外せないのである。

 統計とは、何らかの形で推定、推測を目的としている。しかし、ビックデータを考える場合、単に推定、推測をするという目的だけでなく、意思決定に、即、結びつけるという要素が加わっている。そのために、記述統計と推定統計が融合された考え方が導入されなければならなくなる。又、ベイズ統計のような主観的要素に基づく統計も必要となる。

 ビッグデータを活用する場合、記述統計的目的なのか、推定統計的目的なのか、多変量解析的目的なのかが重要な意味を持つ。
 ビッグデータと言えば、即、記述統計に活用すると思われがちだが、実際には、推定統計に活用される場合もある。そして、記述統計に活用するのか、推定統計に活用するのかによって効果や手段にも差が出るのである。

 情報量が増えれば増える程、情報は細分化され、個別化する。その時、重要となるのは、情報が何を現しているかである。しかも、情報と数値は一体ではない。非数値情報を数値化する技術も要求される。それが、統計の新しい分野を生み出しているのである。



統計の目的



 統計を数学だと認識していない者がいる。
 確かに、学校で教わる統計は、それまでの数学と異質である。
 何よりも曖昧模糊として、不確かにところが統計には付きまとう。
 というよりも統計や確率は、不確かな事を扱っている数学だと言える。

 演繹的な数学を最初から教えられたものからすると足下が覚束ない。危うい印象を統計から感じるかもしれない。
 しかし、数学の成り立ちから考えると統計というのは、最も、数学の根源的な在り方のように思える。

 何が統計や確率を成り立たせているのか。それは目的である。
 統計や確率を成り立たせているのは、目的であり、人間の意志である。

 統計というのは、本来、合目的的である。
 統計の目的は、なにか、統計を知るという事は、その目的を知る事でもある。
 数学も元をただせば合目的的な事である。

 統計の目的には、予測、推測(因果関係)原因を知るといった事が考えられる。
 物事の未来や全体像を予測、推測する目的において統計は意味を持つ。そこから検定の重要性も生じる。
 この事を理解しないと統計の構造は理解できない。また、統計においては、前提や過程、誤差が重要な意味を持つ。
 統計の本質は誤差だとするものすらいる。

 そして、もう一つ重要な事は、分配するという事である。つまり、統計を成り立たせている事の一つが経済である。
 公正な分配をするためには、全体を知る必要がある。また、結果を予測する必要がある。だから統計が準備される。
 統計において重要な概念は、分布と分散であり、分布と分散を図るための基準の一つに平均がある。
 そして、分布、分散、平均の延長線上に分配がある。分配という目的があるから、分布、分散、平均は重要な意味を持つ。

 統計を知るうえで重要な概念に平均と分散がある。

 なぜ、平均値を求めるのか。平均値を求める動機は、水準や標準、基準値、中心値を求める。
 平均には、総ての偏差の和がゼロとなる点という意味がある。

 平均の目的の一つ、歪を知るという事がある。そして、歪を知るという事は分散にもつながる。

 今の経済統計は、時間の推移ばかりに気をとられて統計本来の平均や分散、すなわち、構造的問題に活用されていない。重要なのは、構造的な歪みを見つけ出し、歪みを有効に活用すると同時に弊害を取り除く事である。その分野でこそ、統計は、最も効果を発揮するのである。
 むろん、時間的な歪みも重要である。又、時間的な歪みは最も経済に影響をもたらす歪みである。しかし、歪みは時間的な事象に限られているわけではない。地域的な歪み、物的な歪み、貨幣的歪み、制度的歪み、人的な歪みなど歪みは多様であり、あらゆる要素に見せられるのである。

 歪みを発見するために鍵を握っているのが、平均と分散である。故に、経済も分散と平均が決め手なのである。そこに統計の意義もある。

 統計は、その性格から社会現象や経済現象を基礎として成り立っている。故に、統計を社会科学の基礎に位置付ける者もいるが、実際には、実験結果や観察データの処理にも多く用いられる。また、多くの工業では、品質管理や原価計算には、統計的手法は不可欠である。故に、統計や確率は、科学の基礎と言うこともできるし、工学の基礎とも言える。

 統計とは、合目的的な手法である。故に、統計の妥当性は、目的から求められる必要がある。そして、目的は前提によって規定される。故に、統計においては、前提が重要となる。

 我々が、日常、目にする数字の多くは、社会的統計である。故に、我々は統計というと、社会的統計を意味すると思い込みがちである。しかし、実際に経済に同じくらい重大な影響を与えている統計が、生産現場で活用されている統計である。

 そして、統計は、社会統計より生産統計の方が効用を発揮しやすい。
 生産統計の方が目的や範囲を特定しやすいからである。統計というのは、本来、合目的的な数学である。故に、数学の働きを知るためには、その目的を明らかにする事が近道である。その意味では、生産現場で使われている統計は、目的や数値の範囲が特定しやすいため、その意味も理解しやすい。理解しやすいから軽視されるのかもしれない。

 推定統計とは、与えられた結果としての事象や過去の事象から作られた標本から母集団を推定、推測する手法である。

 標本から母集団を推定、推測し、それを検証する。その過程は科学そのものである。標本は、事象から作られる。標本は、一定の基準に基づいた試行や観測によって見出された事象を数値として集積される事によって作られる。



背景によって統計の受け取り方もかわる


 世の中には、数多くの統計データが出回っている。そして、数値による説明は、絶大な説得力を持って受け入れられる。不思議な事に、数学を苦手としている者ほど、数字に弱い。
 いい加減な話でも数値によって説明されるともっともらしく聞こえる。しかし、数値といてもデータの質や前提によってまるで違うものなる。データの質や前提は、そのデータを根拠による。つまり、情報源によるのである。
 データの根拠が曖昧でよしとするから、一度、示された数値は、勝手に、一人歩きするようになる。そして、世の中に害毒をまき散らすのである。
 数値が重要であればあるほど、数の性格や働きをよくよく理解しておく必要がある。

 数の塊、集合の背景にある実体によっても数の性格は違ってくるし、統計のあり方も違ってくる。例えば、背景として、物理学的現象を対象としている数、生物学的実体を持つ数、心理学的対象、社会的対象、経済的対象、医学的対象と背景とする実体によって数の塊の正確も処理の仕方にも差が出る。

 数字で説明されるとあたかも客観的に分析に聞こえるから不思議である。それは、数値情報は、客観的な前提に立つとされているからである。
 しかし、統計情報は、決して純粋に客観的なものではなく。合目的的な値であり、合目的的である以上、データを収集する時点でも、分析する時点でも、活用し、表現する時点でもかなり恣意的なものであるのである。しかも、統計情報は、全ての事象を網羅しているわけではない。さらに、統計は、過去のデータに基づき、確率は任意な定義に基づく数学である。
 確かに、中には、全ての情報をもれなく数値として収集できる事象もある。しかし、それは、きわめて希な事象である。
 失業者数や需要、物価などは、全数を把握しようがないのである。このように、統計は、全体の数字を表しているのではなく、一部の数字しかとらえていないという事を前提とすべきなのである。
 又、全数を把握できたからと言って答えが出るわけではない。例えば、生産量の全量を把握できたとしても、不良品の数を全数予測できるわけではない。
 故に、統計は、予測や推測に基づいてこそ有効なのであり、予測や推測、検証のための手段が確率なのである。
 だからこそ、統計と確率に不離不可分の関係が生じ、また、平均値といった代表値の役割があるのである。
 特に、この関係は、経済において重要な意味を持つ。

 経済を表す統計でも数量と価格では性格が違う。数量では、足したり引いたりできないような対象でも、価格にすれば足したり引いたりすることが可能となる。たとえば、料理とサービスは、そのままでは足すことができないが、価格に置き換えれば足したり引いたりすることが可能となる。

 同じ事象を表した統計でも、数量的な統計と貨幣的な統計は違った結果になる。

 数値を扱っている人が必ずしも統計的素養に精通しているとは限らない。むしろ、自分に都合よく数値を解釈しているに過ぎないことの方が多い。
 一般に数値を示して何らかの事象を説明しようとした場合、数値自体の性格や働きについて事前に説明されることはない。ただ、数値を示して、自分なりの所感を述べるのが常である。
 しかし、数値は、各々性格や働きを異にしている。その点を明確にしなければ、数値の持つ意味を明らかにすることはできない。

 経済や社会的事象は、数字によって説明する傾向が高い。ただ、経済や社会的事象と言っても千差万別、会計情報のように厳格な基準や制度によって管理されている情報もあれば、簡単なアンケート調査も結果もある。
 社会統計と会計統計とでは、本質が違うのである。一律に語ることはできない。社会統計と会計統計では、データの質が違うのである。それはデータの収集する手段や仕組みが違うからである。必然的にデータの信憑性にも差が出る。
 ところが我々が目にする数値は、皆、同じ見える。それ自体が誤魔化し以外何ものでもない。

 データを無防備、無作為に使いすぎるし、また、安易に受け入れ過ぎる。そして、何でもかんでも統計と言った片付ける癖がある。しかし、実際に何をもつと統計とするのか、いい加減に解釈をしている場合が多い。それだから統計の基礎が固まらないのである。

 物価上昇率、成長率、利益率、労働分配率、総資本回転率、失業率、合格率、地震発生率、視聴率これらの数値は、一般に、比率として同じ形で表示されるが、全て、性格を異にしている。

 数の性格や働きは、数が指し示す対象の実体によっても制約を受ける。
 数というのは、抽象である。本来、数の性格を決めるのは、その数の基となる具体的な実体である。
 例えば、2011年の日本の人口は、127,817,277人といった場合、この数値は、何を根拠に、つまり、どのような調査手段によっていつ、どのように測定されたかという事が、データの信憑性や誤差の根拠となる。又、性別や年齢、時間、場所と言ったデータが含まれているか、いないかがデータの性格を形成する。
 また、推定値か、否かもデータの性格に影響を及ぼす。
 この様に、統計では、データの性格に依存する部分が大きいのである。その前提を曖昧にするから、統計に対する信頼も固まらないのである。



平均と分散



 平均がゼロで、標準偏差が一の世界。
 偏差値は、言い換えると分散の一種である。
 つまり、平均値ゼロで、分散が一の世界とも言える。
 確率、統計とは、これが一つの目安となる世界である。

 平均とは、偏差の総和をゼロにする点である。そして、この性格が統計を考えるうえで、また、統計的空間を考えるうえで重要な鍵を握っているのである。

 数値自体に力がある事さえある。例えば、貨幣価値に関わる数値である。利益として表された数値は、その会社の経営自体を反映しているし、投資や融資の決定的な情報となる。又、財政予算として組まれた数値は、それ自体が実体を持つ。

 表面に現れる数値は、任意の対象と一対一に対応しているとは限らない。何らかの数値が複数、組み合わされて構成されている場合もある。この様な数値は、構造を持っている。構造には、代数的構造、順序構造、位相構造、論理構造、階層構造などがある。

 比率は、代数的構造を持ち、基本的に分母と分子からになる。比率を表す数値は、この代数的構造によってその性格が形成される。
 即ち、分母となる数値の性格と分子となる数値の性格が、表面に表れる数値の性格を決定するのである。
 分母や分子となる数値には、実測値、計算値、総数、全量、確定数、推定数、標本、連続数、離散数、平均値、代表値等がある。全量を正確に測定しているとは限らない。その場合は、基となるデータの信憑性が問題となる。
 実測値は、測量の手段や限界による制約を受ける。
 金額で表される数値もある。物理量で表される数値もある。人数で表される数値もある。比率で表される数値もある。時間で表される数値もある。単位あたりで表される数値もある。それぞれの持つ属性によって数値の性格も変わる。
 また、どのような目的を持った数値かによって独立変数と従属変数の別も決まる。この様な前提によって数値の性格は、形成されるのである。そして、数値の性格を理解しないと数値の意味や働きを理解する事もできないのである。

 統計で重要となるのは、意味のある差である。それが、有意差である。経済を動かしているのは、差である。故に、有意差の概念が重要となる。

 経済において最も統計で重要な働きは、経済的な歪みを見いだす事である。歪みは、力の源であると同時に、過剰な力は、経済を混乱させ、最悪な場合、経済の仕組みを破壊してしまうからである。


分  布


 統計とは、数値の集合を前提とした分布であり、分散である。故に、分布や分散の形から数値の集合の背後にある意味や法則を推定する。それが統計であり、確率である。
 統計とは、一定の条件によって集められた数値である。すなわち、数の集合である。
 統計上の分布とは、集められた数の分散具合である。分散具合とは、散らばりであり、偏りである。
 統計というのは、何らかの現実を数値にして表した集合である。この様な数の集合から偏りや構成、変化などを読み取り、数の背後ある実体、全体の性格を解明しようとするのが統計の目的である。

 統計と確率とでは分布の意味が違う。意味が違えば働きも違う。統計でいう分布は、全体を構成する要素の散らばり具合を言う。それに対して、確率でいう分布は確率分布である。即ち、起こりうる事象の散らばり具合である。

 統計上の分布で重要なのは、形である。なぜなら、統計の一番の目的は、現状を把握する事である。まず現状を把握したうえで対策を立てていく。それが統計の論理・アルゴリズムである。その対策を建てるための手段の一つが確率なのである。

 統計で重要なのは、分布や分散の形を生み出している仕組みである。それを前提として、分布や分散の形が意味する事を明らかにする必要があるのである。
 分布や分散の形をどう捉え、どの様に解釈するかによって母集団の意味や働きが違って認識される。分布や分散の形は、一律、一様に定まるわけではない。分布や分散の形を何に当て嵌めるかは任意なのである。故に、検証、検定が必要となる。

 新製品の売れ行きは、どの様な分布の形を辿るのか。正規分布の形を辿るのか、それとも、二項分布の形を辿るのであろうか。それをどう設定するかによって販売戦略も価格戦略も製造計画や投資計画も違ってくる。重要なのは、分布の形である。

 統計データを分析する場合、統計データを引き比べる事が不可欠になる。そして、統計データを比べる場合、データの形が重要となる。データの数や単位、要素の性格などが統一されていないとデータを比較する事ができないからである。
 統計データを比べる事によってデータの歪みや偏り、又、平均や分散を導き出す事ができる。

 十億円の売り上げがある会社が一億円利益を上げるのと、一千億円の売り上げを上げる会社が一億円の利益を上げのでは、一億円の価値が価値が違う。
 十億円の売り上げがある会社が前期より一億円増販したのと一千億円の売り上げがある会社が一億円増販するのでは、成長の意味が違うのである。
 そこに同じ差でも比率に置き換えてみるとその意味がわかる値がある。

 データを引き比べる時、注意しなければならないのは、共通の前提に立っているかである。前提や基準、設定の違うデータを比較しても意味がないのである。

 データを持ち出して任意の現象の対策を立てる場合、例えば、近年、俗悪なテレビの影響で犯罪率が増えたからテレビを取り締まる必要があると言った主張する場合、犯罪率の根拠となるデータの根拠や期間、方程式の構成、テレビ番組との因果関係等を明らかにする必要がある。ところが、単に自分の意見に都合の良い期間を取り出して、犯罪率の根拠も方程式の構成も曖昧にしたまま、いきなり結論を導き出して衝撃的な扱いをして、世の中を惑わしているような記事が多く見られる。
 しかも、推移についても複数のデータを組み合わせて相関関係を分析したりせずに心象によって因果関係を想定してしまっている例もある。それでは有効な手立てが打てないどころか、有害ですらある。
 すなわち、何を前提とし、どの様な条件、状況下においてどのような手続き、処理がなされているかによって結果の信憑性が測られるのである。

 物価の構成を見ると地域や国には、地域差や国家差がある。
 又、所得で重要なのは、平均と分散である。

 統計で重要なのは、平均と分散であり、それは経済の目的とも合致している。統計データが正しく政策に反映できるようになった時、経済学と数学は一体となるのである。

 統計は、帰納法的という意味では、数学の本質的をよく現していると言えるかもしれないが、経済の仕組みなどを演繹的に組み立てる手段にはなりえない。その点を誤解しては成らない。



確率のアルゴリズム



 統計でアルゴリズムが重要なように確率においてもアルゴリズムは重要である。
 ただ、統計におけるアルゴリズムと確率におけるアルゴリズムは異質である。

 いろいろに情報を集めてそれを一定の基準で分類し、仕分けて分析するまでが統計のアルゴリズムなら、その結果に基づいてこれから起こる事を予測し意思決定に結び付けていくのが確率のアルゴリズムである。

 統計のアルゴリズムは、現実を正しく認識するための手順であるのに対して、確率のアルゴリズムは、事象が起こる割合を予測し、判断するための手順である。

 統計と確率は、共有する部分が大きいが、本質が違う。ところが共通する部分が相互に作用して統計や確率に対する誤解を生みだしている。

 例えば、分布に対する考え方である。統計でいう分布と確率でいう分布は根本が違う。大体、同じ分布という言葉を使うが、厳密にいうと確率でいう分布は確率分布であり、統計が現実の事象の分布を指すのに対して確率分布は仮想の分布を指して言うのである。

 現代の統計・確率にたいする学校教育の最大の過ちは、統計上の分布と確率上の分布とをゴチャゴチャにしている事である。その為に、統計上の分布と確率上の分布が見分けがつかなくなっている。
 一番ひどい例は、正規分布は世の中に一般に存在しているとするような教科書すら存在している事である。。

 確率において一番、使われているのは、成績であろう。今、子供たちの成績を位置付けるのに、一般に広く使われているのが偏差値である。この偏差値の根拠となっている考え方が正規分布であり、成績は、正規分布に従って分散されているという事を仮定としている。その為に、あたかも成績は、現実に正規分布になると信じられている。
 それは、現実の成績が正規分布になっているという訳ではなく、偏差値の性格から、正規分布に従って位置づけるのが、妥当だと言っているのに過ぎない。偏差値は、平均からの距離による分散を基として計算されているから、正規分布に近づくというのが正確なところである。それも「大数の法則」を前提としたうえでの話である。

 統計と確率を結び付けているのは、母集団と母数である。つまり、代表値である。

 そして、確率分布においては、何を中心に置くかが重要になる。何を中心に置くかによって確率分布の在り様、形が変わってくるからである。
 従前の確率は、平均値、中央値、頻度などの代表値を中心にしてその距離、誤差、偏差などに基づいて論理を展開する。
 それに対して、ベイズは、仮定を基にして展開をしていく。
 どちらが是か非かではなく、どちらが目的に適しているかが重要なのである。

 成績とか、物理的現象といった実験や観測のための手法が確立され、規則性、法則性が明確で、なおかつ、過去のデータが豊富に蓄積された事象は、従前のような代表値に基づくアルゴリズムが有効であろう。しかし、データ数が少なかったり、景気や株価の変動のように変化が激しく規則性が乏しい事象などは、ベイズが有効である。
 問題は、アルゴリズムである。

 統計も確率も最終的には、意思決定に結び付く事である。故に、意思決定に結び付くような展開、手順が要求される。
 それを前提として統計のアルゴリズムも確率のアルゴリズムも構築されなければならない。

確率における分布



 一般に確率を教育しようとした際、平均、偏差、分散等から確率を教え始めようとする。平均、偏差、分散等から確率を教え始めようとするのは、頭に正規分布ありきという発想があるからである。
 平均や偏差、分散は、正規分布を前提として考えると、確率を教えるのに都合がいい。なぜならば、正規分布は、平均からの偏差によって分布を構成するからである。ゆえに、偏差の分布は、正規分布に近づく。
 正規分布によって平均を中心とした偏差や分布を考えるうえで、正規分布は都合がいい。しかし、それは、確率分布が特定されている場合を除くと逆に都合が悪くなる。一般に事象が正規分布に忠実に分布するような事は稀だからである。

 確率でいう分布は確率分布であり、記述統計でいう分布とは異質である。
 確率分布を構成するのは、試行と事象である。
 試行とは、繰り返し観測できる、あるいは実験できる事であり、事象はその結果である。

 正規分布というのは確率分布である。記述統計でいわれる分布とは違う。
 確率で問題となるのは、確率分布である。
 確率分布は、確率の分布である。

 確率は、確率分布を想定しなければ成立しない。統計は、標本から母集団を推定する手段であるが、確率分布を想定するために、統計は役立つのである。
 標本やモデルから母集団を推定し、その分布に基づいて未来を予測する。この手法の先端をいく考え方がヘイズ統計である。ベイズか古くて新しい手法と言われる由縁がそこにある。

 確率分布には、一様な分布、正規分布、二項分布、指数分布、ベータ分布、ポアソン分布、ガンマ分布、逆ガンマ分布などがあるが、これらの分布は、ベイズにおいては絶対的な意味を持つわけではなく、最も確率分布を表すのに何が一番都合がいいかの重要なのである。
 中でも、正規分布は、中心的な分布とされている。

 確率分布は「大数の法則」を前提として成り立っている。
 確率分布は、中心を定めてその中心から生起した事象、要素との距離、誤差、偏差から推定される。
 必然的に計測の回数、データの数を重ねると対称的で釣り鐘型になっていく。
 逆にいうと計測の回数やデータの数が少ないと全体の形は、歪んだものになる。
 その歪みを修正して、背後にある全体像を想定する必要がある。
 全体像が分からないと個々の判断がつかないからである。

 確率分布には、離散分布と連続分布がある。貨幣単位は、基本的には離散分布に属し、財は、連続分布に属する。貨幣価値は、貨幣と財の積であるから、離散数と連続数の積と言える。

 離散というのは、値が不連続な場合を言う。
 離散分布には、幾何分布や二項分布、ボアソン分布等がある。連続分布には、正規分布とワイブル分布等がある。



確率で重要な働きをする正規分布


 確率で重要な働きをするのが、正規分布である。
 確率の中で正規分布は特別な役割を果たしている。そのために、正規分布がすべてであるような錯覚を起こさせる教科書や書籍がある。
 しかし、正規分布が分布の全てではない。
 正規分布が重要であればあるほど、正規分布に対する誤った認識は、確率や統計を歪める事になる。

 そのために正規分布に対してもいくつかの誤解がある。
 まず第一に言えるのは、正規分布ありきという考え方である。極端な場合、正規分布がすべてであるような錯覚を起こすような教科書すらある。
 正規分布は確率分布の一つに過ぎない。確率分布には、正規分布以外にいろんな分布がある。
 また、総ての事象が最初から正規分布になるわけではない。正規分布というのは、ある種特殊な確率分布である。

 正規分布以外に確率分布は幾つかある。正規分布は、唯一絶対な分布ではない。
 まず確率分布とは何かである。
 確率とは、一定の条件下で任意の事象が生起する割合をいう。そして、確率分布というのは、確率の分散具合である。
 ただ、ここでややこしいのは、確率というのは、実際に起こった事を言うのか、起こるであろう割合を言うのかである。
 確率にはこの二つの意味がある。それは、確率が常に予測と実績、即ち、予実績の上にな成り立っているからである。

 なぜ、計測した対象の多くが、正規分布となるのか。それは、必然的結果なのである。
 つまり、主観的前提に立てば必然的帰結として正規分布が現れると言える。と言うよりも、対象を正規分布的な形として認識するからである。
 前提や設定が正規分布を作り出すのである。
 確率分布の形を認識する時は、この点を忘れてはならない。確率、統計というのは合目的的なものであり、確率、統計の結果は、観察者の前提や設定によって現れる物であり、設定や前提によって変化するものだという点である。
 つまり、確率や統計を分析する場合は、その前提や設定を常に確認する必要がある。

 これは確率の成り立ちに基づく。つまり、確率は、天気予報や経営の意思決定、ギャンブル等動機とし、結果を常に求められてきたからである。

 なぜ、正規分布なのかというとそれは確率だからである。そして大数の法則が重要となる。
 確率という事は、何らかの全体があってその部分の割合を言う。つまり、何らかの中心と基準があって成り立つ。

 確率というのは、仮想的な事象である。確率というのは、確からしさを数値化したものである。
 確からしさというのを数値化する為には、数値化するための前提が重要となる。それが大数の法則であり、対称性である。
 ある事象が起こる確率を設定するためには、一定の前提条件に基づく方程式を想定する必要がある。そして、それは、必然的に対称性を備えたものになる場合が多い。なぜならば、想定される事象が是か非かといった二者択一的な事象を前提とする事になるからである。

 正規分布が確率分布だという事は、正規分布というのは、仮想的な分布だという事である。

 正規分布というのはイデアのようなものであり、極論すると思想である。

 正規分布は偏差の確率分布ともいえる。偏差の平均をとると正規分布に近づいてくる。しかも、大数の法則を前提とするとである。
 ただ、これは重要な働きである。
 正規分布は偏差と平均の関係、また、偏差と平均から導き出された基準だと考えてもいい。だから、経済において、特に貨幣経済、会計において重要となるのである。また、正規分布は誤差の分布ともいわれるゆえんは、この偏差と平均の関係から容易にわかる。

 人為的原則を前提とする経済現象は、対称的構造に成りやすいのである。
 故に確率分布の形が重要になるのである。


経済と正規分布



 経済を考える上では、正規分布は重要な役割を果たしているのである。
 正規分布は、平均の概念を発展させた概念とも言える。正規分布は、分布を測る手段である。即ち、平均との距離によって分散度合いを測るのである。
 経済や財のライフサイクルを測る上でもこの正規分布は、重要な役割を果たしている。
 一般に、財のライフサイクルは、正規分布の形をとり、累積曲線(Sカーブ)は、市場の飽和度を見る基本となる。

 利益は、変化によってもたらされる。費用も収益の一定、一様ではない。問題は、費用や収益がどの様な確率分布の形を形成するかである。
 費用や収益の変化の形を推測する場合、正規分布は欠かせない要素の一つである。

 働きは、比率と対比と差とした現れる。

 表面の価格が同じでも、価格を構成する要素や要素の比率によって働きに違いが生じる。その働きが、価格の働きを規定する。
 費用の金額は同じでも、費用を構成する要素や要素の比率によって費用の働きに違いが生じる。その働きが、費用対効果を規定する。
 表面に表れる数値が同じでも数値を構成する要素や要素の比率によっ数値の働きに違いが出る。その働きによって表面に表れた数値の働きを規定する。

 貨幣価値というのは数値である。故に、数値の働きや性格に依る運動が重要となるのである。つまり、表に現れた数値の動きばかりを問題にするのではなく。数値の働きや性格を見極める必要がある。
 数値間の相互作用が肝心なのである。

 経済における事実とは、蓋然性の問題である。
 だからこそ、表面に表れた数値に囚われるのではなく。その数値の背後にある変化や意味、働きを明らかにすることが肝心なのである。

 経済の変化を読み解くうえでは、ベイズ統計が有効だとされる。
 ベイズ統計は、時間変化を確率の中に織り込んでいる。
 すなわち、事前確率と尤度、事後確率を想定することによって統計の時間的変化を確率の中に組み込んだのである。

確からしさ



 人間は哀しい。生きている時も、死んでからも・・・。何も確かなものはない。ただ、信じるか、否かの問題である。全てのことは、不確かで、曖昧模糊としている。それでも、何かを信じて、生きていかなければならない。だからこそ確かさを求めざるをえないのである。そこに、ものの哀れの正体があるのかもしれない。
 ものの哀れの上にこそ統計や確率は築かれていると言ってもいい。
 何が正しくて、何が間違っているのか。それすら誰にも解らないのである。

 この世の中には、不確かな事象、不確実な事や確かな事象、確実な事がある。
 不確かな事、確かな事が混在した、我々は生きていかなかければならない。我々が生きていく上では、未来をある程度予測する必要がある。予測というと我々は未知数を求めることのように考える傾向がある。しかし、実際は、予測とは、不確かな事と確かな事を照らし合わせながら、より確かな事を推し量ることである。
 だから、確率統計的な考え方が要求されるのである。

 確率には、頻度主義と確からしさの意識によるものとがある。
 確率は頻度であるとするのが頻度主義である。

 偶然的な変動を積み重ねた場合、偶然的な変動が加法的に合成される場合と乗法的に合成される場合とでは、まったく異質な現象が起こる場合がある。(「偶然とは何か」竹内啓著 岩波新書)

 偶発的な現象が積み重なった場合、それが、加法的であれば、「大数の法則」および「中心極限定理」が成立して、結果が一定の値に近づいたり、あるいは、分布が釣り鐘型の分布に近づいたりするが、しかし、積み重なりが乗法的であったり、あるいは、もっと別の累積方式だったりするそうなるとは限らず、いろいろなことが起こりうる。
 データで重要なのは、期間や単位といった前提の統一である。むろん、期間や単位、尺度の内容、精度の問題もあるがそれ以上に重要なのは統一性である。

 確率も全体から見ると不確定な要素はなく確定的なものである。
 例えば、宝くじの当たりくじの数は最初から設定されており、競馬の配当総額も事前に確定している。むろん全てが確定しているというわけではない。宝くじにあたったとしても懸賞金を、宝くじに当たった人、全てが、受取に来るとは限らないからである。それでも宝くじの当たりくじの数は事前に決められていることには変わりはない。

 不確かなのは、誰が宝くじにあたるかと言う事である。
 確率を考える場合は、何が確かで、何が不確かなのかを予め明らかにしておく必要がある。

 常日頃、我々が接しているのは、不規則な数の塊である。最初から規則性があるとは限らないのである。

 真円や正三角形、正方形、球のような形が自然界に存在する方が稀なのである。我々が、普段、目にするのは、不定型な形である。
 ところが学校の数学で対象とするのは、真円や正三角形である。それでは、現実の社会で間尺が合わなくなる。
 現実の世界は、不定形で、不規則な形ばかりなのである。それはデータも同じである。データの形には同じ形は少ない。しかし、反面に相似形は多い。かように不定形、不確かな事象の中に、不規則な数の塊の中に定型や規則性を見いだす為の手段が数学なのである。

 自然界では、真円や正三角形、正方形、球を目にする事は希である。
 しかし、人間が創り出した世界では、真円や正三角形、正方形、球などは頻繁に見受けられる。
 人間は、幾何学的な形を生み出す事で文明を育んできたとも言える。そして、幾何学的で数学的な空間を人工的に作り上げる事で、予測可能な世界を生み出してきたとも言える。そこに、数学の重要性がある。

 予測というのは、不確かな未来を予想するという意味と何らかの法則や前提を想定、或いは、設定する事によって予定するという二つの意味がある。
 人類が重きを置いてきたのは後者である。

 現実の事象は、数学で描かれるように綺麗な形になる訳ではない。故に、物理学でも、経済学でもいかに現実の事象を標本化、モデル化するかが重要となる。そのために確率密度関数が設定される。確率密度関数で有名なのは正規分布である。

 確率では、起こりうる事象は、平等、対称、均質に起こる事を前提としている。しかし、現実の世界の事象は、平等、対称、均質に起こるとは限らない。むしろ、平等、対称、均質に起こる事象の方が稀である。ならば、確率は、想定上の事象だと言える。

 確率は、任意な定義に基づいていた実証的な数学であり、大数の法則を前提として成り立っている。

 サイコロの出目の確率なら六等分の一、コイントスの出目なら二等分の一、ならば、将棋の駒の出目は、何等分の一なのか。一を何等分に設定するかが、確率の鍵である。


確率の基礎を統計は形成する




 個々の事象を集積することで確率は成り立つ。確率の根拠となるのは、集積された事象である。
 個々の事象の数値を集積した結果が統計である。

 数学の目的の一つに、測る事がある。物差しで測れない対象を測るという事は、推測、推定、予測することを意味する。推測、推定、予測の手段が数学であり、特に、統計や確率は、有効である。
 また、統計や確率の土台は集合である。
 統計と確率、集合は一体となって推測や推定、予測に活用される。故に、経済では、統計や確率がよく活用されるのである。

 統計の元となる数値は、数以外の意味があるわけではない。数以外の意味は、数値の実体の背後に隠されている。この事を前提としておかないと統計から導き出された規則や法則、関係の持つ意味を正しく理解する事ができない。

 統計数値を我々が見る場合、一般に、結果だけを示される場合が多い。しかも、衝撃的な形で数値を取り上げられる数値が記憶に残ることが往々にしてある。しかし、そのような数値の多くは、異常値であったり、何らかの加工がされた数値で当たり、ことさらに誇張された数値であったりすることが多い。
 データの形や性格は、調査のあり方、即ち、データを集める手段や方法によっても違いが生じる。しかも、それは、統計の本質も関わる問題でもある。

 また、データの定義が重要なのである。データの定義は、要件定義によって為されなければならない。データの定義とは、データがどのような目的で、誰によって、どのような手段で集められたかを明らかにすることである。つまり、データが成立するための前提条件によってデータは定義されなければならない。

 データを集める目的や根拠がデータを定義する上では重要な役割を持つ。なぜ、何のためにデータを集めるのか。そこに統計の重大な意義が隠されている。

 統計では、データの性格が重要な役割を果たしている。そして、そのデータの性格を決定的にしているのは、調査方法である。
 例えば、会計のように厳格な規則の上に集計された数値の塊なのか。失業のようにきわめて曖昧な定義の上に推測された数値なのかによって統計の信憑性にも重大な影響を及ぼす。又、データの本質も違ってくるのである。それをあたかも同じものとして多くのメディアは扱っている。しかも客観的な数値としてである。
 会計データと社会データでは、数値の信用度も扱いも全く違うのである。そして、統計データは、この根本的な差によって分類されていなければならない。ところが、現在は、会計データも社会データも一緒くたにされてしまっている。それが混乱の原因なので゛ある。

 統計には、記述統計と推定統計、多変量解析がある。しかし、発表される時は、十把一絡げにして統計データである。これでは統計データなど当てにならない。

 一見、数値で表された事象には、恣意的な判断が加わらず、客観的なものに見える。そこが付け目なのである。
 だから、一般に、統計、数値で表された事は、客観的なものだという思い込みがある。しかし、統計や数値によって表された事象は、本来、合目的的な前提に立ち、主観的なものである。やりよういかんで数値はいかようにも下降できる。なぜならば、数値自体は、実体を持たないからである。だからこそ、データの定義が必要となるのである。

 統計の母体となるデータが出鱈目、いい加減では、統計も確率も最初から成り立たない。嘘を裏付ける資料に過ぎないからである。

 統計は、不確かなことを扱っているというのに、出だしや土台、前提を不確かにものにしていたら統計の信頼など確立しようがない。

統計は、現実を写す鏡である。



 現実の世界は、曖昧模糊とした確率的な世界である。だからこそ統計的発想が横行するのである。又、勝負事がもて囃されるのである。
 人々は、オリンピックに夢中になり、サッカーに熱狂する。競馬、競輪と意って賭け事は人々の人生を狂わせ。将棋や麻雀に我を忘れる。
 出逢えるか、出逢えないか、不確かに相手を求めて人は、確かな今を捨てて彷徨い歩く。

 我々が習いはじめた頃の数学というのは、明快な論理によって裏付けられている。1+1は2であり、疑る余地のない真実である。そう教え込まれる。教え込まれると言うより覚えさせる。こんな自明な事まで疑っていられたら数学の勉強なんて先に進まない。だから、数学で最初に学ぶ事は暗記である。考えることではない。だから、数学は、一度覚えてしまうと後は機械的に導き出されるものという印象が強い。

 だから、統計のように曖昧模糊、不確実な数学に出逢うと大概の者は面食らってしまう。面食らうだけでなく混乱し、やがて数学嫌いになる。
 学校と言うところはどうも勉強嫌いを生み出すのが得意なようだ。

 しかし、数学の本来の在り方とは何か。数学というのは、本来、推測や予測のための道具である。数を数えるとか計算するというのは、その延長線上から生まれた。

 確率や統計が今一つ人々に受け容れられない原因があるとしたら、確率統計が実生活の問題を扱っていながら実生活からかけ離れているように感じさせるからである。

 大多数の人が感心があるのは、タバコを吸う人の肺ガンにかかる確率が何%あるかではなくて、自分が肺ガンにかかるか否かなのである。

 多くの人は、確率や統計に対して誤解している。それは、確率や統計は偶然の出来事、偶発的事象を扱っているという事である。では、確率や統計は、確定的なことを扱っているのかというとそうとも言えない。偶然や確定というのは、認識の問題であり、存在の問題ではないからである。
 統計というのは、任意の数の集合の全体から集合の特性を導き出すことを意味する。

 統計は、数の性格を忠実に反映しているとも言える。例えば、タバコを吸う人間が肺ガンになる確率というのは、一定の標本、即ち、数字の集合の性格から母数を推定することである。この場合、標本となる数字の集合の性格が問題とされるのである。

 経済的事象には、予め確かな事象、不確か、不明瞭な事象、確かに出来る事象、確かに出来ない事象がある。

 経済にとって統計は最終的には重要である。しかし、経済にとって統計が重要となるのは、最終的段階においてであり、経済理論における論理的骨格は、数論や群論にある。

 我々は統計による数値を利用する場合、統計の元となる数値の性格を確認しておく必要がある。統計の元となる数値には、二種類ある。一つは、観察に基づくものと、もう一つは、実験による数値である。観察に基づく数値は、人間の手を基本的に加えないで観察を本に得られた数値であり、実験に基づく数値とは、一定の条件を人工的作り出す事によって得られる数値である。無論厳密にどちらとも言えない場合があるが、観察に基づく傾向が強いか、実験的傾向が強いかで、情報を分析する手段や解釈に差が出る。

 基本的に、経済や社会現象は、自然現象とは異質なものであり、人工的な仕組みの上に成り立って現象であることを忘れてはならない。

 統計で重要なのは、設定前提や条件であり、統計の正当性を評価するためには、前提や条件を充分に検証する必要がある。

 重要なのは、元となる数値が形成される過程で何等かの主体的な意志や意図が関わっているかどうかなのである。一見、客観的に見える研究成果も情報を収集する段階で歪曲されている場合もあるのである。しかも、初期の段階で歪められた研究結果ほど、発見することが困難なのである。

 数学は数学と対象となる物なしに、ポンと生まれたものではない。数学こそ、現実に存在する物を基礎として発生したのである。
 現実の世界は曖昧模糊とし、不確実な世界である。一寸先は闇である。故に、確率統計が成立した。確率統計的な発想こそが数学の原点なのである。それは論理的に考えることの先駆けとも言える。

 一見、不規則な数の塊のように見える中から塊の背後にある規則や法則、関係を見出そうとするのが数学である。数と数の相互関係、特に、因果関係を推測することが数学の役割の一つなのである。
 ただ、数と数との背後にある規則や法則、関係は、基本的には推測の域を出ない。だから、科学の根底は、仮説なのである。

 経済的価値には、名目的価値と実質的価値、あるいは、実物価値がある。
 名目的価値とは、取引が成立した時点における貨幣価値を言い。実質価値、あるいは、実物価値とは、その時点における財の取引相場の貨幣価値を言う。実物価値には、物価上昇に伴う時間価値が加わる。故に、実質価値に換算する場合は、その時点、その時点での物価を考慮して換算する必要がある。また、地域や季節によっても物価の水準や構造には変動や差がある。この点も考慮する必要がある。
 名目価値に時間価値を加えるのは金利である。ただ、名目的価値自体の中には、金利は含まれていない。

 市場経済の基盤となる会計は、帰納法的体系ではなく、演繹法的体系である。
 故に、会計の基本は、数論である。
 確かに、会計の根本思想には、成分法的な大陸法とコモンロー、判例主義的な英米法がある。しかし、いずれにしても何等かの合意、契約を前提とした演繹法的な論理を前提としている。故に、数論や群論が基礎となっているのである。その上に統計的な空間が構成されている。

 会計情報は、企業経営に重大な影響を与える。経営者や投資家、金融、取引業者、消費者、政策決定者の行動規範を規制するからである。会計情報によっては、企業の存続をも左右しかねない。決算内容が悪ければ、資金を調達できなくなり、最悪の場合倒産する。
 企業経営に重大な影響を及ぼすという事は、当然、経済にも影響を及ぼす。それなのに、会計や簿記の基礎知識すら修得していない経済学者や政策決定者が多くいる。経済学者や政策決定者どころか、経営者ですら、会計を理解していない者が結構いるのである。
 会計情報は、景気や経営の根本を左右するほど重要な働きをしているというのに、会計原則や規則の変更に対して、世間一般は鈍感すぎる。特に、政治家の多くは、会計の意味すら理解していない。
 同じデータに基づきながら会計基準が違うと赤字にも、黒字にもなる。現実に、日本の会計基準に基づいて作成された黒字決算が他の国の基準で作成したら赤字になるといった例が多く見られる。その結果、日本の会計情報の信憑性が疑られる説いた事態も起こっている。では、どちらが正しいのかというとそれは一概に言えない。それは、会計や経営に対する思想の問題なのである。
 最もスポーツの結果を左右するのは、ルールの変更である。しかし、観客からは、ルールの変更による影響は解りにくい。
 同じように、会計基準は、経済の動向を左右するというのに、一般にはなかなか理解されないでいる。このことは、会計のみならず、他の統計データにも言えるのである。

 確率統計的な発想の中に平均という考え方がある。気をつけなければならないのは、平均というのは決まった概念ではなく。相対的、合目的的概念だという点である。
 平均というのは、平均という思想である。
 どの様な前提、どの様条件、どの様な状況、あるいは、どの様な目的かによって平均に対する考え方は違ってくる。

 統計で嘘をつくというのは、前提や条件を操作して相手に間違った認識を植え付けることを意味する。

 例えば、犯罪や事故、経済の変動などを時間や単位の設定を変える事で、因果関係に間違った認識を与えることである。
 事実を事実として扱っているだけに、数字がもっともらしくなり、嘘と言っても見抜くのが難しい厄介な嘘なのである。

 会計は、貨幣の流れが生み出した虚構である。

 よく貸借対照表の働きを説明する際、バケツやタンクを引き合いに出して説明する人がいるが、そう言う人は、貸借対照表の本質を理解していない。貸借対照表は、貨幣によって満たされているわけではない。貸借対照表は、現金が流れることによって生じた残像である。

 金融機関でさえ、保有する現金は、規模に比し僅かなのである。

 数字とは、無意味である。故に、貨幣も無意味である。無意味だかにこそ、数という働き、貨幣という機能が作用するのである。数字や貨幣にとって大切なのは関わりである。数字や貨幣は何等かの対象と関わることで価値を持つのである。故に、数や貨幣で重要になるのは数や貨幣の働きである。

 数学は形式だと言う事である。故に、貨幣経済も形式である。


リスクは変化の中に潜んでいる



 不確かさにはリスクがつきものである。確率の根底には、リスクに対する考え方、捉え方が潜んでいる。リスクは、不確かな出来事、偶発的な事象によって引き起こされる。
 不確かな出来事、偶発的事象には、数学的な事象、統計的な事象、そして、予測し得ない事象がある。数学的事象と統計的な事象をリスクと言う。
 真の不確実性は、予測し得ない事象に基づくとフランク・H・ナイトは言う。(「本当は嘘つきな統計数学」門倉貴史著 幻冬舎新書)

 そして、リスクは変化の中に潜んでいる。

 変化とは何か。
 激動の時代とか、この世の中は絶え間なく変化しているとよく言われる。しかし、大多数の人間は、その変化を実感できずに、何も変わらないと思っている。或いは何も変わらないと思いたいらしい。日常生活において多くの人は、変化をなかなか受け容れようとはしない。その好例が老いである。
 多くの人は自分は若い、又、以前の変わりないつもりでいる。自分の衰えをなかなか受け容れようとしない。それでも、老いは、密かに、そして確実にやってくる。
 変化を受け容れなければ、自分の衰えに対して対策も立てられないし、前向きにもなれない。多くの変化は突然に訪れるわけではないのである。
 変化の実相をどの様にどの様に対応していくかによってその後の人生も、社会や経済の有り様も変わってくるのである。まず、固定観念を捨て、変化を受け容れ、その上で自分を変え、周囲も変えていくのである。その為に、未来を予測する。予測する手段として確率統計がある。

 確率とは、全ての起こりうる可能性の中で特定の事象が起こりうる可能性の比率である。

 例えば、天気予報において雨の降る確率とは、特定の日時、場所において全ての起こりうる天気を全体とした時、雨が降る可能性の比率が雨が降る確率である。

 今日、傘を持っていくべきか否かを判断するために天気予報を見る。その天気予報は、統計的確率で表される。株の動向も経済指標もその大本にあるのは統計である。会計も統計の一種だと言える。大企業も中小企業も個人商店でさえ、統計的確率的な発想を知らず知らずのうちにしている。
 経済や事業をやっていく上では統計数字というのは欠かせないのである。それなのに、統計に対する基本的な素養に欠けている人が大多数にのぼる。

 木を見て森を見ずと言う。統計は、木から森を想定するような事象である。

 ゼロサムと言う均衡の、他に、総和が一となる均衡がある。例えば確率である。確率の合計、即ち、全確率の和は一になる。

 統計の前提となる、集合は、魚の群を見るように捉えるべきものである。
 魚の群には、形があり、密度があり、バラツキがあり、部分と全体があり、位置があり、変化があり、重心があり、平均がある。
 統計は、その一つ一つを解明することによって魚の群の持つ働きや性格を明らかにしていくことなのである。
 そして、魚の群には、カオスがあり、フラクタルがある。


統計では、相関関係が重要である。



 経済は数学と伴にあった。

 経済的な数学の始まりは、数える、測る、分けるである。そして、それが数の機能の基礎を形成する。
 獲物を数える。獲物との距離を測る。獲物を分ける。収穫した作物の数を数える。畑の面積を測る。収穫物を公平に分ける。これらの行為は、人々の生活において死活問題である。それは、人間が集団生活の中で生きるために不可欠な活動であり、それが、生活であり、経済の始まりである。そして、そこから、数学ははじまる。

 統計は、データのあり方によって規制を受けている。この点が統計をわかりにくくしている。特に記述統計に対する認識を混乱させている。
 一般に統計というと例えば就職率とか、失業率、視聴率、不良率と言った比率のことを指したり、また、GDPといった何らかの集計結果を指したり、出荷台数とか、生産量といった実績値を指したりする。この様に、一口に統計と言ってもデータの形や性格は、千差万別である。
 ところが、我々が、日常、目にする統計数値は、そのようなデータの持つ性格や条件などいつ再お構いなく、いきなり、数値だけを示され、あたかも統計的な裏付けが為されているように思い込まされている。
 それが、統計をいかがわしいものにしてしまっているのである。

 経済にとって数学は合目的的な事である。合目的的な事だから目的によって数学の在り方も影響を受ける。合目的的だから、恣意的であり、人間の意志が重要なのである。
 経済にとってどの様に数学を活用するか、その目的によって数学の有り様が規定される。それは、経済の元となる事象や現象をどの様に認識するかにかかっている。

 記述統計で重要なのは、データの形である。なぜなば、記述統計は、データの全体像を表しているからである。

 統計は、抽象である。この点を忘れてはならない。統計が実体を表しているとは限らない。統計データはあくまでも抽象なのである。

 統計の与件(データ)は、基本的には結果として表現される。しかし、統計的与件が原因となる場合もある。

 また、結果には、原因がある。

 経済は、人為的事象である。自然現象とは違う。経済的事象の原因は、客観的なものではなく、任意、即ち、主観的に作られた事である。
 つまり、物理的な意味での確率と経済現象や社会現象の確率とを一律に語ることは出来ない。前提となるところが違うのである。

 認識の仕方によっては、統計の与件(データ)は、結果にも、原因にもなる。

 相関関係と因果関係は違う。相関関係とは、一方の要素がもう一方の要素に何等かの関連があると考えられる関係を言う。因果関係とは、一方の要素が原因となってもう一方の変化を引き起こしている関係を言う。
 相関関係があっても、因果関係があるとは限らない。
 相関関係にある事柄を全て因果関係に置き換えるのは危険である。

 単純に多いか少ないか。それも直感だけに訴えるのではなく。複数の基準を組み合わせることで、データ間の関係を探るだけでもいろいろな背景や隠された関係が見えてくる。
 つまり、データとデータを結びつけて分析することにこそ意義があるのである。

 推移、変化を相関関係や因果関係の検証もしないで、明確な根拠を明らかにしないで印象だけで判断している例が多々見られる。

 一般に数値を問題とする場合、数値に囚われてその数値の前提を故意にか無視している事か多い。

 一般に統計の数値を見る時、多くの人は、結果だけに着目する。例えば、日本の人口は、どれくらいで、どの程度増えたかというようにである。
 しかし、本来重要なのは、人口が増えたり、減ったりする原因であり、評価であり、対策である。それに、原因や、評価や、対策の話になると多くの場合、主観的なものに飛躍する事が多い。だいたい、必然的な問題なのか、偶然の産物なのかも明らかにしない。
 まず、誤差があるのか、ないのか。あったとしたらどれくらい誤差を見るのか。その上で、誤差の範囲内に収まっているか否か。
 誤差の持つ意味や誤差をどのような基準で判断するかは、統計の根本に関わる問題なのである。

 経済的現象は、偶然の産物なのか。それとも何らかの相関関係による必然的帰結なのか。これは経済現象考える上で決定的な要因となる。一見、偶発的な思える経済現象の背後に何らかの関係や動機、原因が隠されているとしたら、それを見いだすことは、経済を制御する際の基準を確立することにも繋がる。

 統計で重要なのは、相関関係である。

 因果関係も判らないのに、強引に意味づけをして、短絡的に結論を出すのは危険である。

 世の中には、多くの陰謀論なるものが存在する。あたかも、闇の勢力がこの世の全てを支配しているような思想である。

 しかし、そもそも陰謀論が成立する前提は、全ての現象を必然的帰結だと断定する事が可能でなければならない。
 大体、陰謀そのものが願望や欲望に基づくのである。陰謀の存在そのものも推測や憶測に基づいている。陰謀を成立するための最大の要素は、陰謀を企てている者の能力なのである。
 そして、陰謀が実現する前提は、陰謀を企む者は、全知全能な存在でなければならない。全知全能な存在ならば何も陰謀を企てるまでもないのである。
 そうなると陰謀そのものが怪しくなる。
 陰謀と言われる企てはある。又、ある程度の力を持つ者が陰謀を企てれば、ある程度の効果を発揮するだろう。しかし、その根本は、その陰謀を企てている者の意図である。陰謀を企てている者自体が限りある命しか持ち合わせていないのである。
 大体、陰謀を企てている存在で一番強力な存在は国家なのである。
 陰謀が成就するのは、全ての社会的現象は必然的帰結であらねばならない。しかし、全てのことを予め予測し、その予測に基づいて対策を講じることは不可能なのである。底に、確率統計が必要とされる意味がある。

 原因を何にするかによって結論は、百八十度違ってくるのである。円高が原因でデフレーションになっていると考えれば、円高を対策を先にすることになるし、原因がデフレーションで結果が円高だとなれば、デフレーションに対する対策を講じなければ、円高は解消されない事になる。しかし、円高対策とデフレーション対策は必ずしも一致していない。そこが悩ましいところなのである。


経済は、主観的産物である。




 現象をどう認識するかによって統計のデータの意味は変わってくる。いずれにしても統計の前提は、主観的なのである。

 経済的必然性は、主観的確率による。
 経済的事実とは、蓋然性に依るのである。
 確率は、物質的事象(客観的事象)と人為的事象(主観的事象)では前提条件が違う。

 確率に対する考え方には、客観的確率と主観的確率の二つの考え方がある。この二つの考え方は、対象、および、対象の捉え方の違いによって生じる。
 客観的確率は、対象とする事象が瀬衰期する頻度に基づき、主観的確率は、対象とする事象が生起すると思われる確からしさ程度である。(「偶然とは何か」竹内啓著 岩波新書)

 会計は、論理的必然によって成り立っている。故に、会計で重要なのは、本にある論理である。

 経済は、人為的な仕組みの上に成り立つ現象である。経済は、自然現象のように所与の法則の上に成り立っている現象ではない。当然、数学に対する考え方の前提も自然科学と経済とでは違ってくる。

 経済現象は、任意の仕組みの上に成り立っている。故に、経済現象を制御するためには、仕組みを構成している前提を明らかにする必要がある。
 経済現象は自然現象のように成るものではなく。経済現象は、起こるべきして起こっている現象なのである。
 飛行機が飛ぶのと鳥が飛ぶのとでは、同じ飛ぶのでも本質が違う。鳥は、卵を暖めれば生まれるが、飛行機は卵から生まれない。鳥は、生まれれば、自身の力で飛び方を学ぶが、飛行機を飛ばすためには、飛行機を設計する必要があるのである。

 経済制度は、仕組みとしては完結しているのである。仕組みとして完結しているが故に、制御できなくなって暴走することがあるのである。恐慌やインフレーションというのは、地震や津波、台風の猛威とは違う。人間が引き起こした現象なのである。その証拠に、野生の動物の世界には、インフレーションやデフレーションはないのである。

 統計と言うっても単純に数値情報とは限らない。短観が良い例である。定性的なデータを数値情報に置き換えることもある。

 データの型や性格、前提が違うとデータに対する扱い方にも差が出る。
 生まれや育ちと言うけれど、データの性格を決めるのに、重要な要素の一つにデータの出典、出自がある。データの根拠や信憑性を決定づけるからである。

 データには固有の形がある。例えば階層的構造を有するデータである。また、データを構成する要素が複数の因子で構成されている場合がある。その他に、データを構成する要素に方向と量があるものがある。

 データ間の関係も重要となる。

 データ間の関係を見るための尺度としては、第一に推移、第二に、比較、第三に、比率、第四に、交差がある。これらの操作によってデータ間の相関関係を探るのである。

 指数というのは、任意に基準となる数値を定め、それを一、或いは、百に置き換える操作を行う際、任意の基準となる対象を言う。

 推移というのは、時間の経過に伴って数値がどのように変化するかを表したものである。

 経済的データというと単純に推移にばかり目を向ける傾向がある。しかし、より重要なのは、データの背後に隠されている相関関係である。中でも因果関係を知ることは、予測や対策を立てる上で鍵を握ることになる。
 経済現象を推移によって捉えることは基本である。しかし、推移ばかりに囚われると、推移に背後に隠されている要因を見落とすことになりかねない。
 多くの分析者は、ただ単に多いとか少ないとか、増えたとか、減ったとかを問題にする。それも、直感的に良いとか、悪いという評価に結びつける。そのような短絡的な判断に陥るのではなく。他の要素ととのような関係にあるのかを明らかにしてこそ意味がある。
 大体、多いとか、少ないという評価を他の要素との関連から考えた方がわかりやすい。例えば、去年から何センチ伸びたかと言うだけでなく、身長と体重を関連づけて考えるのである。

 特に、経済評論家の多くは、推移、変化に囚われてその相関関係、因果関係を分析することを怠り心象によって短絡的に結論を導き出している。

 例えば、売り上げが去年に比べて増えたといっても、どの要因と結びついて売り上げが伸びたのか、また、その影響がどこにどのように及ぶのか判らなければ意味がないのである。即ち、期間損益では、資産、負債、資本、費用、収益が利益にどう関わっていくのか、その関係が重要となるのである。

 経済効果を見る上で重要なのは、整数で表示されているか、それとも、何らかの有理数で表示されているかである。
 整数によって表示されているデータは、差か、総数である。
 有理数は比による。比には、比率と対比がある。対比というのは、二つのデータを割ることによってもたらされる。
 差は、引き算である。比は割り算である。
 例えば、売り上げの推移といった会計の推移は、整数で表示される。この場合は、総額で示される。
 しかし、経済効果は、分配が重要な働きをしている。この様な分配の働きを見るためには、比が重要である。
 例えば、値上げの影響を見る上でも所得に対する比率が重要なのである。
 又、経済の推移は、差か対比で表される。そして、差として認識するか、対比として認識するかによって変化に対する認識に差が生じる。

 経済現象に限らず、諸々の現象を考察する場合、数の性格というか、数の背後にある実体の持つ性格が重要になる。なぜならば、数は、実態を反映、写像した影だからである。
 数の変化は、数を構成する要素の性格に依存する。そして、経済においては、特に、数を構成する要素の働きが決定的な役割を果たしているからである。

 貨幣価値を表す数値でも、その貨幣価値の対象となる実体によって随分と数値の動きに差が出る。例えば、生鮮食料を表す貨幣価値の数値は、短期間に縮小するであろうし、土地や固定資産を表す数値の変化は、長期に亘っている。

 データには、場所や時間、価格等の情報が組み込まれた要素がある。人口と言ってもその人口を調査した時、場所、また、性別といった属性といった要素が数の変化を対比の上で重要な制約条件である場合がある。

 利益や資産を表す数値には固有の性格がある。貨幣価値を表す数値と実物を表す数値とでは性格に違いがある。基本的に貨幣価値は自然数であるのに対し、実物を表す数値は実数である場合が多い。

 収入は、不確かで変動的であるのに対して支出は、確定的で固定的である。お金がどれくらいかかるかは、判るけれど、どれくらい儲かるかは判らないのである。それが商売である。それが理解できなければ、経済の数字の意味はわからない。経済学者が簡単に競争力とか、効率と言うが、経済の現場では、人間の生活が掛かっているのであり、生き死にの場でもあるのである。
 現金主義である財政は、費用対効果を分析するための尺度を持っていない。
 所得、収益、収入、収支、利益、資産、負債、資本、費用、物価など、これらの情報は、貨幣の性格と密接な関係がある。

 負債は、相関関係が重要になるのである。資産との相関関係、収益との相関関係、費用との相関関係、そして、資本との相関関係がどの様に利益に作用するのか、それが負債の働きを知るために不可欠な要素なのである。

 財産や収入、支出というのは、所有権に結びついた概念である。それに対して資産は、負債や資本、或いは、費用との関係から生じた概念である。資産と負債、資本、そして、資産と費用との関係や相互作用が重大なのである。

 最初からデータ間に相関性があるか、ないかは判っているわけではない。仮定や仮説は、ある程度必要であるが、あまり、最初から色眼鏡で見るとデータを歪曲する原因になる。まずは、データの形をしっかりと見極めることが重要となる。
 相関性の有無は、目に見える形にする。即ち、図式化することである程度は、データ間の相関関係つかめる。又、たとえ、何らかの相似があったとしてもそれが何らかの直接的な関係、例えば、因果関係に結びつけられるとは限らないし、因果関係があったとしてもどちらが原因で、どちらが結果かは、その時点でははっきりしない場合が多い。ただ、データの性格や傾向をある程度認識できれば、一定の効果があった捉えるべきなのである。

 経済では、特に、ゼロサム関係にあるデータ間の関係が鍵を握っている。
 テータ間にゼロサム関係が成立する場合は、それだけでデータは、制約を受けていることになる。データに内部に働く制約の性格が、推定や予測をする上で重要なはたらきをするのである。

 ゼロサムというのは、ゼロサムになるのではなく。最初からゼロサムになるように設定されているのである。それ故に、ゼロサムになるようになぜ設定されたかが重要となるのである。

 例えば、GDPを構成する要素は、家計収支と財政と民間企業収支、経常収支である。そして、これらの要素は、ゼロサム関係にある。
 つまり、家計収支と財政収支、民間企業収支、経常収支の総和はゼロになる。
 その場合、黒字の主体と赤字の主体の組み合わせが重要となる。例えば、家計と民間企業が黒字で財政と経常収支が赤字というようにである。
 これらの組み合わせの数だけ経済には型がある。

 偏差の総和は、ゼロになる。
 即ち、偏差はゼロサムだと言える。
 経済でゼロサム関係になる値は、偏差を意味している場合がある。
 ゼロサムというのは、無に帰す関係である。つまり、帰無である。
 この様な関係では、幅(レンジ)が重要となる。
 幅というのは、最大値と最小値の間を言う。この幅の持つ意味が重要である。
 この幅が全体を制約しているのである。
 故に、幅が重要な働きをするようになるのである。




貨幣経済と統計




 統計の基礎は、集合である。

 市場経済の動きは、負債と資本、収益、費用が均衡する事によって成り立っている。負債、資本、収益、費用の均衡を支え、資金の動きを実体的に裏付けになっているのが資産である。
 財政にはこの均衡モデルがない。

 経済を制御するためには、経済現象を引き起こす仕組みのプラットフォームを明らかにすることが重要となる。

 貨幣の働きは、分配にある。
 市場に一定量通貨が流通すると市場は貨幣が飽和状態となり、実体的貨幣価値の水準は臨界点に達する。貨幣が飽和状態になったると、名目的貨幣価値は、通貨の流通量の均衡、所得の総和、消費と投資(貯蓄)、財の需給によって定まる。
 通貨の供給は、政府の負債に基づく支出、資本に基づく支出、収益に基づく支出によるが、収益に基づく支出は、通貨の回収によるものであるから通貨の供給量に直接影響しない。通貨の供給量は、政府の負債に基づく支出と政府の資本に基づく支出による。資本に基づく支出とは、シニョレッジを意味する。
 所得の総和は、所得を獲得している人口数と平均所得の積によって求められる。重要なのは、人口と所得の分布とバラツキである。
 消費の所得と同様に人口構成が問題となる。ただし、所得に関わる人口構成と消費に関わる人口構成は、一致していない。所得に関わる人口構成、中でも労働人口の構成と消費に関わる人口構成が一致していないことが、経済変動にとって重要な意味を持つ。
 少子高齢化の根本的な原因もこの所得に関わる人口構成と消費に関わる人口構成の不一致にある。
 生産活動に関わる人口が消費に関わる人口の面倒をみていかなければならない。つまり、消費は生産活動を促進する反面において負荷にも成るのである。それが、消費と貯蓄、あるいは、投資の比率にも影響をあたえる。そして、収益にも作用する。

 負債、資本によって調達された資金を用いて投資が実行される。投資した資金を収益によって回収し、その過程で費用を通じて分配をする。負債や資本の裏付けとして資産を設定する。償却費や費用を調節することで、収益と長期借入金の資金を調節する。これが、民間企業の均衡モデルである。
 財政には、この均衡モデルがない。それが財政破綻を招いているのである。大体、実際に破綻しているのかどうかも検証されていない。
 経済全体で見ると政府の負債や資本によって資金を創造し、それを公共投資や行政費用、所得の再分配等によって市場に供給し、税や事業収益によって回収する。

 先ず設備投資や公共投資を通じて資産価値が上昇し、それが、費用を経由して分配され所得に転じる。所得の配分、即ち、第一にストックに向かうかフローに向かうかによって経済に違いがでてくる。次ぎに、公共部分、民間部分への配分が重要となる。更に、民間部分では、家計か企業かによって景気の動向が左右される。なぜならば、それは直接的に雇用や消費に反映されるからである。
 インフレーションやデフレーションは、原則、フローの現象であるが、ストックの部分にも、即ち、資産インフレーションや資産デフレーションと言えるような類似した現象がある。その好例がバブルと言われる現象である。

 インフレーションやデフレーションは、フローの問題である。収益性の悪化が、背後にある。しかし、収益の悪化を問題にして、資金の回収を急げば、フローの問題がストックの部分に深刻なダメージを与えることになる。そして、インフレーションやデフレーションを加速して景気の深刻な悪化をもたらすのである。フローの部分だけに景気の変動が収まれば一時的な現象として納められるが、それが、ストックの部分にまで及ぶと市場の仕組みそのものを破壊してしまうことにも繋がる。

 バブルの発生やバブルの破綻後の景気の低迷は、資産、負債、資本、収益、費用を均衡させる機構が機能しなくなったことによる。即ち、負債、資本の資金的裏付けであった資産価値が急騰する事によって市場に過剰な資金が供給され過剰流動性を引き起こし、その反動で資産が暴落すると市場から資金が吸い上げられ、行き場を失った資金が金融機関に滞留すると言ったことによってデフレが形成されたのである。
 要するに、市場経済の基盤が毀損し、適正量の資金が市場に流れなくなったことが最大の問題なのである。

 確率、統計の本質は、分布とバラツキである。つまり、確率統計とは、本来、図形的な概念、アナログな概念なのであり、集合的概念なのである。
 この様な図形的な捉え方の中で、平均とか標準、分散という概念は意味を持つのである。

 国内総所得のサイズと分配の比率が経済の動きを決定付ける。

 何が、経済を貫く基準かというと所得である。 所得の水準と平均、分布、分散が経済状態の核心となる。
 ただ、所得と収益とが連動して考えられていないことが問題なのである。取得は、分配を表しており、収益の中から配分される。収益の状態は、必然的に所得に反映される。
 為替の変動を受けやすい産業では、必然的に、為替の変動は、所得に影響を及ぼす。また、雇用にも影響する。

 購買力平価という思想がある。物価は、購買力によって決まるという考え方である。この購買力の基礎は、所得である。国際化が進むと所得の平準化も進む。この所得の平準化が、景気の変動に重要な影響を及ぼすのである。
 それぞれの国や地域、業種の所得の平均が重要になる。それが、生活水準の標準になるからである。その上で、分散が問題となる。なぜならば、それが市場の偏り、消費の偏りを生むからである。つまり、平均、標準、分散が重要となる。

 市場は一つではない。複数の市場が組み合わさり、重なり合って市場全体を形成している。通貨圏も一つではない、複数の通貨圏が組み合わさって通貨空間の全体を作り上げているのである。

 この様な市場や通貨圏を貫いているのが、購買力であり、購買力の裏付けとなる所得である。故に、所得は、一定の水準に向かって収斂しつつある。一人当たりの所得の平均は、長期的には市場全体で均衡すると考えられる。それが購買力平価である。
 所得が一定の水準に収斂する過程で拡大均衡の市場と縮小均衡の市場が生じる。市場は、全体としては、均衡の方向に向かっているのである。

 購買力平価にも人件費の水準は、直接作用し、国際競争力に深刻な影響を与える。ひいては、それが雇用や物価水準にも影響するのである。即ち、所得が景気の動向を規制しているのである。

 ところが、社会主義者は、所得の確保ばかりに力を注ぎ、反対に、資本主義者は、利益のみを追求する。それが、実効力のある政策の施行を阻んでいるのである。その為に、政策に偏りが生じ、有効な景気対策が打てないのである。
 特に、市場原理主義者は、競争を原理として取り違え、市場の規律や秩序を蔑ろにしている。その為に、市場を制御する事が出来ないのである。
 生産性や効率、競争は、分配との関連の上で判断すべきであり、生産性だけ、あるいは、競争を絶対視するようなことは、経済に偏りや不均衡を生じさせる原因となる。


投資という思想


 資本主義は、投資という思想が根底にあって成り立っている。投資というのは思想なのである。
 土地や設備、人、事業に資金を投ずる。土地や設備、人、事業に投じた資金から利益を得る。それが投資という思想である。
 この事から、費用、負債、資本が先に生じてその後で資産や収益が生じるのである。時間と伴に増加した資産や収益と費用の差が利益の本となる。これが資本主義の根本理念である。

 この事を理解しないと負債や費用の意味は理解できない。
 つまり、資本主義社会では、投資によって事業を始めた瞬間から費用と負債との格闘が始まるのである。
 そして、費用や負債の裏側に収入や所得が隠されているのである。

 投資を成り立たせているのは、確率である。

 経営の合理化の一貫として工場の無人化という思想がある。工場を無人化することによって費用を削減するのである。この場合の費用とは、主として人件費を指している。
 しかし、無人化が意味することは、無人化なのである。つまり、人手を必要としていないと言うことである。

 投資というのは、長期的な資金の流れと短期的な資金の流れをどう分解し組み立てるかの問題でもある。それは、長期的な決済の手続と短期的な決済の手続をどの様に会計的に処理するかの問題でもある。

 私が子供の頃には、屋台が沢山あった。ところが最近は、屋台をめっきり見受けなくなった。そして、失業者の事ばかりが問題となる。失業をしても逃げ場がないのである。
 以前は、失業すると屋台を借りて露天商などになったものである。今日の市場では、自営業者や職人という職業、つまり、個人事業者が成り立たなくなっている。
 それは、投資の持つ意味が変質してきたからである。個人の力の範囲出来る小規模の投資では、事業が成り立たなくなったからである。
 その結果、事業は画一化され、全ての人間が何等かの形で賃金労働者にならざるをえなくなっている。

 バブルの時代に、多くの資産家の貧乏人を産みだした。
 今の日本は象徴している。つまり、資産を持つもう一方で、借金が減らずに収入がないという状態である。収入がないから物価がいくら下がって追いつかない。この様な構図が今の日本の実情なのである。

 コスト削減は、所得の削減でもある事を忘れてはならない。コストを削減することの効果と所得を削減することによって生じる結果を天秤に掛けて判断することが肝要なのである。

 今の経済では、負債や費用という目の仇にされ、その否定的な要素や負の働きばかりが誇張される傾向にある。特に、費用は、削減する対象でしかないように見られている。
 しかし、費用の本来の働き、正の働きは、分配にあり、本来、能動的な働きなのである。適正な費用が認められなければ、分配は機能しなくなる。その結果が、格差であり、貧困であり、失業なのである。

 名目的価値と実物的価値の非対称性が今日の貨幣経済を形作っている要素である。名目的価値と実物価値が非対称だから貨幣が流通し、利益も成立し、又、問題も生じるのである。

 名目的価値に対して実物価値の水準が相対的に上がったり、下がったりする現象の根本的原因の一つが所得のサイズや格差がある。
 費用を構成する代表的な三つの要素は、第一に、仕入れ原価。第二に、経費、中でも、固定資産減耗、即ち、減価償却費。第三に、労務費、即ち、人件費である。
 仕入れ原価や経費は、基本的に、物の価値である。物の価値は、地域性に左右されるが基本的には、一定の価格に収斂していく。問題は、人件費であり、人件費の特徴は下方硬直的である上に、取引、競争の原理だけで定まる性格の値ではない。市場の論理、以外に、年齢や経験、生活と言った人間的要素や文化と言った社会的要素がかなりの部分影響する。また、変動するのには時間がかかる。
 そして、この人件費は、所得でもあるのである。所得は、消費の原資である。

 貨幣経済が確立される以前では、必ずしも、労働と分配とが直接的に関連付けられていたわけではない。思想の多くは、労働と分配とを切り離して考え、働かなくても豊かな生活を営めることを理想としている場合が多い。労働には否定的な思想が多いのである。多くの国では、労働蔑視の価値観が強い。
 その結果に、労働時間の短縮や休日を重視する事になるのである。

 自由主義経済は、労働と分配が結びつくことによって成り立っているが、自由主義経済以外の経済体制においては、労働と分配は必ずしも結びついているわけではない。
 労働と分配とを結び付けたのは、貨幣である。つまり、貨幣経済が未発達な時代の経済体制では、必ずしも労働と分配は結びついていない。その様な時代では、労働者の権利は確立されておらず、労働は、強制的な行為、奴隷労働だったのである。それが労働を蔑視する風潮を生み出した。特に、階級制度や奴隷制度が社会の一部をなしていた国では、労働を蔑視する傾向が高い。
 貨幣経済が確立される以前では、労働の仕組みは労働の仕組み、分配の仕組みは分配の仕組みと分離した体制の方が一般的であった。なぜならば、労働と分配とを直接的に結び付ける媒体がなかったからである。

 市場経済と貨幣制度を土台とした自由主義経済は、労働と分配とを結び付けることによって基本的には成り立っている。自由主義経済は、労働と分配を結び付ける事で生産と消費を需給関係よって生産者と消費者を関連づけ形成されたのである。

 根本にあるのは、報酬は、労働に対する対価であるという思想である。報酬は、収入となり、所得を形成する。その所得は、消費と投資と貯蓄を生み出す。それが自由経済を構成する基本的要素へと発展するのである。即ち、消費は、収益に、投資や貯蓄は、負債や資本に転じていくのである。

 近代民主主義の背景には、貨幣制度に依拠して経済的に市民階級や労働者階級が経済的に自立したことが大きいく影響している。

 自由主義経済は、貨幣を媒体として直接、個人に労働と分配を結び付けたのである。それが、結果的には、近代的個人主義の発達を促したのである。

 また、労働と分配とを関連付けるためには、私的所有権の確立を前提としている。

 貨幣の働きには、人的な側面、物的な側面、貨幣的な側面があり、それぞれの働きが及ぼす影響を理解しておかないと貨幣の働きを正し理解することは出来ない。
  貨幣が、労働と分配を結び付ける役割を果たしたのには、貨幣の持つ性格が多分に影響している。貨幣の働きには、第一に、物の交換価値を測る手段としての働き、第二に、権利の働きを測る手段としての働き、第三に、労働の成果を測る働きの三つの働きがある。
 第一の働きは、市場取引や私的所有権の根拠となり、資産価値を形成する基となる。第二の働きは、負債や資本の基礎となる。第三の働きは、所得の根源となる。
 この貨幣持つ性格を正しく理解しておかないと雇用と生産性の整合性はとれないのである。

 市場で決定的な働きをするのは価格である。故に、価格競争力がなくなれば、市場から淘汰される。この価格に決定的な作用を及ぼすのが人件費である。
 市場経済においは、市場の規模と範囲が重要となる。つまり、国際市場か国内市場かが重要な鍵を握っているのである。
 利益は、収益と費用によって定まる。収益は、価格が集積した値である。
 価格は、競争密度と回転率によって左右される。競争密度とは、同じ市場の中に競争相手がどれくらい存在するかである。独占的市場か、過当競争的市場かが価格形成に決定的な働きをしている。(「IGPI流経営分析のノウハウ」冨山和彦著 PHPビジネス新書)
 人件費は、国際市場に連動しているものと国内市場に連動しているものがある。国際市場に連動している人件費は、国際市場の競争に曝されていることを意味する。製造業の多くは、国際市場を基礎にして人件費は決まる。
 それに対して、小売業、サービス業、官庁は、国内市場を基礎にして人件費が定まる。この違いが、製造業と小売業、サービス業、官庁との間に所得格差を生み出す要因となるのである。
 そして、この格差が経済の仕組みに歪みをもたらすのである。


国民統計



 コスト削減は、所得の削減でもある。ただ経費削減をして、生産性の効率化を計れば景気が良くなると言うのは幻想なのである。

 以上を前提として次の等式、三面等価の持つ意味を考える必要がある。

 三面等価を考察する上では、等しいことの持つ意味が重要になるのである。等しいという事の意味の中に、ゼロサムと言う考え方がある。
 経済ではゼロサムの背後にある関係を明らかにすることが鍵となる。

 国内総生産=国内総所得=国内総支出
 この等式は、生産=分配(所得)=支出を意味する。
 更に、裏には、労働と所得と需要の関係が隠されている。
 経済的効率を考える時は、この三つの要素の均衡(バランス)を重視する必要がある。ただ単に生産性の効率ばかりを追い求めると所得や支出を縮小させることになる。
 生産の効率は、分配や支出とのバランスの上に立って考えられるべきなのである。

 支出を構成するのは、消費と投資と貯蓄である。
 収入を構成するのは、借入と資本と所得である。
 会計は、消費と投資と貯蓄が借方を構成し、負債と資本と収益を構成する。

 支出では、消費の構成が重大な意義を持つ。
 又、投資と貯蓄の関係が重要となる。投資も貯蓄も時間の関数である。そして、投資と貯蓄は表裏の関係を持つ。会計では、資産と負債の関係を構成する。

 家計における消費の根幹は、衣食住(光熱費を含む)、それに、現在は、通信、交通費である。また、不定期にかかる費用として冠婚葬祭、教育、医療費、遊興娯楽費である。
 この家計消費は、企業収益に反映される。家計とは、消費者なのである。

 自由主義経済体制は、いずれにしても安定した収入が前提となる。その為には、定収を保障した定職を前提としなければ成り立たない。定収を前提とすることによって長期借入金が可能となり、投資が成立する。
 例えば、家計について考えてみよう。家計上における最大の投資は、住宅投資である。住宅投資は、住宅ローンが成立することによって発達した。
 住宅ローンの前提は定収入である。定収入の前提は、定職である。

 賃貸か、持ち家かの選択肢の問題である。
 将来、地価が値上がりをすることが見込まれる場合は、キャピタルゲインを狙って持ち家を選択する。つまり、ローンの月の返済が、月間の家賃と同じ位ならば、ローンを支払った後に資産が残る持ち家を選択した方が得だからである。
 住宅は、土地と建物に分割できる。土地は、地価に左右される。家の価値は、耐用年数によって変化する。
 ローンを支払う以前に家の寿命になってしまうのならば、借金だけが残ることになる。又、大幅に地価が下落した場合、担保力が低下することもある。
 拡大均衡か、縮小均衡か、市場の方向性が重要となる。
 つまり、地価の上昇が見込める場合と見込めない場合とでは、キャピタルゲインに対する考え方が百八十度違ってくるからである。
 仮に地価が値下がりし、キャピタルゲインが望めなくなれば、拘束の多い持ち家よりも借家住まいを選ぶ公算が大きくなる。

 しかも、この様な消費者の思惑は地価の動向を左右することになる。

 なぜならば、仮に、失業をして定収入を得る事が出来なくなった場合、負債がある場合は、その返済負担によって生活が成り立たなくなる可能性があるからである。
 その場合、新たな収入源を確保するか、それまでの蓄えを取り崩すことによっるか、借金生活にはいるかしかない。
 収入を増やす事を目的として投資をする事が、現実的なのか。貯蓄を取り崩すことが現実的なのかの問題である。
 どちらにしても定収入の有無が、決定的な要因となるのである。

 経済現象は、家計、財政、民間企業、海外の経済主体との貸借関係を基礎として収益、費用の増減運動によって成り立っている。収益と費用の増減運動を調節するのが資金の流れである。そして、資産、負債、資本の相関関係によって資金の流れが制御されている。収益と費用の増減運動は損益関係であり、資産、負債、資本の相関関係は、貸借関係である。
 故に、損益関係と貸借関係をいかに制御するかが、経済政策の要諦である。

 ゼロサムには、二つの意味がある。
 一つは、利益のように差が等しいという意味、今一つは、絶対額が等しいという意味である。
 損益と貸借の関係は前者の例であり、貸方、借方の関係は後者の例である。

 資本収支、財政収支、民間収支、家計収支の絶対額が均衡する組み合わせは、①資本収支=財政収支+民間企業収支+家計収支、②財政収支=資本収支+民間企業収支+家計収支、③民間企業収支=資本収支+財政収支+家計収支、④家計収支=資本収支+財政収支+民間企業収支、⑤資本収支+財政収支=民間企業収支+家計収支、⑥資本収支+民間企業収支=財政収支+家計収支、⑦資本収支+家計収支=財政収支+民間企業収支の七つである。

 これらの七つの形によって経済の基礎的条件は違ってくる。

 家計部門、企業部門、政府部門、海外部門、何れを赤字にし、何れを黒字にするのか。全てを黒字にすることも、赤字にすることも出来ないのである。結局、何が最適な組み合わせかの問題である。

 インフレーションは、ある意味で加点主義的であり、デフレーションは、減点主義的だともいえる。
 インフレーションの時は、物価も加わっていくが、同時に、収益も、所得も、加わっていくし、市場も拡大成長していく。それに対して、デフレーションは、物価が減っていくかもしれないが、収益も、所得も、雇用も減っていくし、市場のも縮小していく。

 消費税や所得税は、現金主義に則った税制上にある。法人税は、期間損益主義に則った税制上にある。つまり、消費税や所得税と法人税の問題は、現金主義に則るか、期間損益主義に則るかの問題なのである。

 家計も、財政も、民間企業も、海外の経済主体も、収益と費用の均衡が崩れれば、資金繰りの都合によって負債と資本が増大する。
 利益は、収益と費用、資産と負債、資本の均衡を示す指標である。そして、清算取引とは、利益に関わる取引である。基本的に期間利益に、直接、関わるのは、損益取引である。

 収益-費用=当期総資産残高-前期総資産残高
        =当期総資本残高-前期総資本残高

 注意しなければならないのは、減価償却に対応するのは、長期借入金の返済であり、借入の返済による資金の流れは、損益の表面には現れてこない。
 不良債権を安易に償却してしまうと実体的裏付けのない借入金だけが取り残されてしまう。それが、社会的に累積すると負債と資産残高の均衡を失う結果を招く。債権を処理する場合は、同時に債務の処理も図らなければならない。

 設備投資をしていないのに、総資本の増加が続くのは、収益によって費用が賄いきれていない証拠である。特に、注意しなければならないのは、減価償却費の動向である。利益は、操作することが可能なのである。収益構造に問題があるのか、費用構造に問題があるのか、それによってとるべき対策、政策も違ってくる。
 公会計が確立されていないが故に、財政赤字の真の原因は解明されていない。

 現代の経済は、制御装置のない自動車のようなものである。成り行きまかせで運転するしかない。

 損益上の問題は、損益上で解決すべきなのである。それなのに、損益上の問題が発生するとそれを貸借の問題にすり替えるために、本質的な問題に繋がらず。問題を拗らせてしまう結果を招くのである。

 損益構造を歪める要因には、外的要因と内的要因がある。また、損益構造を歪める要因には、制御が可能な要因と制御が不能な要因がある。

 経済の方向性、傾向をどの様に見るのか。
 統計データとして表れた形の傾向をいかに解釈するかである。
 景気の動向を見るのに、先ず統計データの傾向と方向性。上昇局面なのか、下降局面なのかを見極める必要がある。その頂点と分岐点をどの様な基準によって見極めるのか。
 頂点や分岐点を形成する要素は何か。
 また、閾値をどう設定するかが意味を持つ。

 昔ならば街の商店が潰れても店主が困るのが関の山であった。それに対して、今は、街の小さな商店が潰れても、融資をしていた金融機関、土地を貸している地主、商品を納入したり、設備を貸与していた取引業者、顧客、従業員と多くの人間が困ることになる。
 それは、現代の経済は信用制度、即ち、借金を土台とした体制だからである。納入業者からは借入金という借金をし、また、多くの商店主は、土地や設備を借りて商売をしている。その上に、顧客には売掛金という貸付をしているのである。


経済政策の基本は、組み合わせにある。



 アルゴリズムとは、一連の操作によって思想を表現するための手段である。例えば、作業手順によって表現された論理である。故に、アルゴリズムに大切なのは、順序と組み合わせである。時には、答よりも過程の順番、組み合わせの方が重要である場合もある。

 事務手続きやコンピューターのプログラム、組織、規則、法律、礼儀、作法もアルゴリズムの一種である。

 組織的意思決定はのロジック、論理は、アルゴリズムの一種である。

 論理的に導き出される答は一つである。問題は、論理以前にある。
 世の中の出来事は、数学のように答は一つだと断定できるであろうか。

 一生というように人生は一つである。しかし、間違いのない人生を送れるものは稀である。多くの人は、間違いだらけの一生を送る。又、最後まで、間違いのない人生が送れるという確信は誰にも持てない。

 全ては、曖昧な状況を前提としているのである。
 そこに論理の働きと限界がある。

 福島原発事故後の放射能物質の拡散の動向はかなり正確に予測できるのに、原発事故は予測することが出来なかった。多くのことが想定外の事象なのである。

 現代のアルゴリズムで重要なのは、コード、ステップ、カウント、ロジックである。

 符号理論において、符号(ふごう、code)とは、シンボルの集合S, Xがあるとき、Sに含まれるシンボルのあらゆる系列から、Xに含まれるシンボルの系列への写像のことである。Sを情報源アルファベット、Xを符号アルファベットという。すなわち符号またはコードとは、情報の断片(例えば、文字、語、句、ジェスチャーなど)を別の形態や表現へ(ある記号から別の記号へ)変換する規則であり、変換先は必ずしも同種のものとは限らない。

 コミュニケーションや情報処理において符号化(エンコード)とは、情報源の情報を伝達のためのシンボル列に変換する処理である。復号(デコード)はその逆処理であり、符号化されたシンボル列を受信者が理解可能な情報に変換して戻してやることを指す。(ウィキペディア)

 メールアドレスも、電話番号も、郵便番号もコードの一種である。

 コードというのは、何等かの集合の要素を記号や符号と一対一に関連付けることによって個々の要素を識別する手段である。コードで代表的なのは、コンピューターのコードであるが、コードの基本は、二進数の自然数である。
 記号や符号と言いますが、コードの一般的なものは、数値的なものである。
 数の順位性や数の均質性がコードには適しているからである。

 ステップとは、段階である。ステップとは順位である。
 カウントとは数える事である。順序よく数える事で、論理性は形成されていく。
 この様にして一対一に順序よく組み立てられることで一定のロジック、論理が構成される。経済の背景には、この様なロジックがある。それがアルゴリズムである。

 経済を政策を考える場合、政策を構成する個々の要素の組み合わせが決定的な働きをしている事を留意する必要がある。

 ゼロサムになる組み合わせが重要な意味を持つ。

 現象は結果なのである。現象として現れた結果は、何に起因するのか。即ち、どの様な体制、制度(経済体制、市場制度、税制、貨幣制度、金融制度、為替制度等)の上にどの様な施策(財政政策、金融政策、規制政策、税政、経済政策等)がとられた結果、経常収支がどうなったか、財政がどうなったか、物価がどうなったか、雇用がどうなったかを検証する必要があるのである。
 故に、経済政策の基本は組み合わせである。

 例えば、ロバート・A・マンデル教授が提唱した「国際金融のトリレンマ」である。
 即ち、「為替レートの安定」「国際資本移動の自由化」「金融政策の独立」の三つの政策目的を同時に達成する事はできず、どれか一つの政策を放棄せざるをえないという事である。
 つまり、とるべき政策の選択肢は、
 ① 「為替レートの安定」と「国際資本移動の自由化」を優先して「金融政策の独立」を放棄する。
 ② 「為替レートの安定」と「金融政策の独立」を優先して「国際資本移動の自由化」を放棄する。
 ③ 「国際資本移動の自由化」と「金融政策の独立」を優先して「為替の安定」を放棄する。
 そして、それぞれの選択肢にあった為替制度がとられなければ政策は、有効に機能しない。
 例えば、①の政策は、金本位制度に適合しており、②の政策は、固定相場制度に適合しており、③の政策は、変動相場制度に適合している。(「円のゆくえを問いなおす」片岡剛士著 ちくま新書)

 為替レートには、対外的貨幣単位を調節する働きがあり、輸出入物価に影響を与える。
 金融政策は、金利や貨幣の流通量を調節することによって対内的貨幣単位を調節する働きがあり、対内的物価を変動させる作用がある。
 国際資本移動とは、資本収支を意味し、対極には、経常収支がある。

 資本収支の対極には、経常収支があるという事は、資本の移動の対極に経常収支があることを意味する。

 資金の流れの逆方向に財が流れる。それにともなって通貨の売買が起こり、為替のレートが上下する。為替のレートが上下することによって貨幣価値の密度が変化する。
 為替の密度は、通貨の価値と量によって決まる。
 市場内部の貨幣価値は、貨幣の流通量と財の量、及び、所得の関数である。

 為替制度では、貨幣価値の密度と通貨の量と回転の働きが重要となる。

 水平方向の運動は、垂直方向の運動を触発し、垂直方向の運動は、水平方向の運動に連動している。
 内外の運動は、表裏の関係にある。対内的価値が上がれば対外的価値は下がる。

 対外的貨幣単位を固定化し、資本移動を自由にする為には、金融政策の自律性は失われる。
 対外的貨幣単位を固定化し、対内的貨幣単位を一定に保つためには、国際資本移動を制限する必要が生じる。
 資本移動を自由にして、対内的貨幣単位を一定に保つためには、対外的な貨幣単位を変動する必要がある。

 対内的貨幣価値を変動することは、貨幣密度の濃度を稀薄にするか、濃密にするかを意味する。

 また、マンデル=フレミング効果では、公共投資は、固定相場制では発揮されるが、変動相場制では、効果が相殺される。変動相場制では金融緩和の方が有効であると言ったことである。

 為替を変動させる要因は、通貨の動きである。通貨の相対的価値を決めるのは、貨幣の移動であるが、貨幣の移動を促すのは、人、物、金の流れである。
 つまり、通貨圏を越えて流れる人、物、金が通貨の相対的価値を決めるのである。
 人の流れを形成するのは、第一に、労働と収入、第二に、消費と支出がある。物の流れには、第一に、有形な物と無形な物、第二に、動産と不動産の別がある。金の流れには、第一に、実体的なものと名目的なもの、第二に、貸し借り、第三に、売り買いがある。

 為替制度とはどの様な仕組みによって構成されているのかである。
 第一に、為替制度は、通貨の交換の仕組みがなければならない。第二に、通貨の決算の仕組みがなければならない。
 為替制度では、通貨の流れる方向と通貨の供給量、そして、財と通貨の流通量、決済資金の準備残高が問題となる。

 経常収支は、資本収支と原則一致する。ただし、政府が為替に介入した場合は、外貨準備高増減に反映される。
 即ち、経常収支+資本収支=外貨準備高増減
 財政収支=財政資本収支
 民間収支=民間資本収支(注意しなければならないのは、民間収支、民間資本収支とは、期間損益ではなく、現金収支のことを言う。即ち、キャッシュフローのことを言うのである。)
 家計収支=家計資本収支

 経常収支と資本収支、そして、外貨準備高の増減がゼロサムの関係にあるという事は、経常収支が赤字の時は、資本収支を黒字にし、また、経常収支が黒字の時は、資本収支を赤字に調整する必要があることを意味している。

 貿易収支+サービス収支+所得収支+経常移転=投資収支+その他資本収支+外貨準備高増減

 サービス収支とは、国境を越えた(居住者と非居住者の間の)サービスの取引をいう。サービスとは、輸送、旅行、通信、建設、保険、金融、情報(コンピュータ・データサービス、ニュースサービス等)、特許権使用料、その他営利業務、文化・興行、公的その他サービスである。
 所得収支とは、国境を越えた雇用者報酬(外国への出稼ぎによる報酬の受取等)および投資収益(海外投資による利子・配当金収入等)の支払いを言う。
 経常移転収支とは、政府間の無償資金援助、国際機関への拠出金など、資産の一方的支払いを計上する。出稼ぎ外国人の母国への送金。海外留学生への仕送り等を指す。
 投資収支=直接投資(経営への支配を目的とした投資。原則出資比率10%以上)、証券投資、金融派生商品、その他投資(貿易信用、現預金の動き等)
 その他資本収支=資本移転(固定資産の取得・処分にかかる資金の移転等)+その他の資産の動き(「ウィキベティア」)

 また、経常収支を貯蓄投資面から見ると

 経常収支=家計の貯蓄投資バランス+企業の貯蓄投資バランス
                       +政府の貯蓄投資バランス
       =家計の貯蓄余剰+(-企業の資本・借入)+財政収支

 歳入-歳出=政府の貯蓄投資バランス

 歳入=歳出
 歳入=税収+税外収入+公債

 企業収入-企業支出=企業の貯蓄投資バランス
      =減価償却費-借入金の返済額+資本・負債の増減

 家計収入-家計支出=家計の貯蓄投資バランス



推測統計(部分集合から全体へ)



 統計の分野には、記述統計や多変量分析の他に、推測統計がある。

 木を見て森を見ずという喩えがあるが、推計統計とは、正に、木から森を推測するような手段である。

 全てを調べなければ正確な事は解らないとするのか、一部分を調べれば、おおよその事は解るとするのか、そこが一つの分かれ目である。
 部分から全体を推定する手段が推測統計である。

 推測には、点推定と区間推定がある。
 点というのは、一点をもって推定値を表現する手法を言い、区間推定とは、推定値に幅を持たせる手法を言う。

 経済がうまくいくかいかないかは、予測の精度にあるともいえる。将来をどのように予測するか、それによって景気の動向も株価の変動も決まる。ところが、その将来が判然としていないのである。
 確かに、未来が不確かだからこそ利益が生じるという考え方もある。しかし、余りに不確実だとしたら、何も決められなくなる。
 だからこそ、統計と確率が必要とされるのである。

 統計は、誤差の学問でもある。誤差をどのようにとらえるかは、統計にとって重要な課題である。
 統計は、検定の学問だとも言われている。統計的に見て誤差の範囲内と見なしうるのかを判定することが検定である。検定によって確からしさが検証される。

 推定統計では、ランダム、すなわち、無作為という概念が重要になる。つまり、推計統計では、無作為という作為を働かせるのである。それは、データ全体の偏りを知るためには、標本となるデータがほどよく散らばっていなければならないという事である。

 統計の必要性は、世の中の殆どの現象には、バラツキがあるという前提である。それが統計の基である。そのバラツキをどのように処理するか。それが統計のあり方、全量を対象とするのか、一部を対象とするのかの違いとなる。そして、全量を対象とするのが記述統計であり、一部を対象とするのが推定統計である。同じ統計でも、全量を対象とした場合と、一部を対象としたのとでは、
 そして、平均の意味もバラツキがある故にである。バラツキがあるからこそ平均値をとる必要がある。
 そして、回帰分析とは、翻ってみると平均への回帰を意味する。この様な回帰分析では、回帰という概念と線形という概念が重要な働きをする。

 計画や予算は、経験や情報の上に成り立っている。経験や情報を洗練したのが統計であり、確率である。

 経験や実績から何を見いだすのか。それは因果関係である。因果関係には向きがある。何が原因で、何が結果なのか。それによって因果関係の方向が定まるのである。因果関係から将来を推定し、その推定に基づいて現金の出納の計画を立てるのが予算である。

 因果関係は、平均への回帰に結びつく。

 現代の財政は、予算主義の上に成り立っている。
 財政民主主義は、予算主義によって成り立っている。
 予算主義の原則は、第一に、公開性の原則。第二に、明瞭性の原則。第三に、事前議決、事前承認の原則。第四に、限定性の原則。第五に、単一の原則。第六に、完全性の原則。第七に、厳密性の原則である。
 要するに、予算主義とは、前決め主義なのである。単年度均衡主義である。又、現金主義である。
 それに対して決算主義は、結果主義である。
 財政は、前決めであるが為に、硬直的になるのである。
 健全な財政は、正確な予測の上でしか成り立たない。
 そうなると予測が何に基づき、何を根拠に立てられたものなのかが重要になる。

 予算においても因果関係が重要なのである。

 予算について考える場合、なぜ、何のために、予算を立てるのかが重要となる。
 現在の財政民主主義における予算の基本原則は、経済と言うより、多分に、政治的な理由による。そのために、経済的な加味されていない。例えば、公開主義も経済的な意味で、公開せよというのではなく。政治的、あるいは、思想的な理由で、公開する事が義務づけられているのである。それは、決算主義との決定的な違いである。決算主義における会計原則は、経済的な理由に基づいているからである。
 そのために、基礎となる情報の取り扱いが違ってくるのである。

 財政の働きは、政治的な部分より経済的な部分の方が強い。故に、予算の原則を財政は、より経済的な働きに基づくようにする必要がある。

 統計は、予測、予算の手段である。過去の実績やデータを基にして将来の展望を立て。その上で計画を作るのが、予定であり、金銭的な計画が予算である。その場合、鍵を握るのが、将来に対する見通し、推測である。
 また、統計は、リスク管理の手段でもある。リスク管理は、将来起こりであろう危機を予測し、それに対処しておく事である。将来起こりうるリスク、すなわち、災害や事故にたいし、一つは事前にどこまで推測しておくか、そして、予測される危機に対して、どの程度、例えば、設備や仕組み、制度、組織まで変えるのか、又は、何らかの対処方法を決め、事前に教育や訓練し、周知させておくのかを費用対効果を計算した上で決めるのがリスク管理である。

 予測やリスク管理は、推測や推計を基とする。その際、推測統計が威力を発揮するのである。そこに推測統計の意義がある。

 推測とは、部分集合から全体集合を推計、割り出すことである。

 推計統計は、全体を母集団とするとその一部を標本として、その標本から全体を推測する手法である。母集団から標本を抽出する事を標本抽出という。
 母集団から標本を抽出する場合、何らかの作為が働かないようにする必要がある。標本を抽出する者に何らかの作為があった場合、標本の信憑性が損なわれるからである。

 このような無作為な標本の抽出方法は、政治や経済のあり方にも影響を与えている。無作為とは思想の一種なのである。

 一度の標本抽出によって母集団を推測するような手段を区間推定という。

 人間は、この世の全てのことを予知しているわけではない。明日のことは、解らないのである。それこそ神のみが知る。人間が全てを予知することが可能か、否かは、一神教徒が考えることである。一神教徒にとって神が全知全能であるならば、この世の全ての事は予め決められていて、人間が努力をしても無意味であるという考えに陥りやすいからである。

 しかし、この考え方は、矛盾している。神が全知全能であろうと、人間の為すべき事に変わりがないからである。なぜならば、人間は神の意志を伺い知ることができないからである。それは人間は、神の如き存在、即ち、全知全能の存在にはなれないからである。なろうとすること自体が不遜なのである。

 恋人同士は、赤い運命の糸に結ばれていると考えることは、夢があるかもしれない。しかし、だからといって人間に赤い糸が見えるわけではない。たとえ、赤い糸が見えたとしても、それが人間にとってどれ程の意味があるのであろうか。結局、赤い糸で結ばれているというのは、方便に過ぎない。
 今の時点で知り得ないのが明らかな事象を、知りうると前提としてもその前提自体が曖昧なものである。人間の認識は曖昧さの上に成り立っている。我々が前提としているのは確からしさに過ぎない。

 人間は、神に何を期待しているのだろう。仮に神が全知全能だとしても神は人間に全知全能の力を与えはしないだろう。重要なのは、神が全知全能であるかではなく。人間が全知全能になり得るかである。人間が全知全能になりうる思うことは、神を否定する事である。神を否定するものは、自らを神とする。
 人間は、全知全能な存在にはなれない。それが大前提なのである。神は、人間が全知全能な存在になることを望んではいない。

 神の意志を知り得ないとしたら、自分の定めが予め決められていようがいまいが意味がない。ただ神を信じて自分の意志を護り、最善を尽くす以外に道はない。
 十字架に掛けられることが定めだとしても、それをいかに知る事ができるであろう。十字架に掛けられるか、どうかそれ自体不確かなのである。確かなのは、信仰である。つまり、確かなのは内面の動機である。

 自分は、誰を愛し、どの様な子供を産むのか、予め決められていると信じているのであろうか。
 誰がこの世で一番綺麗で、何が最善かは、一つの原理から導き出せるとでも言えるのであろうか。世の中で一番センスのいい服は始めから決められていると言い切れるであろうか。 
 サラブレッドのようにどの組み合わせが最適化が機械的に決められると思い込んでいるのであろうか。
 その様なことを考えるのにどれ程の意味があるというのであろうか。

 人間は、常に不可知な部分を持つ。それが前提である。大体、認識、即ち、分別とは、不完全で相対的だからである。故に、不確かな部分がかならずは入り込むのである。それが確率の前提である。故に、ある意味で確率という考え方は、根源的な思想だと言える。

 人間が前提としうるのは確からしさに過ぎない。その確からしさを前提とするのは、合意でしかないのである。だからこそ、全ての原理は仮説でしかない。

 確率というのは、確からしさを前提とするが、確からしさを前提とすると、確からしさが、もっともらしさに置き換わるがある。つまり、確からしさが、もっともらしさにすり替わる危険性を、常に、孕んでいる事を忘れてはならない。それは、詐欺師の言動に如実に現れている。
 この様な錯誤を防ぐためには、前提条件を明確に設定、定義しておく事が重要になる。

 確率は、起こりうる可能性が等しい事象を平等な事象と仮定すること計算された比率である。

 確率というのは、起こりうる事象の全体と部分の比較によって成り立っている。

 故に、確率にせよ、統計にせよ、全体を如何にして認識し、部分をどのように設定するかが、鍵となる。
 全体を把握できる対象もあれば、数が多すぎて、時には、(無限大な対象もある。)全体を捉えきれない対象もある。
 そうなると全体の規模と範囲を特定し、定義する必要がでてくる。



重要なのは何を前提条件として設定するかである。



 確率や統計は、合目的的な手段である。故に、その前提や設定が重要となる。

 統計は、合目的的なものである。故に、統計は、集めたデータの性格に依って違いが生じる。

 故に、統計は、目的や集めた情報の種類、情報の扱い方によって第一に、記述統計、第二に、推測統計、第三に、多変量解析の三つに分かれる。
 記述統計とは、大量のデータからデータの特徴を捉えるための手段であり、推測データとは、一部のデータから、全体を推測する手法であり、第三の多変量解析とは、複数のデータを同時に処理する手法である。

 個別の対象に一つの要素が結びついているデータを一次元データとする。それに対して、一つの対象に対して二つ以上の要素が結びついているデータを多次元データという。

 統計は、予測や推測に基づいてこそ有効なのであり、予測や推測、検証のための手段が確率なのである。
 だからこそ、統計と確率に不離不可分の関係が生じ、また、平均値といった代表値の役割があるのである。

 平均の働きを考える上で鍵を握っているのは、データの構造である。データの構造を知る上では、必要な要件は、データの数、同じデータが出現する頻度、データの位置などである。

 そして、統計では、情報の収集の段階において、収集の目的、収集者、収集の手段、収集の範囲、収集の手続き、収集の対象、収集の時間、収集の場所、収集の仕方、集計の仕方、収集の前提等が重要となる。同様に、分析の段階でも、分析の目的、考え方、基準、原則、担当者、手段、範囲、手続き、分析手順、対象、時間、場所、方法、処理が重要となり、表現の段階でも表現の目的、考え方、基準、担当者、表現手段、表現方法、範囲、手続き、手順、対象、時間、場所、処理の仕方等が重要となるのである。

 又、情報は生ものにたとえられ、鮮度が重要な要素となる。

 統計は、生な情報を扱っている。統計で重視されるのは、一次情報、即ち、生情報である。一次情報の採取の場所や手段によって情報には何等かのフィルターが掛けられる。故に一次情報の採取の場所や手段が、重要になる。

 客観的命題とは、客観的命題でいい対象だという事を意味している。

 統計の重大な役割の一つに推測がある。推測には、第一に、部分から全体を推測する。第二に、全体から部分を推測する。第三に過去から未来を推測する。第四に、現在から過去を推測するという四つがある。
 推測は、複数のデータ(集合)を比較する事によって為される。

 複数のデータ(集合)を比較する場合、データの形や構造が問題となる。データが共通の形を持っている必要がある。例えば、会計データである。同じ形や構造を持っていなければ、比較する事はできない。同じ形や構造を持つ問い事は、共通の要素を基盤として為される事を意味する。

 例えば、仕事は、5W1H(いつ、どこで、誰が、何を、どのくらいの予算で、どのようにするのか。)といった定型の要件によって形成される。むろん、実際の仕事はこれほど単純ではない。しかし、基本的に時間、人、物、金、動作、情報という一定の構造に要約しないと作業の連続性は保たれない。

 データの共通の枠組みや基準が普遍性を持っている場合がある。それがデータの基盤構造である。
 事象や情報を構成する要素は、複数の部分から成り立っている。そして、その複数の部分は、一定の形式を持っている。
 例えば、情報で言えば、一定の項目である。会計で言えば、決算書類の形式であり、納税申告書の書式である。
 事象ならば、人、物、金、概念、時間、場所、動作、位置に順序などである。

 そして、形式以上に重要となるのが順序である。例えば決めるための手順や手続きである。

 記述統計も推定統計も多変量解析も何から何を推測するのかの問題であり、推測という点においては、同じ働きを持っているのである。

 推定には、大きく分けて二つある。即ち、推測と予測である。前者は時間が陰に作用したものであり、後者は時間が陽に作用したものである。

 推測というと部分から全体をという印象があるが、全体から部分を推測するという事も推測の手段としては成り立つ。



情報革命


 情報革命により、多量の情報を高速で処理することが可能となった。そのため、ビックデータビジネスが脚光を浴びるようになってきた。医療の世界でも大量のカルテルを登録し、統計的に病気の診断をしようという試みがされている。
 この様なビックビジネスは、基本的には、記述統計に属すると思われる。即ち、ビックデータというのは、母集合、全体集合から部分集合を引き出す手段を言うのである

 この様なビックデータを統計的に扱おうとした場合、データの形が重要となる。なぜならば、データベースがその根底にあるからである。データベースは、データの収納の技術でもある。
 この様に情報を一定の枠組みの中に収納しようとした場合、データの形式を統一しておく必要がある。しかも、この様なデータは必ずしも数値情報とは限らない。

 企業や官庁では、伝票や帳簿は、不可欠な道具である。この様な伝票や帳簿には、予め決められた書式がある。また、病院に行けば決められ書式の診療録(カルテ)がある。又、至る所で決められた項目でアンケート調査が行われている。データの形とは、この様に予め決められた形式や項目の事を指して言うのである。
 調査項目や記入項目が予め決められている事で、伝票やアンケートは、効果を発揮する事ができる。その時その時、思いつきで調査項目を変えていたら調査を分析し、何らかの結論を導き出す事は難しい。共通した項目だからこそ、比較対照が可能なのである。重要な事は、連続性と継続性にある。その連続性や継続性を保つためには、データの形を統一しておく必要があるのである。

 同じデータでも枠組みや基準が違うと全く違った結果を導き出す場合がある。例えば、企業の決算報告である。日本とアメリカでは会計基準が違うために、同じデータに基づ゛いているはずなのに、日本では黒字なのに、アメリカでは赤字だという事が起こるのである。
 財政と民間企業とでは、現金主義と期間損益主義という基準どころか思想上の違いもある。財政と民間企業では、データの脈絡も互換性そのものがないのである。

 会計情報というのは、それ自体が一つの働きをする。会計情報いかんによって投資が行われたり、また、納税の根拠とされたりする。会計情報が企業の生殺与奪の権能を持っているともいえる。
 また、会計として現れた結果が、即、経済の実態として認められる。それが資金の流れを決めるのである。そうなると、情報の形が実体を持つ事になるのである。単に形式だと決めつけられない。

 標準と平均が単なる指標してという意味だけでなく。実際の経営の軌跡を表す事になるのである。つまり、表面に現れた集計表が事実だとされるのである。
 標準や平均との差によって生じ歪みをどう認識し、どう解釈するか、それが、重要なのである。

 標準と平均の違いに注意しなければならない。
 平均というのは、特定の集合の代表値の一つである。
 標準というのは、基準、判断のよりどころ、或いは、あるべき形、手本、又は、普通、一般という事を意味する。
 標準は、あるべき形を意味している。あるべき形は、一般とか、普通をも意味する。そして、それは判断の基準である。故に、平均という概念に結びつく。しかし、平均と標準とは意味が違う。
 標準で大切なのは形である。標準とされる形と現実の数値の差が、全体の歪みを表している。
 標準の前提は、標本である。標準というのは、あるべき形を意味する。即ち、標準は構造を持つ。

 売り上げの平均とか、社員数の平均と、借入金の平均と言った事を調べても、それが、何らかの対策や解決策に結びつかなければ意味がない。平均も、ただそれだけでは、対策や解決策に結びつくものではない。その点、基準や手本、即ち、標準は、全体の歪みを見いだす為の手段として有効であり、また、歪みや偏りを正すための目安にもなる。
 その意味では、標準を設定することが第一に求められることである。

 ゼロサム関係にある集合体には、標準が重要が意味を持つ。
 特に、会計情報、決算数値においては、標準は重要な意味を持つ。なぜならば、会計は、閉ざされた空間の中で成立しているからである。

 日々の会計処理は表層的な事象であり、経営や経済は、より根底にある空間や構造の歪みに起因する部分が大きい。
 この歪みを発見するためには、標準の概念が不可欠になる。

 経済における推定の多くは、予測に関するである。予測とは、変化を推測する事である。
 データを構成する要素の推移を調べる事が予測における重要な課題となっている。
予測には、因果関係が不可欠である。将来の生起する現象を予測するためには、因果関係を明らかにする必要がある。なぜならば、因果関係、どのような原因によってどのような結果が導き出されるかが、明らかでなければ、現在の原因から将来の結果は導き出せないからである。因果関係には、方向性と順序があるのである。
 この時、用いられるのが説明変数と結果変数である。

 ここの要素間に働きを知るためには、重要な鍵を握るのが、データ間の脈絡と関連である。

 問題は、データ間に相乗効果、統計用語で言う交互作用があるからである。データ間に交互作用があるということは、そのデータの源にある要素間に相乗効果がある事を意味している。
 この相乗効果が、データ間、又、全体と部分、あるいは、時間的変化にどのような働きをしているかが、最終的には問題となるのである。

 次に重要となるのは、区間推定、あるいは信頼区間、即ち、確率の高い区間の幅である。

 これまで述べたような点から鑑みても、確率や統計で重要なのは、設定であり、また、設定をするための前提である。何を前提とし、何を基準にして確かさを規定するのかが、結果の信憑性を左右するのである。そして、論理は確証できるが、設定は見落とされがちなのである。
 統計を悪用しようとする者にとっては、そこが付け目なのである。前提や設定を巧妙に誤魔化して、自説を正当化するために利用しようとする者が後を絶たない。それが確率や統計を今一つ確固たるものにしていない一因である。

 設定条件が答えを左右しているといいながら、答えが一つだとは限らないのである。確率の問題は、原因と結果が一対一に対応いていない場合がある。それは、因果関係が直接的に結びついていないことを意味する。原因と結果が一対いたに結びついていないのである。
 設定条件が一つでも答えが幾つもでてきたりする。問題と正解が一対一に結びついていないような試験問題のようなものである。確固たるのは、問題だけで、答えは曖昧だというのが、確率の前提なのである。これでは釈然としないのは当然である。しかし、それが確率である。だから比として表される。

 数値によって表現されているから客観的だと決め付けるのは早計である。

 統計のデータは、客観的なデータだと、我々は、思い込みがちだが、必ずしも客観的なデータだとは限らない。認識の仕方でデータの持つ意味は違ってくる。基本的に認識というのは主体的な行為なのである。そして、認識の前提も、又、任意に設定される条件なのである。
 データは、恣意的に加工することが可能である。大体、データを収集する段階で何等かのフィルターを掛けることも可能である。
 統計的データでも、最初から客観的なものだと決め付けずに、むしろ、主観的なものだと思っていた方が無難である。
 だからこそ、データの前提条件、あるいは、設定条件をよく確認する必要があるのである。

 その事を端的に表しているのがベイズである。
 ベイズは、予め任意に設定した仮定や前提に基づいて予測を立てていく。つまりは、主観的な統計的手段である。
 ベイズの考え方は、我々の日常的な考え方にむしろ近い。我々は、普段、物事を判断していく上で、何等かの統計的データを予め用意し、それを一々、分析しているわけではない。
 自分の経験の範囲内で予測を立て、それを何等かの基準に基づいて修正していくのである。
 最初は勘を働かせて当たりをつけ判断し、何等かの結果が出たら、最初の設定と結果をとを比較検討して、基準を修正していく。それが一般的な思考の形である。
 そのやり方を論理的にしたのがベイズだと考えて良い。

 不確実な事に、自分なりに当たりをつけて予測をしていく事、それがベイズで言う事前予測である。事前予測という思想があれば、自分の経験や知識、直感が無駄にならないが、反面、自分の経験や知識、直感だけに頼らなくてもすむ。それがベイズ統計な真骨頂でもある。

 経済では事前確率と事後確率が重要な意味を持つ。故に、ベイズ確率やベイズ統計が有効なのである。

 ベイズの重要性は、その考え方、考える姿勢にあるのである。つまり、統計を単なる客観的な数字、自己認識の外に捉えるのではなく、事故との関わり合い、働きの結果として捉える姿勢にあるのである。

 仮定を立てて、その仮定を検証する過程で、一定の法則や規則を見出していくのである。それが経験主義的な思考方法である。
 計画も予測や仮定を立て、試行錯誤しながら、行動を制御する。計画や予算は、絶対ではない。相対的なものである。だからこそ、計画も予算も機能するのである。科学も、民主主義も、スポーツも、会計も然りである。計画や予算が客観的なもの、あるいは、
 純粋に客観的データに基づくとしたら、計画や予算は変更の余地のない完璧なものであり、人智の及ぶ対象でなくなってしまう。そこに予算万能主義や科学万能主義の弊害がある。

 例えば、明日、雨が降るかどうか。雨が降るとしたら傘を持っていきたいという質問に対し、雨が降る確率は、60%ですと言われても、それが質問に応えたことになったかと聞かれると怪しくなる。
 最終的な判断は、質問した側に委ねられているのである。まるで、あたるも八卦、あたらぬも八卦と言われているようなものである。天気予報を占いの一種だと思っている者がいたとしても不思議はない。
 中には、占いよりも質が悪いという者すらいるかも知れない。なぜならば、占いは、あたらずともある程度の示唆はしてくれている。それに対し、天気予報は、何も保証はしてくれない。実に無責任である。

 なぜ、人間は、数字によっていとも簡単に誤魔化されるのか。それは、数字は、客観的事実を表していると思い込んでいるからである。数字は、客観的でもなければ、かならずしも事実を反映しているとは限らない。数字ほど、意図的に加工することのできるものはない。設定や前提をかえればいくらでも思い通りに変形できるのである。しかも、数という属性以外がないために、いかにも、もっともらしく見せ掛けることができる。

 しかし、確率、統計の重要性は今後、益々、増すこととなる事は間違いない。だからこそ、統計や確率の基礎をよく理解しておく必要があるのである。




統計の信憑性



 我々は、学校では、ほとんど統計に関したことを習わずに社会へ出る。しかし、社会に出て一番目にするのは、統計と確率に関する数字である。つまり、世の中で一番有用だと思われているのが統計だというのに、肝心の統計について教育がなされていない。この事は、現代教育を象徴している。
 統計だけではなく。実用的な数学は何も教えずに、現代の教育では、純粋数学だけを教えている。まるで実用的な数学は不必要だと言わんばかりである。

 現代社会では、数字は大変な威力を持っている。数字を使うことで格段の説得力が生じる。それでありながら使われている数字にしてい厳格な規定があるわけではない。大体、ほとんどの人が数字の持つ意味を理解していなし、理解するだけの知識がなく、理解するための基本的な訓練も受けていない。だから、数字だけが踊っている場合が多い。
 その為に、数字を悪用する例が後を絶たない。数字だけでなく、グラフや表と言った図形表現も悪用されている例が多くある。しかも、公的機関の出している数字や資料においてもかなり多用されている。
 そして、その数字に根拠とされているのが多くの統計資料である。

 統計資料を有効に活用するためには、どの局面で、どの様に活用すべきかが重要なのである。つまり、前提条件が肝心である。

 統計というのは、元来、合目的的なものである。ただ、統計を取る者の多くがその目的を秘匿している。なぜならば、統計を取る目的が税金や徴兵のためだなどと知れたら、たださえ協力してくれなくなるからだ。
 しかし、その為に、統計本来の役割が解りにくくなってしまっている。統計は、目的に応じてその対象や範囲、規模が決められる。統計は合目的的なものでありながら、その目的が不明瞭だったり、目的にあっていない設定になってしまっている。それが統計の持つ信憑性を弱めているのである。

 統計は、統計の情報が集められた状況や前提が重要となる。即ち、いつ、だれが、どの様な目的で、どの様な手段によって何に基づいて情報を収集したかによって統計の信憑性は測られるのである。

 情報技術の発展は、一時に大量な情報を短時間で処理をすることを可能とした。これまでは、機械の能力の問題や技術的問題が最大の障害であったが、これからは、数学的な素養が最大の障害になる。
 大量のデータを一度に処理しなければならないとなるとこれからは、単にデータを数字の羅列として表現するだけでは飽き足らなくなる可能性が高い。データを図形や映像として処理する事が求められる。そうなると数学の性格も変わってくる事が予測される。つまり、数学が映像化されたり、図形化される必要が出てくるのである。

 統計は、数の集合である。故に、数の持つ意味や性格が重要となる。数の持つ意味や性格を理解しなければ、統計の持つ役割を理解することはできない。
 ところが、数というものに意味や性格があると言われてもどのようなことを指して言っているのかが解らなければ、何を言っているのか解らない。つまり、数に意味や性格の違いがあるのかである。その点をまず明らかにする必要がある。

 統計で重要なのは、何が解っていて、何が解っていないかである。何が解っていないかをまず見極めることが統計のはじまりなのである。
 つまり、何か確定値で、何が推定値かである。そして、その数値は、全体を表したものなのか、それとも一部を表したものなのか。また、全体というのは、何の全体なのか。そして、全体とは何を意味するのか。これらの事が数の意味や性格を規定するのである。

 統計は、言うなれば、情報の塊である。その情報の塊をどのように切り開き解体するか。統計は、情報を切り開き解体するための手段である。統計は、分析することが目的なのではなく。目的は、分析をした後にある。この事を忘れると統計は、本質を見失うのである。

 日本の人口と言うが、何を指して(どのような定義に基づいて)日本人とするのか、日本人の人口というのは、実際に何かを集計した値なのか。それとも一部の人口から推定した値なのか。実際に何かを集計したとしたら、それは、何の欠損もない値なのか。それとも一部が欠けている事を前提として値なのか。その値は、数なのか。量なのか。また、全体とは何か。調査した対象全体なのか。それとも日本人の全体を指して言うのかである。戸籍を基としても戸籍に載っていない者がいたり、戸籍に載っていても実際には存在しない者もいる。(例えば、二千十年に、戸籍上二百歳の人間が存在することが発覚し社会問題になった。)洒落や冗談ですめばいいのだが、背後に、年金の不正受給問題が潜んでいたりするから、事は重大なのである。
 経済の問題には、必ずこの様な問題が隠されている。対象が、調査の精度に絡んでいたり、何らかの施策や政治に結びついているから事は、厄介なのである。よく公共投資を判断するための事業収支計画が作為的な統計資料に基づいて作られ、それが、既得権益と結びついて財政を悪化させる要因になったりもする。こうなると統計は、深刻な社会問題である。
 経済統計の妥当性は、何を基礎数値、あるいは、母数、確定値とし、それに対して何の値をどのように処理するかによってきまる。
 2005年の日本の犯罪率は、9.9パーセントといっても何を分母とし、何を分子としているのか。そして、分母の数値の根拠や出典は何にかを明らかにしなければ、その信憑性や意味するところは判断できない。
 第一、重要なのは、統計の意味が判然としないのに、無目的に、自分勝手な解釈によって都合よく使われているという事である。
 大事なのは、データの背後にある実体であり、前提である。その上で、どのような目的で統計によって導き出された数値を活用するかである。
 医療では、厳格に処理されている統計の数値が、経済となると、政治や商売のための方便にデタラメに使われている例が散見される。時には、詐欺ペテンと言われても仕方がない例さえもある。

 統計というのは、ある情報の塊があってその情報の塊を、目的に応じて、どのように処理をするかという問題なのである。最初に結果ありきであったり、情報を単に相手を説得したりするための手段や宣伝の道具としてのみ活用しようとしたら、情報の持つ真の働きを発揮させることはできない。経済に統計を活用する場合、その境界線が明確でない場合が多い。なぜ何のために、情報を活用しようとしているのかの認識が欠けているのである。
 また、経済データの難しさは、前提となる条件が一定でなく。しかも、時々刻々変化しているという事である。

 統計は、全ての数字を掌握しているわけではないという事を前提としている。つまり、確定数値を対象としているのではないのである。調査なよって把握しきれないという事象を前提として成り立っているのが統計であり、だからこそ、統計と確率は、不可分の関係にあるのである。統計とは、不確かな数値の上に成り立っている。
 最初から、統計によって全てを理解しようなどと言うのは考えない事である。
 不確かに数字をいかに、確かな物に置き換えていくか、その過程に統計と確率は成立しているのである。そして、これは思想である。統計とは思想の産物である。

 生産量の全量は測定できても不良品の数を正確には把握できないのが一般である。なぜならば、全量を検査することが物理的に不可能である場合が多いからである。

 世の中には、全ての事柄を数値で表し、又、理解しようとする者がいる。
 何かというと、すぐに数字をあげて、さも真実そうに説明をするのである。そういう者にかぎって、数字の根拠や前提、表現の仕方について曖昧にするのである。統計ほど見た目によってごまかされる数学はない。
 統計によって嘘をつくとまで言われるほどである。
 やたらと数字を出す者の多くは、数値を絶対視する傾向がある。しかし、数値は、特定の対象から数的事象を抽象した結果に過ぎない。統計情報は、全ての事象を網羅しているわけではない。統計に表れないところにこそ物事の本質が隠されている場合が多いのである。
 統計の真の醍醐味は、数値の陰に隠された本質を明らかにするところにある。数値を絶対視してしまえば、統計の真の醍醐味を味わう事はできない。それはお金と同じである。お金は手段であり、目的ではない。お金の本質は、お金の集め方やお金を貯める事にあるのではなく、お金の使い道にあるのである。そこを見失うと、お金の本当のありがたみは理解できないのである。

 だからこそ、統計や確率によって事象を解説する者は、統計の前提や設定を明確にする事が求められるのである。


基礎となる資料


 統計にとって分類は、決定的な役割を果たしている。統計上の分類は、合目的的なものである。どの様な意図の基で統計資料が採取されているかが、重要な意味を持ってくる。

 統計情報、資料が何に活用されているかを見れば、統計資料の役割が見えてくる。

 統計は、主として意思決定を助けるために使用される情報である。つまり、我々が日常生活の中で、何等かの意思決定をしようとした場合、確率統計は、我々を助けてくれるのである。特に、将来の予測をするためには、統計資料はなくてはならない情報である。

 統計の当初の目的は、歴史的に見て徴税と、徴用だった。現在でも統計情報の主要な部分は、国勢調査に負っている部分が大きい。その意味で、統計というのは国家的事業の一つでもある。

 統計情報は、他の情報との比較によって効力を発揮する。その意味では、統計においては、相関関係が重要となる。

 統計は、物の経済、人の経済、金の経済を扱っている。物の経済、人の経済、金の経済間の相関関係が重要となる。

 統計情報は、結果に基づいた値である。統計の基本姿勢は、「温故知新」古きを温めて新しきを知るである。

 統計情報は、仮説を立証するための根拠として有効である。

 統計が結果を表した数値情報だとしたら重要なのは、その前提となる命題であり、その命題の論理的信憑性である。信憑性の基準は、了解可能性である。

 一見、確率の基となる統計資料は、客観的な情報に見えるが、その前提は、任意な設定にあるのである。

 純粋数学に対して厳格な数学者も、事、経済数学となると無邪気になる。そして、初歩的な問題でへまをする。その典型が確率統計である。
 確率統計ほど前提となる条件や前提となる設定に左右される事象はないのである。

 人類は、又一つ統計という万能の手段を発見した。そして、又、本質を見失うのである。情報処理能力の向上は、統計に対して絶大な力を発揮する。
 しかし、同時に、深刻な問題を引き起こす可能性も潜んでいる。
 統計学者が犯す過ちは、結果を全てだと思い違えることである。
 情報処理の鍵は、前提、或いは、前提となる仕組みや目的である。
 元々、情報処理は、合目的的手段なのである。目的を見失えば、本来の意味も失われる。

 今の統計は、技巧に走りすぎている。統計というのは、本来合目的的なものであり、なぜ、統計という技法を用いる必要があるのかが重要なのである。その目的を見失うと統計はかえって弊害にすらなる。

 世の中には、統計では、計り知れない事が沢山ある。
 統計は、あくまでも、推測や予測の手段の一つなのである。問題は、推測や予測の確かさである。
 統計の世界では、百パーセント起こるといえるような事象は希なのである。だからこそ、比率で表すのである。
 ある意味でこの世は賭け事なのである。それ故に、統計も賭け事から始まっているのである。

 この世は確定的なのか、それとも不確実なのか、それは永遠のテーマでもある。そして、その答えは神の領域にあるのである。




統計の誤謬


 数字を使って説明したり、計算をすることを数学だと思い込んでいる人が多くいる。数字を使って説明をしたり、計算をする事が数学なのではない。
 数学は、数値として表れた後ろにある実体や法則を見いだしたり、また、論理的に物事を組み立てる手段である。
 数字を使って説明したところで、それが実態と合っていなければ、数学ではない。
 ところが数学に苦手意識を持っている人の多くは、数字で説明されると幻惑されてしまう。そして、何やら真実らしいと思い込まされてしまう。

 しかし、わけもなくやたらと数字をひけらかすのは、考えものである。数字を使うことで、意味もなく権威づけされたり、もっともらしく聞こえてしまうその方の弊害の方が大きい。それが、学者やジャーナリスト、証券会社や銀行の人間だと数学と無縁な人間にとっては真実でないことも真実らしく思い込ませてしまう危険性が多分にある。

 私は、理科系の大学出身である。理科系では、数学が必須であるが、それでも数字や計算を苦手にしていた人が結構多くいた。
 数字は使い手によってずいぶんと違った印象を与えるものなのである。

 数値は、それを使う人の立ち位置や目的、前提によって違った解釈ができる事を忘れてはならない。その意味では、数字は、きわめて主観的なものである。しかし、前提や目的を明確にすれば数値を使うことでによって主観性をかなり弱めることができる。しかし、それは、立ち位置、視点、目的、設定を明確にする事が大前提である。

 数学は、数値に表れたことや計算よりも、事象や現象を数値として表現し、それを論理的に展開するところに意義がある。
 物理学でも肝心なのは、数値と言うよりも数式や論理展開の方だといえる。

 数字本来の働きを理解せずに、ただ数字を使って人を誑かすとしたら、それは、数学と言うよりもペテンである。

 統計も他の数学の分野と同じ、数の背後にある実体が重要なのである。否、統計こそ、最も前提や目的を明確にする必要があるのである。

 大体、統計は、調査の方法や手段、道具によっても違ってくる。精度にもかなりのバラツキがある。調査主体によっても違いが生じる。かなりデリケートなのである。
 確率はさらに前提や条件によって違いが出てくる。

 統計を使って物事を説明している人の多くは、数字の持つ意味を理解しているとは、思えない場合が数多くある。

 数字の持つ意味とか、性格と言われてもピンと来ないかもしれない。数字の意味や性格という事の意味を知るためには、数字の背後にある実体を知る必要がある。
 数字に性格があるのか、数字の背後の実体とは何か。
 一般に、数字というと、十進法を普通に思い浮かべるが、必ずしも十進法的な世界が全てだとは限らない。例えば、二値、二進法的世界である。

 数値は、美醜や善悪の判断といった定性的な判断をするわけではない。数値は、あくまでも定量的な判断をするための手段に過ぎないのである。数として表せない情報は基本的に処理できないのである。
 この様な数値の性格は、必然的に情報の性格も規定する。
 好き嫌いや美醜と言ったその人その人の主観が関わるような問題は、基本的には、処理できない。
 最終的な判断は人間がするのである。例えば、事業計画や予算を数学的に立てることは可能でも、それを実際に行うか否かの決断は人間がするものである。その点を勘違いしてはならない。
 数学を使ってある種の答えを導き出すことはできるかもしれないが、その答えに従って決断を下すのは人間である。

 数学というのは、定量的な判断は得意でも、定性的な判断は苦手である。ただ、定性的なデータを処理するための手段がないわけではない。

 例えば、定性的な情報を処理する場合、二値や二進法を用いる方法がある。定性的なデータを処理する際、一旦、データの性格を数値化するのである。

 二値、二進法的世界というのは、統計の世界にも意外に多くある。例えば、イエスか、ノーか。また、上か、下か。上向きか、下向きか。男か、女か。あるか、ないか。合格か、不合格か。勝ちか、負けか。善か、悪か。白か、黒か。是か、否か。1か、0か。オール オア ナッシングという具合にである。
 意志決定などは、是か、否かというような二者択一的な問題がある。この様な問題、特に、定性的で数値化できない課題を処理する時に二値、二進法的手法が用いられる。この様な場合、二つに一つという数の性格が、是か否かとか、損か得かとか、好きか嫌いかと言った実体と数字が直接的に結びつく場合があるのである。日本銀行が発表する短観がこの例に当たる。
 しかし、それのような場合でも、あくまでも二者択一的な情報を量化したにすぎない。つまり、二者択一的な問題に限られている。二者択一的でない問題は、なかなか量化できないのである。
 何でもかんでも、イエスか、ノーか。黒か白かと割り切れる問題ばかりではない。むしろ、この世の中、割り切れないことが多い。
 情報技術の発展によって二進法的な空間が広がり、定性的な分析を数学的に行う可能性は開けてきた。しかし、全てを数学的に処理しようとすることには最初から無理がある。又、数学を万能視することにも余り意味がない。

 数学的な処理と非数学的な処理を組み合わせて適切な判断をすればいいだけなのである。数学は道具なのである。

 統計の誤謬は、データにあると言うより、使い手側の根本的な姿勢、思い違いにあるのである。

 数字を見る時は、この様な数字の持つ限界を忘れてはならない。この様な性格は、数値情報である貨幣価値にもつきものである。

 統計は、数の集まりである。数は、何を基準にするか、又、何を単位とするかによって違いが生じる。故に、統計こそ数値の背後にある前提を明らかにする必要がある。ところが、前提を明らかにしないままに、いきなり数値を上げて説明をされることが多々ある。しかも、それが専門と称する人間にでである。金融の不祥事もこの様な些細なことが原因である場合が多い。数字をあげている当人達も意味が解らずに説明している場合すら見受けられる。これでは、騙すために数字を道具として使っていると言われても仕方がない。

 また、統計学者の犯す過ちの一つは、結果が全てだと思い込むことである。結果が良ければ、もっと有り体に言えば結果が解ればいいという事になる。
 教育の効果は、試験の結果や合格率であり、教育の内容は二義的なものと見なしてしまう。しかし、教育において重要なのは、どの様な目的で、何を教え、その結果は、どこに現れるかである。数値に表れる結果が全てではない。
 映画や小説は、売上高だけで評価すべきではない。どうすれば売れるかだけで映画や小説が評価されたら、制作者はなにを映画や小説によって表現したかったか、作者の主張や訴えたいことが忘れられてしまう。
 道徳は、統計的に導き出されるものではない。道徳は、結果ではなく、前提なのである。
 どの様な神を、自分が、信じるかは、統計の問題ではなく。信仰の問題である。結果を絶対視した時、神の本質は見失われる。
 統計で重要なのは前提であり、結果は二義的な意味しか持たない。
 そして、その前提を根本は、どの様な目的で、どの様な視座に立って情報を認識するかという点にある。犯罪を目的として情報を活用すれば、その結果、どんなに利益を得たとしても、結果は、犯罪である。
 映画や小説は、作者が自分の思想を表現し、博く伝えることに本来の目的がある。金を儲けることに目的があるわけではない。金儲けは、大切だが、あくまでも二義的なものにすぎない。
 仮に、映画や小説によって大金をせしめる者が出たとしても、映画や小説を世に出す、本来の目的や意味が失われたわけはない。
 事業の目的は、業績だけでは推し量れない。ただ儲ければ善いというのは、言い過ぎである。事業の目的は、事業に対する経営者の志であり、企業の社会的必要性、社会的責任、社会的働きである。なぜならば、事業目的というのは結果ではなく、事業の前提だからである。そして、事業目的と事業の内容が合致していなければ企業を存続する意味はない。

 現代文明から隔絶した、飛行機を知らない人間が住む島があるとする。その島の上空を毎日、定期便が飛んでいるとする。
 その島の住人にしてみれば、毎日、決まった時間に得体の知れない物体が頭上を通過していく事になる。
 自分の頭上を得体の知れない物体が定期的に飛んでいるとしたら、それを見ているものはどうするであろう。 
 仮に自分が飛行機のことを知らずに、上空を飛ぶ飛行機の頻度だけを数えられるとしたら、飛行機が飛ぶ頻度を数えられても飛行機が飛んでいく仕組みを理解することはできない。飛行機が何等かの理由で飛んでこなくなったとしても、飛んでこなくなった理由は知る事ができない。しかし、飛行機を運航する者にはその原因は自明な事である。
 また、飛行機の高度記録を何の情報かを知らずに解析し、それが飛行機の高度を記録したものだと認識する事自体が難しい。例え、それが飛行機の高度を記録したものではないかと予測したとしても、それを検証する手段がない。
 統計現象というのは、結果でしか判断できないのである。
 いくら統計技術が進んでも結果だけで判断する状態は、群盲象を撫でる状態であることに変わらないのである。その点を念頭に置けば、統計情報ほど有為なのものはない。
 倫理、道徳は、統計的に導き出されることではないのである。それを忘れて倫理観や道徳まで帰納的導き出そうとすると倫理観や道徳観は土台から失われてしまう。

 統計情報が一番豊富で、情報処理の最新技術が最も威力を発揮するのは、会計である。なぜならば、会計は、数値情報記録の塊なのである。ところが、最も、経済問題に活用されていないのは、会計情報である。

 会計の目的と統計の目的は、類似している。会計は、企業経営の実体を把握し、経営の意思決定に有用な情報を提供することにある。
 統計本来の目的は、国家経済の実体を明らかにし、国家の意思決定に必要な情報、資料を提供する事にある。

 過去の経済政策は、無作為化の実験を積み重ねたようなものなのである。

 会計は、数学的現実である。
 会計は、ある意味で統計的考え方を集大成した物と言える。それだけに、統計の活用の仕方に対して、いろいろな示唆に富んでいる。又、現代の統計の限界を知る意味でも重要な要素を提供してくれている。
 会計は、生情報をいかに分類し、集計し、分析するかを系統立てて用意している。又、一連の手続として定型化している。これらは、アルゴリズムとして貴重である。

 現代社会は、統計的な社会とも言える。その好例が、選挙である。選挙は統計的な制度だと言える。選挙は、一体どれくらい民意を公平に且つ正確に反映できるのだろうか。これは民主主義の本質に関わる問題である。
 だから、真の民主主義は直接民主主義でしか実現しないと主張する者も現れるのである。いずれにしても、民主主義は数学的なのである。



数学の可能性と限界


 統計や確率ほど数学の可能性と限界を示しているものはない。

 確率は、元々賭け事や保険から端を発している。
 そうなると、確率で一番問題となるのは、必勝法はあるかであり、又、生存確率と保険料は見合っているかである。
 必勝法があるかというと、あるとも、ないともいえる。なぜならば、それは、場合によるからである。
 場合によるというのは、元となる数の集合の構造によるからである。
 数の集合の構造とは、初期設定と制約条件と手順によって決まる。
 例えば、ブラックジャックのようなゲームには、必勝法はある。

 このような事は、経済を考える上で重要な示唆がある事を意味している。

 統計データでは飛行機を設計することは出来ない。偏差値では、子供に何を教育すべきかの解答はえられない。

 表面に現れた現象面のみを追いかけても経済の動向を制御する事は出来ない。ボイラーを制御するためにメーターなどの外形的な乗法は重要である。しかし、実際にボイラーを動かし、制御しているのは、ボイラーの装置であり、仕組みなのである。つまり、ボイラーの設計時に組み込まれた仕組みの問題であり、その仕組みを設計する際の方程式や値の問題なのである。

 経済にとって統計の重要な事には間違いはない。ただし、それには前提がある。統計は、あまりにも悪用されすぎる。統計を活用するためには、統計が正常に機能するためには、前提条件がある。その前提条件を明らかにしないままに、数字が一人歩きすることが問題なのである。また、統計は合目的的なものである。目的に応じて統計的手段は講じられる。目的によって統計の技法も違ってくる。
 目的に応じて、前提条件も変わってくる。前提条件を明らかにせず、又、確認せずに結果だけを鵜呑みにすることは、危険極まりない行為なのである。
 この様に合目的的で前提に左右される統計を客観的乗法に基づくとするだけでいかがわしい。統計というのは、その前提として主観的なものなのである。その主観的な部分をいかに排除、あるいは少なくするかが、統計結果の正当性を保証するのである。

 経済現象を理解する上で統計的手法が重要であることは、論を待たない。しかし、統計的手法が全てだと思ったら、重大な間違いを犯す。
 貨幣の働きや経済法則の基礎は、貨幣価値にあり、貨幣価値を理解するためには、数論と言った基礎数学の働きの理解が必須となるからである。
 統計的手段を経済の根底に据えようとするのは、古典力学を確立する以前に量子力学を構築しようとするようなことである。
 それでは、統計も本来の在り方を逸脱し、後付的な理念になってしまう。

 統計が全てだと思い込むのは間違いである。しかし、統計の重要性と可能性がこれから益々高くなっていくのも確実である。

 私は、統計を習い始めた時、それまで学習してきた数学と違う、何かしらの違和感を感じた。今考えてみるとそれは、統計以前に学習した数学は、明確な前提の上に演繹的に構築された数式を基礎としていたのに対し、統計が、曖昧さや不確実な事象を対象としたものだからだと思う。
 統計以前の数学というのは、確実な命題、明白な命題の上に築かれている。数学というのは、確実な命題の上に構築されていると思い込んでいたのに、統計や確率は、不確実な事象を対象としているという事である。
 しかし、考えてみると統計的な空間の方がより純粋な数学的空間だと言える。

 我々は、統計的、或いは、確率的というと、偶然、たまたま。生起した事象を扱う数学だと考えがちである。それは、確率や統計が、確実に生起する現象を扱っているのではなく。不確実な現象を扱っている数学だと思い込んでいることが主たる原因である。
 しかし、今日に確率や統計で扱われる現象の多くは、日常的に生起しているごく当たり前の現象である。
 この事は、数学や科学に対する認識の問題でもある。現代人の多くは、科学を決定論的に捉え、科学的に解明されたことは確実な事象だと決め付けている。しかし、今日、その確信が揺らぎつつある。その表れが、統計や確率に対する認識の差として現れてきたのである。確実で、決定的だと思われてきた事象の多くが、実は、曖昧で、不確実な前提の上に成り立っていることが明らかになってきたのである。

 数学的確率というのは、自己の認識を基によって組み立てられる確率であり、統計的確率というのは、統計情報、即ち、対象を基にして成り立っている確率である。
 数学的確率というのは、任意に設定された、或いは、想定された前提に基づく確率であり、「先験的確率」と呼ばれることもある。また、統計的確率というのは、経験や現実の生起した事象に基づく確率であり、「経験的確率」と言われることもある。

 大数の法則とは、不確実性の中に確実性を見出すことである。実は、この点が確率の本質の一面を表している。大数の法則のように、不確実な事象の中に隠された確実性を探求するのも確率の目的の一つである。

 確率論を突き詰めると決定論、非決定論(限界論)に行き着く。この様な議論を突き詰めると神学論に至る。この世の中の出来事は、予め全て定められている。即ち、この世の全ては、予見、予定されているが、その力は神のみに備わっていると考えるのが決定論、宿命論である。それに対し、この世の出来事の全てを予め定めておくことは不可能であり、何かしらの限界がある。故に、全てを予見することはできず。この世の出来事は、偶然によって支配されており、全てを予知することは不可能だというのが非決定論である。
 しかし、結果は、同じである。何もかもが予め決められていようがいまいが、その全てを人間、自分が知る事ができない以上、常に、最善を尽くす以外にない。だからこそ、最後に問われるのは人間の意志、自分の意志である。
 神は、常に、人間に選択の余地を残している。神は、自己に選択の余地を与えているのである。だからこそ、確率という考え方が成り立つのである。

 子供の身長を両親の身長の平均として一意的に導きだす事ができない事は明らかであるのと同様、法則式は、現象の傾向を近似的に表しているのに過ぎない。

 確率は、例えば、晴れる確率は、30%というように、曖昧さを前提とした数字である。

 曖昧だから数値的に捉えようとしたのが確率だといえる。

 考えてみれば、これは当然な事を言っているのに過ぎない。

 何が起こったかは認識できる。しかし、なぜ、起こったのかは解らない。たとえ、原因らしきものを見出したとしても所詮、憶測、推測の域を出ない。人間は、外面しか見えないのである。内部の仕組みや要因は見出しにくい。解ったと思ったら、新たな謎が深まる。その最たるものが人の生と死である。





       

このホームページはリンク・フリーです
ページの著作権は全て制作者の小谷野敬一郎に属しますので、一切の無断転載を禁じます。
The Copyright of these webpages including all the tables, figures and pictures belongs the author, Keiichirou Koyano.Don't reproduce any copyright withiout permission of the author.Thanks.

Copyright(C) 2009.12.20 Keiichirou Koyano