【new】計量経済学関連での新しい書籍についてもこちらで紹介します。
2024/09 – 因果推論の計量経済学
2024/07 – 計量経済学入門(宮川)
2024/05 – Pythonで学ぶ効果検証入門
2024/04 – 反実仮想機械学習〜機械学習と因果推論の融合技術の理論と実践
2024/04 – データ駆動型回帰分析: 計量経済学と機械学習の融合
2024/01 – 入門 計量経済学 第2版: Excelによる実証分析へのガイド
2023/11 – 回帰分析から学ぶ計量経済学: Excelで読み解く経済のしくみ
計量経済学とは
計量経済学では、統計学の単体ではできない経済理論を利用したり、実際の不完全な統制されてないデータを使うために確立されてきました。もし統計学だけでの分析で分かることがあればそれは計量経済学は必要はなく、初学のうちは、何をもって計量経済学というのかを自分の言葉で言い表せられるように意識して学んでいきましょう。
著名な海外のテキストでもやはり最初に計量経済学について触れられています。いくつかここに例として挙げているものを今現在は完全に理解しきれないかもしれませんが、今後学んでいくうちに理解できるようになっていきます。
今回、下記ではおすすめできる計量経済学の書籍を紹介しますが、それに先立ち、計量経済学というのはどのようなものなのか、ここでは洋書での教科書(どれも有名な書籍です)で書かれている事を記載しておきますので様々な角度から見てみてください。
Introductory Econometrics: A Modern Approach (Wooldridge)
1計量経済学とは何か?
1.1計量経済学とは何か?
例えば、州政府に雇われて、州が資金提供している職業訓練プログラムの効果を評価する仕事を依頼されたとしましょう。このプログラムは、製造工程でコンピュータを使用する方法を教える20週間のコースです。任意の時間給労働者が自由に参加でき、プログラムに全体的または部分的に参加することができます。あなたの仕事は、この訓練プログラムが各労働者のその後の時間給にどのような影響を与えるかを判断することです。
別の例として、投資銀行で働いている場合、短期米国債を使ったさまざまな投資戦略のリターンを研究し、それらが経済理論に準拠しているかどうかを判断することが求められるかもしれません。
このような質問に答えることは最初は難しそうに見えるかもしれませんが、経済学の入門コースを終える頃には、経済学の手法を使って正式に評価したり、単純な経済理論をテストしたりする方法が分かるようになるでしょう。
1.2計量経済学と経済データの本質
計量経済学は、経済関係を推定し、経済理論をテストし、政府やビジネスの政策を評価・実施するための統計的方法の開発に基づいています。計量経済学の一般的な応用例として、金利、インフレ率、GDPなどの重要なマクロ経済変数の予測があります。また、政治キャンペーンの支出が投票結果に与える影響や、学校支出が生徒の成績に与える影響なども研究されます。
計量経済学は、非実験的な経済データを収集・分析する上での問題に焦点を当てているため、数学的統計学とは異なる分野として進化してきました。非実験的データとは、個人、企業、経済のセグメントに対する制御実験を通じて蓄積されたものではありません。制御実験が難しい社会科学では、経済学者は複雑な経済データに対処し、経済理論の予測をテストするための新しい技術を考案してきました。
1.3実証的な経済分析のステップ
計量経済学の手法は、経済理論をテストする場合や、ビジネスの意思決定や政策分析に重要な関係を推定する場合に適用されます。実証分析は、理論をテストするためにデータを使用するか、関係を推定するためにデータを使用します。
実証経済分析を構造化する方法は、最初に関心のある質問を慎重に定式化することです。例えば、経済理論の特定の側面をテストする場合や、政府の政策の効果をテストする場合があります。
経済モデルは、様々な関係を記述する数学的方程式から成ります。例えば、犯罪行動を説明するためのベッカーの経済モデルや、職業訓練が労働者の生産性に与える影響を調べるモデルなどがあります。
1.4データの種類
計量経済データには、横断データ、時系列データ、プールされた横断データ、パネルデータの4つの主要な種類があります。
•横断データ: 個人、家庭、企業、都市、州、国などのサンプルを特定の時点で収集したデータ。
•時系列データ: 時間に沿って変数の観測値を収集したデータ。例として、株価や消費者物価指数、GDPなどがあります。
•プールされた横断データ: 異なる年に行われた複数の横断調査を組み合わせたデータ。例えば、1993年と1995年の住宅価格データ。
•パネルデータ: データセット内の各横断メンバーの時系列。例えば、同じ個人の賃金、教育、就業履歴を10年間にわたって追跡するデータなど。
1.5因果関係、セテリス・パリブス、反実仮想推論
経済理論のテストや政策評価において、経済学者の目標は、一つの変数(例:教育)が別の変数(例:労働者の生産性)に因果関係を持つことを推論することです。単に二つ以上の変数の関連性を見つけるだけでは不十分であり、因果関係を確立しなければ説得力に欠けます。
セテリス・パリブスとは、他の関連する要因を一定に保つという意味であり、因果分析において重要な役割を果たします。例えば、価格が変わるときの需要量の変化を分析する際には、他の要因(所得、他の商品の価格、個人の嗜好など)を一定に保つ必要があります。
反実仮想推論は、政策の影響を分析する際の重要なテーマとなります。これは、ある経済単位(例:個人や企業)を異なる状態で想像することを意味します。例えば、ある労働者が職業訓練プログラムに参加した場合と参加しなかった場合の賃金を想像することができます。このように反実仮想的な結果を考えることで、因果関係をより明確に理解することができます。
1.1 計量経済学とは何か?
「計量経済学」という用語は、ノルウェーのラグナー・フリッシュ(1895-1973)によって作られたとされています。フリッシュは、計量経済学会の三大創設者の一人であり、『Econometrica』誌の初代編集者であり、1969年に最初のノーベル経済学賞を共同受賞しました。彼の言葉を借りて、計量経済学の定義を説明します。
計量経済学という用語について説明が必要かもしれません。その定義は、計量経済学会の憲章の第I章に記載された範囲の声明に含まれています。「計量経済学会は、統計学および数学との関連で経済理論を進展させることを目的とした国際的な学会である。…その主な目的は、理論的-定量的アプローチと実証的-定量的アプローチを統一することを目指す研究を促進することである。」
フリッシュの定義は今でも有効です。現在では、計量経済学は経済モデル、数理統計学、経済データの統一された研究とされています。
計量経済学の分野には、いくつかのサブディビジョンと専門分野があります。計量経済学理論は、ツールや方法の開発および計量経済学的手法の性質の研究に関するものです。一方、応用計量経済学は、定量的な経済モデルの開発および経済データを使用したこれらのモデルへの計量経済学的手法の適用を指します。
1.2 計量経済学への確率論的アプローチ
現代の計量経済学の統一された方法論は、ノルウェーのトリッグベ・ハーヴェルモ(1911-1999)の「計量経済学における確率アプローチ」(1944年)という論文で表現されました。ハーヴェルモは、定量的経済モデルは必然的に確率モデル(現在では確率過程モデルと呼ばれるべき)でなければならないと主張しました。経済モデルは明示的にランダム性を取り入れるように設計されるべきであり、確率誤差を決定論的モデルに単に追加してランダムにするのでは不十分です。
一度経済モデルが確率モデルであると認識すると、経済を定量化、推定、推論するための適切なツールは、数理統計学の強力な理論を通じて提供されることが自然に導かれます。確率論的な経済モデルの構築に基づいて、適切な定量的経済分析の方法が導かれます。
ハーヴェルモの確率アプローチは経済学界で迅速に受け入れられました。今日、定量的な経済研究はその基本的なビジョンを避けることはありません。
全ての経済学者が確率アプローチを受け入れる一方で、その実施にはいくつかの進化がありました。構造的アプローチはハーヴェルモの元々のアイデアに最も近いものです。確率的経済モデルが特定され、経済モデルが正しく指定されているという仮定の下で定量分析が行われます。
もう一つのアプローチは、準構造的アプローチです。これは、経済モデルを近似として扱うもので、この理論は擬似真値、準対数尤度関数、準最尤推定(MLE)、準対数尤度推論などの概念を導入しました。
さらに関連するのはセミパラメトリックアプローチです。確率的経済モデルが部分的に指定されているが、いくつかの特徴は未指定のままです。このアプローチは、最小二乗法や一般化モーメント法(GMM)などの推定方法につながります。
もう一つの定量的構造経済学の枝分かれは、キャリブレーションアプローチです。準構造的アプローチに似ていますが、キャリブレーションアプローチは構造モデルを近似として解釈し、したがって本質的に偽であると見なします。キャリブレーションアプローチは数学的統計を否定し、代わりに統計的でないアドホックな方法でモデルとデータのモーメントを一致させるパラメータを選択します。
1.3 計量経済学用語
典型的な応用では、計量経済学者は一連の変数に対して反復測定を行います。例えば、労働の応用では、週給、学歴、年齢、その他の説明的特性が含まれます。これらの情報をデータ、データセット、またはサンプルと呼びます。
個々の観測は、特定の経済単位(個人、家庭、企業、国など)に対応することがよくあります。また、四半期ごとのGDPや日々の金利など、特定の時点での測定値であることもあります。
経済学者は通常、変数をイタリック体のローマ字(\( Y \), \( X \), \( Z \)など)で示します。\( Y \)は説明される変数、\( X \)と\( Z \)は条件(説明)変数を表します。
推定量は、対応する文字の上に帽子「\(\hat{}\)」、チルダ「\(\tilde{}\)」、またはバー「\(\bar{}\)」を付けることで示されます。例えば、\(\ hat {b}\)と\(\ hat {e}\)はそれぞれ\( b \)と\( e \)の推定量であり、\(\hat{b}_A\)は\( A \)の推定量です。
1.4 観測データ
計量経済学の一般的な質問は、ある変数セットが別の変数に与える因果的影響を定量化することです。例えば、労働経済学における関心事は、教育の収益性、すなわち他の変数を一定に保ったときに労働者の教育を増やすことで生じる収益の変化です。
理想的には、これらの質問に答えるために実験データを使用します。例えば、教育の収益性を測定するための実験では、子供をグループにランダムに分け、異なる教育レベルを指示し、その後、彼らが労働力に入った後の賃金パスを追跡します。しかし、このような実験は非道徳的とされるため、経済学における実験データセットは通常、範囲が限られています。
代わりに、多くの経済データは観測データです。このようなデータを使用して、変数間の共同分布を測定し、それらの依存関係を評価することはできますが、観測データから因果関係を推論することは困難です。例えば、教育レベルは個人の選択によって部分的に決定されるため、教育レベルと賃金の正の相関関係は、個人の能力の高さによるものかもしれません。
1.5 標準データ構造
経済データセットには、横断データ、時系列データ、パネルデータ、クラスターデータ、空間データの5つの主要なタイプがあります。これらは観測値間の依存構造によって区別されます。
・横断データ: 個々の経済単位ごとに1つの観測値があります。
・時系列データ: 時間ごとにインデックス付けされたデータです。例えば、マクロ経済指標、価格、金利などです。
・パネルデータ: 複数の経済単位を時間ごとに繰り返し測定したデータです。
・クラスターデータ: 観測値が「クラスタ」にグループ化され、クラスタ間は独立しているが、クラスタ内は依存しているデータです。
・空間データ: 地理的近接性などの空間的尺度に従って相互に依存するデータです。
これらのデータ構造は、計量経済学的分析においてそれぞれ異なる方法で扱われます。
1.6 計量経済学ソフトウェア
経済学者は、さまざまな計量経済学、統計、およびプログラミングソフトウェアを使用します。例えば、Stataは強力な統計プログラムで、多くの計量経済学的および統計的ツールが事前にプログラムされています。MATLAB、GAUSS、OxMetricsは、高レベルの行列プログラミング言語で、多くの統計関数が組み込まれています。Rは、これらの高レベル行列プログラミング言語の機能を持ちながら、統計的環境も多く内蔵しています。
1.7 再現性
科学的研究は文書化され、再現可能である必要があります。観測データを使用した社会科学の研究では、研究方法、データ操作、およびコードの注意深い文書化とアーカイブが必要です。
ベストプラクティスとして、各発表論文には完全な再現パッケージ(データファイル、文書、およびプログラムコードファイルのセット)を作成する必要があります。これには、分析に使用された元データ、および論文で報告されたモデルを推定するためのプログラムが含まれます。多くのジャーナルは、著者が公開論文のデータセットを一般に利用可能にすることを要求しています。
Introduction to Econometrics (Stock and Watson)
1章 経済学の質問とデータ
計量経済学者に「計量経済学とは何か」と尋ねると、6人に聞けば6つの異なる答えが返ってくるかもしれません。ある人は計量経済学を「経済理論を検証する科学」と言い、別の人は「経済変数の将来の値を予測するためのツール」と言うかもしれません。また、ある人は「数学的な経済モデルを実世界のデータに適合させるプロセス」と答え、さらに別の人は「政府やビジネスにおいて歴史的なデータを使用して数値的な政策提言を行う科学と技術」と言うでしょう。
これらの答えはすべて正しいのです。広い意味で、計量経済学とは、経済理論と統計技術を用いて経済データを分析する科学と技術です。計量経済学の方法は、金融、労働経済学、マクロ経済学、ミクロ経済学、マーケティング、経済政策など、多くの経済学の分野で使用されています。計量経済学の方法は、政治学や社会学など他の社会科学でも広く使われています。
このテキストでは、計量経済学者が使用する主要な方法を紹介します。これらの方法を使用して、ビジネスや政府政策の世界から具体的で定量的な質問に答えます。この章では、その質問の4つを提示し、計量経済学のアプローチについて概説します。また、計量経済学者がこれらやその他の定量的な経済質問に答えるために利用する主なデータの種類についても紹介します。
1.1 我々が検討する経済学の質問
経済学、ビジネス、政府の多くの決定は、周囲の世界の変数間の関係を理解することにかかっています。これらの決定には、定量的な質問に対する定量的な答えが必要です。
このテキストでは、現在の経済問題から取られた定量的な質問をいくつか検討します。その中の4つの質問は、教育政策、住宅ローンにおける人種差別、タバコの消費、マクロ経済予測に関するものです。
質問1:クラスサイズの縮小は小学校の教育を改善するか?
アメリカの公教育システムの改革提案は、激しい議論を引き起こします。多くの提案は、小学校の若い生徒に関するものです。小学校教育には、社会技能の発展などさまざまな目的がありますが、多くの親や教育者にとって最も重要な目的は、基本的な学習、つまり読み書きや基本的な算数です。基本的な学習を改善するための有力な提案の一つは、小学校のクラスサイズを縮小することです。クラスの生徒数が減ることで、各生徒が教師の注意をより多く受け、クラスの混乱が少なくなり、学習が向上し、成績が上がるという考えです。
しかし、クラスサイズを縮小することが小学校教育にどのような具体的な影響を与えるのか?クラスサイズの縮小には費用がかかります。教師を増やす必要があり、学校がすでに満員の場合は教室を増設する必要があります。意思決定者は、これらの費用と利益を比較検討しなければなりません。しかし、利益を比較するためには、意思決定者はその利益の具体的な定量的理解が必要です。小さいクラスサイズの学習効果は大きいのか、小さいのか?実際には、小さいクラスサイズが基本的な学習に影響を与えない可能性もあります。
常識や日常の経験は、生徒が少ないと学習が増えると示唆するかもしれませんが、常識だけではクラスサイズを縮小することが基本的な学習に与える具体的な影響を定量的に答えることはできません。そのためには、クラスサイズと基本的な学習に関するデータに基づく実証的証拠を調べる必要があります。
このテキストでは、1999年にカリフォルニア州の420の学区から収集されたデータを使用して、クラスサイズと基本的な学習の関係を検討します。カリフォルニア州のデータでは、小さいクラスサイズの学区の生徒は、大きいクラスサイズの学区の生徒よりも標準テストの成績が良い傾向にあります。この事実は、小さいクラスがより良いテストの成績を生むという考えと一致していますが、実際には小さいクラスの学区の生徒が他の多くの利点を持っているだけかもしれません。例えば、小さいクラスサイズの学区は裕福な住民が多い傾向にあるため、小さいクラスサイズの学区の生徒は教室外での学習の機会が多い可能性があります。これらの追加の学習機会が高いテストスコアの原因であり、小さいクラスサイズが原因ではないかもしれません。
第II部では、多重回帰分析を使用して、クラスサイズの変更が他の要因、例えば生徒の経済的背景の変更から分離してその影響を分析します。
質問2:住宅ローン市場における人種差別は存在するか?
多くの人は、住宅ローンという大規模な借金を利用して家を購入します。アメリカの法律では、貸出機関が住宅ローンの承認または拒否を決定する際に人種を考慮することはできません。同じ条件の申請者は、人種を除いて同等の可能性で住宅ローンの申請が承認されるべきです。理論的には、住宅ローンの貸し付けに人種的な偏見は存在しないはずです。
しかし、この理論的な結論に反して、ボストン連邦準備銀行の研究者は1990年代初頭のデータを使用して、黒人申請者の28%が住宅ローンを拒否される一方で、白人申請者の9%しか拒否されないことを発見しました。これらのデータは、実際に住宅ローンの貸し付けに人種的な偏見が存在することを示しているのでしょうか?もしそうであれば、その偏見の大きさはどの程度でしょうか?
ボストン連邦準備銀行のデータで黒人と白人の申請者が拒否される割合が異なるという事実だけでは、住宅ローンの貸し付けに差別が存在する証拠にはなりません。黒人と白人の申請者は、人種以外の多くの点で異なります。住宅ローン市場に偏見があると結論付ける前に、これらのデータを詳しく調べ、他の条件が同じである申請者間で拒否される確率に差があるかどうかを確認する必要があります。これを行うために、第11章では、他の申請者の特徴、特にローンの返済能力を一定に保ちながら、人種が住宅ローンの取得確率に与える影響を定量化する計量経済学の方法を紹介します。
質問3:医療支出は健康結果を改善するか?
誰もが永遠に生きることはできませんが、回避可能な死亡は医療の提供によって減らすことができ、生存期間を延ばすことも可能です。医療には、個人の健康関連の生活の質を向上させるなど、他にも有益な効果があります。これらの目的のために、世界中で膨大な量の資源が医療提供に費やされています。さらに、各国間で医療支出には絶対額および一人当たりの額に大きな差があり、健康結果にも差があります。例えば、出生時の平均寿命で測定されます。
医療が健康に悪いという考え(医原性)の懸念を脇に置いておくと、基本的な経済学は、医療支出が増加すれば回避可能な死亡が減少するはずだと言います。しかし、どれくらいの割合で減少するのでしょうか?医療支出が1%増加すると、回避可能な死亡は何%減少するのでしょうか?医療支出の1%増加によって回避可能な死亡がどれだけ減少するかの割合は、死亡に対する支出の弾力性(需要の価格弾力性に類似)です。回避可能な死亡を20%減少させたい場合、必要な医療支出の増加を計算するためには、この弾力性の値を知る必要があります。
多くの政策目標は、回避可能な死亡の削減目標に基づいています。例えば、国連開発計画(UNDP)の持続可能な開発目標の一つは、すべての国が「5歳未満の死亡率を1000出生あたり25以下に削減する」ことを目指すことです。しかし、この目標はどのように達成すべきでしょうか?医療サービスを拡大することによってでしょうか?それとも他のサービスによってでしょうか?医療支出を増やすことが政策の一部となる場合、それを達成するためにどれくらいの増加が必要でしょうか?これらの答えは、死亡に対する支出弾力性の推定値から得ることができます。
経済理論は、健康生産関数のように、健康結果を改善するための入力の組み合わせを分析するのに役立ちますが、死亡に対する支出弾力性のようなパラメータの実際の値は教えてくれません。その値を推定するためには、医療支出のリターンに関する実証的な証拠を調べる必要があります。例えば、各国の医療支出と死亡率のデータを使用して推定することができます。多くの年、経済学者はこの質問に答えようとしてきましたが、そのような実証研究には多くの課題があります。その中でも特に大きな課題は、各国間の広範な異質性です。第一の課題は観察可能な異質性であり、各国の死亡率に影響を与える要因で、医療支出にも関連している可能性があります。例えば、一人当たりの所得です。これらの要因は観察可能なため、複数回帰分析を使用して制御することができます。第二の課題は、観察不可能な異質性の存在です。観察不可能な要因は、医療支出の決定と達成された健康結果の全体レベルを決定する基礎的なプロセスにおいて重要である可能性があります。これらの要因により、因果関係は両方向に進むことがあります。医療は死亡率を減少させますが、高い医療支出は自然災害のような観察不可能な要因に対する反応である可能性があります。これらの「同時因果性」を扱う方法は、第12章で説明されており、概念的には類似した文脈であるタバコの価格弾力性の推定に適用されています。
質問4:来年のアメリカのGDPはどれくらい成長するか?
人々は常に未来を予測したがります。新しい設備に投資を考えている企業の来年の売上はどうなるでしょうか?来月の株式市場は上がるでしょうか?上がるとしたらどれくらいでしょうか?来年の市の税収は、市のサービスに計画された支出をカバーするでしょうか?来週のミクロ経済学の試験は外部性についてか、それとも独占についてでしょうか?土曜日はビーチに行くのに良い天気でしょうか?
マクロ経済学者が特に関心を持つ未来の一つの側面は、翌年の実質経済活動の成長率です。管理コンサルティング会社は、経済成長の楽観的な予測に基づいて製造業の顧客に能力拡張を勧めるかもしれません。ワシントンD.C.の連邦準備制度理事会のエコノミストは、実質GDPをその潜在水準に近づけ、雇用を最大化する政策を設定することを義務付けられています。彼らが翌年のGDP成長率の低迷を予測するなら、経済活動を促進するために金利を引き下げるなどの措置を講じるかもしれません。
数値予測に依存するプロのエコノミストは、計量経済学のモデルを使用して予測を行います。予測者の仕事は過去のデータを使用して未来を予測することです。計量経済学者は経済理論と統計技術を使用して歴史的データの関係を定量化します。
GDPの成長率を予測するために使用するデータには、過去のGDPの値とアメリカのいわゆるタームスプレッドが含まれます。タームスプレッドは長期金利と短期金利の差であり、将来の短期金利が上昇するか下がるかについての投資家の期待を反映します。タームスプレッドは通常正の値ですが、景気後退の開始前には急激に低下する傾向があります。第15章では、タームスプレッドに基づいたGDP成長率の予測を開発し評価します。
定量的な質問、定量的な答え
これらの4つの質問はすべて数値的な答えを必要とします。経済理論はその答えに関する手がかりを提供します。例えば、タバコの価格が上がればタバコの消費量が減少するはずですが、実際の数値はデータを分析して学ばなければなりません。データを使用して定量的な質問に答えるため、私たちの答えには常に不確実性が伴います。異なるデータセットは異なる数値的な答えをもたらすでしょう。したがって、分析の概念的枠組みは、質問に対する数値的な答えとその答えの精度を測る方法の両方を提供する必要があります。
このテキストで使用する概念的枠組みは、多重回帰モデルです。これは計量経済学の基礎です。このモデルは、一つの変数の変化が他の変数に与える影響を定量化する数学的な方法を提供します。例えば、クラスサイズの変化が、学校区管理者が制御できない生徒の特性(例えば家庭の収入)を一定に保ちながら、テストのスコアにどのような影響を与えるか。あなたの人種が、ローンの返済能力など他の要因を一定に保ちながら、住宅ローンの申請が承認される確率にどのような影響を与えるか。タバコの価格が1%上がると、タバコの消費量にどのような影響を与えるか(喫煙者や潜在的な喫煙者の収入を一定に保ちながら)。多重回帰モデルとその拡張は、データを使用してこれらの質問に答え、その答えに伴う不確実性を定量化するための枠組みを提供します。
1.2 因果効果と理想的な実験
計量経済学で遭遇する多くの質問と同様に、セクション1.1の最初の3つの質問は、変数間の因果関係に関するものです。一般的な使用法では、ある行動が結果を直接もたらす場合、その行動が結果を引き起こすと言います。例えば、熱いストーブに触れると火傷する、水を飲むと喉の渇きが癒える、タイヤに空気を入れると膨らむ、トマトの植物に肥料を与えるとより多くのトマトが生産される。因果関係とは、特定の行動(肥料の施用)が特定の測定可能な結果(トマトの増産)をもたらすことを意味します。
因果効果の推定
100グラムの肥料を1平方メートルあたりに施用することがトマトの収量(キログラムで測定)に与える因果効果をどのように測定するのが最良でしょうか?
一つの方法は実験を行うことです。その実験では、園芸研究者が多くのトマトの区画を植えます。各区画は、肥料の有無以外は同一の手入れを行います。肥料を与えるかどうかはコンピュータでランダムに決定され、区画が日当たりが良いかどうかと肥料を与えるかどうかとの間に体系的な関係がないようにします。成長期の終わりに、園芸研究者は各区画から収穫された作物を計量します。処理区と非処理区の平均収量の差が、肥料処理のトマト生産に対する効果です。
これはランダム化対照試験の一例です。対照群(肥料なし)と処理群(100 g/m²の肥料)があるという意味で対照されており、処理がランダムに割り当てられるという意味でランダム化されています。このランダム割り当てにより、処理群と対照群の間の違いが処理以外に体系的に存在する可能性が排除されます。この実験が適切に大規模に実施されれば、処理(100 g/m²の肥料施用)がトマト生産に与える因果効果を推定することができます。
このテキストでは、因果効果は理想的なランダム化対照試験で測定された結果の行動や処置の効果として定義されます。このような実験では、処理群と対照群の間の結果の違いの唯一の体系的な理由が処理自体であるということです。
セクション1.1の最初の3つの質問に答えるための理想的なランダム化対照試験を想像することができます。例えば、クラスサイズの研究では、異なるクラスサイズの「処置」をランダムに学生グループに割り当てることを想像できます。この実験が、クラスサイズ以外のすべての要因を一定に保ちながら設計され実行された場合、この実験は理論的には、すべての他の条件を一定に保ちながらクラスサイズを削減することがテストのスコアに与える影響を推定します。
計量経済学では実験が広く使用されていますが、多くの応用分野では、倫理的な理由や満足のいく実行が不可能、時間がかかりすぎる、または費用がかかりすぎるため、実験は選択肢になりません。非実験データでも、理想的なランダム化対照試験の概念は重要です。なぜなら、それが因果効果の定義を提供するからです。
予測、予報、および因果関係
セクション1.1の最初の3つの質問は因果効果に関するものですが、4つ目の質問(GDP成長率の予測)はそうではありません。
予測とは、ある変数に関する情報を使用して別の変数の値についての声明を行うことです。予報とは、将来のある変数の値についての予測です。例えば、来年のGDP成長率です。
良い予測をするために因果関係を知る必要はありません。雨が降っているかどうかを「予測」する良い方法は、歩行者が傘を使っているかどうかを観察することです。しかし、傘を使う行為が雨を降らせるわけではありません。
少数の予測因子があり、データが時間とともに進化しない場合、パートIIの多重回帰法は信頼性の高い予測を提供することができます。しかし、多くの候補となる予測因子がある場合、予測はしばしば改善されます。多くの予測因子を使用する方法は第14章で説明されます。
予報とは、将来についての予測であり、時間とともに進化する変数に関するデータを使用します。これにより、新しい課題と機会が生まれます。第15章では、多重回帰分析を使用して、過去の関係を定量化し、その関係が時間とともに安定しているかどうかを確認し、将来についての定量的な予測を行い、予測の精度を評価します。
1.3 データ:ソースと種類
計量経済学では、データは実験または世界の非実験的観察のどちらかから得られます。このテキストでは、実験データと非実験データの両方を検討します。
実験データと観察データ
実験データは、処置や政策を評価するため、または因果効果を調査するために設計された実験から得られます。例えば、テネシー州は1980年代にクラスサイズを調査する大規模なランダム化対照試験を資金提供しました。その実験では、何千人もの生徒が数年間にわたって異なるクラスサイズにランダムに割り当てられ、毎年標準テストを受けました。
テネシー州のクラスサイズ実験には数百万ドルの費用がかかり、数年間にわたって多くの管理者、親、教師の協力が必要でした。実際の人間の被験者を使った実験は管理や制御が難しいため、理想的なランダム化対照試験に比べて欠陥があります。さらに、いくつかの状況では、実験は費用がかかりすぎるだけでなく、非倫理的です(ランダムに選ばれたティーンエイジャーに安価なタバコを提供してどれだけ購入するかを見るのは倫理的でしょうか?)。これらの財政的、実際的、倫理的な問題のため、経済学における実験は比較的少ないです。代わりに、多くの経済データは現実の行動を観察して得られます。
実験環境の外で実際の行動を観察することで得られたデータを観察データと呼びます。観察データは、消費者への電話調査や、貸出機関が保有する住宅ローンの歴史的記録などの行政記録を使用して収集されます。
観察データは、因果効果を推定するための計量経済学の試みに対して大きな課題を提示します。実世界では、「処置」(トマトの例での肥料の量、クラスサイズの例での生徒対教師の割合)のレベルはランダムに割り当てられないため、「処置」の効果を他の関連する要因から分離することが難しいです。計量経済学の多くとこのテキストの多くは、実世界のデータを使用して因果効果を推定する際に遭遇する課題に対処するための方法に専念しています。
データが実験的であれ観察的であれ、データセットには3つの主要なタイプがあります:横断データ、時系列データ、およびパネルデータです。このテキストでは、これら3つのタイプすべてを扱います。
横断データ
横断データは、労働者、消費者、企業、政府単位など、異なるエンティティに関する単一時点のデータです。例えば、カリフォルニア州の学区のテストスコアに関するデータは横断データです。これらのデータは、単一の時点(1999年)で420のエンティティ(学区)に関するものです。一般的に、観察対象のエンティティの数はnで表されます。例えば、カリフォルニア州のデータセットではn=420です。
カリフォルニア州のテストスコアデータセットには、各学区のいくつかの異なる変数の測定値が含まれています。これらのデータの一部は表1.1に示されています。各行には異なる学区のデータが記載されています。例えば、最初の学区(「学区1」)の平均テストスコアは690.8です。これは、1999年にその学区の全5年生が受けた標準テスト(スタンフォード達成テスト)の数学と科学のテストスコアの平均です。その学区の平均生徒対教師の割合は17.89です。つまり、その学区の生徒数をその学区の教室教師の数で割った値が17.89です。学区1の生徒1人当たりの平均支出は6385ドルです。その学区の生徒のうち、まだ英語を学んでいる生徒(つまり、英語が第二言語であり、まだ英語に堪能でない生徒)の割合は0%です。
他の行には、他の学区のデータが記載されています。行の順序は任意であり、観察番号はデータを整理するために任意に割り当てられた番号です。表を見てわかるように、記載されているすべての変数は大きく変動しています。
横断データを使用すると、単一の時点で人々、企業、または他の経済エンティティ間の違いを研究することで、変数間の関係について学ぶことができます。
時系列データ
時系列データは、複数の時点で収集された単一エンティティ(個人、企業、国)のデータです。アメリカのGDP成長率とタームスプレッドに関するデータセットは、時系列データの一例です。このデータセットには、単一エンティティ(アメリカ)の2つの変数(GDP成長率とタームスプレッド)に関する観察が含まれています。このデータセットの各時点は四半期です(第1四半期は1月、2月、3月、第2四半期は4月、5月、6月など)。このデータセットの観察は1960年第1四半期(1960:Q1)から始まり、2017年第4四半期(2017:Q4)まで続きます。時系列データセットの観察数(つまり時点)はTで表されます。1960:Q1から2017:Q4まで232四半期あるため、このデータセットにはT=232の観察が含まれています。
このデータセットの一部の観察は表1.2に示されています。各行のデータは異なる時点(年と四半期)に対応しています。例えば、1960年第1四半期には、GDPが年率8.8%成長しました。つまり、1960年第1四半期の成長率で4四半期続けば、GDPの水準は8.8%増加することになります。1960年第1四半期には、長期金利は4.5%で、短期金利は3.9%でした。その差であるタームスプレッドは0.6ポイントでした。
単一エンティティを時間を追って追跡することで、時系列データを使用して変数の進化を研究し、その変数の将来の値を予測することができます。
パネルデータ
パネルデータ(縦断データとも呼ばれる)は、複数のエンティティに関するデータで、各エンティティが2回以上の時点で観察されています。私たちのタバコ消費と価格に関するデータは、パネルデータセットの一例であり、そのデータセットの選択された変数と観察が表1.3に示されています。パネルデータセットのエンティティの数はnで表され、時点の数はTで表されます。タバコのデータセットでは、1985年から1995年までの11年間にわたり、48のアメリカ本土の州(エンティティ)の観察があります。したがって、n * T = 48 * 11 = 528の観察があります。
表1.3にはタバコ消費データセットの一部のデータが示されています。最初の48の観察ブロックには、1985年の各州のデータがアルファベット順にアラバマ州からワイオミング州までリストされています。次の48の観察ブロックには、1986年の各州のデータがリストされています。
要約
- ビジネスや経済学の多くの決定には、ある変数の変化が他の変数にどのような影響を与えるかの定量的な推定が必要です。
- 概念的には、因果効果を推定する方法は理想的なランダム化対照試験ですが、経済学における実験を行うことは倫理的でない場合や実行が困難、または費用がかかりすぎる場合があります。
- 計量経済学は、観察データ(非実験データ)や現実世界の不完全な実験データを使用して因果効果を推定するためのツールを提供します。
- 計量経済学は、他の関連変数の情報を使用して関心のある変数の値を予測するためのツールも提供します。
- 横断データは、単一の時点で複数のエンティティを観察して収集され、時系列データは複数の時点で単一のエンティティを観察して収集され、パネルデータは複数の時点で複数のエンティティを観察して収集されます。
第1章 経済学の質問とデータ
計量経済学とは何かについて、6人の計量経済学者に尋ねれば、6つの異なる答えが返ってくるかもしれません。ある人は、計量経済学は経済理論を検証する科学だと言うでしょう。別の人は、計量経済学は企業の売上や経済成長、株価などの経済変数の将来値を予測するためのツールのセットだと言うでしょう。さらに別の人は、計量経済学は数学的経済モデルを実データに適合させるプロセスだと言うかもしれません。4人目の人は、計量経済学は歴史的データを使用して政府や企業の政策提言を数値的に行う科学と芸術だと言うでしょう。
実際、これらすべての答えが正しいのです。広義には、計量経済学は経済理論と統計技術を用いて経済データを分析する科学と芸術です。計量経済学の手法は、金融、労働経済学、マクロ経済学、ミクロ経済学、マーケティング、経済政策など多くの経済学の分野で使用されています。また、計量経済学の手法は政治学や社会学など他の社会科学でも広く使われています。
このテキストでは、計量経済学者が使用する主要な手法のセットを紹介します。これらの手法を用いて、ビジネスや政府政策の世界からの具体的な定量的な質問に答えていきます。この章では、そのうちの4つの質問を提示し、それらに答えるための計量経済学的アプローチを一般的な観点から説明します。章の最後には、計量経済学者がこれらおよび他の定量的な経済質問に答えるために利用できる主要なデータの種類について概観します。
1.1 私たちが検討する経済学の質問
経済学、ビジネス、政府の多くの決定は、私たちの周りの世界における変数間の関係を理解することに依存しています。これらの決定には、定量的な質問に対する定量的な答えが必要です。
このテキストでは、現代の経済学の課題から選ばれた定量的な質問をいくつか検討します。そのうちの4つの質問は、教育政策、住宅ローン市場における人種差別、タバコ消費、マクロ経済予測に関するものです。
質問1:クラスサイズの縮小は小学校教育を改善するか?
米国の公教育制度の改革提案は熱い議論を引き起こします。多くの提案は、初等学校の最年少の生徒に関するものです。初等学校教育には、社会的スキルの発達などのさまざまな目的がありますが、多くの親や教育者にとって最も重要な目的は基本的な学力の習得です。読み書きや基本的な数学の学習です。基本的な学習を改善するための著名な提案の1つは、小学校でのクラスサイズを縮小することです。教室内の生徒数が少なくなれば、各生徒が教師の注意をより多く受け、クラスの混乱が少なくなり、学習が促進され、成績が向上するという論理です。
しかし、クラスサイズの縮小が小学校教育に具体的にどのような効果をもたらすのでしょうか?クラスサイズの縮小には費用がかかります。さらに多くの教師を雇い、学校が既に満員の場合は教室を増設する必要があります。意思決定者がより多くの教師を雇うことを検討する際には、これらの費用と利益を比較検討する必要があります。しかし、コストと利益を比較するためには、意思決定者は予想される利益について正確な定量的理解を持つ必要があります。クラスサイズの縮小による基本的な学習への効果は大きいのか小さいのか?小さいクラスサイズが実際には基本的な学習に何の影響も与えない可能性はあるのか?
常識や日常の経験は、学生数が少ないほど学習が進むことを示唆するかもしれませんが、常識だけではクラスサイズの縮小が基本的な学習に具体的にどのような効果をもたらすのかについて定量的な答えを提供することはできません。このような答えを提供するためには、クラスサイズと小学校での基本的な学習に関する実証的な証拠、つまりデータに基づく証拠を調査する必要があります。
このテキストでは、1999年にカリフォルニア州の420の学区から収集されたデータを使用して、クラスサイズと基本的な学習の関係を検討します。カリフォルニア州のデータでは、小さいクラスサイズの学区の学生は、大きなクラスサイズの学区の学生よりも標準テストで良い成績を収める傾向があります。この事実は、小さいクラスがより良いテストスコアを生むという考えと一致していますが、それは小さいクラスサイズの学区の学生が、大きなクラスサイズの学区の学生に比べて他の多くの利点を持っていることを反映しているだけかもしれません。例えば、小さいクラスサイズの学区は、大きなクラスサイズの学区よりも裕福な住民が多い傾向があるため、小さいクラスサイズの学区の学生は教室外での学習機会が多いかもしれません。これらの追加の学習機会が高いテストスコアの原因であり、小さいクラスサイズではないかもしれません。
パートIIでは、多重回帰分析を使用して、学生の経済的背景などの他の要因の変化からクラスサイズの変化の効果を分離します。
質問2:住宅ローン市場には人種差別が存在するのか?
ほとんどの人は、住宅を購入する際に住宅ローンという大規模なローンを利用します。法律では、米国の金融機関は住宅ローンの申請を承認するか拒否する際に人種を考慮してはならないとされています。したがって、人種以外のすべての点で同一の申請者は、住宅ローンの申請が承認される確率が等しいはずです。理論的には、住宅ローンの融資には人種的な偏見がないはずです。
この理論的な結論に反して、ボストン連邦準備銀行の研究者は(1990年代初頭のデータを使用して)、黒人申請者の28%が住宅ローンを拒否されている一方で、白人申請者の拒否率は9%であることを発見しました。これらのデータは、実際に住宅ローンの融資に人種的な偏見が存在することを示しているのでしょうか?もしそうなら、その偏見はどの程度大きいのでしょうか?
ボストン連邦準備銀行のデータでは、黒人申請者の拒否率が白人申請者の拒否率よりも高いという事実だけでは、住宅ローン融資者による差別の証拠を提供しているわけではありません。黒人申請者と白人申請者は、人種以外の多くの点で異なるためです。住宅ローン市場に偏見が存在するという結論を出す前に、これらのデータを詳しく調べて、他のすべての特徴が同一の申請者の拒否率に違いがあるかどうか、そしてその違いが大きいか小さいかを確認する必要があります。そのために、第11章では、他の申請者の特徴、特にローン返済能力を一定に保ちながら、人種が住宅ローン申請の承認確率に与える影響を定量化するための計量経済学的方法を紹介します。
質問3:医療費の支出は健康結果を改善するのか?
誰もが永遠に生きることはできませんが、医療の提供により回避可能な死亡を減らし、寿命を延ばすことができます。医療には他にも、個々の健康関連の生活の質を向上させるなどの有益な効果があります。これらの目的やその他の目的のために、世界中で膨大な量のリソースが医療の提供に充てられています。さらに、医療費の絶対的および一人当たりの支出には国ごとに大きな差があり、出生時の平均寿命などの健康結果にも国ごとに大きな差があります。
医療が健康に悪影響を与えるというアイデアを脇に置いておくと、基本的な経済学では、医療費の増加は一般的に回避可能な死亡を減少させるべきだと言っています。しかし、どの程度の効果があるのでしょうか?医療費が1%増加した場合、回避可能な死亡は何パーセント減少するでしょうか?医療費の1%の増加に対する回避可能な死亡のパーセンテージ変化は、死亡率の支出弾力性です(これは、価格の1%の増加に対する需要の数量のパーセンテージ変化である価格弾力性に類似しています)。回避可能な死亡を20%減少させるためには、支出弾力性を知る必要があります。
多くの政策目標は、回避可能な死亡率の削減目標に基づいています。例えば、国連開発計画(UNDP)の持続可能な開発目標の1つは、「5歳未満の死亡率を1,000人の出生あたり25未満に削減することを目指す」ことです。しかし、この目標をどのように達成すればよいのでしょうか?医療サービスを拡大するのか、それとも他のサービスを提供するのか?医療費の増加が政策の一部を占める場合、それを達成するためにどの程度増加させる必要があるのでしょうか?これらの答えは、死亡率の支出弾力性の推定値から得られます。
経済理論、例えば健康の生産関数は、健康結果を改善するための入力の組み合わせを分析するのに役立ちますが、支出弾力性などのパラメーターの実際の値を教えてくれるわけではありません。その値を推定するためには、国ごとの医療費と死亡率のデータを調査しなければなりません。
長年、経済学者は、国ごとの医療費と死亡率のデータを考慮してこの問題に取り組んできましたが、そのような実証研究は多くの課題に直面しています。最大の課題の2つは、国ごとの異質性の広範な存在です。第1の課題は観察可能な異質性であり、各国の一人当たりの所得など、医療費に関連する要因を考慮することです。これらの要因は分析者にとって観察可能であるため、多重回帰分析を使用して制御できます。第2の、より厄介な課題は、観察不可能な異質性の存在です。観察されていない要因は、医療費の支出額や達成された健康結果の全体的なレベルを決定する基礎的なプロセスにおいて重要です。これらの要因は、因果関係が両方向に流れる結果をもたらします。つまり、医療が死亡率を減少させる一方で、医療費の増加は、死亡率を増加させる小さな自然災害などの観察されていない要因に対する反応であるかもしれません。第12章では、タバコの需要の価格弾力性の推定における同様の概念的な文脈で、この「同時因果関係」に対処する方法を説明します。
質問4:来年の米国のGDP成長率はどのくらいか?
人々は常に未来を予測したがります。新しい設備投資を検討している企業の来年の売上はどうなるでしょうか?来月の株価は上がるのでしょうか?上がるとしたらどの程度でしょうか?来年の市税収入は、市サービスへの予定支出をカバーできるのでしょうか?来週のミクロ経済学の試験は外部性に焦点を当てるのでしょうか?独占に焦点を当てるのでしょうか?土曜日はビーチに行くのに良い天気になるでしょうか?
マクロ経済学者が特に興味を持つ未来の1つの側面は、次の年の実質経済活動の成長、つまり実質国内総生産(GDP)で測定される成長です。経済成長の楽観的な予測に基づいて製造業の顧客に能力拡大を勧めるかもしれません。ワシントンD.C.の連邦準備制度理事会の経済学者は、実質GDPが潜在的なレベルに近い状態を維持し、雇用を最大化するための政策を設定する使命を持っています。彼らが来年のGDP成長率が低迷すると予測する場合、金利を引き下げるなどの措置を通じて経済活動を活性化させるために流動性を拡大するかもしれません。
数値予測に依存する専門の経済学者は、計量経済学モデルを使用してその予測を行います。予測者の仕事は、過去のデータを使用して未来を予測することです。計量経済学者は、経済理論と統計技術を使用して、歴史的データの関係を定量化します。
GDPの成長率を予測するために使用するデータには、過去のGDPの値と米国のいわゆるタームスプレッドが含まれます。タームスプレッドは長期金利と短期金利の差であり、投資家が将来の短期金利の上昇または下降を予期しているかどうかを測定します。タームスプレッドは通常正の値ですが、不況の前には急激に低下する傾向があります。第15章で開発および評価するGDP成長率の予測の1つは、タームスプレッドに基づいています。
定量的な質問と定量的な答え
これらの4つの質問のそれぞれは、数値的な答えを必要とします。経済理論はその答えについての手がかりを提供します。例えば、タバコの消費は価格が上がると減少するべきですが、その数値的な答えは実証的に学ばなければなりません。データを使用して定量的な質問に答えるため、私たちの答えには常にある程度の不確実性があります。異なるデータセットは異なる数値の答えを生み出すでしょう。したがって、分析の概念的な枠組みは、質問に対する数値的な答えとその答えの精度の程度を提供する必要があります。
このテキストで使用される概念的な枠組みは、多重回帰モデルです。このモデルは、ある変数が他の変数に与える影響を、他の要因を一定に保ちながら定量化する数学的な方法を提供します。例えば、クラスサイズの変更がテストのスコアに与える影響を、学校地区の管理者が制御できない学生の特性(家族の収入など)を一定に保ちながら評価します。人種が住宅ローン申請の承認確率に与える影響を、ローンの返済能力などの他の要因を一定に保ちながら評価します。タバコの価格が1%上昇した場合のタバコ消費への影響を、喫煙者や潜在的な喫煙者の収入を一定に保ちながら評価します。多重回帰モデルとその拡張は、これらの質問にデータを使用して答えるための枠組みを提供し、その答えに伴う不確実性を定量化します。
1.2 因果効果と理想化された実験
計量経済学で遭遇する多くの質問と同様に、セクション1.1の最初の3つの質問は変数間の因果関係に関するものです。一般的な用法では、行動が結果を直接引き起こす場合、その行動は結果を引き起こしたと言います。熱いストーブに触れると火傷をします。水を飲むと喉の渇きが和らぎます。タイヤに空気を入れると膨らみます。トマトの苗に肥料を与えるとトマトの収量が増えます。因果関係とは、特定の行動が特定の、測定可能な結果を引き起こすことを意味します。
トマトの収量に対する100グラムの肥料の影響をどうやって測定するのが最適でしょうか?
その影響を測定する一つの方法は、実験を行うことです。その実験では、多くのトマトの区画を植え、それぞれの区画を同一の方法で管理し、一部の区画には100グラムの肥料を与え、他の区画には肥料を与えないようにします。どの区画に肥料を与えるかはコンピュータでランダムに決定され、区画の違いは肥料を与えるかどうかとは無関係です。収穫期の終わりに、園芸家は各区画の収穫量を測定します。処理された区画と未処理の区画の平均収量の差が肥料処理のトマト生産への影響です。
これはランダム化比較試験の一例です。これは、処理を受ける群(100g/m2の肥料を与えられた群)と処理を受けない群(肥料を与えられなかった群)があるという意味で制御されたものであり、処理はランダムに割り当てられるという意味でランダム化されています。このランダムな割り当てにより、日当たりの良さと肥料を与えられるかどうかの間に系統的な関係が生じる可能性が排除され、処理群と対照群の唯一の系統的な違いは処理そのものです。この実験が適切に実施され、十分な規模で実施されれば、処理(100g/m2の肥料を与えること)が興味のある結果(トマト生産)に与える因果効果を推定することができます。
このテキストでは、因果効果とは、理想的なランダム化比較試験で測定される特定の行動や処理が結果に与える影響と定義されています。そのような実験では、処理群と対照群の間の結果の違いの唯一の系統的な理由は処理そのものです。
セクション1.1の最初の3つの質問に答えるための理想的なランダム化比較試験を想像することは可能です。例えば、クラスサイズを研究するために、異なるクラスサイズの「処理」を異なる学生グループにランダムに割り当てることを想像することができます。実験が設計され、実行され、クラスサイズ以外の唯一の系統的な違いがない場合、この実験は理論的には他のすべてを一定に保ちながらクラスサイズの削減がテストスコアに与える影響を推定するでしょう。
実験は計量経済学でますます広く使用されるようになっています。しかし、多くの応用では、倫理的、実行不可能、時間がかかりすぎる、または非常に高価であるため、実験は選択肢になりません。非実験データでも、理想的なランダム化比較試験の概念は重要です。因果効果の定義を提供するからです。
予測、予報、および因果関係
セクション1.1の最初の3つの質問が因果効果に関するものであるのに対し、4つ目の質問はGDPの成長率の予測に関するものです。
予報は、予測と呼ばれることもありますが、いくつかの変数に関する情報を使用して別の変数の値についての声明を行うことです。予報は、例えば来年のGDP成長率のように、将来の変数の値についての予測です。
因果関係を知らなくても良い予測をすることは可能です。雨が降っているかどうかを「予測」する良い方法は、歩行者が傘を使用しているかどうかを観察することですが、傘を使用することが雨を降らせる原因ではありません。
少数の予測変数があり、データが時間の経過とともに変化しない場合、パートIIの多重回帰法は信頼性のある予測を提供できます。しかし、多数の予測変数がある場合は、予測を改善することができます。多くの予測変数を使用する方法は第14章で説明します。
予測、つまり将来についての予測は、時間の経過とともに変化する変数に関するデータを使用します。これは新しい課題と機会をもたらします。第15章で見るように、多重回帰分析は過去の関係を定量化し、その関係が時間の経過とともに安定しているかどうかを確認し、将来についての定量的な予測を行い、その予測の精度を評価することができます。
1.3 データの種類とその出典
計量経済学では、データは実験または非実験的な観察のどちらかから得られます。このテキストでは、実験データと非実験データの両方を検討します。
実験データと観察データ
実験データは、処理や政策を評価するため、または因果効果を調査するために設計された実験から得られます。例えば、テネシー州は1980年代にクラスサイズを調査する大規模なランダム化比較試験を実施しました。その実験では、何千人もの学生がランダムに異なるクラスサイズに割り当てられ、毎年標準化されたテストを受けました。
テネシー州のクラスサイズ実験は数百万ドルの費用がかかり、数年にわたって多くの管理者、親、教師の協力を必要としました。実際の人間の被験者を用いた実験は、管理と制御が難しいため、理想的なランダム化比較試験に比べて欠陥があります。さらに、一部の状況では、実験は費用が高いだけでなく、実施が困難であるだけでなく、非倫理的でもあります(例えば、無作為に選ばれたティーンエイジャーに安価なタバコを提供してどれだけ購入するかを調べるのは倫理的でしょうか?)。これらの財政的、実際的、倫理的な問題のため、経済学における実験は比較的稀です。代わりに、ほとんどの経済データは実際の行動を観察することによって得られます。
実験環境外での実際の行動を観察して得られたデータは、観察データと呼ばれます。観察データは、消費者への電話調査や、金融機関によって保持されている住宅ローン申請に関する歴史的記録などの調査を使用して収集されます。
観察データは、計量経済学が因果効果を推定する試みに対して大きな課題を提示します。計量経済学のツールは、これらの課題に対処するために設計されています。現実の世界では、「処理」のレベル(トマトの例では肥料の量、クラスサイズの例では学生と教師の比率)がランダムに割り当てられることはないため、「処理」の影響を他の関連要因から分離するのは難しいのです。計量経済学の多くの部分、そしてこのテキストの多くの部分は、現実のデータを使用して因果効果を推定する際に直面する課題に対処する方法に焦点を当てています。
データが実験データであれ観察データであれ、データセットには主に3つの種類があります:横断データ、時系列データ、パネルデータ。このテキストでは、これらのすべての種類のデータに出会うでしょう。
横断データ
異なるエンティティ(労働者、消費者、企業、政府単位など)に関する単一の時間点でのデータは、横断データと呼ばれます。例えば、カリフォルニア州の学区のテストスコアに関するデータは横断データです。これらのデータは、単一の時間点(1999年)の420のエンティティ(学区)に関するものです。一般的に、観察されるエンティティの数はnで表されます。したがって、カリフォルニアのデータセットでは、n = 420です。
カリフォルニアのテストスコアデータセットには、各学区に関するいくつかの異なる変数の測定値が含まれています。これらのデータの一部は表1.1に示されています。各行には、異なる学区のデータが一覧表示されています。例えば、最初の学区の平均テストスコア(「学区1」)は690.8です。これは、その学区のすべての5年生の数学と科学のテストスコアの平均です。学区1の学生と教師の比率の平均は17.89です。つまり、学区1の生徒数を学区1の教室教師の数で割ったものです。学区1の生徒1人当たりの平均支出は6,385ドルです。その学区でまだ英語を学んでいる生徒の割合、つまり英語が第二言語であり、まだ英語に習熟していない生徒の割合は0%です。他の行には他の学区のデータが示されています。行の順序は任意であり、学区の番号はデータを整理するために任意に割り当てられた番号です。表に示されているように、すべての変数は大きく異なります。
横断データを使用すると、単一の時間点で異なる人々、企業、または他の経済エンティティ間の違いを研究することによって、変数間の関係を学ぶことができます。
時系列データ
時系列データは、単一のエンティティ(人、企業、国)に関する複数の時間点で収集されたデータです。米国のGDP成長率とタームスプレッドに関するデータセットは、時系列データセットの一例です。このデータセットには、単一のエンティティ(米国)の2つの変数(GDP成長率とタームスプレッド)に関する232の観察値が含まれています。このデータセットの各時間点は四半期です(第1四半期は1月、2月、3月、第2四半期は4月、5月、6月など)。このデータセットの観察は、1960年の第1四半期(1960:Q1)から始まり、2017年の第4四半期(2017:Q4)までです。時系列データセットの観察数はTで表されます。したがって、1960:Q1から2017:Q4までの232四半期があるため、このデータセットにはT = 232の観察値が含まれています。
このデータセットの一部の観察値は表1.2に示されています。各行のデータは異なる時間点(年と四半期)に対応しています。例えば、1960年第1四半期には、GDPは年率で8.8%成長しました。言い換えれば、1960年第1四半期の成長率で4四半期が続けば、GDPのレベルは8.8%増加することになります。1960年第1四半期の長期金利は4.5%、短期金利は3.9%であり、その差、つまりタームスプレッドは0.6パーセントポイントです。
単一のエンティティを時間の経過とともに追跡することによって、時系列データを使用して変数の進化を研究し、将来の値を予測することができます。
パネルデータ
パネルデータ、または縦断データは、複数のエンティティに関するデータであり、各エンティティが2つ以上の時間点で観察されます。タバコの消費と価格に関するデータはパネルデータセットの一例であり、そのデータセットの一部の変数と観察値が表1.3に示されています。パネルデータセットのエンティティの数はnで表され、時間点の数はTで表されます。タバコのデータセットでは、48の州(エンティティ)の観察があり、1985年から1995年までの11年間(時間点)の観察があります。したがって、総観察数はnT = 4811 = 528です。
タバコの消費データセットの一部のデータは表1.3に示されています。最初の48の観察値のブロックには、1985年の各州のデータがアルファベット順にアラバマからワイオミングまで示されています。次の48の観察値のブロックには、各州の1986年のデータが示されています。
まとめ
- ビジネスや経済の多くの決定には、ある変数が別の変数にどのように影響するかについての定量的な推定が必要です。
- 概念的には、因果効果を推定する方法は理想的なランダム化比較試験にありますが、経済的な応用において実験を行うことは非倫理的、非現実的、または高価すぎる場合があります。
- 計量経済学は、観察データまたは現実の不完全な実験データを使用して因果効果を推定するためのツールを提供します。
- 計量経済学は、関連する変数の情報を使用して興味のある変数の値を予測するためのツールも提供します。
- 横断データは、単一の時間点で複数のエンティティを観察して収集されます。時系列データは、単一のエンティティを複数の時間点で観察して収集されます。パネルデータは、複数のエンティティを観察し、各エンティティを複数の時間点で観察して収集されます。
計量経済学でのおすすめ教科書・テキスト
計量経済学のおすすめ書籍
難易度分けのランキング
書籍の概要、ポイント
各書籍の概要/目次/ポイントを記載してます。
入門〜中級
中級〜上級
上級〜
計量トピック
計量の統計、数学
【マクロ経済学】おすすめ本(入門,大学学部,大学院でのテキスト)も確認する
【ミクロ経済学】おすすめ本(入門,大学学部,大学院でのテキスト)も確認する
【ゲーム理論 – おすすめ教科書・参考書(入門,学部,大学院】も確認する