2.4.3近似する実験

私たちは、私たちが行うことができない実験を近似することができます。特にデジタル時代の恩恵を受け2つのアプローチが一致すると自然実験されています。

多くの重要な科学と政策の質問は因果関係があります。賃金に職業訓練プログラムの効果は何である:のは、例えば、次の質問を考えてみましょうか?この質問に答えるための一つの方法は、労働者がランダムに訓練を受けるか、訓練を受けていないかのいずれかに割り当てられたランダム化比較試験であろう。その後、研究者は、単にそれを受け取っていないものに訓練を受けた人々の賃金を比較することにより、これらの参加者のための研修の効果を見積もることができます。

ランダム化:単純な比較はためにデータがあっても収集される前に発生したもので有効です。ランダム化がなければ、問題ははるかに複雑です。研究者が自主的にサインアップをしなかった人にトレーニングにサインアップした人の賃金を比較することができます。その比較は、おそらく訓練を受けた人々がより獲得したことを示しているが、人々は、トレーニングのためのサインアップは、訓練のためのサインアップしないものと異なっていることため、どれだけこののためのトレーニング、どのくらいこののであることはあるのでしょうか?換言すれば、人のこれら二つのグループの賃金を比較するために公平ですか?

公正な比較については、この懸念は、実験を実行せずに因果見積りを行うことは不可能であると信じているいくつかの研究をリードしています。この主張は行き過ぎ。それは実験が因果効果のための最も強力な証拠を提供することは事実ですが、貴重な因果推定値を提供することができ、他の戦略があります。代わりに、因果推定が(受動的にデータを観察する場合には)(実験の場合には)容易または不可能であることを考えると、最強から最弱に連続に沿って存在する因果推定を行うための戦略を考える方が良いです(図2.4)。連続体の最強の終わりに制御された実験を無作為化しています。しかし、これらは多くの場合、多くの治療は、政府や企業からの協力の非現実的な量を必要とするため、社会的な研究に行うことは困難です。非常に単純に私たちが行うことができない多くの実験があります。私は、無作為化対照試験の両方の長所と短所には、第4章のすべてを捧げるだろう、と私はいくつかの例では、実験方法に観察好む強い倫理的な理由があると主張します。

図2.4:推定因果効果のための研究戦略の連続。

図2.4:推定因果効果のための研究戦略の連続。

連続体に沿って移動し、研究者が明示的にランダム化されていない状況があります。つまり、研究者が実際に実験を行うことなく、実験のような知識を習得しようとしています。当然、これはトリッキーになるだろうが、ビッグデータが大幅にこのような状況で因果推定をさせる当社の能力を向上させます。

時には世界でランダム性が研究者のための実験のようなものを作成するために起こるの設定があります。これらの設計は、 自然の実験と呼ばれ、それらは、セクション2.4.3.1で詳細に検討されます。彼らが発生したときにビッグデータ・ソース-その性質常時オンとそのサイズが大きく以下の2つの機能では、自然の実験から学ぶために私たちの能力を高めます。

さらに離れた無作為化対照実験から移動し、時には私たちは自然実験を近似するために使用することができます自然の中であってもイベントはありません。これらの設定では、我々は慎重に実験を近似する試みで非実験データ内の比較を構築することができます。これらの設計は、 整合と呼ばれ、それらは、セクション2.4.3.2で詳細に検討されます。自然の実験と同様に、マッチングはまた、ビッグデータ・ソースから利益を得る設計です。特に、大規模な例数の点でサイズの両方と情報の種類ごとの場合、大幅には、マッチングを容易にします。自然の実験との整合の主な違いは、自然の実験で研究者が治療が割り当てられたを通じてプロセスを知っていて、それがランダムであると考えているということです。

自然の実験と一致する:実験を行うために欲望を動機と公正な比較の概念はまた、2つの代替的アプローチの基礎となります。これらのアプローチは、あなたが既に持っているデータの中に座って公正な比較を発見することにより受動的に観測されたデータから因果効果を推定することができます。