自然の実験は世界でランダムなイベントを活用します。ランダムイベント+常時オンデータシステム=自然実験
公正な比較を可能にする無作為化比較実験するための鍵は、無作為です。しかし、時折何かが本質的に異なる治療に無作為にランダムに、またはほぼ人を割り当て、世界で起こります。 自然の実験を使用しての戦略の明確な例の一つは、研究から来てAngrist (1990)利益に対する軍事的サービスの効果を測定します。
ベトナム戦争中、米国はドラフトを通じてその軍隊のサイズを増加させました。サービスに呼ばれるであろう国民決定するために、米国政府は宝くじを開催しました。すべての誕生日は、紙の上に表現し、これらの論文は、大きなガラスジャーに入れました。図2.5に示すように、紙のこれらのスリップは若い男性が(若い女性がドラフトの対象ではありませんでした)奉仕するために呼び出されることを順序を決定するために、一度に瓶1から引き出されました。結果に基づいて、9月14日に生まれた男性は、というように4月24日に生まれた男性は、第2と呼ばれていた、最初に呼び出され、及びました。最終的に、この宝くじでは、195別の日に生まれた人が171日に生まれた男性は呼ばれなかった一方でサービスを提供するために呼ばれていました。
それはすぐに明らかにならないかもしれませんが、ドラフト抽選は無作為化対照実験に重要な類似性を有する:両方の状況で参加者が無作為に治療を受けるために割り当てられています。我々はドラフト適格性とその後の労働市場の収益に兵役の影響について学ぶことに興味を持っている場合は、ドラフト抽選の場合は、我々は、生年月日抽選カットオフ(例えば、9月14日、4月を下回っていた人々のために結果を比較することができます誕生日カットオフ(例えば、2月20日、12月2日、等)の後にあった人々のための成果と24など)。
起草され、この処理は、ランダムに割り当てられていることを考えると、我々は、次に、測定された任意の結果のために、この治療の効果を測定することができます。例えば、 Angrist (1990) 、ランダムに白ベテランの収益は、比較可能な非ベテランの利益よりも約15%以下であったと結論する社会保障庁によって収集された収益データとドラフトで選ばれた人についての情報を組み合わせました。他の研究者らは、同様に同様のトリックを使用しています。例えば、 Conley and Heerwig (2011) 、ランダムに2000国勢調査と2005年アメリカのコミュニティ調査から収集した家庭用のデータとドラフトで選択し、限りドラフトの後、少し長期的な効果があったことが判明した人についての情報を組み合わせましたこのような住宅の任期(賃借対所有)と住宅の安定性(過去5年間に移動した可能性)などの成果の様々な上に兵役。
この例が示すように、時々、社会的、政治的、または自然の力が実験や研究者が活用できる近実験を作成します。多くの場合、自然の実験は、無作為化対照実験を実行するために、倫理的または実用的ではない設定で因果関係を推定するための最良の方法です。彼らは、非実験データで公正な比較を発見するための重要な戦略です。この研究戦略は、この式によって要約することができます。
\ [\テキスト{ランダム(またはランダムな場合など)イベント} + \テキスト{常時オンのデータ・ストリーム} = \テキスト{自然実験} \ qquad(2.1)\]
しかし、自然の実験の分析は非常にトリッキーなことができます。例えば、ベトナムのドラフトの場合には、ドラフト対象ではなかった誰もが(免除の様々ながあった)働くことになりました。そして、同時に、ドラフト対象外とされた一部の人々は、サービスのために志願しました。新薬の臨床試験において、治療群の一部の人々は彼らの薬を服用していなかったと何とか薬を受けた対照群の人々の一部かのようでした。この両面違反と呼ばれる問題、ならびに多くの他の問題は、この章の最後に推奨される測定値のいくつかでより詳細に説明します。
自然に無作為割り当てを発生を利用しての戦略は、デジタル時代に先行するが、ビッグデータの有病率は、使用するこの戦略ははるかに容易になります。あなたには、いくつかの治療がランダムに割り当てられている実現したら、ビッグデータ・ソースを使用して、治療群と対照条件に住んでいる人達の結果を比較するために必要な結果データを提供することができます。例えば、ドラフトや兵役の影響の彼の研究では、Angristは、社会保障庁からの収益レコードを利用しました。この結果データなしで、彼の研究は不可能でした。この場合、社会保障庁は常時オンのビッグデータ・ソースです。ますます自動的に収集されたデータソースが存在するように、我々は、外因性の変動によって作成された変更の影響を測定することができるより多くの結果データを持つことになります。
デジタル時代におけるこの戦略を説明するために、マスとモレッティの考えてみましょう(2009)生産上のピアの影響でエレガントな研究を。表面には、それは構造で、ベトナムのドラフトの効果についてAngristの研究よりも違って見えるかもしれないが、それらの両方は、式のパターンに従ってください。 2.1。
マスとモレッティは、ピアが、労働者の生産性にどのように影響するかを測定しました。一方で、一生懸命働いピアを有するため、仲間からの圧力の生産性を高めるために労働者を導くかもしれません。または、他の一方で、頑張っピアは、さらに緩めるために、他の労働者を導くかもしれません。生産性のピア効果を研究するための明確な方法は、労働者がランダムに異なるレベルの生産性の労働者とシフトに割り当てられ、その後、得られた生産性は皆のために測定された無作為化対照実験であろう。研究者は、しかし、任意の実際のビジネスの労働者のスケジュールを管理していない、ので、マスとモレッティは、スーパーマーケットで起こった自然実験に頼らなければなりませんでした。
ただ、EQなど。 2.1は、彼らの研究は二つの部分を持っていました。まず、彼らは正確に、個々のを持っているスーパーマーケットのチェックアウトシステムからのログを使用し、生産性の尺度常時オン:毎秒スキャンされたアイテムの数。そして、第二、そのせいでスケジューリングは、このスーパーで行われたようで、彼らは仲間のランダムな組成の近くにあります。換言すれば、レジのスケジューリングが抽選によって決定されていなくても、それは本質的にランダムでした。実際には、自然の実験では、我々が持っている自信が頻繁にこの "として-あれば「ランダム主張の妥当性にかかっています。このランダムな変動を利用して、マスとモレッティは、より高い生産性ピアでの作業は、生産性を向上させていることがわかりました。この効果の不均一性 (そのために労働者の種類が大きく影響である) 機構 :また、マスとモレッティは、さらに2つの重要かつ微妙な問題を探求するために、因果の推定を越えて移動するために、そのデータセットの大きさと豊かさを使用しました効果の背後にある(なぜ生産性の高いピアを持つんより高い生産性につながります)。我々はより詳細に実験を議論する際には、第5章のメカニズム、治療効果とのこれら二つの重要な問題、不均質に戻ります。
収益にベトナムのドラフトの効果と生産上のピアの効果の研究についての研究から一般化、表2.3は、この正確な同じ構造を持っている他の研究をまとめたものです。いくつかのイベントの影響を測定するために、常時オンのデータソースを使用して、 。表2.3は明らかにしたように、あなたがちょうどそれらを探すために方法を知っていれば、自然実験があふれています。
実質的な焦点 | 自然実験のソース | 常時オンのデータソース | 引用 |
---|---|---|---|
生産性への影響をピア | スケジューリング処理 | チェックアウトデータ | Mas and Moretti (2009) |
友情の形成 | ハリケーン | フェイスブック | Phan and Airoldi (2015) |
感情の広がり | 雨 | フェイスブック | Coviello et al. (2014) |
経済転送をピアツーピア | 地震 | モバイルマネーデータ | Blumenstock, Fafchamps, and Eagle (2011) |
個人消費行動 | 2013年、米国政府のシャットダウン | 個人金融データ | Baker and Yannelis (2015) |
推薦システムの経済的影響 | さまざまな | アマゾンで閲覧データ | Sharma, Hofman, and Watts (2015) |
胎児へのストレスの影響 | 2006イスラエル・ヒズボラ戦争 | 出生記録 | Torche and Shwed (2015) |
ウィキペディアの行動を読みます | スノーデンの啓示 | ウィキペディアのログ | Penney (2016) |
実際には、研究者が実りすることができ、どちらも自然の実験を、見つけるための2つの異なる戦略を使用しています。一部の研究者は、常時オンのデータ・ソースで開始し、世界でランダムイベントを探します。他の人は、世界でランダムイベントで始まり、その影響をキャプチャデータソースを探します。最後に、自然の実験の強さはない統計分析の高度化から、しかし歴史の幸運な偶然によって作成された公正な比較を発見するケアから来ていることがわかります。