Природні експерименти переваги випадкових подій в світі. випадкова подія + завжди на системі даних = природний експеримент
Ключ до рандомізованих контрольованих експериментів, що дозволяють справедливе порівняння є рандомізації. Проте, час від часу щось відбувається в світі, який по суті призначає людей випадковим чином або майже випадковим чином, щоб різні види лікування. Одним з яскравих прикладів стратегії використання природних експериментів походить від дослідження Angrist (1990) , який вимірює вплив військової служби на прибуток.
Під час війни у В'єтнамі, Сполучені Штати збільшили розмір своїх збройних сил через проект. Для того, щоб вирішити, які громадяни назвали б в експлуатацію, уряд США провели лотерею. Кожна дата народження була представлена на аркуші паперу, і ці документи були поміщені в великій скляній банці. Як показано на малюнку 2.5, ці смужки паперу були взяті з глечика по одному за раз, щоб визначити порядок, в якому молоді люди будуть покликані служити (молоді жінки, не підлягали проекту). На підставі результатів, люди, народжені 14 вересня були названі по-перше, люди, народжені 24 квітня були названі другий, і так далі. Зрештою, в цій лотереї, чоловіки, які народилися на 195 різні дні були покликані на службу в той час як чоловіки, які народилися на 171 днів не було названо.
Хоча це може бути не відразу, проект лотереї має критичне схожість з рандомізованого контрольованого експерименту: в обох випадках учасники випадковим чином призначали лікування. У разі проекту лотереї, якщо ми зацікавлені у вивченні наслідків проекту-права і військової служби на наступні ринку праці прибутку, ми можемо порівняти результати для людей, чиї дати народження були нижче лотереї обрізання (наприклад 14 вересня, квітень 24 і т.д.) з результатами для людей, чиї дні народження були після обрізання (наприклад, 20 лютого, 2 грудня, і т.д.).
З огляду на, що це лікування в стадії розробки були випадковим чином розподілені, ми можемо виміряти ефект цього лікування для будь-якого результату, який був вимірюється. Наприклад, Angrist (1990) в поєднанні з інформацією про те, хто був випадковим чином обраний в проекті з даними про доходи, що збирається Адміністрації соціального забезпечення , щоб зробити висновок , що доходи білих ветеранів були приблизно на 15% менше , ніж заробіток порівнянних , які не є ветеранами , Інші дослідники використовували подібний прийом, а також. Наприклад, Conley and Heerwig (2011) в поєднанні з інформацією про те, хто був випадковим чином обраний в проекті з побутовими даними , зібраними з обстеження 2000 перепису і 2005 американського суспільства і виявили , що так довго після того, як проект, був мало довгостроковий ефект військова служба на різних результатів, таких як володіння житлом (володіє в порівнянні з орендою) та житлової стабільності (ймовірність того, що переїхавши в попередні п'ять років).
Як показує цей приклад, іноді соціальні, політичні або природні сили створюють експерименти або майже експерименти, які можуть бути використані дослідниками. Часто природні експерименти є найкращим способом оцінити причинно-наслідкові зв'язки в тих місцях, де це не етично чи непрактично для запуску рандомізованих контрольованих експериментів. Вони є важливою стратегією для виявлення справедливого порівняння в неексперіментальних даних. Ця стратегія дослідження можна підсумувати таким співвідношенням:
\ [\ {Текст випадковим чином (або як ніби випадкове) подія} + \ {текст завжди на потоці даних} = \ {текст природний експеримент} \ qquad (2.1) \]
Проте, аналіз природних експериментів може бути досить складно. Наприклад, в разі проекту у В'єтнамі, не всі, хто був призовного право в кінцевому підсумку виступає (були різні вилучення). І, в той же час, деякі люди, які не були протягів право добровільно на службу. Це було, як ніби в клінічному випробуванні нового препарату, деякі люди в групі лікування не приймали їх ліки і деякі з людей в контрольній групі якимось чином отримав препарат. Ця проблема, звана двостороння неузгодженість, а також безліч інших проблем, які описані більш детально в деяких з рекомендованих показань в кінці цього розділу.
Стратегія використання переваг природним рандомізації передує цифровий вік, але поширеність великих обсягів даних робить цю стратегію набагато простіше у використанні. Після того, як ви розумієте, деякі лікування було призначено випадковим чином, великі джерела даних можуть надати дані про результати, що вам потрібно для того, щоб порівняти результати для людей в лікуванні і контрольних умовах. Наприклад, в своєму дослідженні наслідків проекту і військової служби, Angrist використовували прибутку записів з Адміністрації соціального забезпечення; без цього результату даних, його дослідження не було б можливо. В цьому випадку Адміністрація соціального забезпечення є завжди на великий джерело даних. Оскільки існує все більше і більше, автоматично зібрані джерела даних, ми матимемо більше підсумкового дані, які можуть виміряти вплив змін, створених екзогенної варіації.
Щоб проілюструвати цю стратегію в епоху цифрових технологій , давайте розглянемо Mas і Моретті (2009) елегантне дослідження про вплив однолітків на продуктивність. Хоча на поверхні це може виглядати трохи інакше, ніж вивчення Angrist йде про вплив проекту у В'єтнамі, в структурі вони обидва йдуть за зразком в рівнянні. 2.1.
Мас і Моретті вимірюється, як однолітки впливають на продуктивність праці працівників. З одного боку, маючи працьовитий пера може привести робочих для підвищення їх продуктивності через тиск з боку однолітків. Або, з іншого боку, працьовитий однолітків може привести інших працівників труїти ще більше. Найяскравіший спосіб вивчення однорангові вплив на продуктивність була б рандомізованого контрольованого експерименту, де робочі випадковим чином розподілені на зрушення з працівниками різних рівнів продуктивності, а потім в результаті чого продуктивність вимірюється для всіх. Дослідники, проте, не контролюють графік робочих в будь-якому реальному бізнесі, і так Мас і Моретті повинні були покладатися на природний експеримент, який проходив в супермаркеті.
Так само, як ек. 2.1, їх дослідження складалося з двох частин. По-перше, вони використовували колоди з системи супермаркет Checkout, щоб мати точну, індивідуальний, і завжди в міру продуктивності: кількість сканованих в секунду. І, по-друге, через спосіб, що планування було зроблено в цьому супермаркеті, вони мають майже випадковим складом однолітків. Іншими словами, навіть при тому, що планування касирів не визначається лотерею, це було по суті випадковим чином. На практиці ми маємо впевненість в природних експериментах часто залежить від правдоподібності цього "як якби" випадкового претензії. Користуючись цією випадкової варіації, Мас і Моретті виявили, що робота з більш високими колегами продуктивності підвищує продуктивність праці. Крім того, Мас і Моретті використовував розмір і багатство їх набору даних для переміщення за межі оцінки причинно-наслідкових вивчити два важливих і тонких питань: гетерогенність цього ефекту (для яких види робочих ефект більше) і механізм за ефекту (чому маючи високі однолітки продуктивності призводить до підвищення продуктивності праці). Ми повернемося до цих двох важливих питань-гетерогенності ефектів лікування та механізмів-в розділі 5, коли ми обговорюємо експерименти більш докладно.
Узагальнюючи дослідження про вплив проекту В'єтнаму на заробітки і вивчення впливу однолітків по продуктивності, Таблиця 2.3 узагальнює інші дослідження, які мають таку саму структуру: за допомогою завжди на джерелі даних для оцінки впливу якої-небудь події , Як видно з таблиці 2.3 ясно, природні експерименти всюди, якщо ви просто знаєте, як їх шукати.
Основна спрямованість | Джерело природного експерименту | Завжди-на вихідних даних | цитування |
---|---|---|---|
Peer вплив на продуктивність | процес планування | виписка даних | Mas and Moretti (2009) |
формування дружби | урагани | Phan and Airoldi (2015) | |
поширення емоцій | дощ | Coviello et al. (2014) | |
Спеціальний робочий економічні переклади | землетрус | мобільних грошових даних | Blumenstock, Fafchamps, and Eagle (2011) |
Особиста поведінка споживання | 2013 завершення роботи уряду США | особисті дані фінанси | Baker and Yannelis (2015) |
Економічний вплив рекомендаційних систем | різний | Дані веб-перегляду на Amazon | Sharma, Hofman, and Watts (2015) |
Вплив стресу на ненароджених дітей | 2006 Ізраїль-Хезболлах війна | записи про народження | Torche and Shwed (2015) |
Читання поведінку в Вікіпедії | Snowden одкровень | журнали Вікіпедія | Penney (2016) |
На практиці, дослідники використовують дві різні стратегії для пошуку природних експериментів, обидва з яких можуть бути плідними. Деякі дослідники починають з завжди-на вихідних даних і шукати випадкових подій в світі; інші починають з випадковими подіями в світі і шукати джерела даних, які захоплюють їх вплив. Нарешті, зверніть увагу, що сила природних експериментів виходить не від складності статистичного аналізу, але від медичної допомоги в розкритті справедливого порівняння, створений завдяки щасливому випадку історії.