2.4.3.1 Природні експерименти

Природні експерименти переваги випадкових подій в світі. випадкова подія + завжди на системі даних = природний експеримент

Ключ до рандомізованих контрольованих експериментів, що дозволяють справедливе порівняння є рандомізації. Проте, час від часу щось відбувається в світі, який по суті призначає людей випадковим чином або майже випадковим чином, щоб різні види лікування. Одним з яскравих прикладів стратегії використання природних експериментів походить від дослідження Angrist (1990) , який вимірює вплив військової служби на прибуток.

Під час війни у ​​В'єтнамі, Сполучені Штати збільшили розмір своїх збройних сил через проект. Для того, щоб вирішити, які громадяни назвали б в експлуатацію, уряд США провели лотерею. Кожна дата народження була представлена ​​на аркуші паперу, і ці документи були поміщені в великій скляній банці. Як показано на малюнку 2.5, ці смужки паперу були взяті з глечика по одному за раз, щоб визначити порядок, в якому молоді люди будуть покликані служити (молоді жінки, не підлягали проекту). На підставі результатів, люди, народжені 14 вересня були названі по-перше, люди, народжені 24 квітня були названі другий, і так далі. Зрештою, в цій лотереї, чоловіки, які народилися на 195 різні дні були покликані на службу в той час як чоловіки, які народилися на 171 днів не було названо.

Малюнок 2.5: конгресмен Олександр Pirnie (R-Нью-Йорк) малюнок першої капсули для проекту Selective Service 1 грудня 1969 р Джошуа Angrist (1990) об'єднав проект лотереї з даними про доходи від Адміністрації соціального забезпечення, щоб оцінити вплив військової служби на заробітки. Це є прикладом досліджень з використанням природного експерименту. Джерело: Wikimedia Commons

Малюнок 2.5: конгресмен Олександр Pirnie (R-Нью - Йорк) малюнок першої капсули для проекту Selective Service 1 грудня 1969 р Джошуа Angrist (1990) об'єднав проект лотереї з даними про доходи від Адміністрації соціального забезпечення , щоб оцінити вплив військової служби на заробітки. Це є прикладом досліджень з використанням природного експерименту. Джерело: Wikimedia Commons

Хоча це може бути не відразу, проект лотереї має критичне схожість з рандомізованого контрольованого експерименту: в обох випадках учасники випадковим чином призначали лікування. У разі проекту лотереї, якщо ми зацікавлені у вивченні наслідків проекту-права і військової служби на наступні ринку праці прибутку, ми можемо порівняти результати для людей, чиї дати народження були нижче лотереї обрізання (наприклад 14 вересня, квітень 24 і т.д.) з результатами для людей, чиї дні народження були після обрізання (наприклад, 20 лютого, 2 грудня, і т.д.).

З огляду на, що це лікування в стадії розробки були випадковим чином розподілені, ми можемо виміряти ефект цього лікування для будь-якого результату, який був вимірюється. Наприклад, Angrist (1990) в поєднанні з інформацією про те, хто був випадковим чином обраний в проекті з даними про доходи, що збирається Адміністрації соціального забезпечення , щоб зробити висновок , що доходи білих ветеранів були приблизно на 15% менше , ніж заробіток порівнянних , які не є ветеранами , Інші дослідники використовували подібний прийом, а також. Наприклад, Conley and Heerwig (2011) в поєднанні з інформацією про те, хто був випадковим чином обраний в проекті з побутовими даними , зібраними з обстеження 2000 перепису і 2005 американського суспільства і виявили , що так довго після того, як проект, був мало довгостроковий ефект військова служба на різних результатів, таких як володіння житлом (володіє в порівнянні з орендою) та житлової стабільності (ймовірність того, що переїхавши в попередні п'ять років).

Як показує цей приклад, іноді соціальні, політичні або природні сили створюють експерименти або майже експерименти, які можуть бути використані дослідниками. Часто природні експерименти є найкращим способом оцінити причинно-наслідкові зв'язки в тих місцях, де це не етично чи непрактично для запуску рандомізованих контрольованих експериментів. Вони є важливою стратегією для виявлення справедливого порівняння в неексперіментальних даних. Ця стратегія дослідження можна підсумувати таким співвідношенням:

\ [\ {Текст випадковим чином (або як ніби випадкове) подія} + \ {текст завжди на потоці даних} = \ {текст природний експеримент} \ qquad (2.1) \]

Проте, аналіз природних експериментів може бути досить складно. Наприклад, в разі проекту у В'єтнамі, не всі, хто був призовного право в кінцевому підсумку виступає (були різні вилучення). І, в той же час, деякі люди, які не були протягів право добровільно на службу. Це було, як ніби в клінічному випробуванні нового препарату, деякі люди в групі лікування не приймали їх ліки і деякі з людей в контрольній групі якимось чином отримав препарат. Ця проблема, звана двостороння неузгодженість, а також безліч інших проблем, які описані більш детально в деяких з рекомендованих показань в кінці цього розділу.

Стратегія використання переваг природним рандомізації передує цифровий вік, але поширеність великих обсягів даних робить цю стратегію набагато простіше у використанні. Після того, як ви розумієте, деякі лікування було призначено випадковим чином, великі джерела даних можуть надати дані про результати, що вам потрібно для того, щоб порівняти результати для людей в лікуванні і контрольних умовах. Наприклад, в своєму дослідженні наслідків проекту і військової служби, Angrist використовували прибутку записів з Адміністрації соціального забезпечення; без цього результату даних, його дослідження не було б можливо. В цьому випадку Адміністрація соціального забезпечення є завжди на великий джерело даних. Оскільки існує все більше і більше, автоматично зібрані джерела даних, ми матимемо більше підсумкового дані, які можуть виміряти вплив змін, створених екзогенної варіації.

Щоб проілюструвати цю стратегію в епоху цифрових технологій , давайте розглянемо Mas і Моретті (2009) елегантне дослідження про вплив однолітків на продуктивність. Хоча на поверхні це може виглядати трохи інакше, ніж вивчення Angrist йде про вплив проекту у В'єтнамі, в структурі вони обидва йдуть за зразком в рівнянні. 2.1.

Мас і Моретті вимірюється, як однолітки впливають на продуктивність праці працівників. З одного боку, маючи працьовитий пера може привести робочих для підвищення їх продуктивності через тиск з боку однолітків. Або, з іншого боку, працьовитий однолітків може привести інших працівників труїти ще більше. Найяскравіший спосіб вивчення однорангові вплив на продуктивність була б рандомізованого контрольованого експерименту, де робочі випадковим чином розподілені на зрушення з працівниками різних рівнів продуктивності, а потім в результаті чого продуктивність вимірюється для всіх. Дослідники, проте, не контролюють графік робочих в будь-якому реальному бізнесі, і так Мас і Моретті повинні були покладатися на природний експеримент, який проходив в супермаркеті.

Так само, як ек. 2.1, їх дослідження складалося з двох частин. По-перше, вони використовували колоди з системи супермаркет Checkout, щоб мати точну, індивідуальний, і завжди в міру продуктивності: кількість сканованих в секунду. І, по-друге, через спосіб, що планування було зроблено в цьому супермаркеті, вони мають майже випадковим складом однолітків. Іншими словами, навіть при тому, що планування касирів не визначається лотерею, це було по суті випадковим чином. На практиці ми маємо впевненість в природних експериментах часто залежить від правдоподібності цього "як якби" випадкового претензії. Користуючись цією випадкової варіації, Мас і Моретті виявили, що робота з більш високими колегами продуктивності підвищує продуктивність праці. Крім того, Мас і Моретті використовував розмір і багатство їх набору даних для переміщення за межі оцінки причинно-наслідкових вивчити два важливих і тонких питань: гетерогенність цього ефекту (для яких види робочих ефект більше) і механізм за ефекту (чому маючи високі однолітки продуктивності призводить до підвищення продуктивності праці). Ми повернемося до цих двох важливих питань-гетерогенності ефектів лікування та механізмів-в розділі 5, коли ми обговорюємо експерименти більш докладно.

Узагальнюючи дослідження про вплив проекту В'єтнаму на заробітки і вивчення впливу однолітків по продуктивності, Таблиця 2.3 узагальнює інші дослідження, які мають таку саму структуру: за допомогою завжди на джерелі даних для оцінки впливу якої-небудь події , Як видно з таблиці 2.3 ясно, природні експерименти всюди, якщо ви просто знаєте, як їх шукати.

Таблиця 2.3: Приклади природних експериментів з використанням великих джерел даних. Всі ці дослідження дотримуються тієї ж основний рецепт: випадковий (або як ніби випадкова подія) + завжди на системі даних. Див Dunning (2012) для більшого кількості прикладів.
Основна спрямованість Джерело природного експерименту Завжди-на вихідних даних цитування
Peer вплив на продуктивність процес планування виписка даних Mas and Moretti (2009)
формування дружби урагани facebook Phan and Airoldi (2015)
поширення емоцій дощ facebook Coviello et al. (2014)
Спеціальний робочий економічні переклади землетрус мобільних грошових даних Blumenstock, Fafchamps, and Eagle (2011)
Особиста поведінка споживання 2013 завершення роботи уряду США особисті дані фінанси Baker and Yannelis (2015)
Економічний вплив рекомендаційних систем різний Дані веб-перегляду на Amazon Sharma, Hofman, and Watts (2015)
Вплив стресу на ненароджених дітей 2006 Ізраїль-Хезболлах війна записи про народження Torche and Shwed (2015)
Читання поведінку в Вікіпедії Snowden одкровень журнали Вікіпедія Penney (2016)

На практиці, дослідники використовують дві різні стратегії для пошуку природних експериментів, обидва з яких можуть бути плідними. Деякі дослідники починають з завжди-на вихідних даних і шукати випадкових подій в світі; інші починають з випадковими подіями в світі і шукати джерела даних, які захоплюють їх вплив. Нарешті, зверніть увагу, що сила природних експериментів виходить не від складності статистичного аналізу, але від медичної допомоги в розкритті справедливого порівняння, створений завдяки щасливому випадку історії.