Естественные эксперименты преимущества случайных событий в мире. случайное событие + всегда на системе данных = естественный эксперимент
Ключ к рандомизированных контролируемых экспериментов, позволяющих справедливое сравнение является рандомизации. Тем не менее, время от времени что-то происходит в мире, который по существу назначает людей случайным образом или почти случайным образом, чтобы различные виды лечения. Одним из ярких примеров стратегии использования природных экспериментов происходит от исследования Angrist (1990) , который измеряет влияние военной службы на прибыль.
Во время войны во Вьетнаме, Соединенные Штаты увеличили размер своих вооруженных сил через проект. Для того, чтобы решить, какие граждане назвали бы в эксплуатацию, правительство США провели лотерею. Каждая дата рождения была представлена на листе бумаги, и эти документы были помещены в большой стеклянной банке. Как показано на рисунке 2.5, эти полоски бумаги были взяты из кувшина по одному за раз, чтобы определить порядок, в котором молодые люди будут призваны служить (молодые женщины, не подлежали проекта). На основании результатов, люди, рожденные 14 сентября были названы во-первых, люди, рожденные 24 апреля были названы второй, и так далее. В конце концов, в этой лотерее, мужчины, родившиеся на 195 разные дни были призваны на службу в то время как мужчины, родившиеся на 171 дней не были названы.
Хотя это может быть не сразу, проект лотереи имеет критическое сходство с рандомизированного контролируемого эксперимента: в обоих случаях участники случайным образом назначали лечение. В случае проекта лотереи, если мы заинтересованы в изучении последствий проекта-права и военной службы на последующие рынка труда прибыли, мы можем сравнить результаты для людей, чьи даты рождения были ниже лотереи обрезания (например, 14 сентября, апрель 24 и т.д.) с результатами для людей, чьи дни рождения были после обрезания (например, 20 февраля, 2 декабря, и т.д.).
Учитывая, что это лечение в стадии разработки были случайным образом распределены, мы можем измерить эффект этого лечения для любого результата, который был измеряется. Например, Angrist (1990) в сочетании с информацией о том, кто был случайным образом выбран в проекте с данными о доходах, собираемого Администрации социального обеспечения , чтобы сделать вывод , что доходы белых ветеранов были примерно на 15% меньше , чем заработок сравнимых , не являющихся ветеранами , Другие исследователи использовали подобный прием, а также. Например, Conley and Heerwig (2011) в сочетании с информацией о том, кто был случайным образом выбран в проекте с бытовыми данными , собранными из обследования 2000 переписи и 2005 американского общества и обнаружили , что так долго после того, как проект, был мало долгосрочный эффект военная служба на различных результатов, таких как владения жильем (владеющей по сравнению с арендой) и жилой стабильности (вероятность того, что переехав в предыдущие пять лет).
Как показывает этот пример, иногда социальные, политические или природные силы создают эксперименты или почти эксперименты, которые могут быть использованы исследователями. Часто естественные эксперименты являются лучшим способом оценить причинно-следственные связи в тех местах, где это не этично или непрактично для запуска рандомизированных контролируемых экспериментов. Они являются важной стратегией для обнаружения справедливого сравнения в неэкспериментальных данных. Эта стратегия исследования можно суммировать следующим соотношением:
\ [\ {текст случайным образом (или как будто случайное) событие} + \ {текст всегда на потоке данных} = \ {текст естественный эксперимент} \ qquad (2.1) \]
Тем не менее, анализ естественных экспериментов может быть довольно сложно. Например, в случае проекта во Вьетнаме, не все, кто был призывного право в конечном итоге выступающей (были различные изъятия). И, в то же время, некоторые люди, которые не были сквозняков право добровольно на службу. Это было, как будто в клиническом испытании нового препарата, некоторые люди в группе лечения не принимали их лекарства и некоторые из людей в контрольной группе каким-то образом получил препарат. Эта проблема, называемая двусторонняя несогласованность, а также множество других проблем, которые описаны более подробно в некоторых из рекомендованных показаний в конце данной главы.
Стратегия использования преимуществ естественным рандомизации предшествует цифровой век, но распространенность больших объемов данных делает эту стратегию намного проще в использовании. После того, как вы понимаете, некоторые лечение было назначено случайным образом, большие источники данных могут предоставить данные о результатах, что вам нужно для того, чтобы сравнить результаты для людей в лечении и контрольных условиях. Например, в своем исследовании последствий проекта и военной службы, Angrist использовали прибыли записей из Администрации социального обеспечения; без этого исхода данных, его исследование не было бы возможно. В этом случае Администрация социального обеспечения является всегда на большой источник данных. Поскольку существует все больше и больше, автоматически собраны источники данных, мы будем иметь больше итогового данные, которые могут измерить влияние изменений, созданных экзогенной вариации.
Чтобы проиллюстрировать эту стратегию в эпоху цифровых технологий , давайте рассмотрим Mas и Моретти (2009) элегантное исследование о влиянии сверстников на производительность. Хотя на поверхности это может выглядеть несколько иначе, чем изучение Angrist идет о воздействии проекта во Вьетнаме, в структуре они оба следуют за образцом в уравнении. 2.1.
Мас и Моретти измеряется, как сверстники влияют на производительность труда работников. С одной стороны, имея трудолюбивый пэра может привести рабочих для повышения их производительности из-за давления со стороны сверстников. Или, с другой стороны, трудолюбивый сверстников может привести других работников травить еще больше. Ярчайший способ изучения одноранговые влияние на производительность была бы рандомизированного контролируемого эксперимента, где рабочие случайным образом распределены на сдвиги с работниками различных уровней производительности, а затем в результате чего производительность измеряется для всех. Исследователи, однако, не контролируют график рабочих в любом реальном бизнесе, и так Мас и Моретти должны были полагаться на естественный эксперимент, который проходил в супермаркете.
Так же, как эк. 2.1, их исследование состояло из двух частей. Во-первых, они использовали бревна из системы супермаркет Checkout, чтобы иметь точную, индивидуальный, и всегда по мере производительности: количество сканируемых в секунду. И, во-вторых, из-за способа, что планирование было сделано в этом супермаркете, они имеют почти случайным составом сверстников. Другими словами, даже при том, что планирование кассиров не определяется лотерею, это было по существу случайным образом. На практике мы имеем уверенность в естественных экспериментах часто зависит от правдоподобности этого "как если бы" случайного претензии. Пользуясь этой случайной вариации, Мас и Моретти обнаружили, что работа с более высокими коллегами производительности повышает производительность труда. Кроме того, Мас и Моретти использовал размер и богатство их набора данных для перемещения за пределы оценки причинно-следственных изучить два важных и тонких вопросов: гетерогенность этого эффекта (для которых виды рабочих эффект больше) и механизм за эффекта (почему имея высокие сверстники производительности приводит к повышению производительности труда). Мы вернемся к этим двум важным вопросам-гетерогенности эффектов лечения и механизмов-в главе 5, когда мы обсуждаем эксперименты более подробно.
Обобщая исследования о влиянии проекта Вьетнама на заработки и изучение влияния сверстников по производительности, Таблица 2.3 обобщает другие исследования, которые имеют точно такую же структуру: с помощью всегда на источнике данных для оценки влияния какого-либо события , Как видно из таблицы 2.3 ясно, естественные эксперименты везде, если вы просто знаете, как их искать.
Основная направленность | Источник естественного эксперимента | Всегда-на исходных данных | цитирование |
---|---|---|---|
Peer влияние на производительность | процесс планирования | выписка данных | Mas and Moretti (2009) |
формирование дружбы | ураганы | Phan and Airoldi (2015) | |
Распространение эмоций | дождь | Coviello et al. (2014) | |
Одноранговый экономические переводы | землетрясение | мобильных денежных данных | Blumenstock, Fafchamps, and Eagle (2011) |
Личное поведение потребления | 2013 завершение работы правительства США | личные данные финансы | Baker and Yannelis (2015) |
Экономическое воздействие рекомендательных систем | различный | Данные о просмотренных на Amazon | Sharma, Hofman, and Watts (2015) |
Влияние стресса на нерожденных детей | 2006 Израиль-Хезболлах война | записи о рождении | Torche and Shwed (2015) |
Чтение поведение в Википедии | Snowden откровений | журналы Википедия | Penney (2016) |
На практике, исследователи используют две различные стратегии для поиска природных экспериментов, оба из которых могут быть плодотворными. Некоторые исследователи начинают с всегда-на исходных данных и искать случайных событий в мире; другие начинают со случайными событиями в мире и искать источники данных, которые захватывают их влияние. Наконец, обратите внимание, что сила естественных экспериментов исходит не от сложности статистического анализа, но от медицинской помощи в раскрытии справедливого сравнения, созданный счастливой случайности истории.