2.4.3.1 naturalne eksperymenty

Eksperymenty fizyczne wykorzystać zdarzeń losowych na świecie. zdarzenie losowe + zawsze na systemie danych = eksperymentem naturalnym

Kluczem do randomizowanych badań umożliwiających rzetelne porównanie jest randomizacji. Jednak od czasu do czasu coś się dzieje na świecie, która zasadniczo przypisuje ludziom losowo lub prawie losowo do różnych zabiegów. Jeden z najczystszych przykładów strategii wykorzystania naturalnych eksperymentów wynika z badań Angrist (1990) , który mierzy wpływ służb wojskowych na wyniki.

Podczas wojny w Wietnamie, Stanach Zjednoczonych wzrosła wielkość sił zbrojnych poprzez projekt. W celu podjęcia decyzji, której obywatele będą powołani do służby, rząd USA odbyła się loteria. Każda data urodzin była reprezentowana na kartce papieru, a papiery te zostały umieszczone w dużym szklanym słoju. Jak pokazano na rysunku 2.5, te karteczki zostały sporządzone ze słoika po jednym na raz, aby określić kolejność, że młodzi ludzie będą powołani do służby (młode kobiety nie były przedmiotem projektu). Na podstawie wyników, mężczyźni urodzeni w dniu 14 września nazywano pierwsze, mężczyźni urodzeni w dniu 24 kwietnia były nazywane po drugie, i tak dalej. Ostatecznie, w tym loterii, mężczyźni urodzeni na 195 różnych dniach zostali powołani do służby, podczas gdy mężczyźni urodzeni na 171 dni, nie zostali wezwani.

Rysunek 2.5: Kongresman Alexander Pirnie (R-NY) sporządzanie pierwsza kapsułka do projektu Selektywna obsługa na 1 grudnia 1969. Joshua Angrist (1990) w połączeniu projekt loterii z danymi o zarobkach z Social Security Administration, aby oszacować wpływ służby wojskowej na zarobki. Jest to przykład badań z wykorzystaniem naturalnego eksperymentu. Źródło: Wikimedia Commons

Rysunek 2.5: Kongresman Alexander Pirnie (R-NY) sporządzanie pierwsza kapsułka do projektu Selektywna obsługa na 1 grudnia 1969. Joshua Angrist (1990) w połączeniu projekt loterii z danymi o zarobkach z Social Security Administration, aby oszacować wpływ służby wojskowej na zarobki. Jest to przykład badań z wykorzystaniem naturalnego eksperymentu. Źródło: Wikimedia Commons

Chociaż może nie być od razu widoczne, projekt loterii ma krytyczny podobieństwo do randomizowanego kontrolowanego eksperymentu: w obu przypadkach uczestnicy są losowo przydzielono do grupy otrzymującej leczenie. W przypadku projektu loterii, jeśli jesteśmy zainteresowani nauką o efektach projektu-kwalifikowalności i służby wojskowej na kolejnych zarobków na rynku pracy, możemy porównać skutki dla osób, których miejsc urodzenia były poniżej wartości granicznej loterii (np, September 14, kwiecień 24, etc.) z wynikami dla ludzi, których urodziny były po odcięcia (np, 20 lutego, 02 grudnia, etc.).

Biorąc pod uwagę, że leczenie jest opracowane zostały losowo przypisane, można następnie zmierzyć wpływ tego leczenia jakiegokolwiek wyniku, że została zmierzona. Na przykład, Angrist (1990) w połączeniu z informacjami o tym, kto został wybrany losowo w projekcie z danymi o zarobkach, które zostały zebrane przez Social Security Administration, aby stwierdzić, że zarobki białych weteranów były o 15% niższe od zarobków porównywalnych non-weteranów , Inni badacze wykorzystali podobny trik, jak również. Na przykład, Conley and Heerwig (2011) w połączeniu z informacjami o tym, kto został wybrany losowo w projekcie z danymi gospodarstw domowych zgromadzonych od Survey 2000 Census i 2005 amerykańskiej społeczności i okazało się, że tak długo po zakończeniu projektu, było trochę długoterminowy efekt służba wojskowa na różnych efektów, takich jak kadencji obudowy (posiadającej kontra wynajmu) i stabilności mieszkaniowej (Prawdopodobieństwo przeprowadzce w poprzednich pięciu lat).

Jako przykład ten pokazuje, czasami siły społeczne, polityczne lub fizyczne tworzenie eksperymentów lub prawie eksperymenty, które mogą być wykorzystane przez badaczy. Często naturalne eksperymenty są najlepszym sposobem na oszacowanie przyczynowo-skutkowe w ustawieniach, w których nie jest etyczne i praktyczne uruchomienie randomizowanych kontrolowanych eksperymentów. Są one ważną strategią odkrywanie sprawiedliwe porównanie z danymi nieeksperymentalnych. Ta strategia badań można podsumować tego równania:

\ [\ text {random (albo jakby losowo) imprezy} + \ text {zawsze na strumieniu danych} = \ text {naturalny eksperyment} \ qquad (2,1) \]

Jednak analiza naturalnych eksperymentów może być dość trudne. Na przykład, w przypadku projektu w Wietnamie, nie każdy, kto był draft-kwalifikują skończyło się służąc (było wiele wyłączeń). A w tym samym czasie, niektórzy ludzie, którzy nie kwalifikują się przeciągów ochotnika do służby. To tak, jakby w badaniu klinicznym nowego leku, niektórzy ludzie w grupie leczonej nie biorą ich lekarstwo, a niektóre z osób w grupie kontrolnej jakoś otrzymał lek. Problem ten, nazywany dwustronnego niezgodności, a także wielu innych problemów, są opisane bardziej szczegółowo w niektórych zalecanych odczytów na końcu rozdziału.

Strategia korzystając z naturalnie występujących losowy przydział poprzedza ery cyfrowej, ale częstość występowania dużego danych sprawia, że ​​strategia ta znacznie łatwiejszy w użyciu. Kiedy zdajesz sobie sprawę, niektóre zabieg został przydzielony losowo, duże źródła danych mogą dostarczyć danych wyjściowych, które są potrzebne w celu porównania wyników dla ludzi w warunkach leczenia i kontroli. Na przykład, w swoim studium wpływu projektu i wojskowej służby Angrist wykorzystał zarobków rekordów z Social Security Administration; bez tych danych wynikowych, jego badanie nie byłby możliwy. W tym przypadku, Social Security Administration jest zawsze na wielkim źródłem danych. Ponieważ istnieje coraz więcej źródeł danych zbieranych automatycznie, będziemy mieli więcej danych wynik, który może mierzyć wpływ zmian stworzonych przez egzogenne zmienności.

Aby zilustrować tę strategię w erze cyfrowej, rozważmy MAS Morettiego (2009) eleganckie badania nad wpływem rówieśników na produktywność. Choć na powierzchni może wyglądać inaczej niż w badaniu Angrist na temat skutków projektu w Wietnamie, w strukturze oboje zgodne z wzorcem w równaniu. 2.1.

Mas i Moretti zmierzyć, jak rówieśnicy wpływają na produktywność pracowników. Z jednej strony, mając peer ciężko pracujących pracowników może prowadzić do zwiększenia ich produktywności z powodu presji. Albo, z drugiej strony, trudno wzajemnej pracy może prowadzić innych pracowników osłabnąć jeszcze bardziej. Najwyraźniejszy sposób badać wpływ rówieśników na temat wydajności byłby eksperyment randomizacją, w których pracownicy są losowo przypisane do zmian z pracownikami różnych poziomów wydajności i produktywności wynikająca jest mierzona dla każdego. Naukowcy jednak nie kontrolują harmonogramu pracowników w jakiejkolwiek realnej działalności gospodarczej, a więc Mas i Moretti musieli polegać na naturalnym eksperymentem, która odbyła się w supermarkecie.

Podobnie jak równ. 2,1, ich badanie miało dwie części. Po pierwsze, są wykorzystywane logi z systemu kasie supermarketu mieć precyzyjne, indywidualne, i zawsze na miarę wydajności: liczba skanowanych elementów na sekundę. A po drugie, ze względu na sposób planowania została sporządzona w tym supermarkecie, mają blisko losowej składu rówieśników. Innymi słowy, chociaż szeregowanie kasjerów nie jest określona przez loterii, było zasadniczo losowy. W praktyce mamy zaufanie w naturalnych eksperymentów często zależy od wiarygodności tego "co-jeśli" losowej roszczenia. Korzystając z tej zmienności losowej, Mas Moretti i okazało się, że pracuje z wyższymi rówieśników wydajność zwiększa produktywność. Ponadto Mas i Moretti przyjąć wielkość i bogactwo ich zbiorze wyjść poza szacowania przyczynowo-skutkowy zbadać jeszcze dwa ważne i delikatne kwestie: heterogeniczność tego efektu (na jakie rodzaje pracowników jest efektem powiększenie) oraz mechanizm za efekt (dlaczego posiadające wysokie rówieśnicy produktywności prowadzi do wyższej wydajności). Wrócimy do tych dwie ważne kwestie-niejednorodność efektów leczenia oraz mechanizmy-w rozdziale 5, kiedy omówimy eksperymenty w sposób bardziej szczegółowy.

Uogólniając z badań dotyczących wpływu Projektu Wietnam zarobków i badania wpływu rówieśników na wydajność, Tabela 2.3 podsumowuje inne badania, które mają dokładnie ten sam wzór: stosując zawsze od źródła danych, aby zmierzyć wpływ jakiegoś wydarzenia , W Tabeli 2.3 sprawia, że ​​jasne, naturalne eksperymenty są wszędzie, jeśli tylko wiemy, jak ich szukać.

Tabela 2.3: Przykłady naturalnych eksperymentów z wykorzystaniem dużych źródeł danych. Wszystkie te badania zgodnie z tą samą podstawową recepturę: Random (lub jakby zdarzenie losowe) + zawsze w systemie danych. Zobacz Dunning (2012) więcej przykładów.
merytoryczny ostrości Źródło naturalnego eksperymentu Zawsze na danych źródłowych Cytat
Peer wpływ na produktywność proces planowania Zamówienie dane Mas and Moretti (2009)
formacja przyjaźń huragany Facebook Phan and Airoldi (2015)
Rozprzestrzenianie emocji deszcz Facebook Coviello et al. (2014)
Peer to peer transferów gospodarczych trzęsienie ziemi Pieniądze danych mobilnych Blumenstock, Fafchamps, and Eagle (2011)
Zachowanie indywidualnego spożycia 2013 US zamykania rząd Dane osobiste finanse Baker and Yannelis (2015)
Skutki ekonomiczne system rekomendacyjny różnorodny Dane przeglądania w Amazon Sharma, Hofman, and Watts (2015)
Wpływ stresu na nienarodzone dzieci 2006 Izrael-Hezbollah wojny zapisy urodzenia Torche and Shwed (2015)
Odczytywanie zachowania Wikipedia rewelacje Snowden dzienniki Wikipedia Penney (2016)

W praktyce, badacze stosują dwie różne strategie w celu znalezienia naturalnych eksperymentów, z których oba mogą być owocne. Niektórzy badacze zaczynają się zawsze na danych źródłowych i szukać zdarzeń losowych na świecie; inni zacząć od zdarzeń losowych na świecie i szukać źródeł danych, które oddają ich wpływu. Wreszcie należy zauważyć, że siła naturalnych eksperymentów nie pochodzi od złożoności analizy statystycznej, ale z opieką w odkrywaniu rzetelne porównanie utworzony przez szczęśliwym wypadkiem historii.