2.4.3.1 Doğal deneyler

Doğal deneyler dünyada rasgele olaylar yararlanın. rastgele bir olay + her zaman açık veri sisteminin = doğal deney

adil karşılaştırma sağlayan randomize kontrollü deneyler anahtarı randomizasyon olduğunu. Ancak, bazen bir şey aslında farklı tedavilere rasgele rastgele veya neredeyse insanları atar dünyada olur. Doğal deneyler kullanım stratejisi en belirgin örneklerinden biri araştırma gelen Angrist (1990) kazanç askeri hizmetlerin etkisini ölçer.

Vietnam savaşı sırasında, Amerika Birleşik Devletleri taslak aracılığıyla silahlı kuvvetlerinin boyutu arttı. hizmete çağrılacak hangi vatandaşların karar vermek için, ABD hükümeti bir piyango düzenledi. Her birthdate bir kağıt parçası üzerinde temsil edildi ve bu kağıtlar büyük bir cam kavanoza konuldu. Şekil 2.5 de gösterildiği gibi, kağıt bu fişleri genç erkekler (genç kadın taslak tabi değil) hizmet denir olacağını sırasını belirlemek için bir defada kavanoz birinden çizildi. sonuçlarına dayanarak, 14 Eylül tarihinde doğdu erkekler böylece 24 Nisan'da doğmuş erkek ikinci çağrıldı, ilk olarak adlandırılır ve bulundu. 171 gün doğmuş erkek denilen değildi iken Sonuçta, bu piyango, 195 farklı günlerde doğan erkekler hizmete çağrıldı.

Şekil 2.5: 1 Aralık Selective Service taslak için ilk kapsülü çizim Kongre Alexander Pirnie (R-NY), askerlik etkisini tahmin etmek için Sosyal Güvenlik İdaresi kazanç verileri ile taslak piyango 1969 Joshua Angrist (1990) kombine kazanç üzerinden. Bu doğal bir deney kullanılarak bir araştırma örneğidir. Kaynak: Vikipedi

Şekil 2.5: 1 Aralık Selective Service taslak için ilk kapsülü çizim Kongre Alexander Pirnie (R-NY), 1969 Joshua Angrist (1990) Askerlik etkisini tahmin etmek için Sosyal Güvenlik İdaresi kazanç verileri ile taslak piyango kombine kazanç üzerinden. Bu doğal bir deney kullanılarak bir araştırma örneğidir. Kaynak: Vikipedi

o hemen belli olmayabilir rağmen, bir taslak piyango randomize kontrollü bir deney için kritik bir benzerlik vardır: Her iki durumda katılımcılar rastgele bir tedavi için atanır. Taslak piyango durumda, taslak-uygunluk ve sonraki işgücü piyasası kazançları üzerindeki askerlik etkileri hakkında öğrenmeye ilgi eğer, biz kimin doğum günlerinin (piyango kesme altında olan insanlar için sonuçlarını karşılaştırabilirsiniz örneğin, 14 Eylül Nisan doğum günü kesim sonrası olan insanlar (örneğin, 20 Şubat 2 Aralık vs.) sonuçları ile 24, vb.)

hazırlanmakta olan bu tedavi rastgele atanmıştır göz önüne alındığında, biz o zaman ölçülen herhangi bir sonuç için bu tedavinin etkisini ölçebilir. Örneğin, Angrist (1990) rastgele beyaz gazileri kazanç karşılaştırılabilir olmayan gazi kazanç göre yaklaşık% 15 daha az olduğu sonucuna Sosyal Güvenlik Kurumu tarafından toplanan kazanç verileri ile taslak seçildi kimin hakkında bilgi kombine . Diğer araştırmacılar da benzer bir hile kullanmış. Örneğin, Conley and Heerwig (2011) rastgele 2000 Nüfus Sayımı ve 2005 Amerikan Toplum Araştırma toplanan evsel verileriyle taslak seçildi kim olduğu hakkında bilgi kombine ve çok uzun taslak sonra, küçük uzun vadeli etkisi olduğunu ortaya koymuştur böyle konut mülkiyeti (kiralama karşı sahip) ve konut istikrar (önceki beş yıl içinde taşınmış olan olasılığı) olarak sonuçların çeşitli askerlik.

Bu örnekte gösterildiği gibi, bazen sosyal, politik, ya da doğal güçler deneyler veya araştırmacılar tarafından kaldıraçlı olabilir yakın deneyleri oluşturmak. randomize kontrollü deneyler çalıştırmak için etik veya pratik olmadığı durumlarda sıklıkla doğal deneyler ayarlarında neden-sonuç ilişkilerini tahmin etmenin en iyi yoludur. Onlar olmayan deneysel verilere adil karşılaştırmalar keşfetmek için önemli bir strateji vardır. Bu araştırma stratejisi bu denklemle özetlenebilir:

\ [\ metin {rastgele (veya rastgele sanki) olay} + \ metin {her zaman açık veri akışı} = \ metin {doğal deney} \ qquad (2.1) \]

Ancak, doğal deneylerin analizi oldukça zor olabilir. Örneğin, Vietnam taslak halinde, herkes taslak serbest hizmet sona erdi kim (muafiyetleri çeşitli vardı). Ve, aynı zamanda, taslak-uygun olmayan bazı insanlar hizmet için gönüllü oldu. Yeni bir ilacın klinik araştırmaya, tedavi grubunda bazı insanların ilacı ve olmasaydı kontrol grubundaki insanların bazıları nedense ilacını aldı gibi oldu. Bu iki taraflı uyumsuzluk adlandırılan bir sorun, aynı zamanda pek çok diğer sorunlar, bu bölümün sonunda edilen okuma, bazı daha ayrıntılı olarak tarif edilmektedir.

doğal olarak rasgele atama meydana yararlanarak stratejisi dijital çağa öncesinde, ancak büyük veri sıklığı kullanmak için bu strateji çok daha kolay hale getirir. Bazı tedavi rastgele atanmıştır gerçekleştirmek kez, büyük veri kaynakları size tedavi ve kontrol koşullarında insanlar için sonuçları karşılaştırmak için gereken sonuç verileri sağlayabilir. Örneğin, taslak ve askerlik etkileri çalışmasında, Angrist Sosyal Güvenlik İdaresi kazanç kayıtların kullandı; Bu sonuç verileri olmadan, onun çalışma mümkün olmazdı. Bu durumda, Sosyal Güvenlik Kurumu her zaman büyük veri kaynağıdır. Daha fazla ve daha otomatik olarak toplanan veri kaynakları var, biz eksojen varyasyon yarattığı değişikliklerin etkilerini ölçmek daha sonuç verilere sahip olur.

Dijital çağda bu stratejiyi açıklamak için, en Mas ve Moretti'nin düşünelim (2009) verimlilik üzerindeki eş etkisi şık bir araştırma. yüzeyde bu yapıda, Vietnam Draft etkileri hakkında Angrist çalışmasında farklı görünebilir rağmen her ikisi de denklem desen izleyin. 2.1.

Mas ve Moretti eşleri çalışanların verimliliğini nasıl etkilediğini ölçülür. Bir yandan, bir çalışkan eş olan, çünkü akran baskısı verimliliklerini artırmak için işçileri yol açabilir. Ya da, diğer taraftan, çalışkan eş daha laçka diğer çalışanları neden olabilir. verimlilik üzerinde akran etkilerini incelemek için net bir şekilde olur işçiler rastgele farklı üretkenlik seviyelerinin işçilerle vardiya atanan ve daha sonra ortaya çıkan verimlilik herkes için ölçüldüğü bir randomize kontrollü deney olacak. Araştırmacılar, ancak, herhangi bir gerçek iş işçilerin zamanlamayı kontrol etmiyoruz ve bu yüzden Mas ve Moretti bir süpermarkette gerçekleşen bir doğal deney güvenmek zorunda.

Sadece denklem gibi. 2.1, yaptıkları çalışmada iki bölümden vardı. Birincisi, onlar kesin bir bireyi var süpermarket çıkış sisteminden günlükleri kullanılan ve verimlilik ölçüsü her zaman açık: saniyede taranan öğelerin sayısı. Ve ikinci olarak, çünkü bu zamanlama bu süpermarkette yapıldı şekilde, onlar eş rastgele kompozisyon yakın var. Diğer bir deyişle, kasiyer zamanlama bir piyango tarafından belirlenen olsa bile, aslında rasgele oldu. Uygulamada, doğal deneylerde var güven sık sık bu "olarak eğer" rastgele iddia inandırıcılık bağlıdır. Bu rastgele değişim yararlanan, Mas ve Moretti daha yüksek verimlilik yaşıtları ile çalışan verimliliği artırır bulundu. Dahası, Mas ve Moretti iki önemli ve ince konuları araştırmaya sebep-sonuç tahmin ötesine taşımak için boyut ve veri kümesi zenginliğini kullandı: (işçi türlü etkisi büyük olduğu) bu etkinin heterojeniteyi ve mekanizması etkisi arkasında (neden yüksek verimlilik eşleri daha yüksek verimlilik yol olan yapar). biz daha ayrıntılı deneyler tartışmak zaman biz tedavi etkilerinin ve mekanizmalar-in Bölüm 5 bu iki önemli konular-heterojenite dönecektir.

kazanç ve verimlilik üzerindeki akranlarının etkisi çalışmaya Vietnam Taslak etkisi üzerinde çalışmalar genelleme, Tablo 2.3 bu aynı yapıya sahip diğer çalışmalar özetlenmektedir: her zaman açık veri kaynağının bazı olay etkisini ölçmek için kullanıyor . Tablo 2.3 net yapar gibi sadece onlara bakmak için nasıl biliyorsanız, doğal deneyler her yerde vardır.

Tablo 2.3: Büyük veri kaynaklarını kullanarak doğal deneylerin örnekleri. rastgele (veya rastgele sanki) olayı + veri sistemi her zaman açık: Bütün bu çalışmalar aynı temel tarifi izleyin. Bkz Dunning (2012) Daha fazla örnek için.
özlü odak doğal bir deney kaynağı Her zaman veri kaynağı alıntı
verimlilik üzerindeki etkileri Peer planlama süreci ödeme veri Mas and Moretti (2009)
Dostluk oluşumu kasırgalar Facebook Phan and Airoldi (2015)
Duyguların Yayılması yağmur Facebook Coviello et al. (2014)
Ekonomik transferler peer to peer deprem mobil para veri Blumenstock, Fafchamps, and Eagle (2011)
Kişisel tüketim davranışı 2013 ABD hükümeti kapatma kişisel finans verileri Baker and Yannelis (2015)
recommender sistemlerinin ekonomik etkileri çeşitli Amazon at tarama verilerini Sharma, Hofman, and Watts (2015)
Doğmamış bebeklerin stres etkisi 2006 İsrail-Hizbullah savaşı doğum kayıtları Torche and Shwed (2015)
Wikipedia'da davranışı Okuma Snowden âyetlerini Vikipedi günlükleri Penney (2016)

Uygulamada, araştırmacılar verimli olabilir, her ikisi de doğal deneyler, bulmak için iki farklı stratejiler kullanırlar. Bazı araştırmacılar verileri her zaman açık kaynağı ile başlar ve dünyada rastgele olaylar için bakmak; Diğerleri dünyada rasgele olaylar ile başlar ve etkilerini yakalamak veri kaynakları aramak. Son olarak, doğal deneyler gücü istatistiksel analiz sofistike değil geliyor, ama bir tarih şanslı kaza tarafından oluşturulan adil bir karşılaştırma keşfetmek bakımı dikkat edin.