Biz yapamayız deneyler yaklaşık olarak belirleyebilir. Özellikle dijital çağda yarar iki yaklaşım eşleşen ve doğal deneyler vardır.
Birçok önemli bilimsel ve politika soruları nedensel vardır. en düşünelim, örneğin, aşağıdaki soru: ücretler üzerindeki bir iş eğitim programının etkisi nedir? Bu soruyu cevaplamak için bir yolu işçileri rastgele eğitim almak ya da eğitim almayan ya ayrıldı randomize kontrollü bir deney ile olacaktır. Ardından, araştırmacılar basitçe almadım olanlara eğitim almış kişilerin ücretlerin karşılaştırarak bu katılımcılar için eğitimin etkisini tahmin olabilir.
randomizasyon: basit karşılaştırma çünkü veri bile toplanmış önce olur şey geçerlidir. randomizasyon olmadan, sorun çok daha karmaşıktır. Bir araştırmacı, gönüllü kaydolma vermedi olanlara eğitim için kaydoldum kişilerin maaşlarını karşılaştırabilirsiniz. Bu karşılaştırma muhtemelen eğitimi almış insanlar daha fazla kazandığını gösteriyor, ama ne kadar bu nedeniyle eğitim ve kaydolma eğitimi için insanlar kaydolma olmadığını eğitimi için farklıdır, çünkü ne kadar bu nedir? Diğer bir deyişle, bu insanlar bu iki grubun ücret karşılaştırmak adil?
Adil karşılaştırmalar konusundaki bu endişe bir deney çalıştırmadan nedensel tahminleri yapmak mümkün olduğuna inanmak için bazı araştırmacılar yol açar. Bu iddia çok ileri gider. bu deneyler nedensel etkileri güçlü kanıt olduğu doğru olmakla beraber, değerli nedensel tahminleri sağlayabilir diğer stratejiler vardır. Bunun yerine (pasif verilerin bulunması durumunda) bu nedensel tahminleri (deneylerin durumunda) kolay ya da imkansız ya olan düşünme, bir süreklilik güçlü ila zayıf (Şekil boyunca uzanan nedensel tahminler yapmak için stratejileri düşünmek daha iyidir 2.4). süreklilik güçlü sonunda kontrol deneyler randomize. Ancak, bu genellikle birçok tedaviler hükümetlerden veya şirketlerden işbirliği gerçekçi miktarda gerektirir çünkü sosyal araştırma yapmak zordur; oldukça sade yapamayacağımız birçok deneyler vardır. Ben güçlü ve randomize kontrollü deneyler zayıf hem de Bölüm 4 tüm ayıracağız ve bazı durumlarda, deneysel yöntemlere gözlemsel tercih güçlü etik nedenler var olduğunu iddia edeceğiz.
sürem boyunca hareket eden araştırmacılar, açıkça randomize değil durumlar vardır. Yani, araştırmacılar aslında bir deney yapmadan deney gibi bilgiler öğrenmek çalışıyorsunuz edilir; Doğal olarak, bu zor olacak, ama büyük veri ölçüde bu durumlarda nedensel tahminler yapmak için yeteneğini geliştirir.
Bazen dünyanın rastgelelik araştırmacılar için bir deney gibi bir şey yaratmak için olur ayarları vardır. Bu tasarımlar, doğal deneyler denir ve bunlar Bölüm 2.4.3.1 ayrıntılı olarak ele alınacaktır. Büyük veri kaynaklarından-onların her zaman doğa ve onların iki özelliği boyutu-büyük ölçüde bunlar oluştuğunda doğal deneyler öğrenmek için yeteneğini geliştirir.
daha uzakta randomize kontrollü deneyler hareketle, bazen bir doğal deney yaklaştığı kullanabileceğiniz doğada bile bir olay yoktur. Bu ayarlara, biz dikkatle bir deney yaklaştığı bir girişim olmayan deneysel verilerle içinde karşılaştırmalar oluşturabilirsiniz. Bu tasarımlar eşleşen denir ve bunlar Bölüm 2.4.3.2 ayrıntılı olarak ele alınacaktır. Doğal deneyler gibi, eşleştirme aynı zamanda büyük veri kaynaklarından yararlanır bir tasarımdır. Özellikle, masif boyut Her iki durumda sayısı ve kişi başına bilgi türü bakımından durumunda-büyük eşleştirme kolaylaştırır. Doğal deneyler ve eşleştirme arasındaki temel fark, doğal deneylerde araştırmacı tedavi atanmış ve rastgele inandığı hangi aracılığıyla sürecini biliyor.
Doğal deneyler ve eşleme: deneyler yapmak arzuları motive adil karşılaştırmalar kavramı da iki alternatif yaklaşımlar yatmaktadır. Bu yaklaşımlar zaten var verilerin içinde oturan adil karşılaştırmalar keşfederek pasif gözlemlenen verilerden nedensel etkileri tahmin etmek sağlayacaktır.