Bu ekte, deneysel olmayan verilerden nedensel çıkarım yapma konusunda biraz daha matematiksel bir formda bazı fikirleri özetleyeceğim. İki ana yaklaşım vardır: En çok Judea Pearl ve meslektaşlarıyla ilişkili nedensel grafik çerçevesi ve en çok Donald Rubin ve meslektaşlarıyla ilişkili potansiyel sonuç çerçevesi. Potansiyel çıktılar çerçevesini tanıtacağım çünkü bölüm 3 ve 4'ün sonundaki matematiksel notlardaki fikirlerle daha yakından bağlantılıdır. Nedensel grafikler çerçevesi hakkında daha fazla bilgi için Pearl, Glymour, and Jewell (2016) tavsiye ederim. ) ve Pearl (2009) (gelişmiş). Potansiyel çıktı çerçevesini ve nedensel grafik çerçevesini birleştiren nedensel çıkarımın kitap uzunluğundaki bir tedavisi için Morgan and Winship (2014) tavsiye ederim.
Bu ekin amacı, bu konuda yazılan daha teknik materyallerin bazılarına geçiş yapabilmeniz için potansiyel sonuç geleneğinin notasyonu ve stiliyle rahat olmanıza yardımcı olmaktır. İlk olarak, potansiyel sonuç çerçevesini anlatacağım. Daha sonra, askeri hizmetin kazançlar üzerindeki etkisi konusunda Angrist (1990) gibi doğal deneyleri daha fazla tartışmak için kullanacağım. Bu ek, büyük ölçüde Imbens and Rubin (2015) üzerine Imbens and Rubin (2015) .
Potansiyel çıktılar çerçevesi
Potansiyel çıktılar çerçevesinin üç ana unsuru vardır: birimler , tedaviler ve potansiyel sonuçlar . Bu unsurları göstermek için, Angrist (1990) ele alınan sorunun stilize edilmiş bir versiyonunu ele alalım: Askeri hizmetin kazançlar üzerindeki etkisi nedir? Bu durumda, biz Amerika Birleşik Devletleri'nde 1970 celbi için seçilebilir insanlar gibi birimlerini tanımlayabilir ve olabilir biz endeksi ile bu insanlar \(i = 1, \ldots, N\) . Bu davadaki tedaviler “askeriyede hizmet etmek” veya “orduda hizmet vermemek” olabilir. Bunları tedavi ve kontrol koşullarına \(W_i = 1\) eğer kişi \(i\) \(W_i = 1\) yazacağım \(W_i = 1\) \(i\) Tedavi durumunda ve \(i\) kişi kontrol durumunda ise \(W_i = 0\) . Son olarak, potansiyel sonuçlar biraz daha kavramsal olarak zordur çünkü “potansiyel” sonuçları içerirler; Olabilecek şeyler. 1970 taslağı için uygun olan her bir kişi için, eğer orduda hizmet ederse, 1978 yılında kazanacakları miktarı hayal edebiliriz ki, ki buna \(Y_i(1)\) , ve kazanacakları miktar. 1978 askeriyede hizmet etmediyselerdi, ki buna \(Y_i(0)\) . Potansiyel çıktı çerçevesinde, \(Y_i(1)\) ve \(Y_i(0)\) sabit miktarlar olarak kabul edilirken, \(W_i\) rasgele bir değişkendir.
Birimlerin, tedavilerin ve sonuçların seçimi kritiktir çünkü çalışmadan neyin öğrenilebileceğini ve yapamayacağını tanımlar. Ünitelerin seçimi - 1970 taslağı için uygun insanlar - kadınları içermez ve bu nedenle ek varsayımlar olmaksızın, bu çalışma bize askerlik hizmetinin kadınlar üzerindeki etkisi hakkında hiçbir şey söylemeyecektir. Tedavileri ve sonuçları nasıl tanımlayacağına dair kararlar da önemlidir. Mesela, ilgilenilen muamele, orduya hizmet etmeye veya savaşmayı deneyimlemeye odaklanmalı mı? Faiz sonucu kazanç mı, yoksa iş tatmini mi? Sonuç olarak, birim, tedavi ve sonuçların seçimi çalışmanın bilimsel ve politik hedefleri tarafından yönlendirilmelidir.
Birimlerin, tedavilerin ve potansiyel sonuçların seçimleri göz önünde bulundurulduğunda, tedavinin kişinin \(i\) , \(\tau_i\) üzerindeki nedensel etkisi,
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
Başka bir deyişle, ne kadar kişi karşılaştırmak \(i\) çok kişi nasıl yattıktan sonra kazanılan olurdu \(i\) sunmadan kazanmış. Benim için eq. 2.1 nedensel bir etkiyi tanımlamanın en net yoludur ve son derece basit olmasına rağmen, bu çerçeve birçok önemli ve ilginç yolla genellenebilir hale gelmektedir (Imbens and Rubin 2015) .
Potansiyel çıktılar çerçevesini kullanırken, genellikle tüm birimler için potansiyel sonuçları ve tedavi etkilerini gösteren bir tablo yazmayı faydalı buluyorum (tablo 2.5). Çalışmanız için böyle bir tablo hayal edemiyorsanız, ünitelerinizin, tedavilerinizin ve potansiyel sonuçlarınızın tanımlarında daha kesin olmanız gerekebilir.
Kişi | Tedavi koşullarında kazanç | Kontrol koşullarındaki kazançlar | Tedavi etkisi |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
Anlamına gelmek | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Nedensel etkiyi bu şekilde tanımlarken, bir problemle karşılaşırız. Hemen her durumda, hem potansiyel sonuçları gözlemlemeyiz. Yani, belirli bir kişi hizmet etti ya da hizmet etmedi. Bu nedenle, potansiyel sonuçlardan birini gözlemliyoruz - \(Y_i(1)\) veya \(Y_i(0)\) - her ikisini de değil. Hem potansiyel sonuçların gözlemlenememesi, Holland (1986) Nedensel Çıkarımın Temel Sorunu olarak adlandırdığı büyük bir sorundur.
Neyse ki, araştırma yaparken, sadece bir insanımız yok; daha doğrusu, birçok insanımız var ve bu, Nedensel Çıkarımın Temel Sorunu etrafında bir yol sunuyor. Bireysel düzeyde tedavi etkisini tahmin etmeye çalışmak yerine, tüm birimler için ortalama tedavi etkisini tahmin edebiliriz:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
Bu denklem hala gözlemlenemeyen \(\tau_i\) cinsinden ifade edilir, fakat bazı cebirlerle ( Gerber and Green (2012) eq 2.8)
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
Bu, tedavi altındaki popülasyonun ortalama sonucunu tahmin edebilecek olursak ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) ve popülasyonun ortalama sonucunun kontrol altında ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), daha sonra, belirli bir kişinin tedavi etkisini tahmin etmeden bile, ortalama tedavi etkisini tahmin edebiliriz.
Şimdi tahminimizi - tahmin etmeye çalıştığımız şeyi - tanımladım, veriyi nasıl tahmin edebileceğimize döneceğim. Ve burada, doğrudan, her bir insan için olası sonuçlardan birini gözlemlediğimiz soruna doğru koşuyoruz; ya \(Y_i(0)\) ya da \(Y_i(1)\) (tablo 2.6). Hizmet etmeyen kişilerin kazancına hizmet eden kişilerin kazançlarını karşılaştırarak ortalama tedavi etkisini tahmin edebiliriz:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
Burada [ \(N_t\) ve \(N_c\) , tedavi ve kontrol koşullarındaki kişilerin \(N_c\) . Bu yaklaşım, tedavi ataması potansiyel sonuçlardan bağımsız olarak iyi işleyebilir ; bu durum bazen duyarsızlık olarak adlandırılan bir durumdur . Ne yazık ki, bir denemenin yokluğunda, çoğu zaman tatmin edilemez, bu da denklemdeki tahmin edicinin anlamına gelir. 2.4, iyi bir tahmin üretme olasılığı düşüktür. Bunu düşünmenin bir yolu, rastgele tedavinin yapılmaması durumunda, denk. 2.4, benzeriyle karşılaştırılamıyor; Farklı insan türlerinin kazançlarını karşılaştırıyor. Ya da tedavinin rastgele atanması olmadan, biraz farklı ifade edildiğinde, tedavi tahsisi muhtemelen potansiyel sonuçlarla ilişkilidir.
Bölüm 4'te, randomize kontrollü deneylerin araştırmacıların nedensel tahminler yapmalarına nasıl yardımcı olabileceğini açıklayacağım ve burada araştırmacıların taslak piyango gibi doğal deneylerden nasıl yararlanabileceğini açıklayacağım.
Kişi | Tedavi koşullarında kazanç | Kontrol koşullarındaki kazançlar | Tedavi etkisi |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
Anlamına gelmek | ? | ? | ? |
Doğal deneyler
Bir deney yapmadan nedensel tahminler yapmanın bir yaklaşımı, sizin için rasgele bir şekilde tahsis edilmiş olan, dünyada meydana gelen bir şeyi araştırmaktır. Bu yaklaşıma doğal denemeler denir. Birçok durumda, ne yazık ki, doğa ilgi popülasyonuna istediğiniz tedaviyi rastgele dağıtmaz. Ancak bazen, doğa rastgele bir şekilde ilgili bir tedavi sunar. Özellikle, insanları birincil tedaviyi almaya teşvik eden bazı ikincil tedavilerin olduğu durumu ele alacağım. Örneğin, taslak, bazı kişileri ordunun hizmetinde olan birincil tedaviyi almaya teşvik eden rastgele atanmış bir ikincil tedavi olarak düşünülebilir. Bu tasarıma bazen teşvik tasarımı denir. Ve bu durumu ele almak için tanımlayacağım analiz metodu bazen araçsal değişkenler olarak adlandırılır. Bu ortamda, bazı varsayımlarla, araştırmacılar, belirli bir alt grup birimi için birincil tedavinin etkisini öğrenmek için cesaretlendirmeyi kullanabilirler.
İki farklı tedaviyi (teşvik ve birincil tedavi) ele almak için yeni bir notasyona ihtiyacımız var. Bazı insanların rastgele hazırlandığını ( \(Z_i = 1\) ) veya taslağı hazırlanmadığını ( \(Z_i = 0\) ); Bu durumda, \(Z_i\) bazen bir enstrüman olarak adlandırılır.
Hazırlananlar arasında, bazı ( \(Z_i = 1, W_i = 1\) ) ve bazı ( \(Z_i = 1, W_i = 0\) ) hizmet etti. Aynı şekilde, taslak olmayanlar arasında, bazı ( \(Z_i = 0, W_i = 1\) ) ve bazı ( \(Z_i = 0, W_i = 0\) ) hizmet \(Z_i = 0, W_i = 0\) . Her bireyin potansiyel sonuçları şimdi hem teşvik hem de tedavi için durumlarını göstermek için genişletilebilir. Örneğin, \(Y(1, W_i(1))\) \(W_i(1)\) , taslağı hazırlanırsa \(i\) kazancının olması durumunda, \(W_i(1)\) öğesi, eğer hazırlanırsa servis durumu ise. Dahası, nüfusu dört gruba ayırabiliriz: compliers, asla alamamayanlar, savunucular ve her zaman toplayıcılar (tablo 2.7).
tip | Eğer hizmet varsa | Servis edilmediyse servis |
---|---|---|
uymayanların | Evet, \(W_i(Z_i=1) = 1\) | Hayır, \(W_i(Z_i=0) = 0\) |
Hiçbir zaman girenlerin | Hayır, \(W_i(Z_i=1) = 0\) | Hayır, \(W_i(Z_i=0) = 0\) |
Defiers | Hayır, \(W_i(Z_i=1) = 0\) | Evet, \(W_i(Z_i=0) = 1\) |
Her zaman girenlerin | Evet, \(W_i(Z_i=1) = 1\) | Evet, \(W_i(Z_i=0) = 1\) |
Tedavinin etkisini (yani askerlik hizmetini) tahmin etmeden önce, önce cesaretin iki etkisini (yani, taslak olarak) tanımlayabiliriz. İlk olarak, teşvikin birincil tedavi üzerindeki etkisini tanımlayabiliriz. İkincisi, cesaretin sonuca etkisini tanımlayabiliriz. Bu iki etkinin, belirli bir grup insan üzerinde tedavinin etkisinin bir tahminini sağlamak için birleştirilebileceği ortaya çıkacaktır.
İlk olarak, tedaviye teşvikin etkisi kişi olarak tanımlanabilir: \(i\)
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
Ayrıca, bu miktar tüm popülasyon üzerinde tanımlanabilir.
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
Son olarak, verileri kullanarak \(\text{ITT} _{W}\) tahmin edebiliriz:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
\(\bar{W}^{\text{obs}}_1\) , teşvik edilenler için gözlenen tedavi oranıdır ve \(\bar{W}^{\text{obs}}_0\) teşvik edilmeyenler için gözlenen tedavi oranı. \(\text{ITT}_W\) da bazen alım oranı olarak adlandırılır.
Daha sonra, teşvikin sonuca olan etkisi, kişi \(i\) için şu şekilde tanımlanabilir:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
Ayrıca, bu miktar tüm popülasyon üzerinde tanımlanabilir.
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
Son olarak, verileri kullanarak \(\text{ITT}_{Y}\) tahmin edebiliriz:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
\(\bar{Y}^{\text{obs}}_1\) burada teşvik edilenler için (örneğin, taslak) ve \(\bar{W}^{\text{obs}}_0\) teşvik edilmeyenler için gözlenen sonuçtur.
Son olarak, dikkatimizi ilginin etkisine çeviriyoruz: birincil tedavinin (örneğin askerlik hizmetinin) sonucu üzerindeki etkisi (ör., Kazanç). Ne yazık ki, genel olarak, tüm birimler üzerindeki bu etkiyi tahmin edemeyeceği ortaya çıkıyor. Bununla birlikte, bazı varsayımlarda, araştırmacılar tedavinin uyumlayıcılar üzerindeki etkisini tahmin edebilirler (örneğin, taslağı hazırlanırsa sunulacak kişiler ve hazırlanmamışsa hizmet vermeyen kişiler, tablo 2.7). Bu tahmin ve derleyici ortalama nedensel etkiyi (CACE) (aynı zamanda bazen yerel ortalama tedavi etkisi , LATE olarak da adlandırılır) çağıracağım:
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
\(G_i\) , \(i\) kişi grubunu bağışlar (bkz. tablo 2.7) ve \(N_{\text{co}}\) compliers sayısıdır. Başka bir deyişle, eq. 2.11 \(Y_i(1, W_i(1))\) taslağı hazırlanmış ve \(Y_i(0, W_i(0))\) . Eşdeğerde 2.11 gözlemlenen verilerden tahmin etmek zor görünmektedir, çünkü sadece gözlemlenen verileri kullanan bir compliers tanımlamak mümkün değildir (birisinin derleyici olup olmadığını bilmek için, taslağı hazırlanırken sunulup sunulmadığını ve taslağı hazırlanmadığında işe yarayıp yaramadığını gözlemlemeniz gerekir).
Şaşırtıcı bir şekilde ortaya çıkıyor ki, eğer herhangi bir compliers varsa, o zaman üç ek varsayım sağlanmışsa, CACE'yi gözlemlenen verilerden tahmin etmek mümkündür. İlk olarak, tedaviye atanmanın rasgele olduğunu varsayalım. Çekiliş çekilişi durumunda bu makul. Bununla birlikte, doğal deneylerin fiziksel randomizasyona dayanmadığı bazı ortamlarda, bu varsayım daha sorunlu olabilir. İkincisi, onların birer savunmacı olmadığını varsaymak gerekir (bu varsayım aynı zamanda bazen monotonluk varsayımı olarak da adlandırılır). Taslak bağlamında, taslağı hazırlanmayan ve hazırlanmaması durumunda hizmet edecek çok az insanın var olduğunu varsaymak makul görünmektedir. Üçüncü olarak ve son olarak, dışlama kısıtlaması olarak adlandırılan en önemli varsayım gelir. Dışlama kısıtlaması altında, tedavi atamalarının tüm etkilerinin tedavinin kendisinden geçtiğini varsaymak gerekir. Başka bir deyişle, sonuçların teşvik edilmesinin doğrudan bir etkisi olmadığı varsayılmalıdır. Örneğin, taslak piyango örneğinde, taslak durumun askeri hizmetten başka kazançlara hiçbir etkisi olmadığı varsayılmalıdır (şekil 2.11). Örneğin, tasarlanan kişiler hizmetten kaçınmak için okulda daha fazla zaman harcamışlarsa veya işverenlerin taslak halindeki kişileri işe alma olasılıkları daha az ise, dışlama kısıtlaması ihlal edilebilir.
Eğer bu üç koşul (tedaviye rastgele atama, sınırsızlık ve dışlama kısıtlaması) karşılanırsa
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
bu yüzden CACE'yi tahmin edebiliriz:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
CACE'yi düşünmenin bir yolu, teşvik edilen ve teşvik edilmeyenlerin, alım oranı ile şişirilenlerin sonuçları arasındaki farktır.
Akılda tutulması gereken iki önemli uyarı var. Birincisi, dışlama kısıtlaması güçlü bir varsayımdır ve konu alanı uzmanlığını sıklıkla gerektiren durum bazında gerekçelendirilmelidir. Dışlama kısıtlaması, cesaretlendirmenin randomizasyonu ile haklı çıkarılamaz. İkincisi, araçsal değişken analizi ile ortak bir pratik meydan okuma, teşvikin tedaviyi ele geçirme üzerinde çok az etkisi olduğu zaman gelir ( \(\text{ITT}_W\) küçük olduğunda). Buna zayıf bir araç denir ve çeşitli problemlere yol açar (Imbens and Rosenbaum 2005; Murray 2006) . Sorunu zayıf enstrümanlar ile düşünmenin bir yolu, \(\widehat{\text{CACE}}\) nin küçük olasılıklara duyarlı olabileceğidir: \(\widehat{\text{ITT}_Y}\) Dışlama kısıtlamasının ihlali - çünkü bu önyargılar küçük bir \(\widehat{\text{ITT}_W}\) tarafından büyütülür (bkz. denklem 2.13). Kabaca, doğanın yaptığı tedaviyi önemsediğiniz tedavi üzerinde büyük bir etkisi yoksa, o zaman önem verdiğiniz tedaviyi öğrenmek için zor bir zamanınız olacaktır.
Bu tartışmanın daha resmi bir versiyonu için Imbens and Rubin (2015) bölüm 23 ve 24'e bakınız. Araçsal değişkenlere geleneksel ekonometrik yaklaşım tipik olarak, potansiyel sonuçları değil, denklemleri tahmin etme anlamında ifade edilir. Bu diğer perspektiften bir giriş için, bkz. Angrist and Pischke (2009) ve iki yaklaşım arasındaki bir karşılaştırma için, Imbens and Rubin (2015) bölüm Imbens and Rubin (2015) bakınız. Enstrümantal değişkenler yaklaşımının alternatif, biraz daha az resmi bir sunumu, Gerber and Green (2012) bölüm 6'da verilmiştir. Dışlama kısıtlaması hakkında daha fazla bilgi için, bkz. D. Jones (2015) . Aronow and Carnegie (2013) , Aronow and Carnegie (2013) hesaplamak için kullanılabilecek ek bir varsayım grubu tanımlamaktadır. Doğal deneylerin yorumlanması çok zor olabileceği hakkında daha fazla bilgi için Sekhon and Titiunik (2012) bakınız Sekhon and Titiunik (2012) . Doğal deneylere daha genel bir giriş yapmak için - sadece, enstrümantal değişkenler yaklaşımının ötesine geçen, gerileme süreksizliği gibi tasarımları da içeren - bkz. Dunning (2012) .