Jigana kalawan cara anu pangalusna pikeun ngarti percobaan nyaeta potensi kerangka hasil (anu kuring dibahas dina catetan matematika dina bab 2). Potensi kerangka hasil ngabogaan hubungan deukeut jeung pamanggih ti sampling dumasar rarancang-yen kuring nu dijelaskeun dina bagean 3 (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) . lampiran ieu geus ditulis dina cara sapertos ka ngantebkeun sambungan éta. tekenan ieu bit non-tradisional, tapi kuring mikir yén sambungan antara sampling jeung percobaan nyaeta mantuan: eta hartina lamun nyaho hal ngeunaan sampling lajeng anjeun terang hal ngeunaan percobaan sabalikna. Salaku Abdi gé nunjukkeun dina catetan ieu, potensi kerangka hasil mangka kakuatan percobaan dikawasa randomized keur estimasi épék kausal, sarta nembongkeun keterbatasan naon anu bisa dilakukeun ku percobaan malah sampurna dieksekusi.
Dina lampiran ieu, kuring gé nerangkeun kerangka hasil poténsi, duplicating sababaraha bahan tina catetan matematika dina bab 2 dina urutan nyieun catetan ieu beuki timer ngandung. Saterusna kuring gé ngajelaskeun sabagian hasil mantuan ngeunaan precision of perkiraan tina épék perlakuan rata, kaasup sawala ngeunaan alokasi optimal sarta bédana-di-béda estimators. Lampiran ieu draws beurat on Gerber and Green (2012) .
Kerangka poténsi hasil
Dina raraga ngagambarkeun kerangka hasil poténsi, hayu urang balik deui ka Restivo jeung percobaan van de Rijt urang keur estimasi éfék narima barnstar dina kontribusi kahareup mun Wikipedia. Potensi kerangka hasil boga tilu elemen utama: unit, perlakuan, jeung hasil poténsial. Dina kasus Restivo na van de Rijt, unit anu deserving rai-jalma dina luhur 1% tina kontributor-anu kungsi henteu acan nampi barnstar a. Urang tiasa indéks rai ieu ku \(i = 1 \ldots N\) . The perlakuan dina percobaan maranéhanana éta "barnstar" atawa "henteu barnstar," sarta abdi gé nulis \(W_i = 1\) lamun jalma \(i\) nyaeta dina kaayaan pengobatan sarta \(W_i = 0\) disebutkeun. Unsur katilu tina kerangka hasil poténsi ngarupakeun bagéan nu pangpentingna: nu hasil poténsial. Di handap ieu mangrupakeun bit langkung conceptually hésé sabab ngalibetkeun "potensial" hasil-hal anu bisa kajadian. Pikeun unggal redaktur Wikipédia, salah tiasa ngabayangkeun jumlah éditan yén Aisyah bakal nyieun dina kaayaan perlakuan ( \(Y_i(1)\) ) jeung jumlah yén Aisyah bakal nyieun dina kaayaan control ( \(Y_i(0)\) ).
Catet yén pilihan ieu unit, perlakuan, jeung hasil ngahartikeun naon bisa diajar tina percobaan ieu. Contona, tanpa wae asumsi tambahan, Restivo na van de Rijt bisa ngomong nanaon ngeunaan balukar barnstars on sadayana rai Wikipédia atawa dina hasil kayaning édit kualitas. Sacara umum, pilihan unit, perlakuan, jeung hasil kudu dumasar kana tujuan pangajaran.
Dirumuskeun ieu poténsial hasil-nu diringkeskeun dina tabél 4.5-salah bisa nangtukeun efek kausal tina perlakuan pikeun jalma \(i\) salaku
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]
Pikeun abdi, persamaan ieu jalan clearest keur ngartikeun éfék kausal, sarta, sanajan pisan basajan, kerangka ieu tétéla mun generalizable ku sababaraha cara penting jeung metot (Imbens and Rubin 2015) .
jelema | Éditan dina kaayaan perlakuan | Éditan dina kaayaan kontrol | éfék perlakuan |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
N | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
maksudna | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Lamun urang nangtukeun kausalitas di jalan ieu, kumaha ogé, urang ngajalankeun kana masalah. Ampir sakabeh kasus, kami teu meunang pikeun niténan duanana calon hasil. Hartina, pangropéa Wikipedia husus boh narima barnstar atawa henteu. Kituna, urang niténan salah sahiji outcomes- poténsi \ \(Y_i(1)\) atanapi \(Y_i(0)\) -but teu duanana. The henteu mampuh pikeun niténan duanana calon hasil nyaéta sarupaning masalah utama nu Holland (1986) disebut di Masalah dasar tina kausal kaputusan.
Untungna, lamun urang keur ngalakonan panalungtikan, urang ulah ngan boga hiji jalma, urang kudu loba jalma, sarta ieu nawarkeun cara sabudeureun Masalah dasar tina kausal kaputusan. Tinimbang ngusahakeun estimasi éfék perlakuan individu-tingkat, urang tiasa estimasi éfék perlakuan rata:
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]
Ieu masih ditembongkeun dina watesan tina \(\tau_i\) nu mangrupakeun teu ka-observasi, tapi mibanda sababaraha aljabar (EQ 2.8 tina Gerber and Green (2012) ) urang meunang
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]
Persamaan 4.3 nembongkeun yen lamun bisa nga-estimasi populasi hasilna rata dina perlakuan ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) jeung populasi rata hasilna dina kontrol ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), mangka urang bisa estimasi éfék perlakuan rata, malah tanpa estimasi éfék perlakuan kanggo naon baé tangtu.
Ayeuna mah geus tangtu urang estimand-hal kami nyoba estimasi-I'll giliran sabaraha urang sabenerna bisa estimasi eta kalawan data. Kuring resep mikir ngeunaan tantangan estimasi ieu masalah sampling (pikir deui ka catetan matematika dina bab 3). Ngabayangkeun nu urang acak nyokot sababaraha urang nengetan dina kaayaan pengobatan sarta kami acak nyokot sababaraha urang nengetan dina kaayaan control, mangka urang bisa estimasi hasilna rata di tiap kondisi:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]
dimana \(N_t\) sarta \(N_c\) anu nomer tina jalma dina kaayaan pengobatan sarta kontrol. Persamaan 4.4 mangrupakeun bédana-of-hartosna estimator. Kusabab rarancang sampling, urang terang yén istilah munggaran ieu ngarupakeun unbiased estimator keur hasilna rata dina perlakuan jeung istilah kadua unbiased estimator dina kontrol.
Cara séjén pikeun mikir ngeunaan naon randomization nyandak téh nya éta ensures yén perbandingan antara pengobatan sarta control grup téh adil sabab randomization ensures yén dua grup bakal nyarupaan unggal lianna. siga kieu nahan pikeun hirup urang geus diukur (Ngucapkeun Jumlah éditan dina 30 poé saméméh percobaan) jeung hal kami geus moal diukur (sebutkeun gender). Pangabisa ieu pikeun mastikeun kasaimbangan on duanana faktor katalungtik tur teu katalungtik nya kritis. Ningali kakawasaan balancing otomatis dina faktor anu teu katalungtik, hayu urang ngabayangkeun yen panalungtikan kahareup manggih yén lalaki téh leuwih responsif kana panghargaan ti awéwé. Bakal yén invalidate hasil Restivo jeung percobaan van de Rijt urang? No Ku randomizing, aranjeunna ensured yén sakabéh unobservables bakal saimbang, dina frékuénsi ékspéktasi. perlindungan ieu ngalawan kanyahoan ti pisan kuat, tur eta teh mangrupakeun cara nu Kadé percobaan nu béda ti téhnik non-eksperimen nu dijelaskeun dina bagean 2.
Salian watesan efek perlakuan pikeun sakabéh populasi, kasebut nyaéta dimungkinkeun pikeun nangtukeun éfék perlakuan pikeun sawaréh ti urang. Ieu ilaharna disebut kondisional rata éfék perlakuan (CATE). Contona, dina ulikan ku Restivo na van de Rijt, hayu urang ngabayangkeun yen \(X_i\) nyaeta naha sanésna éta luhur atawa handap jumlah median tina éditan salila 90 poé saméméh percobaan. Hiji bisa ngitung éfék perlakuan misah pikeun ieu rai lampu sarta beurat.
Potensi kerangka hasil mangrupakeun cara ampuh mikir ngeunaan inferensi kausal jeung percobaan. Sanajan kitu, aya dua complexities tambahan nu kudu tetep dina pikiran. Dua complexities anu mindeng lumped babarengan dina istilah stabil Unit Treatment Niley Asumsi (SUTVA). Bagian mimiti SUTVA mangrupa asumsi yén hijina hal anu perkara pikeun jalma \(i\) 's hasilna mangrupa naha jalma anu dina pengobatan atawa kadali kaayaan. Dina basa sejen, eta dianggap yén jalma \(i\) henteu impacted ku perlakuan dibikeun ka jalma séjén. Ieu sok disebut "teu gangguan" atawa "henteu spillovers", tur bisa ditulis salaku:
\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]
dimana \(\mathbf{W_{-i}}\) mangrupakeun véktor of statuses perlakuan for everyone iwal jalma \(i\) . Hiji cara nu kieu bisa dilanggar nyaeta lamun perlakuan ti hiji jalma spills leuwih onto jalma sejen, boh positif atawa négatif. Balik ka Restivo jeung percobaan van de Rijt urang, ngabayangkeun dua babaturan \(i\) sarta \(j\) sarta yén jalma \(i\) narima barnstar sarta \(j\) henteu. Lamun \(i\) narima barnstar nu ngabalukarkeun \(j\) edit deui (kaluar tina rasa persaingan) atawa ngédit kirang (kaluar tina rasa asa), lajeng SUTVA geus dilanggar. Ogé bisa dilanggar lamun dampak perlakuan gumantung kana jumlah total ngeunaan jalma séjén narima perlakuan. Contona, upami Restivo na van de Rijt sempet dibikeun kaluar 1.000 atanapi 10.000 barnstars tinimbang 100, ieu bisa geus impacted efek narima barnstar a.
Isu kadua lumped kana SUTVA nyaeta anggapan yen hijina perlakuan relevan nya hiji yén panalungtik delivers; Anggapan ieu kadangkala disebut euweuh perlakuan disumputkeun atawa excludibility. Contona, dina Restivo na van de Rijt, éta bisa geus bisi anu kalayan méré barnstar hiji panalungtik disababkeun rai bisa diulas dina kaca rai populér tur pastikeun ieu mahluk di rai populér kaca-tinimbang narima barnstar- a anu ngabalukarkeun parobahan dina kabiasaan ngédit. Lamun ieu téh leres, teras efek barnstar nu teu dibédakeung jeung pangaruh keur dina kaca rai populér. Tangtu, teu jelas upami, ti sudut pandang ilmiah, ieu kudu dianggap pikaresepeun atawa unattractive. Hartina, nu bisa ngabayangkeun hiji panalungtik nyebutkeun yen efek narima barnstar a ngawengku sakabéh perlakuan saterusna nu barnstar nu micu. Atawa anjeun bisa ngabayangkeun kaayaan dimana hiji panalungtikan bakal hoyong ngasingkeun efek barnstars ti ieu hal lianna. Hiji cara mikir ngeunaan éta nanya mun aya nanaon nu ngabalukarkeun naon Gerber and Green (2012) (p. 41) nyauran hiji "ngarecahna dina simetri"? Dina basa sejen, nyaeta aya nanaon lian ti pengobatan nu nyababkeun urang dina kaayaan pengobatan sarta control bisa diolah béda? Kasalempang simétri pegatna aya naon ngakibatkeun penderita di kelompok kontrol dina percobaan médis nyandak hiji karacunan placebo. Cara éta, panalungtik bisa pastikeun yén ngan bédana antara dua kaayaan teh ubar sabenerna teu pangalaman nyokot karacunan nu.
Pikeun langkung lengkep ihwal SUTVA, tingali bagian 2.7 tina Gerber and Green (2012) , bagian 2.5 tina Morgan and Winship (2014) , sarta bagian 1.6 tina Imbens and Rubin (2015) .
katalitian
Dina bagian saencanna, Kuring geus digambarkeun kumaha estimasi éfék perlakuan rata. Dina bagian ieu, kuring gé nyadiakeun sabagian pamendak ngeunaan variability jalma perkiraan.
Lamun mikir ngeunaan estimasi éfék perlakuan rata salaku estimasi bédana antara dua sampel mean, teras kasebut nyaéta dimungkinkeun pikeun némbongkeun yén kasalahan baku tina pangaruh perlakuan rata nyaéta:
\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]
dimana \(m\) jalma ditugaskeun pikeun pengobatan sarta \(Nm\) ngadalikeun (tingali Gerber and Green (2012) , EQ. 3,4). Ku kituna, nalika pamikiran ngeunaan sabaraha urang keur napelkeun ka pengobatan sarta sabaraha mun napelkeun ngadalikeun, Anjeun bisa nempo yén lamun \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) , teras anjeun hoyong \(m \approx N / 2\) , salami waragad pengobatan jeung kontrol nu sami. Persamaan 4,6 clarifies naha desain Bond sareng kolega Anjeun ' (2012) percobaan ngeunaan épék inpormasi sosial dina voting (inohong 4.18) éta episien statistik. Ngelingan yen nya kungsi 98% pamilon dina kaayaan perlakuan. Ieu dimaksudkan yén kabiasaan mean dina kaayaan kadali teu diperkirakeun jadi akurat sakumaha eta bisa geus, anu dina gilirannana dimaksudkan yén diperkirakeun bédana antara kaayaan pengobatan sarta control teu diperkirakeun jadi akurat sakumaha bisa jadi. Pikeun langkung lengkep ihwal alokasi optimal pamilon kondisi, kaasup lamun waragad béda antara kaayaan, tingali List, Sadoff, and Wagner (2011) .
Tungtungna, dina téks utama, kuring dijelaskeun kumaha hiji bédana-di-béda estimator, nu ilaharna dipake dina desain dicampur, bisa ngakibatkeun varian nu leuwih leutik ti bédana-di-hartina estimator, nu ilaharna dipake dina antara-subjék desain. Lamun \(X_i\) ngarupakeun nilai tina hasil saméméh perlakuan, teras kuantitas nu urang nyobian keur estimasi ku pendekatan bédana-di-béda téh:
\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]
Standar kasalahan kuantitas anu mangrupa (tingali Gerber and Green (2012) , EQ. 4.4)
\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]
A ngabandingkeun tina EQ. 4.6 jeung EQ. 4,8 mangka yén bédana-di-béda pendekatan bakal boga standar kasalahan leutik lamun (tingali Gerber and Green (2012) , EQ. 4,6)
\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]
Kasarna, nalika \(X_i\) pisan prediksi \(Y_i(1)\) sarta \(Y_i(0)\) , teras anjeun tiasa meunang perkiraan leuwih tepat ti bédana-of-béda pendekatan ti ti difference- a tina-hartina hiji. Hiji cara mikir ngeunaan ieu dina konteks percobaan Restivo na van de Rijt urang éta aya loba variasi alam di jumlah anu édit jalma, jadi ieu ngajadikeun ngabandingkeun kaayaan pengobatan sarta control hésé: éta teuas pikeun ngadeteksi dulur pangaruh leutik di data hasil ribut. Tapi lamun bédana-kaluar ieu variability kajadian sacara alami, teras aya loba kurang variability, sarta yén ngajadikeun eta gampang ngadeteksi éfék leutik.
Tempo Frison and Pocock (1992) pikeun ngabandingkeun hade bédana-of-hartosna, bédana-of-béda, tur geus deukeut basis ANCOVA dina setting leuwih umum dimana aya sababaraha ukuran pre-pengobatan sarta pos-perlakuan. Dina sababaraha hal, maranéhna wani nyarankeun ANCOVA, nu kuring teu katutupan di dieu. Salajengna, tingali McKenzie (2012) pikeun sawala ngeunaan pentingna sababaraha ukuran hasilna pos-perlakuan.