Credu chì u megliu modu per cumprà l'esperimenti hè u marcu d' outcome potenziale (chì discurria cù notte matematica in u capitu 2). U marcu d'outcome potenzale hè un rapportu righjunali cù l'idee nantu à u dispunimentu (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) di u disignu chì t'aghju scrittu in u capu 3 (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) . Questu appendice hè stata scritta in modu cusì cum'è di riammiscenzà sta rilazioni. Questu enfasi hè un pocu tradiziunale, ma pensu chì a cunnessione entre u prucedimentu è l'esperimenti hè d'utile: volenu chì, se sapete qualcosa di a mostra, pudete sanu cun qualche cosa di esperimenti è viciversa. Quandu aghju vede in queste notte, u marcu di u rispettu potenzali palesa a forza di l'esperimenti cuntrullati à l'azurate per l'estimazione d'effetti causali, è si mostra a limitazione di ciò chì pò esse fattu ancu cù esperimenti perfezultati perfettamenti.
In questu appendix, aghju descrizanu u marcu di i surviglii pussibbili, duplicà un pocu di u materiale da i notae matematica in u capitu 2 per fà alcuni più stessi. Allora scrivi qualcuni risultati utili à a precisione di estimi di l'effetti mediate di u trattamentu, cumpresa una discussione di ottene una distribuzione è stimulanti di diferenza in diferenziu. Questu appendix si basa assai in Gerber and Green (2012) .
Elementu u prugrammu potenzali
Per esse illustrati u marcu di i sulitamenti pussibbili, tornammu à l'affirmazioni di Restivo è van de Rijt per stimarna l'effettu di ricivete una stella di stampa in i future contributions in Wikipedia. U marcu d'outcome potenziale hè parechje elementi principalità: unità , trattamenti è punti di forza . In u casu di Restivo è van de Rijt, l' unità eranu merecedori editori, quelli chì eranu in u top 1% di i contributori-chì ùn anu micca avè ricevutu un barnstar. Pudemu indè qualchì editore per \(i = 1 \ldots N\) . I tratti in u so spirimimentu "hè stannatu" o "micca starnate", è scrive \(W_i = 1\) se a persona \(i\) hè in a cundizione di trattamentu è \(W_i = 0\) altri. U terzu elementu di u marcu d'outcome potenziale hè u più impurtante: i risultati potenzjali . Eccu sò più cuncettualmenti difficiule perchè invistiscenu "punti di u prugrammu": e cose chì puderia succorsu. Per ogni editore Wikipedia, puderete imagine u numeru di editi chì puderia fà in a cundizione di trattamentu ( \(Y_i(1)\) ) è u nùmmuru chì faria in a cundizione di cuntrollu ( \(Y_i(0)\) ).
Avemu chì sta scelta di unità, trattamentu è ricerca definenu ciò chì pò esse da stu esperimentu. Per esempiu, senza alcuna assicuranza supplementu, Restivo è van de Rijt ùn ponu dì più di l'effetti di e cumpagnie in tutti i editori di Wikipedia, o nantu à ricerca cum'è edità di qualità. In generale, l'scelta di unità, trattamentu, è riflettori deve esse basatu nantu à i scopi di u studiu.
Dati di sti segumenti prugressivi-chì sò summarizzati in a table 4.5-unu pò definisce l'effettu causale di u trattamentu per a persona \(i\) com'è
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]
À mè, questa equazioni hè a modu più chjaru di definisce un effettu causale, è, anche si simplificatu assai, stu marcu torna à generalizà in assai modi impurtanti è interessanti (Imbens and Rubin 2015) .
Persuna | Edits in a cundizione di trattamentu | Edit in a cundizione di cuntrollu | Trattamentu |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
N | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
significava | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
Se definisce a causalità in questu modu, però, avemu un problema. In quasi tutti i casi, ùn anu micca bisognu à i risultati potenzjali. Hè ciò chì hè un editore speċatu di Wikipedia per ellu ricevenu un maestru di stile o micca. Eccu, osservammu unu di i punti di \(Y_i(1)\) pussibuli- \(Y_i(1)\) o \(Y_i(0)\) -but not both. L'incapacità di observà i risultati possittivi hè un quistu problema chì Holland (1986) chjamatu u Problemari fundamentale di a inferenza causale .
Fortunatamente, quandu avemu fattu a ricerca, ùn avemu micca solu una persona, avemu tanti pirsuni, è questu offerte un modu à u Circundante di Problemà Fundamentali di a Derbia Causal. Invece di pruvate d'estimà l'effettu di trattamentu individuale, pudemu avè stimi l'effettu mediu di u trattamentu:
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]
Questu hè ancu espresu in terms of the \(\tau_i\) chì ùn sò micca osservati, ma cun algebra (Eq 2.8 di Gerber and Green (2012) ) avemu
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]
L'Ecuazione 4.3 ponu amuce chì se pudemu avè stimiu u prugramma migliu di a pupulazione sottu u trattamentu ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) è u prugramma mediu di pupulazione cun cuntrollu ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), pudemu avè stimi l'effettu mediu di trattamentu, anche senza estimà l'effettu di trattamentu per ogni persona particulare.
Avà chì l'aghju definitu a nostra estimanda-a cosa chì avemu prova di stima-vi daraghju turnà cumu pudemu esaminà stima cù dati. Mi piace à pensà à questa stima di stima com'è un problema di mostra (pensate à e noti matematii in u capitu 3). Puderanu chì puderebbi piglià saltà parechje persone per osservà in a cundizione di trattamentu è aghjustà à parechje persone per osservà in a cundizione di cuntrollu, pudemu avè stimi l'uparazioni mediu in ogni cundizione:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]
induve \(N_t\) è \(N_c\) sò i numeri di i persone in i cundizioni di trattamentu è di cuntrollu. L'equation 4.4 hè un stimatore di difesa di media. Per via di u disignu di u dispunimentu, sapemu chì u primu termini hè un stimatore imparu per u prucedimentu mediu sottu u trattamentu è u second terme hè un stimatore imparu sottu u cuntrollu.
Un'altra manera di penserà quale l'aleatorie permette hè chì assicura chì a comparazione entre i gruppi di trattamentu è di cuntrollu hè giustu perchè a randomizazione sicura chì i dui gruppi se s'assumiganu à l'altri. Questa semitoncia cuntene per i cose chì avemu misuratu (per esempiu u numaru di edita in i 30 ghjorni prima di l'esperimentu) è e cose chì avemu micca misuratu (voi generale). Questa capacità per assicurà un equilibru nantu à i medii observati è micca osservati hè criticu. Per vede u putere di equilibrio automaticu nantu à fatturii micca osservati, imagine chì e ricerche futura trova chì l'omi sò più responsive à i premiu chi à e donne. Could you invalidate the results of Restivo and van de Rijt's experiment? Nè à l'aleatorii, assicuranu chì tutti i seguenti ùn sanu sia equilibratu, in expectazione. Questa prutezione contru l'ignurita hè assai putenti, è hè una manera impurtante chì l'experimenti sò diffirenti di e tecniche non-esperimenti deskritti in u capitu 2.
In più di definisce l'effettu di trattamentu per una populazione sana, hè pussibule definisce un effettu di trattamentu per un subunite di persone. Questu hè chjamatu chjamatu un effettu di trattamentu mediu cuncessionale (CATE). Per esempiu, in studiu da Restivo è van de Rijt, imagine chì \(X_i\) hè esse se l'editore hè sopra o sopra à u mediu numaru di editi duranti i 90 ghjorni prima di l'esperimentu. Puderete per calculà l'effettu di trattamentu per separà per questi editori chjuche è forti.
U marcu d'outcome potenziale hè un modu putente di pensà à a inferenza causale è à l'esperimenti. In ogni casu, ci sò dui complexità supplementi chì voi avete averemu in mente. Sti dui intriczii sò spessu si unificati in u termu Unitate Stable Unità di Trattamentu Assicurativu (SUTVA). A prima parte di SUTVA hè u pensà chi l 'unica cosa ca nteressa di pirsuna \(i\) ' s risultatu hè s'ellu chì e persone era in l 'cundizione fanga o di cuntrollu. In altri palori, hè presumutu chì a persona \(i\) ùn hè micca impreveduta da u trattamentu datu à l'altri populi. Questu hè chjamatu chjamatu "nisunziunzione" o "senza spillovers", è pò esse scrittu cum'è:
\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]
induve \(\mathbf{W_{-i}}\) hè un vìtoru di status di trattamentu per ognunu cù u persone \(i\) . Un modu chì si pò esse infurbatu hè chì u trattamentu da una persona si sparsa nantu à una altra persona, o pusitiva o negativamente. Riturnà à Restivo è l'esperimentu di Van de Rijt, imagine parechji amichi \(i\) è \(j\) è questa persona \(i\) riceve un cantonu è \(j\) ùn hè micca. Se \(i\) riceve u barnstar causa \(j\) mudificà di più (da un sensu di a cuncorsu) o editate menu (da un sensu di disperazione), in seguitu SUTVA hè statu violata. Pò esse ancu viulati l'impattu di u trattamentu dipende nantu à u numaru nùmmaru di altre persone chì riceve u trattamentu. Per esempiu, se Restivo è van de Rijt avia annunziatu 1 000 o 10 000 ingannuli in u cuntu di 100, questu puderia avè impactatu l'effettu di ricivete un granaghju.
U sicuru issue hè aghjunatu in SUTVA hè a supposizione chì l'unicu trattamentu rilevule hè quellu chì u ricerciatore ponu; questa supostu hè quaghja cunnisciutu chjamatu trattamenti sicreti o escluditivi . Per esempiu, in Restivo è van de Rijt, puderia esse u casu chì, dà un altru criticu, i furmati causaru l'edituri per esse prisenti nantu à una pàgina di editori populari è chì era in a pàgina di editori populari in quantu chì avè riceviu una stella- chì hà causatu u cambiamentu in cumpurtamentu di edituri. Si questu hè veru, l'effettu di u barnstar ùn hè micca distinguishable da l'effettu di l'esseru nantu à a pàgina di editori populari. Di sicuru, ùn hè micca chjaru se, da una perspettiva scientifica, questu avissi a essiri cunzidutu attrattiva o pocu attrattivi. Hè ciò chì pudete fà imagine un ricerca chì dice chì l'effettu di ricivutu un barnstar comprende tutte i tratti sussegwenti chì a stintari triggers. O pudete fà imagine una situazione chì a ricerca necessaria d'escegene l'effettu di e cumpagnie di tutti quessi altre cose. Una manera di penserà hè di dumandà s'ellu ci hè qualcosa chì guverna à ciò chì Gerber and Green (2012) (p.41) chjamanu un "rupture in symmetry"? In altri palori, ci hè qualcosa chì ùn hè micca u trattamentu chì provoca e persone in i tratti è e cundizioni di cuntrollà per esse trattatu di manera diversa? I prublemi nantu à a simetria à annunziate sò quì chì dirigenu i pratichi in u gruppu di cuntrollu in i prucessi medichi à piglià una pidola di placebo. Ddu modu, i circhuli ponu esse sicuri chì l'unica diferenza tra u dui cundizzioni hè a medicina propiu è micca l'esperanza di piglià a piglia.
Per più nantu à SUTVA, vede a sezzione 2.7 di Gerber and Green (2012) , sezione 2.5 di Morgan and Winship (2014) , è a sezione 1.6 di Imbens and Rubin (2015) .
Precise
In a sizzioni pricidenti, aghju scritte cumu per estimà l'effettu mediu di u trattamentu. In questa sezione, aghju datu quarchi idee nantu à a variabilità di quiddi estimi.
Se pensate chì l'estimazione di l'effettu mediu di trattamentu cum'è stimatu a diffarenza trà dui media di mostra, hè pussìbule di vede chì l'error standard di l'effettu mediu di trattamentu hè:
\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]
induve \(m\) persone assignatu à u trattamentu è \(Nm\) per cuntrullà (vede Gerber and Green (2012) , e 3.4). Cusì, quandu pensendu à quanti ghjente per assicuratevi à u trattamentu è quantu l'assicura à u cuntrollu, pudete vede chì se \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) , pudete esse vogliate \(m \approx N / 2\) , finu à chì e custioni di u trattamentu è u cuntrollu sò i stessi. L'Equazioni 4.6 accennava perchè u disignu di l'esperimentu di u Bond è di u cullegiu (2012) à l'effetti di l'infurmazioni suciale nantu à votu (figura 4.18) era ineficientu statisticamente. Pensemu chì hà avutu u 98% di i participanti in a cundizione di trattamentu. Questa significava chì u cumpurtamentu mediu in a cundizione di cuntrollu ùn hè micca stimatu da manera precisa, cumu putere chì significava chì a diferenza stimata entre u trattamentu è a cundizione di cuntrollu ùn hè micca stimatu da manera precisa. Per più di ottene una distribuzione ottimisica di i participanti à e cundizioni, ancu quandu u prezzu diferenze trà e cundizione, vede List, Sadoff, and Wagner (2011) .
Infine, in u testu principalu, aghju scrivutu com'è un stimulante diferenze in diferenziu, chì hè tipicamenti in a pruduzzioni stampata, pò esse diventendu varianza più cume d'un stimulante diferenze in u mediu, chì hè tipica in a letteratura u so designu. Se \(X_i\) hè u valore di u risultatu prima di trattamentu, a quantità chì avemu da circà d'estimà cù l'approcciu di diffirenza di diferenza hè:
\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]
L'errore standard di quella quantità hè (vede Gerber and Green (2012) , eq. 4.4)
\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]
A comparazione di eq. 4,6 e eq. 4,8 revela chì l'approcciu di diffarenza in diferenzi seranu un errore standard più ridore quandu (vede Gerber and Green (2012) , ecc 4.6)
\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]
Quandu, quandu \(X_i\) hè assai predictivo di \(Y_i(1)\) è \(Y_i(0)\) , pudete truvà estimazioni più precisi da una diffirenza di diffirenzii d'avè una differenza: de-means one. Una manera di penser à questu in u cuntestu di l'affari di Restivo è van de Rijt hè chì ci hè assai di variazioni naturali in quantità chì e persone editanu, per quessa, fa cumparazione di u trattamentu è e cuntrollu difficultà: hè difficiule di detta un parente petit effettu in i risultati viulenti. Ma se diferenza questa variabilità naturali, ci hè assai menu assai variabilità, è chì facilita a detta un minimu effettue.
Vede Frison and Pocock (1992) per una precisa paragune di diffusione di i mezi, diferenza di diffarenzii, è adopra bashje in ANCOVA in l'ambienti più generale induve esse parechji misure pre-trattamentu è post-trattamentu. In particulari, ricordani assai ANCOVA, chì ùn aghju micca cupèrtatu quì. Aghjunghje, vede McKenzie (2012) per una discussione di l'impurtanza di e diverse misure di u post-trattamentu.