Nòt matematik

Mwen panse ke fason ki pi bon yo konprann eksperyans se fondasyon an rezilta potansyèl (ki mwen diskite nan nòt yo matematik nan chapit 2). Rezo rezilta potansyèl la gen yon relasyon sere ak ide ki soti nan echantiyon ki baze sou konsepsyon ke mwen dekri nan chapit 3 (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) . Apendis sa a te ekri nan yon fason pou mete aksan sou koneksyon sa a. Sa a anfaz se yon ti jan ki pa tradisyonèl, men mwen panse ke koneksyon ki genyen ant echantiyon ak eksperyans ki itil: sa vle di ke si ou konnen yon bagay sou echantiyon Lè sa a, ou konnen yon bagay sou eksperyans ak vis vèrsa. Kòm mwen pral montre nan nòt sa yo, fondasyon an rezilta potansyèl revele fòs nan eksperyans owaza kontwole pou estimasyon efè kozatif, epi li montre limit yo nan sa ki ka fè ak menm eksperyans parfe egzekite.

Nan sa a anèks, mwen pral dekri fondasyon an rezilta potansyèl, kopi kèk nan materyèl ki soti nan nòt yo matematik nan chapit 2 yo nan lòd yo fè sa yo nòt plis endepandan. Lè sa a, mwen pral dekri kèk rezilta itil sou presizyon nan estimasyon de efè yo tretman mwayèn, ki gen ladan yon diskisyon sou alokasyon optimal ak diferans-an-diferans estimeur. Apendis sa a trase lou sou Gerber and Green (2012) .

Potansyèl rezilta fondasyon

Yo nan lòd yo ilistre kad rezilta a potansyèl, se pou yo retounen nan eksperyans Restivo ak Van de Rijt a estime efè a nan resevwa yon barnstar sou kontribisyon nan lavni nan Wikipedia. Kad rezilta a potansyèl gen twa eleman prensipal: inite , tretman , ak rezilta potansyèl yo . Nan ka Restivo ak van de Rijt, inite yo te merite editè-sa ki nan tèt 1% nan kontribitè-ki pa t 'ankò resevwa yon barnstar. Nou ka endèks editè sa yo pa \(i = 1 \ldots N\) . Tretman yo nan eksperyans yo te "barnstar" oswa "pa gen okenn barnstar," epi mwen pral ekri \(W_i = 1\) si moun \(i\) se nan kondisyon an tretman ak \(W_i = 0\) otreman. Eleman nan twazyèm nan fondasyon an rezilta potansyèl se pi enpòtan an: rezilta yo potansyèl yo . Sa yo se ti jan plis konseptyèlman difisil paske yo enplike "potansyèl" rezilta-bagay sa yo ki ka rive. Pou chak editè Wikipedia, yon moun ka imajine kantite edits ke li ta fè nan kondisyon tretman an ( \(Y_i(1)\) ) ak nimewo a ke li ta fè nan kondisyon an kontwòl ( \(Y_i(0)\) ).

Remake byen ke chwa inite, tretman, ak rezilta defini kisa ki ka aprann nan eksperyans sa a. Pou egzanp, san okenn sipozisyon adisyonèl, Restivo ak van de Rijt pa ka di anyen sou efè barnstars sou tout editè Wikipedia oswa sou rezilta tankou bon jan kalite edite. An jeneral, chwa inite, tretman, ak rezilta dwe baze sou objektif etid yo.

Etandone rezilta potansyèl sa-yo ki rezime nan tablo 4.5-yon sèl ka defini efè a kozatif nan tretman an pou moun \(i\) kòm

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]

Pou mwen, ekwasyon sa a se fason ki klè pou defini yon efè kòzèl, epi, byenke trè senp, kad sa a sanble soti nan jeneralize nan anpil fason enpòtan ak enteresan (Imbens and Rubin 2015) .

Tablo 4.5: Table of Potential Results
Moun Edits nan kondisyon tretman an Edits nan kondisyon kontwòl Tretman efè
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
N \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
vle di \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

Si nou defini kozalite nan fason sa a, sepandan, nou kouri antre nan yon pwoblèm. Nan prèske tout ka yo, nou pa oblije obsève toude rezilta potansyèl yo. Sa se, yon editè Wikipedia espesifik swa resevwa yon barnstar oswa ou pa. Se poutèt sa, nou obsève youn nan rezilta yo potansyèl- \(Y_i(1)\) oswa \(Y_i(0)\) -mwen pa tou de. Enkapasite pou obsève tou de rezilta potansyèl se tankou yon gwo pwoblèm ke Holland (1986) rele li Pwoblèm fondamantal nan enferans kòz .

Erezman, lè nou ap fè rechèch, nou pa jis gen yon sèl moun, nou gen anpil moun, epi sa a ofri yon fason alantou pwoblèm nan fondamantal nan Enferans kòz. Olye ke eseye estime efè a tretman endividyèl, nou ka estime efè a tretman mwayèn:

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]

Sa a toujou eksprime an tèm de la \(\tau_i\) ki se unobservable, men ak kèk aljèb (Eq 2.8 nan Gerber and Green (2012) ) nou jwenn

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]

Ekwasyon 4.3 montre ke si nou ka estime rezilta mwayèn nan popilasyon anba tretman ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) ak rezilta mwayèn nan popilasyon anba kontwòl ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), Lè sa a, nou ka estime efè a tretman an mwayèn, menm san yo pa estime efè a tretman pou nenpòt moun an patikilye.

Koulye a, ke mwen te defini estiman nou-bagay nou ap eseye estimasyon-mwen pral vire nan ki jan nou ka aktyèlman estime li ak done. Mwen renmen panse sou defi estimasyon sa a kòm yon pwoblèm echantiyon (panse tounen nan nòt matematik nan chapit 3). Imajine ke nou owaza chwazi kèk moun yo obsève nan kondisyon tretman an epi nou owaza chwazi kèk moun yo obsève nan kondisyon an kontwòl, Lè sa a, nou ka estime rezilta an mwayèn nan chak kondisyon:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]

kote \(N_t\) ak \(N_c\) se nimewo moun nan kondisyon tretman ak kontwòl. Ekwasyon 4.4 se yon estimatè diferans-of-means. Paske nan konsepsyon an pran echantiyon, nou konnen ke tèm nan premye se yon estime san patipri pou rezilta an mwayèn anba tretman ak tèm nan dezyèm se yon estime san patipri anba kontwòl.

Yon lòt fason yo reflechi sou ki sa o azaizasyon se ke li asire ke konparezon ki genyen ant gwoup tretman ak kontwòl se jis paske randomization asire ke de gwoup yo ap sanble ak chak lòt. Sa a resanblè kenbe pou bagay nou te mezire (di nimewo a nan edits nan 30 jou yo anvan eksperyans lan) ak bagay sa yo nou pa te mezire (di sèks). Kapasite sa a pou asire balans sou tou de faktè obsève ak obsève se kritik. Pou wè pouvwa a nan balanse otomatik sou faktè unobserved, se pou yo imajine ke rechèch nan lavni jwenn ke gason yo gen plis reponn a prim pase fanm yo. Èske sa ta envalid rezilta Rezèvivo ak van de Rijt a? No By randomizing, yo asire ke tout unobservables ta balanse, nan tann. Pwoteksyon sa a kont enkoni an trè pwisan, epi li se yon fason enpòtan ke eksperyans yo diferan de teknik ki pa eksperimantal ki dekri nan chapit 2.

Anplis defini efè tretman an pou yon popilasyon tout antye, li posib pou defini yon efè tretman pou yon gwoup moun. Sa a se tipikman rele yon efè kondisyonèl tretman mwayèn (CATE). Pou egzanp, nan etid la pa Restivo ak van de Rijt, kite imajine ke \(X_i\) se si wi ou non editè a te pi wo oswa pi ba pase a medyàn nan edits pandan 90 jou yo anvan eksperyans lan. Youn ta ka kalkile efè a tretman separeman pou sa yo limyè ak editè lou.

Rezilta rezilta potansyèl la se yon fason pwisan panse sou enferans kozatif ak eksperyans. Sepandan, gen de complexite adisyonèl ke ou ta dwe kenbe nan tèt ou. Sa yo complexés de yo souvan lumped ansanm anba tèm ki estab Inite Tretman Valè sipozisyon an (SUTVA). Premye pati nan SUTVA se sipozisyon an ke bagay la sèlman ki zafè pou moun \(i\) 's rezilta se si moun sa a te nan kondisyon an tretman oswa kontwòl. Nan lòt mo, li sipoze ke moun \(i\) pa afekte nan tretman yo bay lòt moun. Sa a se pafwa yo rele "pa gen okenn entèferans" oswa "pa gen okenn spillovers", epi yo ka ekri tankou:

\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]

kote \(\mathbf{W_{-i}}\) se yon vektè estati tretman pou tout moun eksepte moun \(i\) . Yon fason ke sa a ka vyole se si tretman an soti nan yon moun gaye sou yon lòt moun, swa pozitivman oswa negatif. Lè yo retounen nan eksperyans Ris ak van de Rijt a, imajine de zanmi \(i\) ak \(j\) ak moun sa a \(i\) resevwa yon barnstar ak \(j\) pa. Si \(i\) k ap resevwa barnstar a lakòz \(j\) nan modifye plis (soti nan yon sans de konpetisyon) oswa modifye mwens (soti nan yon sans de dezespwa), Lè sa a, SUTVA te vyole. Li ka vyole tou si enpak tretman an depann de kantite total lòt moun k ap resevwa tretman an. Pou egzanp, si Restivo ak van de Rijt te bay soti 1,000 oswa 10,000 barnstars olye pou yo 100, sa a te ka afekte efè a nan resevwa yon barnstar.

Pwoblèm nan dezyèm lumped nan SUTVA se sipozisyon an ki tretman an sèlman ki enpòtan se youn nan chèchè a delivre; sa a sipozisyon pafwa yo rele pa gen okenn tretman kache oswa eksklizyon . Pou egzanp, nan Restivo ak Van de Rijt, li ta ka yo te ka a ki pa bay yon barnstar chèchè yo te lakòz editè yo dwe tap sou yon paj editè popilè e ke li te ke yo te sou editè yo popilè paj-olye ke resevwa yon barnstar- ki te lakòz chanjman nan konpòtman koreksyon. Si sa a se vre, Lè sa a, efè a nan barnstar a pa distenge soti nan efè a yo te sou paj sa a editè popilè. Natirèlman, li pa klè si, ki soti nan yon pèspektiv syantifik, sa a ta dwe konsidere atire oswa désagréable. Sa se, ou ta ka imajine yon chèchè li di ke efè a nan resevwa yon barnstar gen ladan tout tretman ki vin apre ke barnstar a deklannche. Oswa ou ka imajine yon sitiyasyon kote yon rechèch ta vle izole efè a nan barnstars soti nan tout lòt bagay sa yo. Youn nan fason yo panse sou li se mande si gen yon bagay ki mennen nan ki Gerber and Green (2012) (p. 41) rele yon "pann nan simetri"? Nan lòt mo, èske gen lòt bagay pase tretman ki lakòz moun nan tretman ak kontwòl kondisyon yo dwe trete yon fason diferan? Enkyetid sou kraze simetri se sa ki mennen pasyan nan gwoup kontwòl la nan esè medikal yo pran yon grenn plasebo. Nan fason sa a, chèchè yo kapab asire ke diferans la sèlman ant de kondisyon yo se medikaman aktyèl la epi yo pa eksperyans nan pran grenn lan.

Pou plis enfòmasyon sou SUTVA, gade seksyon 2.7 nan Gerber and Green (2012) , seksyon 2.5 nan Morgan and Winship (2014) , ak seksyon 1.6 nan Imbens and Rubin (2015) .

Precision

Nan seksyon anvan an, mwen te dekri kijan pou estime efè tretman an mwayèn. Nan seksyon sa a, mwen pral bay kèk lide sou varyab la nan sa yo estime.

Si ou panse sou estimasyon efè a tretman mwayèn kòm estimasyon diferans ki genyen ant de echantiyon vle di, Lè sa a, li posib montre ke erè a estanda nan efè a tretman an mwayèn se:

\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]

kote \(m\) moun ki asiyen nan tretman ak \(Nm\) kontwole (gade Gerber and Green (2012) , ek. 3.4). Se konsa, lè w ap panse sou konbyen moun ki bay tretman ak konbyen pou bay kontwòl, ou ka wè si si \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) , Lè sa a, ou vle \(m \approx N / 2\) , osi lontan ke depans sa yo nan tretman ak kontwòl yo se menm bagay la. Ekwasyon 4.6 klarifye poukisa konsepsyon Bond ak kòlèg yo (2012) eksperyans sou efè enfòmasyon sosyal sou vòt (figi 4.18) te rezèvwa estatistik. Sonje ke li te 98% nan patisipan nan kondisyon an tretman. Sa vle di ke konpòtman an vle di nan kondisyon an kontwòl pa te estime kòm byen ke li te kapab, ki nan vire vle di ke diferans lan estime ant kondisyon an tretman ak kontwòl pa te estime kòm byen ke li ta ka. Pou plis sou alokasyon optimal nan patisipan yo nan kondisyon, ki gen ladan lè depans diferan ant kondisyon, gade List, Sadoff, and Wagner (2011) .

Finalman, nan tèks prensipal la, mwen dekri kijan yon estimatè diferans-an-diferans ki itilize nan yon konsepsyon melanje, ka lakòz pi piti divèjans pase yon estimatè diferans-an-vle di, ki tipikman itilize nan yon ant sijè konsepsyon. Si \(X_i\) se valè rezilta a anvan tretman an, Lè sa a, kantite a ke nou yo ap eseye estime ak diferans-an-diferans apwòch la se:

\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]

Erè nan estanda sa a kantite se (gade Gerber and Green (2012) , ak 4.4)

\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]

Yon konparezon eq. 4.6 ak ek. 4.8 revele ke diferans-nan-diferans apwòch la ap gen yon erè estanda ki pi piti lè (gade Gerber and Green (2012) , ak 4.6)

\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]

Apeprè, lè \(X_i\) se trè prediksyon nan \(Y_i(1)\) ak \(Y_i(0)\) , Lè sa a, ou ka jwenn estime plis presi soti nan yon diferans-of-diferans apwòch pase soti nan yon diferans- nan-vle di yon sèl. Youn nan fason yo reflechi sou sa a nan kontèks la nan eksperyans Ris ak Van de Rijt a se ke gen yon anpil nan varyasyon natirèl nan kantite lajan ke moun ki modifye, kidonk sa a fè konpare kondisyon yo tretman ak kontwòl difisil: li difisil yo detekte yon manm fanmi ti efè nan done rezilta fè bwi. Men, si ou diferans-soti sa a variabilité natirèlman ki rive, Lè sa a, gen anpil mwens variabilité, e ki fè li pi fasil yo detekte yon ti efè.

Gade Frison and Pocock (1992) pou yon konparezon egzak diferans-of-means, diferans-of-diferans yo, ak ANCOVA ki baze sou apwòch nan anviwònman an plis jeneral kote gen mezi miltip pre-tretman ak apre tretman an. An patikilye, yo fòtman rekòmande ANCOVA, ki mwen pa kouvri isit la. Pli lwen, gade McKenzie (2012) pou yon diskisyon sou enpòtans ki genyen nan mezi plizyè mezi apre tretman.