Noti fil-matematika

Naħseb li l-aħjar mod biex nifhmu l-esperimenti huwa l - qafas tar-riżultati potenzjali (li diskuss fin-noti matematiċi fil-kapitolu 2). Il-qafas tar-riżultati potenzjali għandu relazzjonijiet mill-qrib mal-ideat minn kampjuni bbażati fuq id-disinn li deskritt fil-kapitolu 3 (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) . Dan l-appendiċi ġie miktub b'tali mod li jenfasizza dik il-konnessjoni. Din l-enfasi hija daqsxejn mhux tradizzjonali, iżda naħseb li l-konnessjoni bejn it-teħid ta 'kampjuni u l-esperimenti hija ta' għajnuna: ifisser li jekk taf xi ħaġa dwar it-teħid ta 'kampjuni allura taf xi ħaġa dwar esperimenti u viċi versa. Kif ser nuri f'dawn in-noti, il-qafas tar-riżultati potenzjali juri s-saħħa ta 'esperimenti kkontrollati b'mod każwali għall-istima tal-effetti kawżali, u juri l-limitazzjonijiet ta' dak li jista 'jsir b'esperimenti anke perfettament eżegwiti.

F'dan l-appendiċi, ser niddeskrivi l-qafas tar-riżultati potenzjali, billi nidduppjaw xi wħud mill-materjal min-noti matematiċi fil-kapitolu 2 sabiex dawn in-noti jinżammu fihom infushom. Imbagħad ser niddeskrivi xi riżultati utli dwar il-preċiżjoni tal-istimi tal-effetti medji tat-trattament, inkluż diskussjoni dwar l-allokazzjoni ottima u l-istimi tal-differenza fid-differenzi. Dan l-appendiċi jiġbed ħafna fuq Gerber and Green (2012) .

Qafas ta 'riżultati potenzjali

Sabiex nuru l-qafas tar-riżultati potenzjali, nerġgħu nirritornaw għall-esperiment ta 'Restivo u van de Rijt biex jiġi stmat l-effett li nirċievu barnstar fuq kontributi futuri għal Wikipedija. Il-qafas ta 'riżultati potenzjali għandu tliet elementi ewlenin: unitajiet , trattamenti u riżultati potenzjali . Fil-każ ta 'Restivo u van de Rijt, l- unitajiet kienu jistħoqqilhom edituri - dawk fl-aqwa 1% tal-kontributuri - li kienu għadhom ma rċevewx barnstar. Nistgħu nindikaw dawn l-edituri b ' i=1Ni=1N . It- trattamenti fl-esperiment tagħhom kienu "barnstar" jew "no barnstar", u jien ser tikteb Wi=1Wi=1 jekk il-persuna ii tkun fil-kundizzjoni tat-trattament u Wi=0Wi=0 inkella. It-tielet element tal-qafas tar-riżultati potenzjali huwa l-aktar importanti: ir -riżultati potenzjali . Dawn huma ftit iktar kunċettwali diffiċli għaliex jinvolvu riżultati "potenzjali" - affarijiet li jistgħu jiġru. Għal kull editur tal-Wikipedija, wieħed jista 'jimmaġina n-numru ta' edizzjonijiet li kienet ser tagħmel fil-kundizzjoni tat-trattament ( Yi(1)Yi(1) ) u n-numru li kienet ser tagħmel fil-kundizzjoni ta 'kontroll ( Yi(0)Yi(0) ).

Innota li din l-għażla ta 'unitajiet, trattamenti u riżultati tiddefinixxi dak li jista' jitgħallem minn dan l-esperiment. Pereżempju, mingħajr suppożizzjonijiet addizzjonali, Restivo u van de Rijt ma jistgħux jgħidu xi ħaġa dwar l-effetti ta 'barnstars fuq l-edituri kollha tal-Wikipedija jew fuq riżultati bħal editjar ta' kwalità. B'mod ġenerali, l-għażla ta 'unitajiet, trattamenti u riżultati għandhom ikunu bbażati fuq l-għanijiet tal-istudju.

Minħabba dawn ir-riżultati potenzjali - li huma miġbura fil-qosor fit-tabella 4.5 -wieħed jista 'jiddefinixxi l-effett kawżali tat-trattament għal persuna ii bħala

τi=Yi(1)Yi(0)(4.1)τi=Yi(1)Yi(0)(4.1)

Għalija, din l-ekwazzjoni hija l-aktar mod ċar biex jiġi definit effett kaġunali, u, għalkemm estremament sempliċi, dan il-qafas jirriżulta ġeneralizzabbli f'ħafna modi importanti u interessanti (Imbens and Rubin 2015) .

Tabella 4.5: Tabella ta 'Riżultati Potenzjali
Persuna Tibdil fil-kundizzjoni tat-trattament Tibdil f'kundizzjoni ta 'kontroll Effett tat-trattament
1 Y1(1)Y1(1) Y1(0)Y1(0) τ1τ1
2 Y2(1)Y2(1) Y2(0)Y2(0) τ2τ2
N YN(1)YN(1) YN(0)YN(0) τNτN
jfisser ˉY(1)¯Y(1) ˉY(0)¯Y(0) ˉτ¯τ

Jekk niddefinixxu l-kawżalità b'dan il-mod, madankollu, għandna problema. Fi kważi l-każijiet kollha, ma nibdewx nosservaw iż-żewġ riżultati potenzjali. Jiġifieri, editur speċifiku tal-Wikipedija jew irċieva barnstar jew le. Għalhekk, aħna nosservaw wieħed mir-riżultati potenzjali- Yi(1)Yi(1) jew Yi(0)Yi(0) -but mhux it-tnejn. L-inkapaċità li jiġu osservati ż-żewġ riżultati potenzjali hija problema tant kbira li Holland (1986) sejħitilha l- Problema Fundamentali tad-Dwal tal-Kawżi .

Fortunatament, meta nagħmlu r-riċerka, aħna mhux biss għandna persuna waħda, għandna ħafna nies, u dan joffri mod madwar il-Problema Fundamentali tad-Dwal tal-Kawżi. Minflok ma tipprova tistma l-effett tat-trattament fuq livell individwali, nistgħu nistmaw l-effett medju tat-trattament:

ATE=1NNi=1τi(4.2)ATE=1NNi=1τi(4.2)

Dan għadu espress f'termini ta ' τiτi li mhumiex osservabbli, iżda b'xi algebra (Eq 2.8 ta' Gerber and Green (2012) ) nwasslu

ATE=1NNi=1Yi(1)1NNi=1Yi(0)(4.3)ATE=1NNi=1Yi(1)1NNi=1Yi(0)(4.3)

L-Ekwazzjoni 4.3 turi li jekk nistgħu nistmaw l-eżitu medju tal-popolazzjoni taħt trattament ( N1Ni=1Yi(1)N1Ni=1Yi(1) ) u l-eżitu medju tal-popolazzjoni taħt kontroll ( N1Ni=1Yi(1)N1Ni=1Yi(1) ), allura nistgħu nistmaw l-effett medju tat-trattament, anki mingħajr ma jiġi stmat l-effett tat-trattament għal xi persuna partikolari.

Issa li stajt iddefinixxa l-istima tagħna - il-ħaġa li qed nippruvaw nistennew - nirreferi għal kif inkunu nistgħu nagħmilha stima bid-data. Nixtieq naħseb dwar din l-isfida ta 'l-istima bħala problema ta' teħid ta 'kampjuni (aħseb lura għan-noti matematiċi fil-kapitolu 3). Immaġina li aħna saltwarjament jagħżlu xi nies biex josservaw fil-kundizzjoni tat-trattament u aħna saltwarjament inneħħu ftit nies biex josservaw fil-kundizzjoni tal-kontroll, allura nistgħu nistmaw l-eżitu medju f'kull kundizzjoni:

^ATE=1Nti:Wi=1Yi(1)average edits, treatment1Nci:Wi=0Yi(0)average edits, control(4.4)

fejn Nt u Nc huma n-numri ta 'nies fil-kundizzjonijiet ta' trattament u kontroll. L-ekwazzjoni 4.4 hija stimatur ta 'differenza tal-mezzi. Minħabba d-disinn tat-teħid ta 'kampjuni, nafu li l-ewwel terminu huwa stimatur imparzjali għar-riżultat medju taħt trattament u t-tieni terminu huwa stimatur imparzjali taħt kontroll.

Mod ieħor biex wieħed jaħseb dwar dak li jippermetti l-randomizzazzjoni huwa li jiżgura li t-tqabbil bejn il-gruppi ta 'trattament u ta' kontroll huwa ġust għaliex l-għażla każwali tiżgura li ż-żewġ gruppi jixbħu lil xulxin. Din ix-xebh għandu l-affarijiet li tajna (jiġifieri n-numru ta 'edizzjonijiet fit-30 jum qabel l-esperiment) u l-affarijiet li ma tajnax (jiġifieri sess). Din il-kapaċità li tiżgura l-bilanċ kemm fuq il-fatturi osservati kif ukoll dawk mhux osservati hija kritika. Biex tara s-saħħa ta 'bilanċjar awtomatiku fuq fatturi mhux osservati, ejja nimmaġina li r-riċerka fil-ġejjieni ssib li l-irġiel huma aktar reattivi għal premjijiet min-nisa. Tkun invalidata r-riżultati ta 'l-esperiment ta' Restivo u van de Rijt? Le. Billi randomized, huma assiguraw li l-unobservables kollha jkunu bilanċjati, fl-aspettattiva. Din il-protezzjoni kontra dak mhux magħruf hija qawwija ħafna, u huwa mod importanti li l-esperimenti huma differenti mit-tekniki mhux sperimentali deskritti fil-kapitolu 2.

Minbarra d-definizzjoni tal-effett tat-trattament għal popolazzjoni sħiħa, huwa possibbli li jiġi definit effett ta 'trattament għal sottogrupp ta' nies. Dan tipikament jissejjaħ effett ta 'trattament medju kondizzjonali (CATE). Pereżempju, fl-istudju ta 'Restivo u van de Rijt, ejja nimmaġina li Xi hija jekk l-editur kienx fuq jew taħt in-numru medjan ta' edits matul id-90 jum qabel l-esperiment. Wieħed jista 'jikkalkula l-effett tat-trattament separatament għal dawn l-edituri ħfief u tqal.

Il-qafas tar-riżultati potenzjali huwa mod qawwi biex wieħed jaħseb dwar inferenzi kawżali u esperimenti. Madankollu, hemm żewġ kumplessitajiet addizzjonali li għandek iżżomm f'moħħok. Dawn iż-żewġ kumplessitajiet spiss huma lumped flimkien taħt it-terminu Unità Stabbli tal-Valur tat-Trattament tal-Assunzjoni (SUTVA). L-ewwel parti ta 'SUTVA hija l-assunzjoni li l-unika ħaġa li hi importanti għall-eżitu tal-persuna i hija jekk dik il-persuna kinitx fil-kundizzjoni ta' trattament jew kontroll. Fi kliem ieħor, wieħed jassumi li dik il-persuna i mhix affettwata mit-trattament mogħti lil nies oħra. Dan xi drabi jissejjaħ "l-ebda interferenza" jew "ebda spillovers", u jista 'jinkiteb bħala:

Yi(Wi,Wi)=Yi(Wi)Wi(4.5)

fejn Wi huwa vettur ta 'status ta' trattament għal kulħadd minbarra persuna i . Mod wieħed li dan jista 'jinkiser huwa jekk it-trattament minn persuna waħda jixtered fuq persuna oħra, jew b'mod pożittiv jew negattiv. Ir-ritorn lejn l-esperiment ta 'Restivo u van de Rijt, jimmaġina żewġ ħbieb i u j u dik il-persuna i tirċievi barnstar u j ma. Jekk i tirċievi l-barnstar kawżi j biex teditja aktar (minn sens ta 'kompetizzjoni) jew teditja inqas (minn sens ta' disprament), allura SUTVA ġiet miksura. Tista 'wkoll tiġi miksura jekk l-impatt tat-trattament jiddependi fuq in-numru totali ta' persuni oħra li jirċievu t-trattament. Per eżempju, jekk Restivo u van de Rijt kienu taw 1,000 jew 10,000 barnstars minflok 100, dan seta 'taffettwa l-effett li jirċievi barnstar.

It-tieni kwistjoni ttrattata f'SUTVA hija l-assunzjoni li l-uniku trattament rilevanti huwa dak li r-riċerkatur jagħti; din is-suppożizzjoni kultant tissejjaħ trattamenti moħbija jew esklużjoni . Per eżempju, f'Settivo u f'Ven de Rijt, jista 'jkun il-każ li billi jingħata barnstar, ir-riċerkaturi kkawżaw li l-edituri jkunu jidhru fuq paġna tal-edituri popolari u li kienet qiegħda fuq il-paġna tal-edituri popolari - aktar milli tirċievi messaġġ barnstar- li kkawża l-bidla fl-imġiba tal-editjar. Jekk dan huwa minnu, l-effett tal-barnstar ma jiddistingwix mill-effett li jkun fuq il-paġna tal-edituri popolari. Naturalment, mhuwiex ċar jekk, minn perspettiva xjentifika, dan għandux jitqies attraenti jew mhux attraenti. Jiġifieri, tista 'timmaġina riċerkatur li tgħid li l-effett li jirċievi barnstar jinkludi t-trattamenti sussegwenti kollha li jqajjem il-barnstar. Jew tista 'timmaġina sitwazzjoni fejn riċerka tkun tixtieq li tiżola l-effett ta' barnstars minn dawn l-affarijiet l-oħra kollha. Mod wieħed biex wieħed jaħseb dwarha huwa li jistaqsi jekk hemmx xi ħaġa li twassal għal dak li Gerber and Green (2012) (p.41) isejħu "analiżi tas-simetrija"? Fi kliem ieħor, hemm xi ħaġa oħra għajr it-trattament li jikkawża li n-nies fil-kundizzjonijiet ta 'trattament u kontroll jiġu ttrattati b'mod differenti? It-tħassib dwar it-tkissir ta 'simmetrija huwa dak li jwassal lill-pazjenti fil-grupp ta' kontroll fi provi mediċi biex jieħdu pillola tal-plaċebo. B'dan il-mod, ir-riċerkaturi jistgħu jkunu żguri li l-unika differenza bejn iż-żewġ kundizzjonijiet hija l-mediċina attwali u mhux l-esperjenza tat-teħid tal-pillola.

Għal aktar tagħrif dwar SUTVA, ara sezzjoni 2.7 ta ' Gerber and Green (2012) , sezzjoni 2.5 ta' Morgan and Winship (2014) , u taqsima 1.6 ta ' Imbens and Rubin (2015) .

Preċiżjoni

Fit-taqsima ta 'qabel, stajt deskritti kif nistma l-effett medju tat-trattament. F'din it-taqsima, ser nipprovdi ftit ideat dwar il-varjabbiltà ta 'dawk l-estimi.

Jekk taħseb dwar l-istima tal-effett medju tat-trattament bħala stima tad-differenza bejn żewġ mezzi ta 'kampjun, allura huwa possibbli li jintwera li l-iżball standard tal-effett medju tat-trattament huwa:

SE(^ATE)=1N1(mVar(Yi(0))Nm+(Nm)Var(Yi(1))m+2Cov(Yi(0),Yi(1)))(4.6)

fejn m in-nies assenjati għat-trattament u Nm għall-kontroll (ara Gerber and Green (2012) , eq 3.4). Għalhekk, meta wieħed jaħseb dwar kemm persuni jassenjaw it-trattament u kemm jista 'jassenjahom għall-kontroll, tista' tara li jekk Var(Yi(0))Var(Yi(1)) , imbagħad inti tixtieq mN/2 , sakemm l-ispejjeż tat-trattament u l-kontroll huma l-istess. L-Ekwazzjoni 4.6 tiċċara għaliex id-disinn tal-esperiment ta 'Bond u tal-kollegi (2012) dwar l-effetti tal-informazzjoni soċjali dwar il-votazzjoni (figura 4.18) kien statistikament ineffiċjenti. Ifakkar li kellha 98% tal-parteċipanti fil-kundizzjoni tat-trattament. Dan fisser li l-imġiba medja fil-kundizzjoni ta 'kontroll ma ġietx stmata b'mod preċiż daqs kemm setgħet kienet, li min-naħa tagħha kienet tfisser li d-differenza stmata bejn il-kura u l-kundizzjoni tal-kontroll ma kinitx stmata b'mod eżatt kif jista' jkun. Għal aktar tagħrif dwar l-allokazzjoni ottima tal-parteċipanti għal kundizzjonijiet, inkluż meta l-ispejjeż ivarjaw bejn il-kundizzjonijiet, ara List, Sadoff, and Wagner (2011) .

Fl-aħħarnett, fit-test prinċipali, deskritt kif l-istimatur differenza fid-differenzi, li tipikament tintuża f'disinn imħallat, jista 'jwassal għal varjanza iżgħar minn stimatur ta' differenza fil-mezzi, li tipikament tintuża f'suġġetti interni disinn. Jekk Xi huwa l-valur tar-riżultat qabel it-trattament, allura l-kwantità li qed nippruvaw nistennew bl-approċċ ta 'differenza fid-differenzi hija:

ATE=1NNi=1((Yi(1)Xi)(Yi(0)Xi))(4.7)

L-iżball standard ta 'dik il-kwantità huwa (ara Gerber and Green (2012) , eq 4.4)

SE(^ATE)=1N1(Var(Yi(0)Xi)+Var(Yi(1)Xi)+2Cov(Yi(0)Xi,Yi(1)Xi))(4.8)

Paragun ta 'eq. 4.6 u eq. 4.8 juri li l-approċċ ta 'differenza fid-differenzi jkollu żball standard iżgħar meta (ara Gerber and Green (2012) , eq 4.6)

Cov(Yi(0),Xi)Var(Xi)+Cov(Yi(1),Xi)Var(Xi)>1(4.9)

Bejn wieħed u ieħor, meta Xi huwa predikattiv ħafna ta ' Yi(1) u Yi(0) , allura tista' tikseb stimi aktar preċiżi minn approċċ ta 'differenza ta' differenzi milli minn differenza - ta '-tfisser waħda. Mod wieħed biex wieħed jaħseb dwar dan fil-kuntest ta 'l-esperiment ta' Restivo u van de Rijt huwa li hemm ħafna varjazzjoni naturali fl-ammont li n-nies jeditjaw, għalhekk dan jagħmel diffiċli t-tqabbil tal-kondizzjonijiet ta 'trattament u kontroll: huwa diffiċli li tinstab effett żgħir f'dejta ta 'riżultat storbjuż. Imma jekk tvarja-out din il-varjabilità naturali, allura hemm ħafna inqas varjabilità, u dan jagħmilha eħfef biex jinstab effett żgħir.

Ara Frison and Pocock (1992) għal paragun preċiż tad-differenza ta 'mezzi, differenza ta' differenzi, u approċċi bbażati fuq ANCOVA fl-ambitu aktar ġenerali fejn hemm kejl multiplu ta 'trattament minn qabel u wara t-trattament. B'mod partikolari, huma jirrakkomandaw bil-qawwa ANCOVA, li ma kontx kopert hawn. Barra minn hekk, ara McKenzie (2012) għal diskussjoni dwar l-importanza ta 'miżuri multipli ta' riżultat ta 'wara t-trattament.