Nivîsên mathematîk

Ez difikirim ku riya herî ezmûnên ku ezmûnên fêm bikim ev çarçoveya encama çarçoveyê (işkence kir ku di mijara matematîk de di beşa 2 de) de gotûbêj kir. Di çarçoveya (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) nimûne pêvajoyên nêzîk ên pêkanîna pêkanîna potansiyonên nêzîk hebe ku ez di beşa 3ê de (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) . Ev pêvek di vî awayî de nivîsandiye ku wekî pêwendiya pêwendiyê dike. Vê gişkek hinek ne-kevneşop e, lê ez difikirim ku têkiliya navbera navnîşan û ezmûnan alîkar e. Ew tê wateya ku hûn tiştek nizanin ser tiştek bizanin, paşê hûn di derheqên ezmûnan de û tiştek bizanin. Wekî ku ez di van reşan de nîşanî, çarçoveya encamên potansiyona hêza tecrûbeyên kontrolkirî yên randomkirî nîşan dide ku ji bandorên sedemên texmînkirina texmînan dike, û ev sînorên ku bi tevî tecrûbeyên bi tevahî darve kirin de pêk tê nîşan dide.

Di vê deverê de, ez ê di çarçoveya encamên derfetên derfetên xwe de diyar bikim, hin tiştên ji mijarên mathematîk di di beşa 2 de da ku ji bo van tiştan bêtir xweşartî çêbikin. Piştre ez ê encamên ku bandorên dermankirinê yên navxweyî yên navxweyî û gotûbêjê ya nirxên herî baş û cudahî-nirxên cuda-ê-cudahî-ê-nîqaşên encamên derheqa hin hejmarên nirxên şêwirdar bikşînin. Ev perendixek giran li Gerber and Green (2012) .

Encamên çarçoveyê

Ji bo ku ji bo çarçoveya encamên potansiyonê nîşan bide, em vegerin vegerin Restivo û van de Rijt ya cerdevaniyê da ku bandora paşerojê li pêşerojê li Wîkîpediya. Di çarçoveya encamên aborî de sê elementên bingehîn hene: yekîneyên , tedawî , û encamên potansiyel . Di rewşê de Restivo û van de Rijt, yekîneyên edîtorên wesayît hebûn-yên ku di% 1ê herî mezin de beşdar bûn-yên ku hê nehatibû barnstar. Em dikarin van edîtoran bi \(i = 1 \ldots N\) . Dermanên di tecrûbeya wan de "barnstar" an "no barnstar," û ez ê \(W_i = 1\) heke kesê \(i\) di rewşê tedawî û \(W_i = 0\) ye. Armanca sêyemîn a çarçoveya encamên potansiyona herî girîng e: encamên potansiyel . Ev tiştek zehf ne zehmet e ku ji wan re dibe ku "ew" derfetên "encamên ku tiştan bibin. Ji bo edîtorê her herwiha Wikipedia, hejmareke hejmara guhertinên ku ew di rewşê dermankirinê de ( \(Y_i(1)\) ) û hejmarek wê wê di rewşa kontrola rewşa ( \(Y_i(0)\) ).

Têbînî ku ev hilbijartina yekîneyên, tedawî û encam diyar dike ku ji vê ezmûna ku hîn dibe. Ji bo nimûne, bêyî fikrên din ên din, Restivo û van de Rijt li ser pirtûka barnestên li seranserî Wikibooks an jî encamên wekî qalîteya guhertina tiştek tiştek nabêje. Bi gelemperî, bijartina yekîneyên, tedawî û encam divê li ser armancên lêkolînê li ser bingehê be.

Di encamên van potansiyonê de têne dîtin - ku di çarçoveya kurteya çarçoveyê de 4.5-kes dikare bandorkirina tesîrê ya şexsî ji bo kesê \(i\)

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]

Ji bo min, ev raman e ku riya tesîra sedem eşkere ye, û, her çiqas pir hêsan e, ev çarçoveya di gelek awayên girîng û balkêş de (Imbens and Rubin 2015) .

Table 4.5: Pîlana Enerjiya Hilbijartinê
Şexs Edîtan di rewşeke tedawî de Edits di kontrola kontrola de Bandora dermankirinê
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
N \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
dilxerab \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

Heke di vê rêbazê de mebestek diyar bike, lêbelê, em di nav pirsgirêkê de digerin. Di tevahiya hemî rewşan de, em neyê dîtin ku hemî encamên potansiyel. Ew e, an editor ê Wikipedia-an jî an barnstar an jî neyê qebûl kirin. Ji ber vê yekê, em yek ji encamên potansiyel- \(Y_i(1)\) an \(Y_i(0)\) -bû hem jî ne. Neheqê ku her du encamên potansiyel ên berbiçav dike, ev pirsgirêkek girîng e ku Holland (1986) ji bo pirsgirêka bingehîn ya Causal a tê gotin .

Bi kêfxweşiyê, dema ku em lêkolîn dikin, em tenê tenê kesek nekir, me gelek kes hene, û ev rêyek li dorpêçiya pirsgirêka bingehîn ya Causal. Bi berevajî hewldanîna texmînîna tedawî ya asta asta astê, em dikarin bandorkirina dermankirinê ya navîn didin:

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]

Ev hîn jî di \(\tau_i\) têne pejirandin, lê bi hinek algebra (Eq 2.8 ya Gerber and Green (2012) ) em dihêle

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]

Equation 4.3 nîşan dide ku heger em dikarin binçavkirina nirxandina navîn ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) û nirxên navîn ên bin kontrola navîn ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), hingê em dikarin bandorkirina dermankirinê ya navîn nirxînin, heta bêyî bandora tedawîkirina ji bo kesek taybetî.

Niha ku min estimand diyar kir - tiştek ku em hewce dikin ku bi texmîn bikin-ez ê dihêle ku em çawa bi rastî bi danûstandinan re çawa texmîn bikin. Ez dixwazim li ser vê pirsgirêkiya astengiyê wekî pirsgirêkek nimûne (baweriya paşniyara mathematîk di beşa 3ê de bifikirin) difikirim. Bifikirin ku em ji bo hin kesan bifikirin ku di rewşa rewşa dermanan de bisekinin û em bi hinek kesan hilbijêre ku di bin kontrola kontrola kontrolê de, hingê em dikarin di her rewşê de her texmîna encamê ya nirxê nirxandinê bikin:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]

Li vir ku \(N_t\) û \(N_c\) hejmarek mirov in di rewşê û mercên kontrola de hene. 4.4 Equalîzasyona cûreyek cûda-nirxên nirxê ye. Ji ber ku pîşesaziya samplingê, em dizanin ku demek yekemîn e ku ji bo tedawiya nîv-ê dermankirina nirxandina nîvrojînek e û demek duyemîn nimûne nimûne nimûne nimînator e.

Riyeke din jî ji bo ramana ku çi kiryarî ve dike, ew e ku ew eşkere dike ku tête danûstandinên di navbera tedawî û komên kontrolkirinê de riya ye, ji ber ku berbiçavkirina misoger dike ku du koman dê hevdu hev in. Di heman demê de ev tiştek ji bo tiştên ku em mecbûr kirine (hejmara 30 rojan berî ceribandinê berî nîqaşên navnîşan digotin) û tiştên ku em nehatiye nirxandin (jinê dibêjin). Ev kapasîteya ku tewra bicih bikin li ser herdu faktoran têne dîtin û bêbawer e. Ji bo faktorên xweseriya xweseriyê li ser faktorên bêbawer bibînin, em bifikirin ku lêkolîna pêşerojê bibînin ku mêran ji jinan re bêtir xelatên berpirsiyar in. Gelo wê encamên encamên Restivo û van de Rijt bisekin? Na Na ku bi birêvebirinê, ew garantî kir ku hemî unobservables dê di hêviya xwe de, hevpeyman be. Ev parastina li dijî nenas zehmet e, û ew awayek girîng e ku tecrûbeyên ji teknîkên ne-ezmûnî cuda ye ku di beşa 2ê de tê gotin.

Herweha ku ji bo nirxandina tedawiya tevahiya niştecîh, ev e ku dibe ku ji bo bandorkirina mirovên ji bo bandora tedbîrek şirove bike. Ev bi gelemperî bandora nerazîbûnê ya navîn (CATE) tête gotin. Ji bo nimûne, di lêkolîna bi Restivo û van de Rijt de, em bifikirin ku \(X_i\) e ku ew e-nameya hejmara 90 rojan berî ceribandinê ya li ser hejmarên median li jêr an jî jêrîn bû. Yek dikare ji bo van ronahî û edîtorên giran re bandorek tedawîkirina dermankirinê bikin.

Vebijarkirina encama çarçoveya rêbazek rêkûpêk e ku ji bo derheqê sedemên tedbîran û tecrûbeyên bifikirin Lêbelê, du dravîtiyên din hene ku hûn di hişê xwe de bimînin. Ev du kampanyayên pir caran di bin demdirêjiya Nirxandina nirxê ya Sîteya Stable a (SUTVA) de hev re dorpê kirin. Ya yekemîn beşa SUTVA tête ku ev yek tenê tiştek ku ji bo \(i\) encam dike, ew e ku ew kes di tedawî an rewşa kontrola de ye. Bi gotineke din, ew tê texmîn kirin ku \(i\) mirovek bi tedbîrên din re bandor kirin. Vê carinan carinan bi "destwerdana tu" an "no spillovers" tê gotin, û dikare wekî nivîskî binivîse:

\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]

Li vir ku \(\mathbf{W_{-i}}\) veguhestina statûyên ji bo herkesî mirovek kesî ne \(i\) . Wê awayek ku ev dikare binpêkirin, dibe ku heke tedawî ji kesekî re li ser kesek dî, an jî bi erênî an jî neyînî. Vegerîna vegerandina Restivo û van de Rijt, du hevalên xwe \(i\) û \(j\) bifikirin û kesê \(i\) barnstar û \(j\) neyê qebûl kirin. Heke \(i\) ji barnstar \(j\) ku bêtir veguherîn (ji derheqa rêjeya pêşbaziyê) an jî kêmtir (biguherîne ji hestê bêhêvî) biguherînin, paşê SUTVA hate binçav kirin. Heke dikare bandorkirina tedawî li ser hejmareke din ên mirovî tedbîrên wergirtinê girêdayî ye. Ji bo nimûne, eger Restivo û van de Rijt ji bilî 100 ji 100 an 10000 barnêrberan dane, da ku ev bandor bandora bandora xwe bigire.

Pirsgirêka duyemîn di nav SUTVA de têbawerî ye ku tedbîrên yekgirtî yek e ku lêkolîner xilas dike; ev fikra caran carî tedawî an nehêleya veşartî tê gotin . Ji bo nimûne, li Restivo û van de Rijt, ev dibe ku ev bûyer ji hêla lêkolîneran derxistin pirtûkên ku li ser peldankek edîtorên populer yên berbiçav bû û ji bo pirtûkxaneyên navdar ên li ser barnstar- ku sedema guhartina guhertina rewşê. Ger ev yek rast e, paşê bandora barnstar ne ji hêla bandorên peldankê yên navdar ve nabe. Bê guman, ev eşkere ye ku, ji perspektîfek zanyariyê, ev gerek berbiçav an bêbawer bin. Ew e, hûn dikarin lêkolînerek bifikirin ku bandora bandorê ya wergirtina hemî dermanên paşîn ên ku barnstar digire. An hûn dikarin rewşeke ku li lêkolînê dixwazin dixwazin bandorên barnstars ji van tiştên din ên din cuda bikin. Yek awayek ku ji bo ramana wê ye, ew dipirse ka heke tiştek heye ku Gerber and Green (2012) (p. Bi awayekî din, heye ji bilî tedbîrên din heye ku mirovên di tedawî û mercên kontrolkirinê de dibe sedema cûreyek tedawî ye? Têgihîştina der barê hevpeymaniya hevpeymaniyê ew e ku di nav komên kontrola de ceribandinên tendurustî yên ku gavê cenazeyê bistînin. Bi vî awayî, lêkolîner dikarin diqewiminin ku tenê yek di navbera her du mercan de derman ne rast e û tecrûbeya bisekêşiyê bikişînin.

Ji bo bêtir li SUTVA, beşa 2.7 ya Gerber and Green (2012) , beşa 2.5 ya Morgan and Winship (2014) û beşa 1.6 ya Imbens and Rubin (2015) .

Tamî

Di beşa paşîn de, min diyar kir ku çawa bandora bandora dermankirinê ya texmîn bike. Di vê beşê de, ez ê hin fikrên derbarê guhartina wan texmînan pêşkêş dikin.

Heke hûn difikirin ku bandora nerastkirina nermkirina navberiya nirxandina nimûneyên di navbera du sembolên texmînan de, hema ew e ku nîşan bide ku astengiya standard ya bandora dermankirinê ya navîn e:

\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]

Gava ku \(m\) mirov tê dermankirin û \(Nm\) ji bo kontrolkirina ( Gerber and Green (2012) , eq. 3.4) bibînin. Ji ber vê yekê, dema ku difikirin ka gelo çiqas pêdivî ye ku çiqas pêdivî ye û çiqas gelek kontrol dikin, hûn dikarin bibînin ku \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) , paşê tu dixwazî \(m \approx N / 2\) naxwazin, heta ku mesrefên dermankirinê û kontrolê heman e. Equîziyon 4.6 diyar dike ku çima çima sêwirîna Bond û hevkarên ' (2012) li ser bandorên agahdariya sosyal li ser dengdana (4.18-nîjer) di statûyek kêm in. Bawer dikin ku wê% 98 beşdar bûne di rewşa rewşa tedawiyê de. Ji ber vê yekê wateya ku wateya tevgerê di rewşa kontrola kontrolê de ne rast bû ku ew çêbûbû, ku bi awayekî ku wateya texmînkirina di navbera tedawî û kontrolkirinê de ne rast bû ku ev rast be. Ji bo bêhtir dabeşkirina herî optimal ya beşdaran li ser mercên şertên, dema ku mesrefên di navbera mercên cuda de, li List, Sadoff, and Wagner (2011) .

Di dawiyê de, di nivîsa sereke de, min diyar kir ku çiqas nimûne-nîqaşên nimûne-ê-ê-ê, ku bi gelemperî di sêwirînek hûrgelan de tê bikaranîn, dikare dibe ku ji hêla nimûne-an-mean-texmînan ve, dibe ku bi gelemperî di nav babet-ê de mînakkirin. Heke \(X_i\) nirxandina pêşî ya encam e, hingê heya ku em dixebitin ku bi nîqaşê-di-cûdahiyê de nirxînin:

\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]

Çewtiya standard ya wê hejmara ( Gerber and Green (2012) , eq. 4.4)

\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]

Jihevkirineke eq. 4.6 û eq. 4.8 diyar dike ku dema nêzîkbûna cudahiyê-cudahî-ê-ê çewtiyek piçûktir be, dema ku ( Gerber and Green (2012) , eq. 4.6) bibînin.

\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]

Gava ku \(X_i\) gelekî pêşniyarî ya \(Y_i(1)\) \(Y_i(0)\) , heke hûn dikarin texmînên rastîn ên ji hêla cudahiyê-ji-cudahiyê ve ji cudahengiya bêtir- yên bingehîn. Ji bo ku di vê çarçoveyê de di vê çarçoveya Restivo û van de Rijt de tecrûbeya fikrîtiyê ye, ew e ku hejmareke gelek guhertineke sirûştî di nav hejmara mirovan de tê guhertin, da ku ew bihevhatina tedawî û rewşên zehmet bi zehmet e. bandorên piçûk ên di encamên encam de bêhtir. Lê heke hûn cûda nehêle ku derheqê xwezayî ya xwezayî ya hebe, hebê celeb kêmtir e, û ew hêsantir dike ku hêsantirek piçûk biçûk bike.

Binêre Frison and Pocock (1992) ji bo berhevdana rastîn ya ferq-ji-tê wateya, ferq-ji-cudahiyên, û helwestên li ser bingeha ANCOVA-di danişîna giştî bêtir li wir in û pîvandina multiple li wir pre-tedawî û post-tedawiyê. Bi taybetî, ew bi ANCOVA-ê pêşniyaz dikin, ku ez li vir naxwazim. Wekî din, McKenzie (2012) ji bo nîqaşkirina girîngiya tedawiya encamên piştî paşdibistanê gelek bibînin.