Математикийн тэмдэглэл

Туршилтыг ойлгох хамгийн сайн арга бол боломжит үр дагаврын бүтэц (2-р бүлэгт математикийн тэмдэглэлд би хэлэлцсэн юм) гэж бодож байна. Болзошгүй үр дагаварын хамрах хүрээ нь 3-р бүлэгт тодорхойлсон дизайн дээр тулгуурласан түүвэрлэлтийн санаануудтай ойр дотно холбоотой байдаг (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) . Энэ хавсралт нь холболтыг онцолсон байдлаар бичсэн болно. Энэ нь уламжлалт бус шинж чанартай боловч, дээжлэлт, туршилтуудын хоорондын холболт нь тустай байдаг. Хэрэв та дээж авах талаар мэддэг бол туршилтын талаар ямар нэгэн зүйл мэддэг, эсрэгээр нь мэднэ гэсэн үг юм. Би эдгээр тэмдэглэлд үзүүлснээр боломжит үр дүнгийн цар хүрээ нь учир шалтгааны нөлөөллийг тооцоолох санамсаргүй түүвэрлэсэн туршилтуудын бат бөх чанарыг харуулж, төгс туршилтыг гүйцэтгэхийн тулд юу хийх боломжтойг харуулж байна.

Энэ хавсралтад би эдгээр тэмдэглэлүүдийг илүү бие даасан байлгахын тулд 2-р бүлгийн математикийн тэмдэглэлээс зарим материалыг хувилж олсон үр дүнгийн хүрээг тайлбарлах болно. Дараа нь би эмчилгээний дундаж үр нөлөөг тооцоолох нарийвчлал, оновчтой хуваарилалт, ялгааг тооцоологчдын ялгааны талаархи хэлэлцүүлгийн нарийвчлал зэргийг тайлбарлах болно. Энэ хавсралт Gerber and Green (2012) дээр маш их ач холбогдол өгдөг.

Боломжит үр дүнгийн хүрээ

Болзошгүй үр дагаврын бүтцийг харуулахын тулд Restivo болон van de Rijt-ийн туршилтыг Википедиа дахь ирээдүйн хандивуудад баарны одыг авах нөлөөг үнэлэхийн тулд эргэн оръё. Боломжит үр дагаварын хамрах хүрээ нь нэгж , эмчилгээ , боломжит үр дүн гэсэн гурван үндсэн элементтэй. Restivo болон ван де Рижт нарын хувьд эдгээр нэгжүүд нь одоог хүртэл хараахан хүлээн аваагүй байсан хувь нэмэр оруулагчдын тоонд 1% -ийн редакторууд байсан юм. Бид эдгээр редакторуудыг \(i = 1 \ldots N\) индексжүүлж чадна. Тэдний туршилтын эмчилгээ "barnstar" эсвэл "үгүй barnstar" байсан, би бичих болно \(W_i = 1\) хэрэв хүн \(i\) эмчилгээ нөхцөлд бөгөөд \(W_i = 0\) эсвэл. Боломжит үр дагаварын хүрээний гуравдахь элемент бол хамгийн чухал нь: боломжит үр дагавар . Эдгээр нь "болзошгүй" үр дагаварыг хамарсан, учирч болзошгүй зүйлүүдээс шалтгаалан илүү ойлгомжтой байдаг. Википедиа засварлагч бүрийн хувьд эмчилгээний нөхцөлд хийх засваруудыг ( \(Y_i(1)\) ) болон хяналтын нөхцөлд хийх тоо ( \(Y_i(0)\) ).

Энэ туршилт, эмчилгээ, үр дүнгийн сонголт нь энэ туршилтаас юу сурч болохыг тодорхойлж өгнө. Жишээ нь, ямар нэгэн нэмэлт таамаглалгүйгээр Restivo болон ван де Рижт бүх Википедиа засварлагчид эсвэл засварын чанар гэх мэт үр дагаврын талаар ярьж чадахгүй. Ерөнхийдөө нэгж, эмчилгээ, үр дүнгийн сонголт нь судалгааны зорилгод үндэслэсэн байх ёстой.

4.5-р хүснэгтэд хураангуйлан үзүүлж болох үр дүнгүүдийн үр дүнд хүн \(i\) эмчилгээний учир шалтгааны үр нөлөөг тодорхойлж чадна.

\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]

Миний хувьд энэ тэгшитгэл нь учир шалтгааны үр нөлөөг тодорхойлох хамгийн тод арга бөгөөд хэдийгээр маш энгийн боловч энэхүү тогтолцоо олон чухал, сонирхолтой арга замаар түгээмэл болж байна (Imbens and Rubin 2015) .

Хүснэгт 4.5: Боломжит үр дүнгийн хүснэгт
Хүн Эмчилгээний нөхцөлд засвар хийх Хяналтын нөхцөлд засварлах Эмчилгээний үр нөлөө
1 \(Y_1(1)\) \(Y_1(0)\) \(\tau_1\)
2 \(Y_2(1)\) \(Y_2(0)\) \(\tau_2\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
N \(Y_N(1)\) \(Y_N(0)\) \(\tau_N\)
гэсэн үг \(\bar{Y}(1)\) \(\bar{Y}(0)\) \(\bar{\tau}\)

Хэрэв бид ийм замаар шалтгааныг тодорхойлдог бол бид асуудалтай тулгардаг. Бараг бүх тохиолдолд бид боломжит үр дагаврыг ажиглаж чадахгүй. Өөрөөр хэлбэл, тодорхой Википедиа редактор нь барнестэр хүлээж авдаггүй. Тиймээс бид боломжит үр дагаврын нэгийг ажиглавал \(Y_i(1)\) эсвэл \(Y_i(0)\) -Гэвч хоёулаа биш. Боломжит үр дүнг хоёуланг нь ажиглах боломжгүй байдал нь Holland (1986) нь гол шалтгаан болж байгаа юм.

Аз болоход, бид судалгаа хийж байхдаа зөвхөн нэг хүн байдаггүй, бидэнд олон хүмүүс байдаг, энэ нь үндэслэлтэй дүгнэлтний үндсэн асуудлын талаар замыг санал болгодог. Нэг түвшний эмчилгээний үр нөлөөг тооцоолохын оронд эмчилгээний дундаж үр дүнг тооцож болно.

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]

Энэ нь илэрхий ажиглагддаггүй \(\tau_i\) хэвээр байгаа боловч зарим алгебр ( Gerber and Green (2012) -ын тэгшитгэлээс

\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]

Тэгшитгэл 4.3 харуулж байна гэж бид эмчилгээг дор хүн амын дундаж үр дүнг тооцох болно (хэрэв \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) ба хяналтын дор хүн амын дундаж үр дүн ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), дараа нь эмчилгээний үр нөлөөг тооцоолж болно.

Одоо би үнэлэхийг хичээж байгаа бидний тооцоо, тооцооллыг тодорхойлсон юм. Үүнийг үнэндээ яаж үнэлэх вэ гэдгийг эргэцүүлэх болно. Энэ үнэлгээний сорилтын талаархи түүвэрлэлтийн асуудлын талаар бодохыг хүсч байна (3-р бүлэгт математикийн тэмдэглэлийг эргэцүүлэн бодоорой). Бид эмчилгээний нөхцөлд зарим хүмүүсийг санамсаргүйгээр сонгон авч, бид хяналтын нөхцөл байдлыг ажиглахын тулд зарим хүмүүсийг санамсаргүйгээр сонгон авч, нөхцөл бүр дэх дундаж үр дүнг тооцоолж болно:

\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]

where \(N_t\) ба \(N_c\) нь эмчилгээний болон хяналтын нөхцөлд байгаа хүмүүсийн тоо юм. Тэгшитгэл 4.4 нь ялгавартай тооцоологч байна. Дээж авах загвараас шалтгаалан эхний нэр томъёо нь эмчилгээний дундаж үр дүнгийн хувьд тооцоогүй хоѐрдогч утгатай бөгөөд хоёр дахь томьёолол нь хяналтгүй хоцрогдсон үнэлгээ юм.

Тохиолдол гэж юу вэ гэдгийг бодох өөр нэг арга бол эмчилгээ ба хяналтын бүлгүүдийн хоорондох харьцуулалт шударга бөгөөд ингэснээр хоёр бүлэг бие биетэйгээ адилхан байх болно. Энэ нь бидний төсөөлж буй зүйлсийн хувьд (туршилтаас 30 хоногийн дотор засварын тоо) болон бидний хэмжиж чадаагүй зүйлүүд (жендэр гэж хэлнэ) багтдаг. Энэхүү ажиглалт болон ажиглагдахгүй хүчин зүйлсийг тэнцвэржүүлэх чадвар нь маш чухал юм. Үл мэдэгдэхүйц хүчин зүйлсийн автомат тэнцвэржүүлэх хүчийг олж харахын тулд ирээдүйн судалгаанаас харахад эрэгтэйчүүд эмэгтэйчүүдээс илүү шагналыг авах боломжтой гэж төсөөлцгөөе. Restivo болон van de Rijt-ийн туршилтын үр дүнг хүчингүй болгох байсан болов уу? Үгүй. Санамсаргүй байдлаар хийснээр бүх ажиглагдахгүй зүйлс нь хүлээгдэж буй тэнцвэрт байдлыг тэнцвэржүүлнэ гэдгийг баталгаажуулдаг. Үл мэдэгдэх эсрэг энэхүү хамгаалалт нь маш хүчтэй бөгөөд энэ нь 2-р бүлэгт тайлбарласан туршилтын бус аргуудын туршилтуудаас ялгаатай юм.

Бїх популяцид эмчилгээний їр нєлєєг тодорхойлохоос гадна хїмїїсийн эмчилгээний їр нєлєєг тодорхойлох боломжтой байдаг. Энэ нь ихэвчлэн нөхцөлт дундаж эмчилгээний нөлөөг (CATE) гэж нэрлэдэг. Жишээлбэл, Restivo болон ван де Рижтийн хийсэн судалгаагаар \(X_i\) нь туршилтаас 90 хоногийн өмнө редактор засварлагчийн дундын тооноос доогуур байгаа эсэхийг төсөөлье. Эдгээр гэрэл, хүнд редакторуудад эмчилгээний үр нөлөөг тус тусад нь тооцоолж болно.

Болзошгүй үр дагаврын хүрээ нь учир шалтгааны дүгнэлт ба туршилтуудын талаар бодох хүчирхэг арга юм. Гэсэн хэдий ч, танд хоёр нэмэлт нарийн төвөгтэй зүйл бий. Эдгээр хоёр нарийн төвөгтэй байдлыг ихэвчлэн Тогтвортой Нэгжийн Treatment Value Assumption (SUTVA) хэмээх нэр томъёонд хамт нэгтгэдэг. SUTVA-ийн эхний хэсэг нь тухайн хүний ​​хувьд \(i\) үр дүн нь эмчилгээ, хяналтын нөхцөлд байгаа эсэх нь хамгийн чухал гэж үздэг. Өөрөөр хэлбэл, тухайн хүн \(i\) бусад хүмүүст үзүүлэх эмчилгээнд нөлөөлөхгүй гэж үздэг. Үүнийг заримдаа "ямар ч хөндлөнгийн оролцоо" эсвэл "ямар ч нөлөөгүй" гэж нэрлэдэг бөгөөд үүнийг дараах байдлаар бичиж болно:

\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]

Энд \(\mathbf{W_{-i}}\) нь хүн бүрийн хувьд \(i\) ээс бусад эмчилгээний статусын вектор юм. Үүнийг зөрчиж болох нэг арга бол нэг хүнээс эмчилгээ хийлгэх нь эерэг буюу сөрөг байдлаараа өөр хүн рүү асгарвал. , Restivo болон ван де Rijt-ийн туршилтын руу буцах хоёр найзууд төсөөлж \(i\) ба \(j\) , тэр хүн \(i\) нь barnstar хүлээн авч, \(j\) тийм биш. Хэрэв \(i\) barnstar-ийг хүлээн авбал \(j\) илүү ихийг (өрсөлдөөний мэдрэмжээс) засах, эсвэл багасгах (цөхрөлийн мэдрэмжээс гарах) шалтгаан нь SUTVA зөрчигдсөн байна. Эмчилгээний үр нөлөө нь эмчилгээ хийлгэж буй бусад хүмүүсийн тооноос хамаарч үүнийг бас зөрчиж болно. Жишээ нь, Restivo болон ван де Рижт 100, 100-оодын оронд 10000-аас 100 амбаарыг өгсөн бол энэ нь барнестэр авахын үр нөлөөнд нөлөөлж болзошгүй юм.

Хоёр дахь асуудал нь SUTVA-д шилжсэн нь судлаачид зөвхөн ганцхан холбогдох эмчилгээ гэж үздэг. Энэ таамаглалыг заримдаа далд эмчилгээ эсвэл орхигдуулдаггүй гэж нэрлэдэг. Жишээлбэл, Restivo болон ван де Рижт нь судлаачдад засаж янзалсан редакторууд дээр байршуулснаар зураачдад засвар хийлгэх боломж олгож, энэ нь алдартай редакторуудын хуудас дээр гарч ирсэн бөгөөд энэ нь барник- засварлах зан төлөв өөрчлөгдсөн. Хэрвээ энэ үнэн бол, одны одны нөлөөлөл нь алдартай редакторуудын хуудасны үр дүнгээс ялгаатай байх болно. Мэдээжийн хэрэг, шинжлэх ухааны үүднээс авч үзвэл энэ нь сонирхолтой, сонирхолгүй гэж тооцогдох нь тодорхойгүй байна. Үүний нэг илрэл бол судлаач нь барнелийг хүлээн авахад нөлөөлж байгаа зүйл нь барнелийг идэвхжүүлдэг дараагийн эмчилгээнд хамаатай гэж үздэг. Эсвэл судалгаагаар эдгээр бүх зүйлсээс амны хөндийн нөлөөг тусгаарлахыг хүсч буй нөхцөл байдлыг төсөөлж болно. Үүнийг бодох нэг арга бол " Gerber and Green (2012) (p.41)" гэсэн тэгшитгэлийн эвдрэлийг дуудах ямар нэг зүйл байгаа эсэхийг асуух явдал юм. Өөрөөр хэлбэл, эмчилгээ, хяналтын нөхцөлд хүмүүсийг өөр өөрөөр эмчлэхэд хүргэдэг эмчилгээнээс өөр юу байна вэ? Эмнэлзүйн туршилтанд плацебо бэлдмэлийг авахын тулд хяналтын бүлгийн тэргүүлэх өвчтөнүүд тэгш хэмийн зөрчилтэй холбоотой асуудал үүсдэг. Ийм аргаар судлаачид хоёр нөхцлийн хоорондох ялгаа нь жинхэнэ эм юм.

SUTVA-ийн талаар дэлгэрэнгүйг Gerber and Green (2012) , Morgan and Winship (2014) 2.5, Imbens and Rubin (2015) 1.6-р хэсгээс Imbens and Rubin (2015) .

Нарийвчлал

Өмнөх хэсэгт би эмчилгээний дундаж үр нөлөөг хэрхэн үнэлэхийг тайлбарласан. Энэ хэсэгт би тэдгээр тооцооллын хувьсах байдлын тухай зарим санааг өгөх болно.

Хэрэв та эмчилгээний дундаж үр нөлөөг хоѐр аргын хоорондох зөрүүг тооцоолох талаар бодож байгаа бол эмчилгээний дундаж үр нөлөөний стандарт алдаа нь:

\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]

хаана \(m\) эмчилгээ, томилогдсон хүмүүс \(Nm\) хянах (үзнэ үү Gerber and Green (2012) , экв. 3.4). Тиймээс эмчилгээнд хичнээн хүмүүсийг шилжүүлэх, хэдэн хүнийг хэрхэн зохицуулах талаар бодохдоо, хэрэв \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) , дараа нь эмчилгээний болон хяналтын зардалтай адилаар \(m \approx N / 2\) байхыг хүсч байна. Тэгшитгэл 4.6-т санал асуулгын талаархи нийгмийн мэдээллийн үр нөлөө (Зураг 4.18) нь яагаад Бонд, хамт олон (2012) -ын загварыг яагаад статистикийн үр дүн муутай байгааг тодруулсан. Эмчилгээний нөхцөлд оролцогчдын 98% нь энэ өвчнийг эдгээдэг гэдгийг санаарай. Энэ нь хяналтын нөхцөл дэх дундаж үзүүлэлтийг яг үнэн зөв гэж тооцоолоогүй байсан бөгөөд энэ нь эргээд эмчилгээний болон хяналтын нөхцөл хоёрын хоорондох тооцоолсон алдааг үнэндээ тооцоолоогүй гэсэн үг юм. Оролцогчдын нөхцлийг оновчтой хуваарилахын тулд зардлаа өөр хооронд нь List, Sadoff, and Wagner (2011) тулд илүү дэлгэрэнгүйг List, Sadoff, and Wagner (2011) үзнэ үү.

Эцэст нь хэлэхэд гол сэдэвт би холимог дизайнд ашиглагддаг ялгаагүй ялгааг тооцоологч хэрхэн ялгавартай аргаар тооцоологчоос арай өөр хэлбэлзэлтэй байдаг ба энэ нь ихэвчлэн субъектуудын хооронд хэрэглэгддэг дизайн. Хэрэв \(X_i\) бол эмчилгээний өмнө гарах үр дүнгийн утга юм бол ялгаатай аргаар ялгаатай аргаар тооцоолохыг оролдож буй тоо хэмжээ нь:

\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]

Стандарт алдааны хэмжээ нь ( Gerber and Green (2012) , харьцаа 4.4)

\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]

Тэгш хэм. 4.6 ба тэгш байдал. 4.8-д зөрүүтэй зөрүүтэй хандлага нь ( Gerber and Green (2012) , 4.6-ыг үзнэ үү)

\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]

\(X_i\) \(Y_i(1)\) болон \(Y_i(0)\) маш их таамаглаж байгаа үед ялгаатай байдлаас ялгаатай аргаар тооцоолж болно. нь нэг юм. Restivo болон van de Rijt-ийн туршилтын хүрээнд үүнийг бодох нэг арга бол хүмүүс засах хэмжээгээр маш их өөрчлөгдөж байдаг тул эмчилгээ, хяналтын нөхцөлийг харьцуулах нь хэцүү байдаг: харьцангуйгаар илрүүлэхэд хэцүү байдаг дуу чимээний үр дагаврын өгөгдөлд бага нөлөөтэй. Гэхдээ энэ нь байгалийн унаган төрхөөрөө ялгаатай бол ялгаа нь бага хувьсамтгай байдаг бөгөөд энэ нь бага нөлөө үзүүлдэг.

Frison and Pocock (1992) нарыг ялгавартай аргаар ялгаварлах, ялгавартай байдал, ANCOVA-д суурилсан аргыг нарийн судлахын тулд олон тооны хэмжилт хийх ба эмчилгээ хийлгэхээс өмнөх үеийн эмчилгээний аргыг хэрэглэнэ. Ялангуяа, тэд ANCOVA-г зөвлөж байна. Цаашилбал, McKenzie (2012) -ийг эмчилгээний дараах олон аргуудын ач холбогдлын ач холбогдлын талаар хэлэлцсэн болно.