እንደማስበው በምርመራው ውስጥ የተካሄዱትን የችግሮች ማቅረቢያ ዘዴዎች (በምዕራፍ 2 ውስጥ በሂሳብ አሣሳጌዎች ላይ የተወያየሁት) ምርጥ ሙከራዎች ናቸው. ሊደርስ የሚችል (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) በምዕራፍ 3 (Aronow and Middleton 2013; Imbens and Rubin 2015, chap. 6) ንድፍ-ተኮር ናሙናዎች (ሃሳቦች) ጋር ቅርብ ግንኙነት አለው. ይህ ተጨማሪ መግለጫ የተፃፈውን ያንን ግንኙነት ለማጉላት በሚያስችል መንገድ ነው. ይህ አተገባበር ትንሽ ባህላዊ አይደለም, ነገር ግን በእውነቱ ናሙና እና ሙከራዎች መካከል ያለው ትስስር ጠቃሚ ይመስለኛል-ይህ ማለት ስለ ናሙናነት አንድ ነገር ካወቁ ስለ ሙከራዎች አንድ ነገር እና በተቃራኒው ያውቃሉ ማለት ነው. በነዚህ ማስታወሻዎች ውስጥ እንዳሳየሁ ሁሉ, ሊደረስ የሚችል የውጤት ማዕቀፍ የድንገተኛ ውጤት ተጽእኖዎችን በመገመት የዘፈቀደ ቁጥጥር ያላቸውን ጥንካሬዎች ያሳየናል, እና በተፈፀሙ ሙከራዎች አማካኝነት ሊደረጉ የሚችሉትን ገደቦች ያሳያል.
በዚህ ተጨማሪ አባባል ውስጥ, የማሳወቂያ መሰረቱን እመለከታለሁ, ይህም በምዕራፍ 2 ውስጥ ካሉት የሂሳብ አሀዞች ጋር በማባዛት እነዚህ ማስታወሻዎች እራሳቸውን እንዲችሉ ለማድረግ ነው. ከዚያም በአማካይ አከፋፈልና ልዩነት መካከል ያሉ አማካይ የሕክምና ውጤቶችን ስለሚገመቱበት ትክክለኛ ግኝቶች አንዳንድ ጠቃሚ ውጤቶችን እገልጻለሁ. ይህ ተጨማሪ አባባል Gerber and Green (2012) ላይ በእጅጉ ያመጣል.
ሊሆኑ የሚችሉ የውጤቶች ማዕቀፍ
ሊደረስባቸው የሚችሉትን የማዕቀፍ ማዕቀፍ ለመግለጽ, ወደ ዊኪፔዲያ (አስተዋይለስ) ዳይሬክተርስ (ፖርታሪ) በመቀበል የወደፊት አስተዋፅኦን (ማርከሮች) መቀበል የሚያስከትለውን ተጽእኖ ወደ Restivo እና van de Rijt እንደገና እንመልስ. ሊደረስባቸው የሚችሉ የውጤቶች ማዕቀፍ ሦስት ዋና ዋና ክፍሎች አሉት: አሃዶች , ህክምናዎች እና ሊገኙ የሚችሉ ውጤቶች . ሬስቶቪ እና ቫን ደ ሪት እንደነበሩ, እነዚህ ክፍሎች በአርሶ አደሩ ከ 1% ጣልቃ አሠማሯቸው ውስጥ ገና ያልተማሩ ነበሩ. እነዚህን አርታኢዎች በ \(i = 1 \ldots N\) . በምርመራቸው ውስጥ ያሉት ህክምናዎች "ባርናስት" ወይም "ፓርላማ" አልነበሩም, በሌላ ሰው ( \(i\) በሕክምና ሁኔታ ውስጥ እና \(W_i = 0\) ከሆነ እኔ \(W_i = 1\) \(W_i = 0\) . ሊደረስበት የተገኘው ውጤት ማዕቀፍ ሦስተኛው አካል በጣም አስፈላጊው ነው- ምናልባት ሊያስከትል የሚችለውን ውጤት . እነዚህ በተጨባጭ የበለጠ አስቸጋሪ የሆኑ ፅንሰ ሀሳቦች ("እምቅ" ውጤቶች) ሊሆኑ ይችላሉ - ሊሆኑ የሚችሉ ነገሮች ናቸው. ለእያንዳንዱ የ Wikipedia Wikipedia አርታኢ አንድ ሰው በሕክምና ሁኔታ ውስጥ \(Y_i(1)\) ማስተካከያ ( \(Y_i(1)\) ) እና በቁጥጥር ስርዓት ( \(Y_i(0)\) ).
ይህ የነጥብ መምረጫ, የሕክምና እና ውጤቶች ውጤት ከዚህ ሙከራ ምን መማር እንዳለበት ያስተውሉ. ለምሳሌ, ምንም ሳያስቀሩ, Restivo እና van de Rijt በበርካታ ዌብሳይት አዘጋጆች ላይ ወይም በአርትዖት ጥራት ላይ ውጤቶችን በተመለከተ ምንም ነገር መናገር አይችልም. በአጠቃላይ የመዋለጫዎች, የሕክምናዎች እና ውጤቶችን መምረጥ በጥናቱ ግቦች ላይ የተመሰረቱ መሆን አለባቸው.
ከላይ በሰንጠረዥ 4.5 ውስጥ የተጠቃለሉ ሊሆኑ የሚችሉ ውጤቶችን አስቀምጦ-አንድ ሰው የሕክምናውን (በሰው ልጅ) ሕክምና \(i\)
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(4.1)\]
ለእኔ ይህ እኩልነት መንስኤ ተጽእኖን ለመግለፅ እጅግ በጣም ግልፅ መንገድ ነው, እና በጣም ቀላል ቢሆንም ይህ መዋቅሩ በብዙ ጠቃሚ እና ማራኪ መንገዶች (Imbens and Rubin 2015) .
ግለሰብ | በሕክምና ሁኔታ ውስጥ የተደረጉ አርትዖቶች | አርትዖቶች በመቆጣጠሪያ ሁኔታ | የሕክምና ውጤት |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
N | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
አማካኝ | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
በዚህ መንገድ የሚከሰቱ ድርጊቶችን የምንገልጽ ከሆነ ወደ ችግር እንገታለን. በሁሉም በአብዛኛዎቹ አጋጣሚዎች, ሁለቱንም ሊታዩ የሚችሉ ውጤቶችን ለመመልከት አንችልም. ይህም ማለት የተወሰኑ የዌብስፔክ ጽሕፈት ቤቱም ማርከርን ይቀበላል ወይም አይቀበልም ማለት ነው. ስለዚህ, አንድ ሊመጣ የሚችል ውጤት - \(Y_i(1)\) ወይም \(Y_i(0)\) ነገር ግን ሁለቱንም አይመለከትም. ሁለቱንም ሊታዩ የሚችሉ ውጤቶችን ለማየት አለመቻሉ Holland (1986) መሰረታዊ ችግር ነው, እሱም የ መሰረታዊ የስደት መከሰት ነው .
እንደ እድል ሆኖ ምርምር ስንሠራ አንድ ሰው ብቻ አይደለም, ብዙ ሰዎች አሉን, ይህ ደግሞ በአከባቢ መሰረታዊ ችግር ዙሪያ መሰረታዊ ችግርን ያቀርባል. በግለሰብ ደረጃ የሚደረግ የሕክምና ውጤትን ለመገመት ከመሞከር ይልቅ አማካይ የሕክምና ውጤትን ልንገምት እንችላለን:
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(4.2)\]
ይህ አሁንም ቢሆን \(\tau_i\) በመግለጽ ይገለጻል, ነገር ግን ከአንዳንድ አልጀብራ (Eq 2.8 of Gerber and Green (2012) ) የምናገኘው
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(4.3)\]
በህይወት ውስጥ የህዝብ ቁጥር አማካይነት ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) እና \(N^{-1} \sum_{i=1}^N Y_i(1)\) ያለው ህዝብ አማካይ ውጤት ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), ከዚያም አማካይ የሕክምና ውጤትን, ምንም እንኳ ለየትኛዉ ሰው የሕክምና ውጤት መገመት ባይቻልም.
እኔ አሁን ግምታችንን, ማለትም ለመገመት እየሞከርን ያለሁት - እኔ ወደ ውሂብን እንዴት በትክክል ልንገመግመው እንደምንችል ተመልሳለሁ. እንደ አንድ ናሙና ችግር ስሇዚህ ግምት ፈተና ማሰብ እፇሌጋሇሁ (በምዕራፍ 3 ሊይ ያሇውን የሒሳብ አጭር ማስታወሻ አስቡ). በአዕምሮ ህክምና አንዳንድ ሰዎችን እንዲመርጡ ስንመርጥ እና በአዕምሮአችን ውስጥ አንዳንድ ሰዎችን ለመመርመር እንመርጣለን ከዚያም በእያንዳንዱ ሁኔታ አማካይ ውጤትን ልንገምት እንችላለን:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average edits, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average edits, control}} \qquad(4.4)\]
በ \(N_t\) \(N_c\) እኩልታ 4.4 የመሇያ-ዴስት ሚዛን ነው. የናሙና ንድፍ ምክንያት, የመጀመሪያውን ቃል ለህክምና በአማካይ ግኝት ግስጋሴ መሆኑን እና ሁለተኛውን ግዜ በእውነቱ ቁጥጥር ስር ያለ ግምት ነው.
ምን አይነት ሓይድን መጠቀም እንደሚቻል ማሰብ የሚቻልበት መንገድ በሕክምና እና ቁጥጥር ቡድኖች መካከል ያለው ንጽጽር ትክክለኛ መሆኑን ያረጋግጣል ምክንያቱም ጥርጣሬ ሁለት ቡድኖች እርስ በእርሳቸው የሚጣጣሙ መሆናቸውን ያረጋግጣል. ይህ መመሳሰል ለመለካት ላለን ነገሮች ያገለግላል (ከሙከራው በፊት በ 30 ቀናት ውስጥ የተደረጉ ማስተካከያዎችን) እና ያልተለከካናቸው (ጾታን ይግለጹ). ሁለቱም ጠብቄ አትርሱ ሁኔታዎች ላይ ሚዛን ለማረጋገጥ ይህ ችሎታ ወሳኝ ነው. ባልተጠበቁ ክስተቶች ራስን የማዛመድ ኃይል ለመመልከት, ወደፊት ለሚደረጉ ምርምሮች ወንዶች ከወንዶች ይልቅ ለሽልማት የበለጠ ምላሽ ይሰጣሉ. ታዲያ የሬቫቮ እና ቫን ሬ ሪት ሙከራ ውጤት ዋጋ አለው? የለም በቃለ መጠይቅ ሁሉም ያልተጠበቁ ተጠባባቂዎች ሚዛናዊ በሆነና በሚጠብቁት ነገር ላይ መኖራቸውን ያረጋግጡ ነበር. የማይታወቅ ከሆነ ጥበቃ የሚገኘው ይህ በጣም ኃይለኛ ሲሆን ሙከራዎቹ በምዕራፍ 2 ውስጥ ከተገለጹት የሙከራ ያልሆኑ ዘዴዎች የተለዩ ናቸው.
ለጠቅላላው ህዝብ የሕክምና ውጤት ከመግለጥ በተጨማሪ ለብዙ ስብስብ የሕክምና ውጤት መግለጽ ይቻላል. ይህም በአጠቃላይ እንደ ሁኔታዊ አማካይ የሕክምና ውጤት (CATE) ተብሎ ይጠራል. ለምሳሌ, በ Restivo እና van de Rijt ጥናት ውስጥ, \(X_i\) ሙከራው ከመካሄዱ ከ 90 ቀናት በፊት አርታዒው አማካኝ ከሆኑ የተደረጉ አርትዖቶች በላይ ወይም በታች እንደሆነ \(X_i\) . አንድ ሰው ለእነዚህ ብርሀን እና ከባድ አርታኢዎች የሕክምና ውጤቱን ለይቶ ያስረዳል.
ሊደርስ የሚችል የውጤት ማዕቀፍ ስለ ምክንያታዊ የውጤት እና ሙከራዎች ማሰብ ነው. ይሁን እንጂ ማስታወስ ያለብዎት ሁለት ተጨማሪ ውስብስብ ነገሮች አሉ. እነዚህ ሁለት ውስብስብ ነገሮች በአንድ ጊዜ ተደራጅቶ የእንክብካቤ ዋጋ (SUTVA) በሚለው ቃል አንድ ላይ ይሰባሰባሉ. የ "SUTVA" የመጀመሪያው ክፍል ለግለሰብ \(i\) ውጤት የሚያስፈልገው ብቸኛው ነገር ግለሰቡ በሀኪም ወይም ቁጥጥር ሁኔታ ውስጥ መኖሩን ነው የሚል ግምት ነው. በሌላ አነጋገር, ሰው / \(i\) ለሌሎች ሰዎች በተሰጠ ህክምና አልደረሰም. ይህ አንዳንድ ጊዜ "ጣልቃ ገብነት" ወይም "ሽርሽር የለም" ይባላል, እና እንደሚከተለው ሊፃፍ ይችላል:
\[ Y_i(W_i, \mathbf{W_{-i}}) = Y_i(W_i) \quad \forall \quad \mathbf{W_{-i}} \qquad(4.5)\]
\(\mathbf{W_{-i}}\) ለሰዎች ከ \(i\) የህክምና ሁኔታ ቬክተሮች ናቸው. ይህ ሊጣስ የሚችልበት አንደኛው መንገድ ከአንድ ሰው ህክምና ወደ ሌላ ሰው በመጠፍፈፍ በአዎንታዊነትም ሆነ አሉታዊ በሆነ መልኩ ነው. ወደ Restivo እና van de Rijt ሙከራ ተመለስ, ሁለት ጓደኞች \(i\) እና \(j\) እና ያ ሰው / \(i\) ማረፊያ ካርታ ይቀበላሉ እና \(j\) \(i\) አይቀበሉም. ማረፊያውን \(j\) ተጨማሪ ንባብ \(i\) የሕክምናው ተጽእኖ በሕክምናው ላይ ለሚገኙ ሰዎች ጠቅላላ መጠን ላይ የሚመረኮዝ ከሆነ ሊጣስ ይችላል. ለምሳሌ, ሬስቶቪ እና ቫን ዲ ሪጂት ከ 100 ይልቅ በ 1 እና በ 10,000 መካከል ያሉ ቢርጅቶች ቢሰጧቸው, ይህ የምርት ገበታን ማግኘት ውጤት ያስገኛት ይሆናል.
ሁለተኛው እትም በሱቱቫ ውስጥ የተካተተው ሁለተኛው ጉዳይ ተመራማሪው የሚያቀርበው ተገቢው ሕክምና ብቻ ነው ብሎ ማሰብ ነው. ይህ ግምታዊነት አንዳንድ ጊዜ የተደበቀ አያያዝ ወይም ተለጣፊነት ተብሎ አይጠራም . ለምሳሌ, በ Restivo እና van de Rijt ተመራማሪዎች ተመራማሪዎችን በበርካታ አርታኢዎች ገጽ ላይ እንዲያቀርቡ እና በታዋቂው የአርታኢዎች ገጽ ላይ እንዲገኙ አስችለዋቸዋል, ይህም በአርትዖት ባህሪው ውስጥ ለውጥ እንዲኖር ምክንያት ሆኗል. ይህ እውነት ከሆነ, የቡናቁር ተጽእኖ በታዋቂው የአርታኢዎች ገፁ ላይ ከሚኖረው ውጤት መለየት አይችልም. በርግጥም, ከሳይንሳዊ እሳቤ አንጻር ይህ ማራኪ ወይም ማራኪ እንደሆነ ተደርጎ ሊታይ አይችልም. ያም ማለት አንድ ተመራማሪው ገበሬ (Barnstar) የመነካቸው ውጤት ገበሬዎች (ቤርስከር) የሚያስከትሉትን ተከታይ ህክምናዎችን ያካትታል ማለት ነው. ወይም ደግሞ የምርምር ሥራ ከሌሎች ነገሮች ሁሉ የባርኔጣውን ውጤት ለመለየት የሚፈልግበት ሁኔታ ሊገምቱ ይችላሉ. ስለእሱ ማሰብ ከሚችልባቸው መንገዶች አንዱ ወደ Gerber and Green (2012) (ገጽ 41) ወደ "ሚዛናዊ ጥራጥሬ" የሚመራ ነገር አለ. በሌላ አነጋገር ህክምና እና ህክምና ሲቆጣጠሩ ሰዎች በተለመደው ሁኔታ መታከም ከሚደረግ ህክምና ውጭ ሌላ ነገር አለ? ስለ ሚዛናዊ ጥቃቅን ስጋቶች ያሉት በመድኀኒት ውስጥ ያሉ መርዛማ ህመምተኞች መድሃኒት ለመወሰድ በወሰዱት መድኃኒት መውሰድ ነው. በዚህ መንገድ ተመራማሪዎች በሁለቱ ሁኔታዎች መካከል ያለው ብቸኛ ልዩነት መድሃኒቱን መውሰድ ሳይሆን የእርግዝና መከላከያ መሆኑን ማረጋገጥ ይችላሉ.
SUTVA ላይ ተጨማሪ, ክፍል 2.7 ይመልከቱ Gerber and Green (2012) , ክፍል 2.5 Morgan and Winship (2014) , እና ክፍል 1.6 Imbens and Rubin (2015) .
ግርዘት
በመግቢያው ክፍል አማካይ የሕክምና ውጤት እንዴት እንደሚገመት ገምቻለሁ. በዚህ ክፍል, የእነዚህ ግምቶች ልዩነት ላይ የተወሰነ ሀሳቦችን እሰጣታለሁ.
በሁለት የናሙና መንገዶች መካከል ያለውን ልዩነት ለመገመት የሚያስቡ ከሆነ አማካይ የሕክምና ውጤትን መገመት ከፈለጉ የአማካይ የሕክምና ውጤት መደበኛ ስህተት ማሳየቱ ነው:
\[ SE(\widehat{\text{ATE}}) = \sqrt{\frac{1}{N-1} \left(\frac{m \text{Var}(Y_i(0))}{N-m} + \frac{(N-m) \text{Var}(Y_i(1))}{m} + 2\text{Cov}(Y_i(0), Y_i(1)) \right)} \qquad(4.6)\]
የት \(m\) ህክምና እና ተመድበዋል ሰዎች \(Nm\) ለመቆጣጠር (ማየት Gerber and Green (2012) , EQ. 3.4). ስለዚህ, ምን ያህል ሰዎች ለህክምና መድሃኒት እንደሚመደቡ እና ምን ያህል ቁጥጥር እንደሚያስፈልጋቸው \(\text{Var}(Y_i(0)) \approx \text{Var}(Y_i(1))\) , ከዚያም የሕክምና እና የመቆጣጠሪያ ወጪዎች አንድ እስከሆኑ ድረስ \(m \approx N / 2\) ይፈልጋሉ. ቀመር 4.6 ቦንድ እና ባልደረቦቻቸው 'ንድፍ ለምን እንደሆነ ግልጽ (2012) (በስእል 4.18) ድምጽ ላይ የማህበራዊ መረጃ ውጤት በተመለከተ ሙከራ ስታቲስቲክሳዊ አክሳሪ ነበር. በሕክምና ሁኔታ ውስጥ 98% ተሣታፊዎች እንዳሉት አስታውሱ. ይህም ማለት በቁጥጥር ስርዓት ውስጥ ያለው የተለመደ ባህሪያት በትክክል ሊገመት አልቻለም ነበረ ይህም በተራው በሕክምና እና ቁጥጥር ሁኔታ መካከል ያለው ልዩነት በትክክል ሊገመት እንደማይችል ነው ማለት ነው. List, Sadoff, and Wagner (2011) መካከል ዋጋዎች በሚከሰቱበት ጊዜ List, Sadoff, and Wagner (2011) ሁኔታዎችን List, Sadoff, and Wagner (2011) ተጨማሪ List, Sadoff, and Wagner (2011) .
በመጨረሻም በዋናው ጽሑፍ ላይ በተለወጠ ዲዛይን ውስጥ የተለመደው ልዩነት በአስተያየት የተጠላለፈበት ግምት በአነስተኛ ርእሰ-ነገር ውስጥ ጥቅም ላይ የዋለው ከሌሎች ባለ-ልዩ-ግምገማ አማካኝ ጋር ወደ ትናንሽ ልዩነቶች ሊመራ ይችላል. ንድፍ. ከመድረሱ በፊት ውጤቱ \(X_i\) ውጤት ከሆነ \(X_i\)
\[ \text{ATE}' = \frac{1}{N} \sum_{i=1}^N ((Y_i(1) - X_i) - (Y_i(0) - X_i)) \qquad(4.7)\]
የዚህ መጠን መደበኛ ስህተት ( Gerber and Green (2012) , ኢኳር 4.4)
\[ SE(\widehat{\text{ATE}'}) = \sqrt{\frac{1}{N-1} \left( \text{Var}(Y_i(0) - X_i) + \text{Var}(Y_i(1) - X_i) + 2\text{Cov}(Y_i(0) - X_i, Y_i(1) - X_i) \right)} \qquad(4.8)\]
የ eq ንፅፅር. 4.6 እና eq. 4.8 ልዩነት የጎደለው አቀራረብ አነስተኛ የሆነ መደበኛ ስህተት ሲኖረው ( Gerber and Green (2012) , ነም 4.6)
\[ \frac{\text{Cov}(Y_i(0), X_i)}{\text{Var}(X_i)} + \frac{\text{Cov}(Y_i(1), X_i)}{\text{Var}(X_i)} > 1\qquad(4.9)\]
በእርግጠኝነት, \(X_i\) በ \(Y_i(1)\) እና \(Y_i(0)\) በጣም ትንበያ ሲደረግ, የበለጠ ትክክለኛ ግምትን \(Y_i(0)\) የ-አንድ ማለት. በሬቫቮ እና ቫን ሬ ሪት ሙከራ ውስጥ ስለዚህ ጉዳይ ማሰብ ያለበት አንዱ መንገድ ሰዎች የሚያስተካክሉት ብዛት ባለው የተፈጥሮ ልዩነት ውስጥ ነው. ስለዚህ ህክምናውን እና ተቆጣጣሪዎች ሁኔታን ማገናዘብ አስቸጋሪ ያደርገዋል. ዘመድ በጩኸት ውጤት ውሂብ ላይ አነስተኛ ውጤት. ነገር ግን በተፈጥሮ የሚመጣውን ተለዋዋጭነት (ልዩነት) መለዋወጥ ከቻሉ, በጣም ብዙ ተለዋዋጭነት ያላቸው, እና ትንሽ ውጤት (መለኪያ) መለየት ቀላል ያደርገዋል.
በርካታ ቅድመ-ህክምናዎችን እና የድህረ-ህክምና እቃዎች ባሉበት በጠቅላላው የተለዋዋጭነት ልዩነት ንጽጽር, ልዩነት እና በ ANCOVA-ተኮር አሰራሮች ላይ ትክክለኛውን ንፅፅር ለመፈለግ Frison and Pocock (1992) ይመልከቱ. በተለይም, በጣም በጥብቅ ያልተሸፈነው ANCOVA ን በጥብቅ ይመክራሉ. በተጨማሪም McKenzie (2012) ብዙ የድህረ-ህክምና ውጤቶችን አስፈላጊነት በተመለከተ ማብራሪያ ለማግኘት ይመልከቱ.