આ પરિશિષ્ટમાં, હું બિન-પ્રયોગાત્મક ડેટામાંથી સાધક અનુમાનને થોડો વધારે ગાણિતિક સ્વરૂપમાં બનાવવા વિશે કેટલાક વિચારોનો સારાંશ આપશે. બે મુખ્ય અભિગમો છે: સાધક ગ્રાફ ફ્રેમવર્ક, મોટાભાગે જુદેઆ પર્લ અને સહકાર્યકરો સાથે સંકળાયેલા છે, અને સંભવિત પરિણામ માળખું, મોટાભાગે ડોનાલ્ડ રુબિન અને સહકર્મીઓ સાથે સંકળાયેલા છે. હું સંભવિત પરિણામ માળખું રજૂ કરું છું કારણ કે તે પ્રકરણ 3 અને 4 ના અંતમાં ગાણિતિક Pearl, Glymour, and Jewell (2016) વિચારો સાથે વધુ નજીકથી જોડાયેલું છે. કારણદર્શક આલેખ માળખા પર વધુ, હું Pearl, Glymour, and Jewell (2016) (પ્રારંભિક ) અને Pearl (2009) (અદ્યતન). સાર્થક અનુમાનના પુસ્તક-લંબાઈની સારવાર માટે જે સંભવિત પરિણામો ફ્રેમવર્ક અને સાધક ગ્રાફ ફ્રેમવર્કને જોડે છે, હું Morgan and Winship (2014) ભલામણ કરું છું.
આ પરિશિષ્ટનો ધ્યેય સંભવિત પરિણામોની શૈલીની સંકેત અને શૈલી સાથે આરામદાયક બનવા માટે છે જેથી તમે આ મુદ્દા પર લખેલ વધુ તકનીકી સામગ્રીમાં સંક્રમિત થઈ શકો. પ્રથમ, હું સંભવિત પરિણામોનું માળખું વર્ણવવું પડશે પછી, હું કમાણી પર લશ્કરી સેવાના પ્રભાવ પર Angrist (1990) દ્વારા કુદરતી પ્રયોગો વિશે વધુ ચર્ચા કરવા માટે તેનો ઉપયોગ કરીશ. આ પરિશિષ્ટ Imbens and Rubin (2015) પર ભારે ખેંચે છે.
સંભવિત પરિણામો માળખું
સંભવિત પરિણામ માળખામાં ત્રણ મુખ્ય ઘટકો છે: એકમો , ઉપચાર અને સંભવિત પરિણામો . આ ઘટકોને સમજાવવા માટે, ચાલો Angrist (1990) માં સંબોધિત પ્રશ્નના સ્ટાઇલિટેડ વર્ઝન પર વિચાર કરીએ: કમાણી પર લશ્કરી સેવાનો પ્રભાવ શું છે? આ કિસ્સામાં, અમે યુનિટ્સને યુનાઈટેડ સ્ટેટ્સમાં 1970 ના ડ્રાફ્ટ માટે લાયક લોકો તરીકે વ્યાખ્યાયિત કરી શકીએ છીએ, અને અમે આ લોકોને \(i = 1, \ldots, N\) દ્વારા ઇન્ડેક્સ કરી શકીએ છીએ. આ કિસ્સામાં ઉપચાર "સૈન્યમાં સેવા આપતા" અથવા "લશ્કરમાં સેવા આપતા નથી" હોઈ શકે છે. હું આને સારવાર અને નિયંત્રણની સ્થિતિ કહીશ, અને હું \(W_i = 1\) જો વ્યક્તિ \(i\) સારવારની હાલતમાં હોય છે અને \(W_i = 0\) જો વ્યક્તિ \(i\) કન્ટ્રોલ શરતમાં હોય. છેવટે, સંભવિત પરિણામો થોડી વધુ ખ્યાલિક મુશ્કેલ છે કારણ કે તેમાં "સંભવિત" પરિણામો શામેલ છે; જે વસ્તુઓ બની શકે છે 1970 ના ડ્રાફ્ટ માટે લાયક દરેક વ્યક્તિ માટે, અમે 1978 માં કમાણી કરી હોત, જો તેઓ સૈન્યમાં સેવા આપતા હતા તે રકમની કલ્પના કરી શકીએ છીએ, જે હું \(Y_i(1)\) ને કૉલ કરું અને તેઓ જે રકમની કમાણી કરે છે 1978 જો તેઓ લશ્કરી સેવા આપતા ન હતા, જે હું કૉલ કરું છું \(Y_i(0)\) . સંભવિત પરિણામ માળખામાં, \(Y_i(1)\) અને \(Y_i(0)\) નિયત જથ્થાને ગણવામાં આવે છે, જ્યારે \(W_i\) રેન્ડમ વેરિયેબલ છે.
એકમો, સારવારો, અને પરિણામોની પસંદગી જટિલ છે કારણ કે તે વ્યાખ્યાયિત કરે છે કે શું અભ્યાસ કરી શકે છે - અને અભ્યાસથી શીખી શકાય નહીં. યુનિટ્સની પસંદગી - 1970 ના દાયકા માટે લાયક લોકો - સ્ત્રીઓમાં સમાવેશ થતો નથી, અને તેથી વધારાની ધારણા વિના, આ અભ્યાસ અમને મહિલાઓ પર લશ્કરી સેવાની અસર વિશે કશું જણાવશે નહીં. સારવાર અને પરિણામોને કેવી રીતે વ્યાખ્યાયિત કરવું તે વિશેનાં નિર્ણયો પણ મહત્વપૂર્ણ છે. ઉદાહરણ તરીકે, શું વ્યાજનો ઉપાય લશ્કરી અથવા અનુભવી લડાઇમાં સેવા આપવા પર ધ્યાન કેન્દ્રિત કરે છે? શું વ્યાજનું પરિણામ કમાણી અથવા નોકરીની સંતોષ હોવું જોઈએ? આખરે, એકમો, સારવાર અને પરિણામોની પસંદગી અભ્યાસના વૈજ્ઞાનિક અને નીતિના લક્ષ્યાંકો દ્વારા ચલાવવામાં આવે છે.
એકમો, ઉપચાર અને સંભવિત પરિણામોની પસંદગી, વ્યક્તિ \(i\) , \(\tau_i\) , પર સારવારની સાધક અસર
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
બીજા શબ્દોમાં કહીએ તો, આપણે તુલના કરીએ છીએ કે કેટલી વ્યક્તિ \(i\) સેવા આપ્યા વગર કમાઈ હોત તે કેટલી વ્યકિતને \(i\) સેવા આપ્યા વિના \(i\) કમાણી કર્યા પછી કમાણી કરી હશે. મને, eq. 2.1 એક સાધક અસર વ્યાખ્યાયિત કરવા માટે સ્પષ્ટ માર્ગ છે, અને અત્યંત સરળ હોવા છતાં, આ માળખું ઘણા મહત્વપૂર્ણ અને રસપ્રદ રીતે (Imbens and Rubin 2015) માં generalizable માટે કરે છે.
સંભવિત પરિણામ માળખુંનો ઉપયોગ કરતી વખતે, મને ઘણીવાર સંભવિત પરિણામો દર્શાવતી કોષ્ટક અને તમામ એકમો (કોષ્ટક 2.5) માટે સારવારની અસરો દર્શાવવા માટે સહાયરૂપ લાગે છે. જો તમે તમારા અભ્યાસ માટે આના જેવી કોષ્ટકની કલ્પના કરી શકતા નથી, તો તમારે તમારા એકમો, સારવાર અને સંભવિત પરિણામોની વ્યાખ્યામાં વધુ ચોક્કસ થવાની જરૂર પડી શકે છે.
વ્યક્તિ | સારવાર શરતમાં કમાણી | નિયંત્રણ સ્થિતિમાં કમાણી | સારવાર અસર |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
મીન | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
આ રીતે સાધક અસર વ્યાખ્યાયિત કરતી વખતે, જો કે, અમે એક સમસ્યા માં ચાલે છે. લગભગ તમામ કેસોમાં, અમે બન્ને સંભવિત પરિણામોનું પાલન ન કરીએ એટલે કે, એક વિશિષ્ટ વ્યક્તિ ક્યાં સેવા આપી કે સેવા આપતી નથી. તેથી, અમે સંભવિત પરિણામો પૈકી એકનું અવલોકન કરીએ \(Y_i(1)\) અથવા \(Y_i(0)\) -પરંતુ બન્ને નહીં. બન્ને સંભવિત પરિણામોનું પાલન કરવાની અસમર્થતા એવી મોટી સમસ્યા છે કે Holland (1986) એ તેને કોઝનલ ઇનફેરન્સની ફન્ડામેન્ટલ પ્રોબ્લેમ કહેવાય છે.
સદનસીબે, જ્યારે અમે સંશોધન કરી રહ્યા છીએ, ત્યારે અમારી પાસે એક વ્યક્તિ નથી; તેના બદલે, આપણી પાસે ઘણાં લોકો છે, અને આ બાબતની મૂળભૂત સમસ્યા વિશેનો એક માર્ગ આપે છે. વ્યક્તિગત-સ્તરના સારવારની અસરનો અંદાજ કરવાનો પ્રયાસ કરતા, અમે બધા એકમો માટે સરેરાશ સારવાર અસરનો અંદાજ કરી શકીએ છીએ:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
આ સમીકરણ હજુ પણ \(\tau_i\) ના દ્રષ્ટિએ વ્યક્ત કરવામાં આવે છે, જે અસ્પૃશ્ય છે, પરંતુ કેટલાક બીજગણિત ( Gerber and Green (2012) ના ઇક 2.8), આપણને મળે છે
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
આ બતાવે છે કે જો આપણે સારવાર હેઠળ વસતીનો સરેરાશ પરિણામ અંદાજ કરી શકીએ ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) અને વસ્તીના સરેરાશ પરિણામ નિયંત્રણ હેઠળ છે ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), તો પછી આપણે કોઈ પણ વિશિષ્ટ વ્યક્તિ માટે સારવારની અસરનો અંદાજ કાઢ્યા વિના, સરેરાશ સારવારની અસરનો અંદાજ કરી શકીએ છીએ.
હવે મેં મારા અંદાજને વ્યાખ્યાયિત કર્યો છે- જે વસ્તુ અમે અંદાજ કરવાનો પ્રયાસ કરી રહ્યા છીએ-હું તે માહિતી સાથે કેવી રીતે વાસ્તવમાં અંદાજ કરી શકીશ. અને અહીં આપણે આ સમસ્યામાં સીધા જ ચલાવીએ છીએ કે અમે ફક્ત દરેક વ્યક્તિ માટે સંભવિત પરિણામોનું એક જ અવલોકન કરીએ છીએ; આપણે ક્યાં \(Y_i(0)\) અથવા \(Y_i(1)\) (કોષ્ટક 2.6) જુઓ. અમે લોકોની કમાણીની સરખામણી કરીને સરેરાશ સારવારની અસરનો અંદાજ મેળવી શકીએ છીએ જે લોકોની કમાણી માટે સેવા આપી હતી જે સેવા આપતી નથી:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
જ્યાં \(N_t\) અને \(N_c\) એ સારવાર અને નિયંત્રણ શરતોમાં લોકોની સંખ્યા છે. આ અભિગમ સારી રીતે કામ કરશે જો સારવાર સોંપણી સંભવિત પરિણામોથી સ્વતંત્ર હોય, તો ઘણી વાર અજ્ઞાનતા કહેવાય છે. કમનસીબે, એક પ્રયોગની ગેરહાજરીમાં, અજ્ઞાનતા ઘણીવાર સંતોષતી નથી, જેનો અર્થ એ કે eq માં અંદાજકાર 2.4 સારા અંદાજ ઉત્પન્ન થવાની સંભાવના નથી. તે વિશે વિચારવાનો એક રસ્તો એ છે કે સારવારની રેન્ડમ એસાઈનમેન્ટની ગેરહાજરીમાં, eq. 2.4 ની જેમ સાથે સરખામણી નથી; તે વિવિધ પ્રકારના લોકોની કમાણીની સરખામણી કરે છે. અથવા સારવારની રેન્ડમ એસાઈનમેન્ટ વગર, સહેજ અલગ વ્યક્ત કરી, સારવાર ફાળવણી કદાચ સંભવિત પરિણામો સાથે સંબંધિત છે.
પ્રકરણ 4 માં, હું વર્ણાવું છું કે રેન્ડમાઇઝ્ડ નિયંત્રિત પ્રયોગો સંશોધકોને સાર્થ અંદાજ બનાવવા માટે કેવી રીતે સહાય કરી શકે છે, અને અહીં હું વર્ણન કરું છું કે સંશોધકો કુદરતી પ્રયોગોનો લાભ લઈ શકે છે, જેમ કે ડ્રાફ્ટ લોટરી.
વ્યક્તિ | સારવાર શરતમાં કમાણી | નિયંત્રણ સ્થિતિમાં કમાણી | સારવાર અસર |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
મીન | ? | ? | ? |
કુદરતી પ્રયોગો
એક પ્રયોગ ચલાવ્યા વિના સાર્થક અંદાજ કરવાના એક અભિગમ એ છે કે દુનિયામાં કંઈક બનતું રહ્યું છે તે માટે તમારા માટે એક સારવાર અસાધારણ રીતે સોંપવામાં આવી છે. આ અભિગમને કુદરતી પ્રયોગો કહેવામાં આવે છે. ઘણી પરિસ્થિતિઓમાં, કમનસીબે, કુદરત તમને વ્યાખ્યાની વસ્તી માટે ઇચ્છતા હોય તે સારવારને અવ્યવસ્થિતપણે આપતું નથી. પરંતુ ક્યારેક, પ્રકૃતિ રેન્ડમ સંબંધિત સારવાર પહોંચાડે છે. ખાસ કરીને, હું એવા કેસ પર વિચારણા કરીશ જ્યાં ત્યાં કેટલીક સેકન્ડરી સારવાર છે જે લોકોને પ્રાથમિક સારવાર મેળવવા માટે પ્રોત્સાહિત કરે છે. ઉદાહરણ તરીકે, ડ્રાફ્ટને રેન્ડમ રીતે સોંપાયેલ ગૌણ સારવાર માનવામાં આવે છે જેણે કેટલાક લોકોને પ્રાથમિક સારવાર લેવા માટે પ્રોત્સાહન આપ્યું હતું, જે લશ્કરી સેવામાં સેવા આપતા હતા. આ ડિઝાઇનને ક્યારેક પ્રોત્સાહન ડિઝાઇન કહેવામાં આવે છે. અને વિશ્લેષણ પદ્ધતિ કે જેને હું આ પરિસ્થિતિને હેન્ડલ કરવા માટે વર્ણવું છું તે કેટલીકવાર ઇન્સ્ટ્રુમેન્ટલ ચલો પણ કહેવાય છે. આ સેટિંગમાં, કેટલાક ધારણાઓ સાથે, સંશોધકો એકમોના ચોક્કસ સબસેટ માટે પ્રાથમિક સારવારની અસર વિશે જાણવા માટે પ્રોત્સાહનનો ઉપયોગ કરી શકે છે.
બે અલગ અલગ સારવારોને હેન્ડલ કરવા માટે - પ્રોત્સાહન અને પ્રાથમિક ઉપચાર-અમને કેટલાક નવા સંકેતોની જરૂર છે. ધારો કે કેટલાક લોકો રેન્ડમ મુસદ્દો તૈયાર કરવામાં આવે છે ( \(Z_i = 1\) ) અથવા મુસદ્દો તૈયાર કર્યો નથી ( \(Z_i = 0\) ); આ પરિસ્થિતિમાં, \(Z_i\) ને કેટલીક વખત સાધન કહેવાય છે.
કેટલાક મુસદ્દો તૈયાર કરવામાં આવ્યા હતા, તેમાંના કેટલાક ( \(Z_i = 1, W_i = 1\) ) અને કેટલાક ( \(Z_i = 1, W_i = 0\) ) ન હતા. તેવી જ રીતે, જેઓ મુસદ્દો તૈયાર ન હતા, તેમાંના કેટલાંક લોકો ( \(Z_i = 0, W_i = 1\) ) અને કેટલાક ( \(Z_i = 0, W_i = 0\) ) ન હતા. દરેક વ્યક્તિ માટે સંભવિત પરિણામો હવે બંને પ્રોત્સાહન અને સારવાર માટે તેમની સ્થિતિ દર્શાવવા માટે વિસ્તૃત કરી શકાય છે. ઉદાહરણ તરીકે, ચાલો દો \(Y(1, W_i(1))\) વ્યક્તિની કમાણી હોવી જોઈએ \(i\) જો તે મુસદ્દો તૈયાર કરવામાં આવી હોય, તો જ્યાં \(W_i(1)\) વળી, અમે વસ્તીને ચાર જૂથોમાં વિભાજીત કરી શકીએ છીએ: કટિબદ્ધ, ક્યારેય લેતા નથી, ડિફિઅર્સ અને હંમેશા લેનારા (કોષ્ટક 2.7).
પ્રકાર | જો મુસદ્દો તૈયાર કર્યો હોય તો | સેવા મુસદ્દો તૈયાર ન હોય તો |
---|---|---|
કમ્પાઇલેટર | હા, \(W_i(Z_i=1) = 1\) | ના, \(W_i(Z_i=0) = 0\) |
વિવાદાસ્પદ ક્યારેય નહીં | ના, \(W_i(Z_i=1) = 0\) | ના, \(W_i(Z_i=0) = 0\) |
ડિફિઅર્સ | ના, \(W_i(Z_i=1) = 0\) | હા, \(W_i(Z_i=0) = 1\) |
હંમેશા લેનારાઓ | હા, \(W_i(Z_i=1) = 1\) | હા, \(W_i(Z_i=0) = 1\) |
સારવારની અસર (એટલે કે, લશ્કરી સેવા) ના અંદાજ અંગે અમે ચર્ચા કરીએ તે પહેલાં, અમે સૌપ્રથમ પ્રોત્સાહનના બે અસરોને વ્યાખ્યાયિત કરી શકીએ છીએ (એટલે કે, મુસદ્દો તૈયાર કર્યો છે). પ્રથમ, અમે પ્રાથમિક સારવાર પર પ્રોત્સાહનની અસર વ્યાખ્યાયિત કરી શકીએ છીએ. બીજું, અમે પરિણામો પર પ્રોત્સાહન અસર વ્યાખ્યાયિત કરી શકો છો. તે ચાલુ થશે કે લોકોના ચોક્કસ જૂથ પર ઉપચારની અસરનો અંદાજ પૂરો પાડવા માટે આ બે અસરો ભેગા થઈ શકે છે.
સૌ પ્રથમ, સારવાર પર પ્રોત્સાહનની અસર વ્યક્તિને \(i\) તરીકે વ્યાખ્યાયિત કરી શકાય છે
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
વધુમાં, આ જથ્થાને સમગ્ર વસતી પર નિર્ધારિત કરી શકાય છે
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
છેલ્લે, અમે અંદાજ કરી શકીએ છીએ \(\text{ITT} _{W}\) ડેટાનો ઉપયોગ કરીને:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
જ્યાં \(\bar{W}^{\text{obs}}_1\) એ પ્રોત્સાહિત કરનારા અને \(\bar{W}^{\text{obs}}_0\) જેઓને પ્રોત્સાહન મળ્યું ન હતું તે માટે સારવારના અવલોકન દર. \(\text{ITT}_W\) ને કેટલીકવાર \(\text{ITT}_W\) રેટ કહેવામાં આવે છે.
આગળ, પરિણામ પર પ્રોત્સાહનની અસર વ્યક્તિને \(i\) તરીકે વ્યાખ્યાયિત કરી શકાય છે:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
વધુમાં, આ જથ્થાને સમગ્ર વસતી પર નિર્ધારિત કરી શકાય છે
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
છેલ્લે, અમે અંદાજ કરી શકીએ છીએ \(\text{ITT}_{Y}\) ડેટાનો ઉપયોગ કરીને:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
જ્યાં \(\bar{Y}^{\text{obs}}_1\) એ પ્રોત્સાહન આપવામાં આવ્યું હોય તેવા લોકો માટે (જેમ કે મુસદ્દો તૈયાર કર્યો હતો) અને \(\bar{W}^{\text{obs}}_0\) એવા લોકો માટે સારૂં પરિણામ છે જેઓને પ્રોત્સાહન આપવામાં આવ્યું ન હતું.
છેલ્લે, અમે વ્યાજની અસર તરફ ધ્યાન આપીએ છીએ: પરિણામે (દા.ત. કમાણી) પ્રાથમિક સારવારની અસર (દા.ત., લશ્કરી સેવા). કમનસીબે, તે તારણ આપે છે કે એક, સામાન્ય રીતે, બધા એકમો પર આ અસર અંદાજ નથી કરી શકો છો. જો કે, કેટલાક ધારણાઓ સાથે, સંશોધકોએ ફરિયાદીઓ પરના ઉપચારની અસરનો અંદાજ કરી શકે છે (દાખલા તરીકે, જો લોકો મુસદ્દો તૈયાર કરે અને સેવા આપતા ન હોય તેવા લોકો ટેબલ 2.7) હું આ અંદાજને ફરજિયાત સરેરાશ સાધક અસર (CACE) કહીશ. (જેને કેટલીક વખત સ્થાનિક સરેરાશ સારવારની અસર કહેવામાં આવે છે, તે પછી):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
જ્યાં \(G_i\) વ્યક્તિનું જૂથ દાન કરે છે \(i\) (જુઓ કોષ્ટક 2.7) અને \(N_{\text{co}}\) ફરિયાદીઓની સંખ્યા છે. અન્ય શબ્દોમાં, eq. 2.11 કમ્પાઈલર્સની કમાણીની ગણતરી કરે છે, જે મુસદ્દો તૈયાર કરવામાં આવે છે. \(Y_i(1, W_i(1))\) અને ડ્રાફ્ટ નહીં \(Y_i(0, W_i(0))\) ઇકમાં અંદાજ 2.11 દેખીતી માહિતીથી અંદાજ લગાવવાનું મુશ્કેલ લાગે છે કારણ કે તે માત્ર અવલોકન માહિતીનો ઉપયોગ કરીને (તે જાણવું જરૂરી છે કે કોઈ વ્યક્તિ પાલન કરે છે તે જાણવું શક્ય નથી, તમારે તેનું નિરિક્ષણ કરવું જરૂરી છે કે શું તે મુસદ્દો તૈયાર કરે છે કે નહીં અને તે મુસદ્દો તૈયાર ન થયો હોય ત્યારે સેવા આપે છે કે નહીં).
તે તદ્દન આશ્ચર્યજનક છે- જો કોઈ પણ ફરિયાદો હોય તો, જો પૂરા પાડવામાં આવે તો ત્રણ વધારાના ધારણાઓ બનાવે છે, તે અવલોકન કરેલ ડેટાથી CACE નો અંદાજ કાઢવો શક્ય છે. પ્રથમ, એક એવું માનવું છે કે સારવારમાં સોંપણી રેન્ડમ છે. ડ્રાફ્ટ લોટરીના કિસ્સામાં આ વાજબી છે. જો કે, કેટલીક સેટિંગ્સમાં જ્યાં કુદરતી પ્રયોગો ભૌતિક રેન્ડમાઇઝેશન પર આધાર રાખતા નથી, આ ધારણા વધુ સમસ્યારૂપ બની શકે છે. બીજું, એકને ધારવું પડે છે કે તે કોઈ ડિફેઅર્સ નથી (આ ધારણાને કેટલીક વખત મોનોટોસીસીટી ધારણા તરીકે પણ ઓળખવામાં આવે છે). ડ્રાફ્ટના સંદર્ભમાં એવું માનવું વાજબી લાગે છે કે એવા થોડા લોકો છે કે જેઓ મુસદ્દો તૈયાર કર્યો હોય અને સેવા નહીં આપે તો તે સેવા આપશે નહીં. ત્રીજું, અને અંતે, સૌથી મહત્વપૂર્ણ ધારણા આવે છે જેને બાકાત પ્રતિબંધ કહેવામાં આવે છે. બાકાતના પ્રતિબંધ હેઠળ, એક એવું માનવું જરૂરી છે કે ઉપચારની તમામ અસર સારવારથી પસાર થાય છે. બીજા શબ્દોમાં કહીએ તો, એવું લાગે છે કે પરિણામો પર પ્રોત્સાહનનો કોઈ સીધો પ્રભાવ નથી. ડ્રાફ્ટ લોટરીના કિસ્સામાં, ઉદાહરણ તરીકે, એકને ધારવું જરૂરી છે કે ડ્રાફટની સ્થિતિનો લશ્કરી સેવા (આકૃતિ 2.11) સિવાયની કમાણી પર કોઈ અસર થતી નથી. બાકાતના પ્રતિબંધનું ઉલ્લંઘન થઈ શકે છે, ઉદાહરણ તરીકે, જે લોકો મુસદ્દો તૈયાર કરવામાં આવ્યા હતા તેઓ શાળામાં વધુ સમય ગાળવા માટે સેવા ટાળવા માટે અથવા જો નોકરીદાતાઓ ઓછા લોકોની ભરતી કરવાની શક્યતા ઓછી હોય તો મુસદ્દો તૈયાર કર્યો હતો.
જો આ ત્રણ સ્થિતિ (સારવાર માટે રેન્ડમ અસાઇનમેન્ટ, કોઈ ડિફેઇર્સ અને બાકાત પ્રતિબંધ) મળ્યા નથી, તો પછી
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
તેથી અમે CACE નો અંદાજ કરી શકીએ છીએ:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
CACE વિશે વિચારવાનો એક રસ્તો એ છે કે તે પ્રોત્સાહિત કરનારા અને ઉત્સાહિત ન હોય તેવા લોકો વચ્ચેના પરિણામોમાં તફાવત છે.
ધ્યાનમાં રાખવાની બે મહત્વપૂર્ણ ચેતવણીઓ છે પ્રથમ, બાકાત પ્રતિબંધ મજબૂત ધારણા છે, અને તેને કેસ-બાય-કેસ આધારે ન્યાયી રાખવાની જરૂર છે, જેને વારંવાર વિષય-ક્ષેત્રની કુશળતા જરૂરી છે પ્રોત્સાહનના રેન્ડમાસાઇઝેશન સાથે બાકાત પ્રતિબંધને વાજબી ઠેરવતા નથી. બીજું, ઇન્સ્ટ્રુમેન્ટલ વેરિયેબલ વિશ્લેષણ સાથે એક સામાન્ય વ્યવહારુ પડકાર આવે છે જ્યારે પ્રોત્સાહનના ઉપચારની થોડી અસર થાય છે (જ્યારે \(\text{ITT}_W\) નાનું છે). તેને નબળા સાધન તરીકે ઓળખવામાં આવે છે, અને તે વિવિધ સમસ્યાઓ તરફ દોરી જાય છે (Imbens and Rosenbaum 2005; Murray 2006) . નબળા સાધનો સાથે સમસ્યા વિશે વિચારવાનો એક માર્ગ એ છે કે \(\widehat{\text{CACE}}\) નાના \(\widehat{\text{ITT}_Y}\) સંવેદનશીલ હોઇ શકે છે \(\widehat{\text{ITT}_Y}\) કારણે બાકાતના પ્રતિબંધના ઉલ્લંઘન-કારણ કે આ પક્ષપાતને એક નાના \(\widehat{\text{ITT}_W}\) (જુઓ eq. 2.13). આશરે, જો પ્રકૃતિને જે સારવાર આપવામાં આવે છે તે સારવારની સારવાર પર મોટી અસર પડતી નથી, તો પછી તમે જેની સારવાર કરો છો તે સારવાર વિશે તમને શીખવા માટે હાર્ડ સમય આવે છે.
આ ચર્ચાના વધુ ઔપચારીક સંસ્કરણ માટે Imbens and Rubin (2015) ના પ્રકરણ 23 અને 24 જુઓ. ઇન્સ્ટ્રુમેન્ટલ વેરિયેબલ્સનો પારંપરિક અર્થશાસ્ત્રીય અભિગમ સામાન્ય રીતે સમીકરણોના અંદાજની દ્રષ્ટિએ વ્યક્ત કરવામાં આવે છે, સંભવિત પરિણામો નથી. આ અન્ય પરિપ્રેક્ષ્યમાં પરિચય માટે, Angrist and Pischke (2009) , અને બે અભિગમો વચ્ચેની સરખામણી માટે, Imbens and Rubin (2015) ના વિભાગ 24.6 જુઓ. Gerber and Green (2012) ના પ્રકરણ 6 માં વૈકલ્પિક, વિસ્મય ચલો અભિગમની થોડી ઓછી ઔપચારિક રજૂઆત પૂરી પાડવામાં આવી છે. બાકાત પ્રતિબંધ પર વધુ માટે, જુઓ D. Jones (2015) . Aronow and Carnegie (2013) એવી ધારણાઓના વધારાના સમૂહનું વર્ણન કરે છે કે જે CACE ના બદલે ATE નો અંદાજ કાઢવા માટે વાપરી શકાય છે. કુદરતી પ્રયોગો કેવી રીતે અર્થઘટન કરવા માટે ખૂબ મુશ્કેલ હોઈ શકે તે વિશે વધુ જાણવા માટે, Sekhon and Titiunik (2012) . કુદરતી પ્રયોગો માટે વધુ સામાન્ય પરિચય માટે - એક કે જે ફક્ત વગાડવા્ય ચલોને આગળ જવું છે તેમાં રીગ્રેશન Dunning (2012) જેવી ડિઝાઇનનો પણ સમાવેશ થાય છે - જુઓ Dunning (2012) .