នៅក្នុងឧបទ្វីបនេះខ្ញុំនឹងសង្ខេបគំនិតមួយចំនួនអំពីការបង្កើតការសន្និដ្ឋានមូលហេតុពីទិន្នន័យដែលមិនមានបទពិសោធន៍នៅក្នុងសំណុំបែបបទគណិតវិទ្យាបន្តិចបន្តួច។ មានវិធីសាស្រ្តសំខាន់ៗពីរគឺក្របខ័ណ្ឌក្រាហ្វិចមូលហេតុដែលភាគច្រើនទាក់ទងនឹង Judea Pearl និងសហសេវិកនិងក្របខ័ណ្ឌលទ្ធផលដែលមានសក្តានុពលដែលភាគច្រើនត្រូវបានផ្សារភ្ជាប់ជាមួយនឹង Donald Rubin និងសហសេវិក។ ខ្ញុំនឹងណែនាំពីក្របខណ្ឌលទ្ធផលសក្តានុពលព្រោះវាជាប់ទាក់ទងយ៉ាងជិតស្និទ្ធទៅនឹងគំនិតនៅក្នុងកំណត់ត្រាគណិតវិទ្យានៅចុងបញ្ចប់នៃជំពូកទី 3 និងទី 4. សម្រាប់ព័ត៌មានបន្ថែមអំពីក្រាហ្វក្រាហ្វិកមូលហេតុខ្ញុំសូមណែនាំ Pearl, Glymour, and Jewell (2016) (ការណែនាំ ) និង Pearl (2009) (កម្រិតខ្ពស់) ។ ចំពោះការព្យាបាលដែលមានរយៈពេលវែងនៃការសន្និដ្ឋានមូលហេតុដែលរួមបញ្ចូលគ្នានូវក្របខ័ណ្ឌលទ្ធផលដែលមានសក្តានុពលនិងគ្រោងក្រាហ្វិចមូលហេតុនោះខ្ញុំសូមផ្តល់អនុសាសន៍ Morgan and Winship (2014) ។
គោលដៅនៃឧបទ្វីបនេះគឺដើម្បីជួយអ្នកឱ្យមានផាសុខភាពជាមួយនឹងការកត់សម្គាល់និងរចនាប័ទ្មនៃប្រពៃណីលទ្ធផលដែលមានសក្តានុពលដូច្នេះអ្នកអាចផ្លាស់ប្តូរទៅមួយចំនួននៃសម្ភារៈបច្ចេកទេសបន្ថែមទៀតដែលបានសរសេរនៅលើប្រធានបទនេះ។ ទីមួយខ្ញុំនឹងរៀបរាប់ពីក្របខណ្ឌលទ្ធផលសក្តានុពល។ បន្ទាប់មកខ្ញុំនឹងប្រើវាដើម្បីពិភាក្សាបន្ថែមទៀតអំពីការពិសោធន៍ធម្មជាតិដូចជាមួយដោយ Angrist (1990) លើប្រសិទ្ធិភាពនៃការបម្រើយោធាលើប្រាក់ចំណូល។ ឧបសម្ពន្ធនេះគូរយ៉ាងខ្លាំងទៅលើ Imbens and Rubin (2015) ។
ក្របខ័ណ្ឌលទ្ធផលសក្តានុពល
ក្របខណ្ឌលទ្ធផលមានសក្តានុពលមានធាតុសំខាន់ទាំងបី: គ្រឿង, ការព្យាបាលនិងលទ្ធផលសក្តានុពល។ ដើម្បីបង្ហាញពីធាតុទាំងនេះចូរយើងពិចារណាអំពីសំនួរដែលបានរៀបរាប់ពីសំនួរដែលត្រូវបានដោះស្រាយក្នុង Angrist (1990) ។ ក្នុងករណីនេះយើងអាចកំណត់ឱ្យ អង្គភាព ក្លាយជាមនុស្សដែលមានសិទ្ធិទទួលបានសេចក្តីព្រាងច្បាប់ឆ្នាំ 1970 នៅសហរដ្ឋអាមេរិកហើយយើងអាចរកឃើញមនុស្សទាំងនេះតាម \(i = 1, \ldots, N\) ។ ការ ព្យាបាល ក្នុងករណីនេះអាច "បម្រើក្នុងជួរកងទ័ព" ឬ "មិនបម្រើនៅក្នុងជួរកងទ័ព" ។ ខ្ញុំនឹងហៅលក្ខខណ្ឌព្យាបាលនិងការគ្រប់គ្រងទាំងនេះហើយខ្ញុំនឹងសរសេរ \(W_i = 1\) ប្រសិនបើមនុស្សម្នាក់ \(i\) ស្ថិតនៅក្នុងលក្ខខណ្ឌនៃការព្យាបាលនិង \(W_i = 0\) ប្រសិនបើមនុស្ស \(i\) ស្ថិតនៅក្នុងលក្ខខណ្ឌបញ្ជា។ ចុងបញ្ចប់ លទ្ធផលដែលមានសក្តានុពល គឺពិបាកយល់ខ្លាំងណាស់ដោយសារតែវាពាក់ព័ន្ធនឹងលទ្ធផល "សក្តានុពល" ។ រឿងដែលអាចកើតឡើង។ ចំពោះមនុស្សម្នាក់ៗមានសិទ្ធិទទួលយកសេចក្តីព្រាងច្បាប់ឆ្នាំ 1970 យើងអាចស្រមៃពីចំនួនទឹកប្រាក់ដែលពួកគេអាចរកបាននៅឆ្នាំ 1978 ប្រសិនបើពួកគេបម្រើក្នុងជួរកងទ័ពដែលខ្ញុំនឹងហៅថា \(Y_i(1)\) ហើយចំនួនដែលពួកគេអាចរកបាននៅក្នុង 1978 ប្រសិនបើពួកគេមិនបានបម្រើនៅក្នុងយោធាដែលខ្ញុំនឹងហៅថា \(Y_i(0)\) ។ ក្នុងក្របខ័ណ្ឌលទ្ធផលសក្តានុពល \(Y_i(1)\) និង \(Y_i(0)\) ត្រូវបានគេចាត់ទុកថាជាបរិមាណថេរខណៈ \(W_i\) ជាអថេរចៃដន្យ។
ជម្រើសនៃជម្រើសការព្យាបាលនិងលទ្ធផលគឺមានសារៈសំខាន់ពីព្រោះវាកំណត់នូវអ្វីដែលអាចនិងមិនអាចរៀនបានពីការសិក្សា។ ជម្រើសនៃមនុស្សដែលមានសិទ្ធិទទួលយកសេចក្តីព្រាងច្បាប់ឆ្នាំ 1970 មិនរាប់បញ្ចូលស្ត្រីទេដូច្នេះដោយគ្មានការសន្មតបន្ថែមការសិក្សានេះនឹងមិនប្រាប់យើងអំពីផលប៉ះពាល់នៃការផ្តល់សេវាយោធាដល់ស្រ្តីទេ។ ការសំរេចចិត្តអំពីវិធីកំណត់ការព្យាបាលនិងលទ្ធផលគឺមានសារៈសំខាន់ផងដែរ។ ជាឧទាហរណ៍តើការយកចិត្ដទុកដាក់នឹងត្រូវផ្ដោតលើការបម្រើក្នុងកងទ័ពឬការប្រយុទ្ធគ្នាឬទេ? តើលទ្ធផលនៃការប្រាក់គួរជាប្រាក់ចំណូលឬការពេញចិត្តការងារដែរឬទេ? នៅទីបំផុតជម្រើសនៃការព្យាបាលការព្យាបាលនិងលទ្ធផលគួរតែត្រូវបានជំរុញដោយគោលដៅវិទ្យាសាស្ត្រនិងគោលនយោបាយនៃការសិក្សា។
ដោយមានជម្រើសនៃការព្យាបាលការព្យាបាលនិងលទ្ធផលដែលមានសក្តានុពលផលប៉ះពាល់នៃការព្យាបាលលើមនុស្ស \(i\) , \(\tau_i\) , គឺ
\[ \tau_i = Y_i(1) - Y_i(0) \qquad(2.1)\]
នៅក្នុងពាក្យផ្សេងទៀត, យើងធ្វើការប្រៀបធៀបអំពីរបៀបដែលមនុស្សជាច្រើន \(i\) នឹងបានទទួលបន្ទាប់ពីការបម្រើដល់របៀបដែលមនុស្សជាច្រើន \(i\) នឹងត្រូវបានទទួលបានដោយគ្មានការបម្រើ។ ចំពោះខ្ញុំ, eq ។ 2.1 ជាមធ្យោបាយច្បាស់លាស់ដើម្បីកំណត់នូវឥទ្ធិពលនៃមូលហេតុហើយទោះបីជាសាមញ្ញបំផុតក៏ដោយក៏គ្រោងការណ៍នេះមានលក្ខណៈទូទៅនិងគួរឱ្យចាប់អារម្មណ៍ជាច្រើន (Imbens and Rubin 2015) ។
នៅពេលប្រើក្របខ័ណ្ឌលទ្ធផលដែលមានសក្តានុពលជាញឹកញាប់ខ្ញុំយល់ថាវាមានប្រយោជន៍ក្នុងការសរសេរតារាងមួយដែលបង្ហាញពីលទ្ធផលដែលមានសក្ដានុភាពនិងឥទ្ធិពលនៃការព្យាបាលសម្រាប់អង្គភាពទាំងអស់ (តារាង 2.5) ។ ប្រសិនបើអ្នកមិនអាចស្រមៃមើលតារាងដូចនេះសម្រាប់ការសិក្សារបស់អ្នកទេនោះអ្នកប្រហែលជាចាំបាច់ត្រូវច្បាស់លាស់ក្នុងការនិយមន័យនៃគ្រឿងសំអាងការព្យាបាលនិងលទ្ធភាពដែលអាចមាន។
បុគ្គល | ប្រាក់ចំណូលក្នុងស្ថានភាពព្យាបាល | ប្រាក់ចំណូលនៅក្នុងលក្ខខណ្ឌត្រួតពិនិត្យ | ប្រសិទ្ធភាពនៃការព្យាបាល |
---|---|---|---|
1 | \(Y_1(1)\) | \(Y_1(0)\) | \(\tau_1\) |
2 | \(Y_2(1)\) | \(Y_2(0)\) | \(\tau_2\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | \(Y_N(0)\) | \(\tau_N\) |
មធ្យម | \(\bar{Y}(1)\) | \(\bar{Y}(0)\) | \(\bar{\tau}\) |
ទោះយ៉ាងណាក៏ដោយនៅពេលកំណត់នូវឥទ្ធិពលនៃមូលហេតុនៅតាមវិធីនេះយើងនឹងមានបញ្ហា។ ក្នុងករណីស្ទើរតែទាំងអស់យើងមិនទទួលបានលទ្ធផលគួរអោយជឿជាក់ទេ។ នោះគឺបុគ្គលជាក់លាក់ណាមួយត្រូវបានបម្រើឬមិនបានបម្រើ។ ដូច្នេះយើងសង្កេតឃើញលទ្ធផលនៃសក្តានុពលមួយ - \(Y_i(1)\) ឬ \(Y_i(0)\) - ប៉ុន្តែមិនមែនទាំងពីរទេ។ អសមត្ថភាពក្នុងការសង្កេតមើលលទ្ធផលទាំងពីរគឺជាបញ្ហាចម្បងមួយដែល Holland (1986) ហៅវាថាជា បញ្ហាមូលដ្ឋាននៃការទទួលបានបុព្វហេតុ ។
ជាសំណាងល្អនៅពេលយើងកំពុងធ្វើការស្រាវជ្រាវយើងមិនគ្រាន់តែមានមនុស្សម្នាក់ប៉ុណ្ណោះទេ។ ផ្ទុយទៅវិញយើងមានមនុស្សជាច្រើនហើយនេះផ្តល់នូវវិធីមួយជុំវិញបញ្ហាមូលដ្ឋាននៃការយល់ឃើញ។ ជំនួសឱ្យការប៉ាន់ស្មានដើម្បីប៉ាន់ប្រមាណប្រសិទ្ធភាពព្យាបាលកម្រិតឯកត្តជនយើងអាចប៉ាន់ប្រមាណ ឥទ្ធិពលនៃការព្យាបាលជាមធ្យម សម្រាប់អង្គភាពទាំងអស់:
\[ \text{ATE} = \bar{\tau} = \frac{1}{N} \sum_{i=1}^N \tau_i \qquad(2.2)\]
សមីការនេះនៅតែបង្ហាញតាម \(\tau_i\) ដែលមិនអាចមើលបានប៉ុន្តែជាមួយនឹងពិជគណិតមួយចំនួន (eq 2.8 នៃ Gerber and Green (2012) ) យើងទទួលបាន
\[ \text{ATE} = \frac{1}{N} \sum_{i=1}^N Y_i(1) - \frac{1}{N} \sum_{i=1}^N Y_i(0) \qquad(2.3)\]
នេះបង្ហាញថាប្រសិនបើយើងអាចប៉ាន់ប្រមាណលទ្ធផលជាមធ្យមនៃចំនួនប្រជាជនស្ថិតក្រោមការព្យាបាល ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ) និងលទ្ធផលជាមធ្យមនៃចំនួនប្រជាជនស្ថិតនៅក្រោមការគ្រប់គ្រង ( \(N^{-1} \sum_{i=1}^N Y_i(1)\) ), បន្ទាប់មកយើងអាចប៉ាន់ប្រមាណឥទ្ធិពលនៃការព្យាបាលជាមធ្យមសូម្បីតែដោយគ្មានការប៉ាន់ស្មានពីប្រសិទ្ធភាពនៃការព្យាបាលសម្រាប់មនុស្សណាមួយក៏ដោយ។
ឥឡូវខ្ញុំបានកំណត់ការប៉ាន់ស្មានរបស់យើងដែលជាអ្វីដែលយើងកំពុងព្យាករណ៍ - ខ្ញុំនឹងងាកទៅរកវិធីដែលយើងអាចប៉ាន់ស្មានវាដោយទិន្នន័យ។ ហើយត្រង់នេះយើងដំណើរការដោយផ្ទាល់ទៅក្នុងបញ្ហាដែលយើងសង្កេតឃើញតែលទ្ធផលដែលមានសក្តានុពលមួយសម្រាប់មនុស្សម្នាក់ៗប៉ុណ្ណោះ។ យើងឃើញទាំង \(Y_i(0)\) ឬ \(Y_i(1)\) (តារាង 2.6) ។ យើងអាចប៉ាន់ប្រមាណឥទ្ធិពលព្យាបាលជាមធ្យមដោយប្រៀបធៀបប្រាក់ចំណូលរបស់មនុស្សដែលបម្រើដល់ប្រាក់ចំណូលរបស់មនុស្សដែលមិនបានបម្រើ:
\[ \widehat{\text{ATE}} = \underbrace{\frac{1}{N_t} \sum_{i:W_i=1} Y_i(1)}_{\text{average earnings, treatment}} - \underbrace{\frac{1}{N_c} \sum_{i:W_i=0} Y_i(0)}_{\text{average earnings, control}} \qquad(2.4)\]
ដែល \(N_t\) និង \(N_c\) គឺជាចំនួនមនុស្សនៅក្នុងលក្ខខណ្ឌព្យាបាលនិងការគ្រប់គ្រង។ វិធីសាស្រ្តនេះនឹងដំណើរការបានយ៉ាងល្អប្រសិនបើការចាត់ចែងការព្យាបាលមានលក្ខណៈឯករាជ្យនៃលទ្ធផលដែលជាសក្តានុពលដែលជួនកាលគេហៅថាភាព ល្ងង់ខ្លៅ ។ ជាអកុសលនៅក្នុងការអវត្ដមាននៃការពិសោធន៍ភាពល្ងង់ខ្លៅមិនត្រូវបានគេពេញចិត្តជាញឹកញាប់នោះមានន័យថាការប៉ាន់ស្មានក្នុងអេកូ។ 2.4 មិនទំនងជាបង្កើតការប៉ាន់ប្រមាណល្អទេ។ វិធីមួយដើម្បីគិតអំពីវាគឺថានៅក្នុងការអវត្ដមាននៃការព្យាបាលចៃដន្យនៃការព្យាបាល, eq ។ 2.4 មិនត្រូវប្រៀបធៀបជាមួយនឹងការចូលចិត្តទេ។ វាត្រូវបានគេប្រៀបធៀបការរកប្រាក់ចំណូលនៃប្រភេទផ្សេងគ្នានៃមនុស្ស។ ឬបានសម្តែងភាពខុសគ្នាបន្តិចបន្តួចដោយមិនមានការព្យាបាលដោយចៃដន្យនោះការបែងចែកការព្យាបាលប្រហែលជាទាក់ទងទៅនឹងលទ្ធផលដែលមានសក្តានុពល។
នៅក្នុងជំពូកទី 4 ខ្ញុំនឹងរៀបរាប់ពីរបៀបដែលពិសោធន៍ដែលគ្រប់គ្រងដោយចៃដន្យអាចជួយអ្នកស្រាវជ្រាវធ្វើការប៉ាន់ប្រមាណមូលហេតុហើយនៅទីនេះខ្ញុំនឹងរៀបរាប់អំពីរបៀបដែលអ្នកស្រាវជ្រាវអាចទាញយកអត្ថប្រយោជន៍ពីការធ្វើពិសោធធម្មជាតិដូចជាសេចក្តីព្រាងច្បាប់។
បុគ្គល | ប្រាក់ចំណូលក្នុងស្ថានភាពព្យាបាល | ប្រាក់ចំណូលនៅក្នុងលក្ខខណ្ឌត្រួតពិនិត្យ | ប្រសិទ្ធភាពនៃការព្យាបាល |
---|---|---|---|
1 | ? | \(Y_1(0)\) | ? |
2 | \(Y_2(1)\) | ? | ? |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) |
\(N\) | \(Y_N(1)\) | ? | ? |
មធ្យម | ? | ? | ? |
ពិសោធន៍ធម្មជាតិ
វិធីសាស្រ្តមួយក្នុងការធ្វើការប៉ាន់ស្មានមូលហេតុដោយមិនចាំបាច់ធ្វើការសាកល្បងគឺត្រូវរកមើលអ្វីដែលកំពុងកើតឡើងនៅក្នុងពិភពលោកដែលបានផ្តល់ការព្យាបាលដោយចៃដន្យដល់អ្នក។ វិធីសាស្រ្តនេះហៅថា ពិសោធន៍ធម្មជាតិ ។ នៅក្នុងស្ថានភាពជាច្រើនអកុសលធម្មជាតិមិនផ្តល់ការព្យាបាលដោយចៃដន្យដែលអ្នកចង់ឱ្យប្រជាជនដែលចាប់អារម្មណ៍នោះទេ។ ប៉ុន្តែជួនកាលធម្មជាតិបានផ្តល់នូវការព្យាបាលដែលទាក់ទងគ្នា។ ជាពិសេសខ្ញុំនឹងពិចារណាករណីដែលមានការ ព្យាបាលបន្ទាប់បន្សំ មួយចំនួនដែលលើកទឹកចិត្តឱ្យមនុស្សទទួលការ ព្យាបាលជាបឋម ។ ជាឧទាហរណ៍សេចក្តីព្រាងនេះអាចចាត់ទុកថាជាការព្យាបាលបន្ទាប់បន្សំដែលបានលើកទឹកចិត្តឱ្យមនុស្សខ្លះទទួលការព្យាបាលជាបឋមដែលកំពុងបម្រើក្នុងជួរកងទ័ព។ ការរចនានេះត្រូវបានគេហៅថា ការរចនាលើកទឹកចិត្ត ។ ហើយវិធីសាស្រ្តវិភាគដែលខ្ញុំនឹងរៀបរាប់ដើម្បីដោះស្រាយស្ថានភាពនេះជួនកាលត្រូវបានគេហៅថា អថេរឧបករណ៍ ។ នៅក្នុងការកំណត់នេះដោយមានការសន្មត់មួយចំនួនអ្នកស្រាវជ្រាវអាចប្រើការលើកទឹកចិត្តដើម្បីរៀនអំពីប្រសិទ្ធិភាពនៃការព្យាបាលបឋមសម្រាប់សំណុំរងជាក់លាក់។
ដើម្បីដោះស្រាយការព្យាបាលពីរផ្សេងគ្នា - ការលើកទឹកចិត្តនិងការព្យាបាលសំខាន់ - យើងត្រូវការកំណាត់ថ្មីមួយចំនួន។ សន្មតថាមនុស្សមួយចំនួនត្រូវបានគេព្រាងដោយចៃដន្យ ( \(Z_i = 1\) ) ឬមិនបានព្រាង ( \(Z_i = 0\) ); នៅក្នុងស្ថានភាពនេះ \(Z_i\) ត្រូវបានគេហៅថា ឧបករណ៍ ។
ក្នុងចំណោមអ្នកដែលត្រូវបានព្រាងច្បាប់អ្នកខ្លះបម្រើ ( \(Z_i = 1, W_i = 1\) ) ហើយខ្លះមិនមាន ( \(Z_i = 1, W_i = 0\) ) ។ ដូចគ្នាដែរក្នុងចំនោមអ្នកដែលមិនត្រូវបានគេព្រាងអ្នកខ្លះបំរើ ( \(Z_i = 0, W_i = 1\) ) ហើយខ្លះមិនបានធ្វើ ( \(Z_i = 0, W_i = 0\) ) ។ លទ្ធផលដែលមានសក្តានុពលសំរាប់មនុស្សម្នាក់ៗអាចពង្រីកបានដើម្បីបង្ហាញពីស្ថានភាពរបស់ពួកគេទាំងការលើកទឹកចិត្តនិងការព្យាបាល។ ឧទាហរណ៏សូម \(Y(1, W_i(1))\) ជាប្រាក់ចំណូលរបស់បុគ្គល \(i\) ប្រសិនបើគាត់ត្រូវបានគេព្រាងដែល \(W_i(1)\) គឺជាស្ថានភាពសេវាកម្មរបស់គាត់ប្រសិនបើបានព្រាង។ លើសពីនេះទៀតយើងអាចបែងចែកប្រជាជនជាបួនក្រុម: អ្នកនិពន្ធអ្នកមិនដែលយកចិត្តទុកដាក់និងអ្នកគាំទ្រជានិច្ច (តារាង 2.7) ។
វាយ | សេវាកម្មប្រសិនបើបានព្រាង | សេវាប្រសិនបើមិនបានព្រាង |
---|---|---|
ត្អូញត្អែរ | បាទ, \(W_i(Z_i=1) = 1\) | ទេ, \(W_i(Z_i=0) = 0\) |
មិនយក - | ទេ, \(W_i(Z_i=1) = 0\) | ទេ, \(W_i(Z_i=0) = 0\) |
Defiers | ទេ, \(W_i(Z_i=1) = 0\) | បាទ, \(W_i(Z_i=0) = 1\) |
តែងតែយក | បាទ, \(W_i(Z_i=1) = 1\) | បាទ, \(W_i(Z_i=0) = 1\) |
មុនពេលយើងពិភាក្សាពីការប៉ាន់ស្មានផលប៉ះពាល់នៃការព្យាបាល (ពោលគឺសេវាកម្មយោធា) ដំបូងយើងអាចកំណត់ផលប៉ះពាល់ពីរនៃការលើកទឹកចិត្តនេះ (ឧទាហរណ៍កំពុងត្រូវបានព្រាង) ។ ទីមួយយើងអាចកំណត់ផលប៉ះពាល់នៃការលើកទឹកចិត្តលើការព្យាបាលបឋម។ ទីពីរយើងអាចកំនត់ផលប៉ះពាល់នៃការលើកទឹកចិត្តលើលទ្ធផល។ វានឹងបង្ហាញថាផលប៉ះពាល់ទាំងពីរនេះអាចត្រូវបានបញ្ចូលគ្នាដើម្បីផ្តល់នូវការប៉ាន់ប្រមាណពីប្រសិទ្ធិភាពនៃការព្យាបាលលើក្រុមជាក់លាក់របស់មនុស្ស។
ទីមួយផលប៉ះពាល់នៃការលើកទឹកចិត្តលើការព្យាបាលអាចត្រូវបានកំណត់សម្រាប់មនុស្ស \(i\) as
\[ \text{ITT}_{W,i} = W_i(1) - W_i(0) \qquad(2.5)\]
លើសពីនេះទៀតបរិមាណនេះអាចត្រូវបានកំណត់លើប្រជាជនទាំងមូល
\[ \text{ITT}_{W} = \frac{1}{N} \sum_{i=1}^N [W_i(1) - W_i(0)] \qquad(2.6)\]
ចុងក្រោយយើងអាចប៉ាន់ស្មាន \(\text{ITT} _{W}\) ដោយប្រើទិន្នន័យ:
\[ \widehat{\text{ITT}_{W}} = \bar{W}^{\text{obs}}_1 - \bar{W}^{\text{obs}}_0 \qquad(2.7)\]
ដែលជាកន្លែងដែល \(\bar{W}^{\text{obs}}_1\) គឺជាអត្រាការសង្កេតឃើញនៃការព្យាបាលសម្រាប់អ្នកដែលត្រូវបានគេលើកទឹកចិត្តនិង \(\bar{W}^{\text{obs}}_0\) គឺ អត្រានៃការព្យាបាលចំពោះអ្នកដែលមិនត្រូវបានលើកទឹកចិត្ត។ \(\text{ITT}_W\) ក៏ជួនកាលត្រូវបានគេហៅថា អត្រានៃការស្រូបយក ។
បន្ទាប់មកផលប៉ះពាល់នៃការលើកទឹកចិត្តលើលទ្ធផលអាចត្រូវបានកំណត់សម្រាប់បុគ្គល \(i\) ដែលជា:
\[ \text{ITT}_{Y,i} = Y_i(1, W_i(1)) - Y_i(0, W_i(0)) \qquad(2.8)\]
លើសពីនេះទៀតបរិមាណនេះអាចត្រូវបានកំណត់លើប្រជាជនទាំងមូល
\[ \text{ITT}_{Y} = \frac{1}{N} \sum_{i=1}^N [Y_i(1, W_i(1)) - Y_i(0, W_i(0))] \qquad(2.9)\]
ចុងក្រោយយើងអាចប៉ាន់ស្មាន \(\text{ITT}_{Y}\) ដោយប្រើទិន្នន័យ:
\[ \widehat{\text{ITT}_{Y}} = \bar{Y}^{\text{obs}}_1 - \bar{Y}^{\text{obs}}_0 \qquad(2.10)\]
\(\bar{Y}^{\text{obs}}_1\) \(\bar{W}^{\text{obs}}_0\) គឺជាលទ្ធផលដែលបានអង្កេតចំពោះអ្នកដែលមិនត្រូវបានលើកទឹកចិត្ត។
ទីបំផុតយើងបង្វែរការយកចិត្តទុកដាក់របស់យើងទៅនឹងឥទ្ធិពលនៃចំណាប់អារម្មណ៍: ផលប៉ះពាល់នៃការព្យាបាលបឋម (ឧ។ សេវាយោធា) លើលទ្ធផល (ឧទាហរណ៍ការរកប្រាក់) ។ ជាអកុសលវាប្រែថាមនុស្សម្នាក់មិនអាចប៉ាន់ស្មានពីផលប៉ះពាល់នេះទៅលើគ្រឿងទាំងអស់។ ទោះបីជាយ៉ាងណាក៏ដោយជាមួយនឹងការសន្មតមួយចំនួនអ្នកស្រាវជ្រាវអាចប៉ាន់ប្រមាណផលប៉ះពាល់នៃការព្យាបាលលើអ្នកជំនាញ (ឧទាហរណ៍អ្នកដែលនឹងបម្រើប្រសិនបើមានការពង្រាងនិងអ្នកដែលមិនបម្រើប្រសិនបើមិនបានរៀបចំតារាង 2.7) ។ ខ្ញុំនឹងហៅការប៉ាន់ស្មាននេះនិង ប្រសិទ្ធិភាពបណ្តាលឱ្យផលប៉ះពាល់ជាមធ្យម (CACE) (ដែលជួនកាលត្រូវបានគេហៅថា ប្រសិទ្ធភាពនៃការព្យាបាលជាមធ្យម LATE):
\[ \text{CACE} = \frac{1}{N_{\text{co}}} \sum_{i:G_i=\text{co}} [Y(1, W_i(1)) - Y(0, W_i(0))] \qquad(2.11)\]
ដែល \(G_i\) បរិច្ចាគក្រុមមនុស្ស \(i\) (សូមមើលតារាង 2.7) និង \(N_{\text{co}}\) គឺជាចំនួនអ្នកសរសេរ។ នៅក្នុងពាក្យផ្សេងទៀត, eq ។ 2.11 ប្រៀបធៀបប្រាក់ចំណូលរបស់អ្នកសរសេរអត្ថបទដែលបានព្រាងឡើង \(Y_i(1, W_i(1))\) ហើយមិនបានពង្រាង \(Y_i(0, W_i(0))\) ។ ការប៉ាន់ស្មានក្នុងអេកូ។ 2.11 ហាក់ដូចជាពិបាកក្នុងការប៉ាន់ស្មានពីទិន្នន័យដែលបានអង្កេតព្រោះវាមិនអាចកំណត់អត្តសញ្ញាណអ្នកគណនាដោយប្រើទិន្នន័យដែលបានអង្កេតតែប៉ុណ្ណោះ (ដើម្បីដឹងថាតើមាននរណាម្នាក់បំពេញតម្រូវការអ្នកត្រូវសង្កេតថាតើគាត់បានបម្រើនៅពេលព្រាងហើយថាតើគាត់បានបម្រើនៅពេលមិនត្រូវបានព្រាង) ។
វាមានលក្ខណៈគួរឱ្យភ្ញាក់ផ្អើលណាស់ដែលថាប្រសិនបើមានអ្នកចុះបញ្ជីណាមួយដែលត្រូវបានគេផ្តល់ឱ្យអ្នកបង្កើតការសន្មត់បន្ថែមចំនួនបីវាអាចប៉ាន់ស្មាន CACE ពីទិន្នន័យដែលបានអង្កេត។ ដំបូងគេត្រូវសន្មតថាការចាត់ចែងការព្យាបាលគឺចៃដន្យ។ ក្នុងករណីមានសេចក្តីព្រាងច្បាប់នេះសមហេតុផល។ ទោះជាយ៉ាងណាក៏ដោយនៅក្នុងការកំណត់មួយចំនួនដែលពិសោធន៍ធម្មជាតិមិនពឹងផ្អែកលើការចៃដន្យតាមរូបសណ្ឋានការសន្មត់នេះអាចមានបញ្ហាច្រើន។ ទីពីរយើងត្រូវសន្មតថាពួកគេមិនមានពន្យាពេលទេ (ការសន្មត់នេះក៏ត្រូវបានគេហៅថាការសន្មត់ថាឯកតា) ។ នៅក្នុងបរិបទនៃសេចក្តីព្រាងនេះវាហាក់ដូចជាសមហេតុសមផលក្នុងការសន្មតថាមានមនុស្សតិចតួចណាស់ដែលនឹងមិនបម្រើប្រសិនបើមានការពង្រាងហើយនឹងបម្រើប្រសិនបើមិនត្រូវបានព្រាង។ ទីបីហើយទីបំផុតការសន្មត់សំខាន់បំផុតដែលត្រូវបានហៅថា ការដាក់កំហិតការបដិសេធ ។ នៅក្រោមការដាក់កំហិតការដកហូតមួយត្រូវសន្មតថាផលប៉ះពាល់ទាំងអស់នៃកិច្ចការព្យាបាលត្រូវបានឆ្លងកាត់ការព្យាបាលដោយខ្លួនឯង។ នៅក្នុងពាក្យផ្សេងទៀតមួយត្រូវសន្មតថាមិនមានប្រសិទ្ធិភាពដោយផ្ទាល់នៃការលើកទឹកចិត្តលើលទ្ធផល។ ក្នុងករណីដែលមានសេចក្តីព្រាងច្បាប់នោះគេត្រូវសន្មតថាស្ថានភាពព្រាងនេះមិនមានឥទ្ធិពលលើប្រាក់ចំណូលក្រៅពីសេវាយោធាទេ (រូបភាព 2.11) ។ ឧទាហរណ៍ការដាក់កំហិតការដកចេញអាចត្រូវបានរំលោភបំពានប្រសិនបើឧទាហរណ៍អ្នកដែលត្រូវបានគេព្រាងបានចំណាយពេលច្រើនក្នុងសាលារៀនដើម្បីចៀសវាងសេវាឬប្រសិនបើនិយោជិកមិនសូវជួលអ្នកដែលត្រូវបានព្រាង។
ប្រសិនបើលក្ខខណ្ឌទាំងបីនេះ (ការចាត់ចែងចៃដន្យទៅការព្យាបាលមិនមានការពន្យានិងការដាក់កំហិតនៃការដាក់កំហិត) ត្រូវបានបំពេញ
\[ \text{CACE} = \frac{\text{ITT}_Y}{\text{ITT}_W} \qquad(2.12)\]
ដូច្នេះយើងអាចប៉ាន់ស្មាន CACE:
\[ \widehat{\text{CACE}} = \frac{\widehat{\text{ITT}_Y}}{\widehat{\text{ITT}_W}} \qquad(2.13)\]
វិធីមួយក្នុងការគិតអំពី CACE គឺថាវាជាភាពខុសគ្នារវាងលទ្ធផលរវាងអ្នកដែលត្រូវបានលើកទឹកចិត្តនិងអ្នកដែលមិនត្រូវបានលើកទឹកចិត្តដែលត្រូវបានបំប៉ោងដោយអត្រានៃការស្រូបយក។
មានការរំលឹកដ៏សំខាន់ពីរដែលត្រូវចងចាំ។ ទីមួយការដាក់កំហិតនៃការបដិសេធគឺជាការសន្មត់ដ៏រឹងមាំមួយហើយវាត្រូវការភាពយុត្តិធម៌លើករណីមួយករណីដែលជារឿយៗតម្រូវឱ្យមានអ្នកជំនាញផ្នែកប្រធានបទ។ ការដាក់កំហិតការបដិសេធមិនអាចត្រូវបានផ្តល់យុត្តិធម៌ដោយចៃដន្យនៃការលើកទឹកចិត្តនោះទេ។ ទីពីរបញ្ហាប្រឈមជាក់ស្តែងជាទូទៅជាមួយការវិភាគអថេរឧបករណ៍កើតឡើងនៅពេលការលើកទឹកចិត្តមានឥទ្ធិពលតិចតួចលើការស្រូបយកការព្យាបាល (នៅពេលដែល \(\text{ITT}_W\) តូច។ នេះត្រូវបានគេហៅថា ឧបករណ៍ខ្សោយ ហើយវានាំឱ្យមានបញ្ហាផ្សេងៗ (Imbens and Rosenbaum 2005; Murray 2006) ។ វិធីមួយដើម្បីគិតអំពីបញ្ហាជាមួយឧបករណ៍ខ្សោយគឺថា \(\widehat{\text{CACE}}\) អាចប្រកាន់អក្សរតូចធំនៅក្នុង \(\widehat{\text{ITT}_Y}\) ការរំលោភបំពាននៃការដាក់កំហិតការបដិសេធ - ដោយសារភាពលំអៀងទាំងនេះត្រូវបានពង្រីកដោយតូច \(\widehat{\text{ITT}_W}\) (សូមមើល eq 2.13) ។ យ៉ាងហោចណាស់ប្រសិនបើការព្យាបាលដែលផ្តល់ដោយធម្មជាតិមិនមានផលប៉ះពាល់ធំធេងចំពោះការព្យាបាលដែលអ្នកយកចិត្តទុកដាក់នោះអ្នកនឹងមានការលំបាកក្នុងការរៀនអំពីការព្យាបាលដែលអ្នកយកចិត្តទុកដាក់។
សូមមើលជំពូក 23 និង 24 នៃ Imbens and Rubin (2015) សម្រាប់កំណែផ្លូវការបន្ថែមទៀតនៃការពិភាក្សានេះ។ វិធីសាស្រ្តសេដ្ឋកិច្ចតាមបែបប្រពៃណីទៅនឹងអថេរសំខាន់ៗត្រូវបានបញ្ជាក់ជាធម្មតាក្នុងការប៉ាន់ប្រមាណសមីការមិនមែនលទ្ធផលដែលមានសក្តានុពល។ ចំពោះសេចក្តីផ្តើមពីទស្សនវិស័យផ្សេងទៀតនេះសូមមើល Angrist and Pischke (2009) និងដើម្បីប្រៀបធៀបវិធីសាស្រ្តទាំងពីរនេះសូមមើលផ្នែក 24.6 នៃ Imbens and Rubin (2015) ។ ជម្រើសផ្សេងទៀតការបង្ហាញតិចតួចអំពីអថេរឧបករណ៍គឺត្រូវបានផ្តល់នៅក្នុងជំពូកទី 6 នៃ Gerber and Green (2012) ។ សម្រាប់ព័ត៌មានបន្ថែមអំពីការដាក់កំហិតនៃការដកឃ្លាសូមមើល D. Jones (2015) ។ Aronow and Carnegie (2013) ពណ៌នាអំពីសំណុំសន្មត់បន្ថែមដែលអាចប្រើដើម្បីប៉ាន់ស្មាន ATE ជាជាង CACE ។ សម្រាប់ព័ត៌មានបន្ថែមអំពីរបៀបដែលការពិសោធធម្មជាតិអាចមានភាពពិបាកក្នុងការបកស្រាយសូមមើល Sekhon and Titiunik (2012) ។ ចំពោះការណែនាំទូទៅអំពីពិសោធន៍ធម្មជាតិដែលមិនត្រឹមតែជាអថេរឧបករណ៍ក៏មានវិធីសាស្ត្រដូចជាការបម្លែងការថយចុះតំរូវការផងដែរ - មើលឃើញ Dunning (2012) ។