យើងអាចធ្វើការពិសោធន៍អំពីអ្វីដែលយើងមិនមានឬមិនអាចធ្វើបាន។ វិធីសាស្រ្តពីរដែលទទួលបានអត្ថប្រយោជន៍ជាពិសេសពីប្រភពទិន្នន័យធំគឺការធ្វើពិសោធន៍ធម្មជាតិនិងការផ្គូផ្គង។
សំណួរវិទ្យាសាស្រ្តនិងគោលនយោបាយសំខាន់ៗមួយចំនួនមានមូលហេតុ។ ឧទាហរណ៍តើអ្វីទៅជាផលប៉ះពាល់នៃកម្មវិធីបណ្ដុះបណ្ដាលការងារលើប្រាក់ឈ្នួល? អ្នកស្រាវជ្រាវប៉ុនប៉ងឆ្លើយសំណួរនេះអាចប្រៀបធៀបប្រាក់ចំណូលរបស់មនុស្សដែលបានចុះឈ្មោះចូលហ្វឹកហាត់ដល់អ្នកដែលមិនមាន។ ប៉ុន្តែតើភាពខុសគ្នារវាងប្រាក់ឈ្នួលរវាងក្រុមទាំងនេះដោយសារតែការបណ្តុះបណ្តាលនិងចំនួនប៉ុន្មានដោយសារតែភាពខុសគ្នារវាងមនុស្សដែលចុះឈ្មោះនិងអ្នកដែលមិនមាន? នេះគឺជាសំណួរពិបាកមួយហើយវាជាសំណួរមួយដែលមិនបាត់ទៅវិញដោយមានទិន្នន័យបន្ថែមទៀត។ និយាយម្យ៉ាងទៀតការព្រួយបារម្ភអំពីភាពខុសគ្នាដែលអាចកើតមានកើតឡើងមិនថាមានអ្នកធ្វើការប៉ុន្មាននាក់នៅក្នុងទិន្នន័យរបស់អ្នកទេ។
ក្នុងស្ថានភាពជាច្រើនវិធីដែលមានបំផុតបំផុតដើម្បីប៉ាន់ស្មានផលប៉ះពាល់នៃការព្យាបាលមួយចំនួនដូចជាការបណ្តុះបណ្តាលការងារគឺជាការអនុវត្តការពិសោធដែលគ្រប់គ្រងដោយចៃដន្យដែលអ្នកស្រាវជ្រាវផ្តល់ការព្យាបាលដល់មនុស្សមួយចំនួនដោយមិនដឹងខ្លួន។ ខ្ញុំនឹងចំណាយពេលទាំងអស់នៃជំពូក 4 ដើម្បីពិសោធន៍ដូច្នេះនៅទីនេះខ្ញុំនឹងផ្តោតលើយុទ្ធសាស្រ្តពីរដែលអាចត្រូវបានប្រើជាមួយទិន្នន័យដែលមិនពិសោធន៍។ យុទ្ធសាស្រ្តទី 1 គឺអាស្រ័យលើការស្វែងរកអ្វីដែលកំពុងកើតឡើងនៅលើពិភពលោកដែលចៃដន្យ (ឬជិតចៃដន្យ) ផ្តល់ការព្យាបាលដល់មនុស្សមួយចំនួននិងមិនមែនអ្នកដទៃ។ យុទ្ធសាស្ត្រទី 2 គឺអាស្រ័យលើការកែតម្រូវទិន្ន័យគ្មានការពិសោធន៍តាមស្ថិតិក្នុងការប៉ុនប៉ងដើម្បីគណនាភាពខុសគ្នារវាងអ្នកដែលបានធ្វើនិងមិនបានទទួលការព្យាបាល។
ការសង្ស័យមួយអាចអះអាងថាយុទ្ធសាស្រ្តទាំងពីរនេះគួរតែត្រូវបានជៀសវាងដោយសារតែពួកគេតម្រូវឱ្យមានការសន្មត់យ៉ាងខ្លាំងការសន្មត់ដែលមានការលំបាកដើម្បីវាយតម្លៃហើយថានៅក្នុងការអនុវត្តត្រូវបានរំលោភជាញឹកញាប់។ ខណៈពេលដែលខ្ញុំមានចិត្តអាណិតអាសូរចំពោះការអះអាងនេះខ្ញុំគិតថាវានៅតែឆ្ងាយពេក។ វាជាការពិតដែលថាវាជាការលំបាកក្នុងការជឿទុកចិត្តបានធ្វើឱ្យមានការប៉ាន់ប្រមាណមូលហេតុពីទិន្នន័យដែលមិនពិសោធន៍ប៉ុន្តែខ្ញុំមិនគិតថានេះមានន័យថាយើងមិនគួរព្យាយាម។ ជាពិសេសវិធីសាស្រ្តដែលមិនពិសោធន៍អាចមានប្រយោជន៍ប្រសិនបើឧបសគ្គភស្តុភារបង្ការអ្នកពីការធ្វើពិសោធន៍ឬប្រសិនបើឧបសគ្គសីលធម៌មានន័យថាអ្នកមិនចង់ដំណើរការពិសោធន៍។ លើសពីនេះទៀតវិធីសាស្ដ្រមិនពិសោធន៍អាចមានប្រយោជន៍ប្រសិនបើអ្នកចង់ទាញយកអត្ថប្រយោជន៍នៃទិន្នន័យដែលមានរួចហើយដើម្បីបង្កើតការពិសោធន៍ដែលមានការគ្រប់គ្រងដោយចៃដន្យ។
មុនពេលដំណើរការវាគួរកត់សំគាល់ផងដែរថាការប៉ាន់ប្រមាណមូលហេតុគឺជាប្រធានបទដ៏ស្មុគស្មាញមួយក្នុងការស្រាវជ្រាវសង្គមនិងមួយដែលអាចនាំឱ្យមានការជជែកវែកញែកខ្លាំងនិងអារម្មណ៍។ នៅក្នុងអ្វីដែលខាងក្រោមខ្ញុំនឹងផ្តល់នូវការពិពណ៌នាសុទិដ្ឋិនិយមអំពីវិធីសាស្ត្រនីមួយៗដើម្បីកសាងវិចារណញាណអំពីវាបន្ទាប់មកខ្ញុំនឹងរៀបរាប់អំពីបញ្ហាមួយចំនួនដែលកើតឡើងនៅពេលប្រើវិធីសាស្រ្តនោះ។ ព័ត៌មានលម្អិតបន្ថែមអំពីវិធីសាស្រ្តនីមួយៗអាចរកបាននៅក្នុងសម្ភារឧបទេសនៅចុងបញ្ចប់នៃជំពូកនេះ។ ប្រសិនបើអ្នកមានគម្រោងប្រើប្រាស់វិធីសាស្រ្តទាំងនេះក្នុងការស្រាវជ្រាវផ្ទាល់របស់ខ្ញុំខ្ញុំសូមផ្តល់អនុសាសន៍ឱ្យអានសៀវភៅមួយក្នុងចំណោមសៀវភៅដ៏អស្ចារ្យជាច្រើនអំពីការសន្និដ្ឋានមូលហេតុ (Imbens and Rubin 2015; Pearl 2009; Morgan and Winship 2014) ។
វិធីសាស្ត្រមួយដើម្បីធ្វើការប៉ាន់ប្រមាណមូលហេតុពីទិន្នន័យដែលមិនមែនជាការពិសោធន៍គឺដើម្បីរកមើលព្រឹត្តិការណ៍មួយដែលបានផ្តល់ការព្យាបាលដោយចៃដន្យដល់មនុស្សមួយចំនួននិងមិនមែនចំពោះអ្នកដទៃ។ ស្ថានភាពទាំងនេះត្រូវបានគេហៅថា ពិសោធន៍ធម្មជាតិ ។ ឧទាហរណ៍ជាក់ស្តែងបំផុតមួយនៃការធ្វើតេស្តធម្មជាតិគឺមកពីការស្រាវជ្រាវរបស់ Joshua Angrist (1990) វាស់ឥទ្ធិពលនៃសេវាកម្មយោធាលើប្រាក់ចំណូល។ ក្នុងអំឡុងសង្គ្រាមនៅវៀតណាមសហរដ្ឋអាមេរិកបានបង្កើនទំហំកងកម្លាំងប្រដាប់អាវុធរបស់ខ្លួនតាមរយៈពង្រាងមួយ។ ដើម្បីសំរេចថាតើប្រជាពលរដ្ឋណាម្នាក់នឹងត្រូវគេហៅឱ្យបម្រើនោះរដ្ឋាភិបាលអាមេរិកបានប្រារព្ធឆ្នោតមួយ។ ថ្ងៃខែឆ្នាំកំណើតត្រូវបានសរសេរលើក្រដាសមួយហើយដូចដែលបានបង្ហាញក្នុងរូបភាពទី 2.7 ក្រដាសទាំងនេះត្រូវបានជ្រើសរើសមួយដងដើម្បីកំណត់លំដាប់ដែលបុរសវ័យក្មេងនឹងត្រូវបានហៅឱ្យបម្រើ (ស្ត្រីវ័យក្មេងមិនត្រូវបានទទួលយក ទៅសេចក្តីព្រាង) ។ ដោយយោងតាមលទ្ធផលបុរសកើតនៅថ្ងៃទី 14 ខែកញ្ញាត្រូវបានគេហៅថាជាលើកដំបូងបុរសកើតនៅថ្ងៃទី 24 ខែមេសាត្រូវបានគេហៅថាទីពីរ។ នៅទីបញ្ចប់ក្នុងឆ្នោតនេះបុរសដែលកើតនៅថ្ងៃ 195 ខុសគ្នាត្រូវបានគេធ្វើសេចក្តីព្រាងខណៈដែលបុរសកើតនៅថ្ងៃ 171 មិនមាន។
ទោះបីជាវាមិនច្បាស់ភ្លាមៗក្តីក៏សេចក្តីព្រាងច្បាប់មានភាពស្រដៀងគ្នាខ្លាំងទៅនឹងការពិសោធន៏ពិសោធន៏ដោយចៃដន្យ: ក្នុងករណីទាំងពីរអ្នកចូលរួមត្រូវបានគេជ្រើសរើសឱ្យទទួលការព្យាបាលដោយចៃដន្យ។ ដើម្បីសិក្សាអំពីប្រសិទ្ធិភាពនៃការព្យាបាលដោយចៃដន្យនេះ Angrist ទាញយកប្រយោជន៍ពីប្រព័ន្ធទិន្នន័យដ៏ធំមួយនៅលើប្រព័ន្ធទិន្នន័យដ៏ធំមួយពោលគឺរដ្ឋបាលសន្តិសុខសង្គមអាមេរិកដែលប្រមូលព័ត៌មានស្ទើរតែគ្រប់ប្រាក់ចំណូលរបស់អាមេរិកពីការងារ។ ដោយការច្របាច់បញ្ចូលគ្នានូវព័ត៌មានអំពីអ្នកដែលត្រូវបានជ្រើសរើសដោយចៃដន្យនៅក្នុងឆ្នោតលាយជាមួយនឹងទិន្នន័យរកប្រាក់ចំណូលដែលត្រូវបានគេប្រមូលបាននៅក្នុងកំណត់ត្រារដ្ឋាភិបាលរដ្ឋបាលខួរក្បាលបានសន្និដ្ឋានថាប្រាក់ចំណូលរបស់អតីតយុទ្ធជនមានចំនួនតិចជាងប្រាក់ចំណូលរបស់អតីតយុទ្ធជនដែលប្រៀបធៀប។
ឧទាហរណ៍នេះបង្ហាញថាជួនកាលកម្លាំងសង្គមនយោបាយឬធម្មជាតិផ្តល់ការព្យាបាលតាមវិធីដែលអាចត្រូវបានប្រើដោយអ្នកស្រាវជ្រាវហើយជួនកាលឥទ្ធិពលនៃការព្យាបាលទាំងនេះត្រូវបានចាប់យកដោយប្រភពទិន្នន័យធំ ៗ ជានិច្ច។ យុទ្ធសាស្រ្តស្រាវជ្រាវនេះអាចសង្ខេបដូចខាងក្រោម: \[\text{random (or as if random) variation} + \text{always-on data} = \text{natural experiment}\]
ដើម្បីបង្ហាញពីយុទ្ធសាស្រ្តនេះក្នុងយុគសម័យឌីជីថលចូរយើងពិចារណាលើការសិក្សាដោយអាឡិចសាន់ហ្សេសនិងអេនរីកូម៉ូរីធី (2009) ដែលបានព្យាយាមប៉ាន់ស្មានផលប៉ះពាល់នៃការធ្វើការជាមួយសហសេវិកដែលមានផលិតភាពលើផលិតភាពរបស់កម្មករ។ មុនពេលឃើញលទ្ធផលវាគួរអោយកត់សំគាល់ថាមានការរំពឹងទុកខុសគ្នាដែលអ្នកអាចមាន។ ម្យ៉ាងវិញទៀតអ្នកប្រហែលជារំពឹងថាការធ្វើការជាមួយសហសេវិកដែលមានផលិតភាពនឹងនាំឱ្យកម្មករម្នាក់បង្កើនផលិតភាពរបស់គាត់ដោយសារតែការបង្ខិតបង្ខំពីមិត្តភក្តិ។ ឬផ្ទុយទៅវិញអ្នកប្រហែលជារំពឹងថាការមានកូនធ្វើការដ៏លំបាកអាចនាំឱ្យកម្មករដកដង្ហើមព្រោះការងាររបស់មិត្តភក្តិនឹងត្រូវបានធ្វើ។ វិធីច្បាស់បំផុតដើម្បីសិក្សាពីផលប៉ះពាល់របស់មិត្តភក្ដិលើផលិតភាពនឹងក្លាយជាការពិសោធន៍គ្រប់គ្រងដោយចៃដន្យមួយដែលបុគ្គលិកត្រូវបានគេកំណត់អោយដោយផ្លាស់ប្តូរជាមួយកម្មករនៃកម្រិតផលិតភាពខុសៗគ្នាហើយបន្ទាប់មកលទ្ធផលត្រូវបានវាស់សម្រាប់មនុស្សគ្រប់គ្នា។ យ៉ាងណាក៏ដោយក្រុមអ្នកស្រាវជ្រាវមិនបានគ្រប់គ្រងតារាងពេលវេលារបស់កម្មករនៅក្នុងអាជីវកម្មពិតប្រាកដណាមួយឡើយដូច្នេះម៉ាសនិងម៉ីថេទីត្រូវពឹងផ្អែកលើការពិសោធន៍ធម្មជាតិទាក់ទងនឹងអ្នកគិតលុយនៅផ្សារទំនើប។
នៅផ្សារទំនើបពិសេសនេះដោយសារតែវិធីដែលការកំណត់ពេលត្រូវបានធ្វើហើយវិធីដែលផ្លាស់ប្តូរគ្នាត្រូវគ្នាអ្នកគិតលុយម្នាក់ៗមានអ្នកធ្វើការខុសៗគ្នាខុសៗគ្នាក្នុងពេលខុសៗគ្នា។ លើសពីនេះទៅទៀតនៅក្នុងផ្សារទំនើបនេះកិច្ចការរបស់អ្នកគិតលុយមិនទាក់ទងទៅនឹងផលិតភាពរបស់មិត្តភក្តិឬរបៀបដែលរវល់របស់ហាងនោះទេ។ និយាយម្យ៉ាងទៀតទោះបីជាការកំណត់ពេលនៃអ្នកគិតលុយមិនត្រូវបានកំណត់ដោយឆ្នោតនោះក៏ដោយក៏វាហាក់បីដូចជាថាពលករត្រូវបានគេកំណត់ឱ្យធ្វើការជាមួយមិត្តភក្តិដែលមានផលិតភាពខ្ពស់ (ឬទាប) ។ សំណាងល្អផ្សារទំនើបនេះក៏មានប្រព័ន្ធពិនិត្យឌីជីថលចាស់ដែលតាមដានវត្ថុដែលអ្នកគិតលុយម្នាក់ៗកំពុងស្កេនគ្រប់ពេលវេលា។ ពីទិន្នន័យកំណត់ហេតុនេះលោក Mas និង Moretti មានលទ្ធភាពបង្កើតរង្វាស់ជាក់លាក់នៃផលិតផលដែលមានលក្ខណៈច្បាស់លាស់បុគ្គលនិងវាស់វែងជានិច្ចនូវចំនួនធាតុដែលបានស្កេនក្នុងមួយវិនាទី។ ម៉ាសនិងម៉ីថេបានប៉ាន់ប្រមាណថាប្រសិនបើអ្នកគិតលុយត្រូវបានគេប្រគល់ឱ្យទៅអ្នកធ្វើការដែលមានផលិតភាពខ្ពស់ជាងមធ្យមភាគ 10% ផលិតភាពរបស់អ្នកស្រីនឹងកើនឡើង 1,5% ។ លើសពីនេះទៀតពួកគេបានប្រើទំហំនិងភាពសម្បូរបែបនៃទិន្នន័យរបស់ពួកគេដើម្បីស្វែងយល់ពីបញ្ហាសំខាន់ៗពីរគឺ ភាពមិនប្រទាក់ក្រឡាគ្នា នៃផលប៉ះពាល់នេះ (សម្រាប់ប្រភេទណាខ្លះដែលមានឥទ្ធិពលធំជាង?) និង យន្ដ ការ ដែល នៅពីក្រោយប្រសិទ្ធិភាព (ហេតុអ្វីបានជាមានមិត្តភក្តិដែលមានផលិតភាពខ្ពស់នាំទៅរក ផលិតភាពខ្ពស់?) ។ យើងនឹងត្រលប់ទៅបញ្ហាសំខាន់ៗពីរនេះគឺភាពមិនធម្មតានៃផលប៉ះពាល់និងយន្តការនៃការព្យាបាល - នៅជំពូកទី 4 នៅពេលយើងពិភាក្សាអំពីការពិសោធន៍លម្អិត។
ជាទូទៅក្នុងការសិក្សាទាំងពីរនេះតារាង 2.3 សង្ខេបពីការសិក្សាដទៃទៀតដែលមានរចនាសម្ព័ន្ធដូចនេះដោយប្រើប្រភពទិន្នន័យដែលតែងតែវាស់វែងផលប៉ះពាល់នៃការប្រែប្រួលចៃដន្យមួយចំនួន។ នៅក្នុងការអនុវត្តអ្នកស្រាវជ្រាវប្រើយុទ្ធសាស្រ្តខុសគ្នាពីរដើម្បីស្វែងរកការពិសោធន៍ធម្មជាតិដែលទាំងពីរអាចមានផ្លែផ្កា។ អ្នកស្រាវជ្រាវមួយចំនួនចាប់ផ្តើមជាមួយប្រភពទិន្នន័យដែលតែងតែរកនិងស្វែងរកព្រឹត្តិការណ៍ចៃដន្យនៅលើពិភពលោក។ អ្នកផ្សេងទៀតចាប់ផ្តើមព្រឹត្តិការណ៍ចៃដន្យនៅលើពិភពលោកហើយស្វែងរកប្រភពទិន្នន័យដែលចាប់យកផលប៉ះពាល់របស់វា។
ការផ្តោតសំខាន់ | ប្រភពនៃការពិសោធធម្មជាតិ | បើកប្រភពទិន្នន័យជានិច្ច | សេចក្តីយោង |
---|---|---|---|
ផលប៉ះពាល់របស់មិត្តលើផលិតភាព | ដំណើរការកំណត់ពេលវេលា | ពិនិត្យចេញទិន្នន័យ | Mas and Moretti (2009) |
បង្កើតមិត្តភាព | ព្យុះសង្ឃរា | Phan and Airoldi (2015) | |
ការរីករាលដាលនៃអារម្មណ៍ | ភ្លៀង | Lorenzo Coviello et al. (2014) | |
ការផ្លាស់ប្តូរសេដ្ឋកិច្ចទៅលើមិត្តភក្ដិ | រញ្ជួយដី | ទិន្នន័យប្រាក់ចល័ត | Blumenstock, Fafchamps, and Eagle (2011) |
ឥរិយាបថប្រើប្រាស់ផ្ទាល់ខ្លួន | 2013 អាមេរិកបានបិទ | ទិន្នន័យហិរញ្ញវត្ថុផ្ទាល់ខ្លួន | Baker and Yannelis (2015) |
ផលប៉ះពាល់សេដ្ឋកិច្ចនៃប្រព័ន្ធអ្នកណែនាំ | ផ្សេងៗគ្នា | ការរុករកទិន្នន័យនៅក្រុមហ៊ុន Amazon | Sharma, Hofman, and Watts (2015) |
ឥទ្ធិពលនៃភាពតានតឹងចំពោះទារកមិនទាន់កើត | 2006 អ៊ីស្រាអែល - សង្រ្គាម Hezbollah | កំណត់ត្រាកំណើត | Torche and Shwed (2015) |
ការអានលើវិគីភីឌា | វិវរណៈ Snowden | កំណត់ហេតុវិគីភីឌា | Penney (2016) |
ផលប៉ះពាល់របស់មិត្តលើការហាត់ប្រាណ | អាកាសធាតុ | កម្មវិធីតាមដានលំហាត់រាង្គកាយ | Aral and Nicolaides (2017) |
ក្នុងការពិភាក្សាអំពីការពិសោធធម្មជាតិខ្ញុំបានបោះបង់ចោលនូវចំណុចសំខាន់មួយគឺថាការទៅពីអ្វីដែលធម្មជាតិបានផ្តល់ទៅអ្វីដែលអ្នកចង់បានពេលខ្លះអាចជារឿងពិបាកណាស់។ ចូរយើងត្រលប់ទៅមើលសេចក្តីព្រាងគំរូរបស់វៀតណាមវិញ។ ក្នុងករណីនេះអេកកចាប់អារម្មណ៍ក្នុងការប៉ាន់ប្រមាណអំពីឥទ្ធិពលនៃការបម្រើយោធាលើប្រាក់ចំណូល។ ជាអកុសលសេវាយោធាមិនត្រូវបានគេកំណត់ដោយចៃដន្យទេ។ ផ្ទុយទៅវិញវាត្រូវបានគេព្រាងដែលត្រូវបានគេកំណត់ដោយចៃដន្យ។ ទោះយ៉ាងណាក៏ដោយមិនមែនគ្រប់គ្នាដែលត្រូវបានគេព្រាងឱ្យបម្រើនោះទេ (មានការលើកលែងជាច្រើន) ហើយមិនមែនគ្រប់គ្នាដែលបម្រើការត្រូវបានព្រាង (មនុស្សអាចស្ម័គ្រចិត្តបម្រើ) ។ ដោយសារតែការធ្វើសេចក្តីព្រៀងត្រូវបានគេកំណត់ដោយចៃដន្យអ្នកស្រាវជ្រាវម្នាក់អាចប៉ាន់ស្មានពីប្រសិទ្ធភាពនៃការព្រាងសម្រាប់បុរសទាំងអស់នៅក្នុងសេចក្តីព្រាងនេះ។ ប៉ុន្តែពួកទេវតាមិនចង់ដឹងអំពីប្រសិទ្ធិភាពនៃការពង្រាងនោះទេ។ គាត់ចង់ដឹងពីប្រសិទ្ធិភាពនៃការបម្រើនៅក្នុងយោធា។ ដើម្បីធ្វើការប៉ាន់ស្មាននេះទោះជាយ៉ាងណាក៏ដោយត្រូវមានការសន្មតនិងផលវិបាកបន្ថែមទៀត។ ទី 1 អ្នកស្រាវជ្រាវចាំបាច់ត្រូវសន្មតថាមធ្យោបាយតែមួយគត់ដែលត្រូវបានព្រាងមានផលប៉ះពាល់លើប្រាក់ចំណូលគឺតាមរយៈសេវាកម្មយោធាការសន្មតហៅថា ការដាក់កំហិតនៃការបដិសេធ ។ ការសន្មត់នេះអាចជាការខុសប្រសិនបើឧទាហរណ៍បុរសដែលត្រូវបានគេព្រាងបានស្នាក់នៅក្នុងសាលារៀនបានយូរដើម្បីចៀសវាងការបម្រើឬប្រសិនបើនិយោជកមិនសូវជួលបុរសដែលត្រូវបានព្រាង។ ជាទូទៅការដាក់កំហិតនៃការបដិសេធគឺជាការសន្មត់ដ៏សំខាន់មួយហើយវាជាការពិបាកក្នុងការផ្ទៀងផ្ទាត់។ ទោះបីជាការដាក់កំហិតការដាក់កំហិតគឺត្រឹមត្រូវក៏ដោយក៏វានៅតែមិនអាចប៉ាន់ស្មានពីផលប៉ះពាល់នៃសេវាកម្មលើមនុស្សទាំងអស់។ ផ្ទុយទៅវិញវាបង្ហាញថាអ្នកស្រាវជ្រាវអាចប៉ាន់ប្រមាណតែប៉ុណ្ណោះលើប្រភេទជាក់លាក់នៃបុរសដែលគេហៅថាអ្នកជំនាញ (បុរសដែលនឹងបម្រើនៅពេលដែលបានព្រាងប៉ុន្តែមិនបម្រើនៅពេលមិនត្រូវបានព្រាង) (Angrist, Imbens, and Rubin 1996) ។ ទោះយ៉ាងណាក៏ដោយមិនមានការចាប់អារម្មណ៍ពីប្រជាប្រិយភាពដើមឡើយ។ សូមកត់សម្គាល់ថាបញ្ហាទាំងនេះកើតមានឡើងសូម្បីតែនៅក្នុងករណីស្អាតៗដែលទាក់ទងនឹងសេចក្តីព្រាងច្បាប់។ សំណុំនៃផលវិបាកបន្ថែមទៀតកើតឡើងនៅពេលការព្យាបាលមិនត្រូវបានផ្តល់ដោយឆ្នោតរាងកាយ។ ឧទាហរណ៍នៅក្នុងការសិក្សារបស់ Mas និង Moretti នៃអ្នកគិតលុយសំណួរបន្ថែមបានលេចឡើងអំពីការសន្មតថាកិច្ចការរបស់មិត្តភក្ដិគឺចៃដន្យ។ ប្រសិនបើការសន្មត់នេះត្រូវបានគេរំលោភបំពានយ៉ាងធ្ងន់ធ្ងរនោះវាអាចយាយីការប៉ាន់ស្មានរបស់ពួកគេ។ សរុបមកការពិសោធធម្មជាតិអាចជាយុទ្ធសាស្ត្រដ៏មានឥទ្ធិពលមួយសម្រាប់ការប៉ាន់ប្រមាណមូលហេតុពីទិន្នន័យដែលមិនមានការពិសោធន៍ហើយប្រភពទិន្នន័យធំបង្កើនសមត្ថភាពរបស់យើងក្នុងការទាញយកប្រយោជន៍លើពិសោធន៍ធម្មជាតិនៅពេលដែលវាកើតឡើង។ ទោះជាយ៉ាងណាក៏ដោយវាប្រហែលជាត្រូវការការយកចិត្តទុកដាក់យ៉ាងខ្លាំងហើយជួនកាលការសន្មត់ដ៏ខ្លាំងក្លាត្រូវធ្វើពីអ្វីដែលធម្មជាតិបានផ្តល់ដល់ការប៉ាន់ប្រមាណដែលអ្នកចង់បាន។
យុទ្ធសាស្ត្រទី 2 ដែលខ្ញុំចង់ប្រាប់អ្នកអំពីការប៉ាន់ប្រមាណមូលហេតុពីទិន្នន័យដែលមិនមែនជាការពិសោធន៍គឺអាស្រ័យលើការកែតម្រូវទិន្នន័យដែលមិនមានការពិសោធន៍ដើម្បីគណនាភាពខុសគ្នារវាងអ្នកដែលបានធ្វើនិងមិនបានទទួលការព្យាបាល។ មានវិធីសាស្រ្តក្នុងការកែតម្រូវបែបនេះប៉ុន្តែខ្ញុំនឹងផ្តោតលើអ្វីមួយ ដែលត្រូវបាន គេហៅថាការ ផ្គូរផ្គង ។ នៅក្នុងការផ្គូផ្គងអ្នកស្រាវជ្រាវពិនិត្យមើលទិន្នន័យមិនពិសោធន៍ដើម្បីបង្កើតគូរបស់មនុស្សដែលស្រដៀងគ្នាលើកលែងតែម្នាក់បានទទួលការព្យាបាលហើយម្នាក់ទៀតមិនមាន។ នៅក្នុងដំណើរការនៃការផ្គូផ្គង, អ្នកស្រាវជ្រាវពិតជាត្រូវបានគេ កាត់ ផងដែរ; នោះគឺការបោះបង់ចោលករណីដែលមិនមានភាពច្បាស់លាស់។ ដូច្នេះវិធីសាស្ត្រនេះនឹងត្រូវបានគេហៅថាការផ្គូរផ្គងនិងការកាត់អោយបានត្រឹមត្រូវជាងមុនប៉ុន្តែខ្ញុំនឹងប្រកាន់យកតាមពាក្យប្រពៃណី: ការផ្គូផ្គង។
ឧទាហរណ៏មួយនៃអំណាចនៃយុទ្ធសាស្រ្តផ្គូផ្គងជាមួយនឹងប្រភពទិន្នន័យដែលមិនមានការពិសោធន៍ដ៏ធំគឺបានមកពីការស្រាវជ្រាវលើឥរិយាបថអតិថិជនដោយលីរីនអេណាវ៉ាវនិងសហការី (2015) ។ ពួកគេចាប់អារម្មណ៍លើការដេញថ្លៃដែលធ្វើឡើងនៅលើ eBay ហើយក្នុងការរៀបរាប់ពីការងាររបស់ពួកគេខ្ញុំនឹងផ្តោតលើផលប៉ះពាល់នៃការដេញថ្លៃចាប់ផ្តើមតម្លៃលើលទ្ធផលនៃការដេញថ្លៃដូចជាតម្លៃលក់ឬប្រូបាប៊ីលីតេនៃការលក់។
មធ្យោបាយដែលឆោតល្ងង់បំផុតដើម្បីប៉ាន់ប្រមាណប្រសិទ្ធិភាពនៃការចាប់ផ្តើមតម្លៃទៅលើតម្លៃលក់គឺគ្រាន់តែគណនាតម្លៃចុងក្រោយសម្រាប់ការដេញថ្លៃជាមួយនឹងតម្លៃចាប់ផ្តើមខុសគ្នា។ វិធីសាស្រ្តនេះនឹងត្រូវបានផាកពិន័យប្រសិនបើអ្នកចង់ព្យាករណ៍តម្លៃលក់ដែលបានផ្តល់ឱ្យតម្លៃចាប់ផ្តើម។ ប៉ុន្តែប្រសិនបើសំណួររបស់អ្នកពាក់ព័ន្ធនឹងផលប៉ះពាល់នៃតម្លៃចាប់ផ្តើមនោះវិធីសាស្ត្រនេះនឹងមិនដំណើរការទេពីព្រោះវាមិនផ្អែកលើការប្រៀបធៀបដោយយុត្តិធម៌។ ការដេញថ្លៃដែលមានតម្លៃចាប់ផ្ដើមទាបអាចមានភាពខុសគ្នាខ្លាំងពីអ្នកដែលមានតម្លៃចាប់ផ្តើមខ្ពស់ (ឧទាហរណ៏ពួកគេអាចនឹងមានទំនិញខុសៗគ្នាឬមានប្រភេទអ្នកលក់ផ្សេងៗគ្នា) ។
ប្រសិនបើអ្នកដឹងពីបញ្ហាដែលអាចកើតមានឡើងនៅពេលដែលធ្វើការប៉ាន់ស្មានពីមូលហេតុនៃទិន្នន័យដែលមិនមែនជាការពិសោធន៍អ្នកអាចរំលងវិធីសាស្រ្តដែលឆោតល្ងង់និងពិចារណាពីការដំណើរការពិសោធន៍វាលមួយដែលអ្នកនឹងលក់វត្ថុជាក់លាក់មួយពោលគឺក្លឹបវាយកូនហ្គោល - ប៉ារ៉ាម៉ែត្រនៃការដេញថ្លៃនិយាយថាការដឹកជញ្ជូនដោយឥតគិតថ្លៃនិងការដេញថ្លៃបើកសម្រាប់ពីរសប្តាហ៍ - ប៉ុន្តែជាមួយនឹងការចាប់ផ្តើមតម្លៃដែលបានផ្ដល់ដោយចៃដន្យ។ ដោយប្រៀបធៀបលទ្ធផលនៃលទ្ធផលទីផ្សារការពិសោធន៍លើវាលនេះនឹងផ្តល់នូវការវាស់ស្ទង់ច្បាស់លាស់នៃប្រសិទ្ធិភាពនៃការចាប់ផ្តើមតម្លៃទៅលើតម្លៃលក់។ ប៉ុន្តែការវាស់ស្ទង់នេះនឹងអនុវត្តចំពោះតែផលិតផលពិសេសមួយនិងសំណុំប៉ារ៉ាម៉ែត្រដេញថ្លៃ។ លទ្ធផលអាចមានភាពខុសគ្នាឧទាហរណ៍សម្រាប់ប្រភេទផ្សេងៗនៃផលិតផល។ ដោយគ្មានទ្រឹស្តីរឹងមាំវាពិបាកក្នុងការសំអាងពីការពិសោធន៍តែមួយនេះទៅនឹងការពិសោធន៍ដែលអាចធ្វើទៅបានដែលអាចធ្វើទៅបាន។ លើសពីនេះទៅទៀតការពិសោធន៍លើវាលមានតំលៃថ្លៃគ្រប់គ្រាន់ដែលវាមិនអាចដំណើរការរាល់បំរែបំរួលដែលអ្នកចង់សាកល្បង។
ផ្ទុយទៅនឹងវិធីសាស្រ្តពិសោធន៍នុយក្លេអែរនិងពិសោធន៍, Einav និងមិត្តរួមការងាររបស់គាត់បានប្រើវិធីសាស្រ្តទីបី: ការផ្គូផ្គង។ ល្បិចសំខាន់ក្នុងយុទ្ធសាស្រ្តរបស់ពួកគេគឺដើម្បីរកមើលអ្វីដែលស្រដៀងនឹងការពិសោធន៍លើវាលដែលបានកើតឡើងរួចហើយនៅលើ eBay ។ ឧទាហរណ៏តួលេខ 2.8 បង្ហាញពីបញ្ជីរាយនាមចំនួន 31 សម្រាប់ក្លឹបវាយកូនគោលដូចគ្នា Taylormade Burner 09 Driver ត្រូវបានលក់ដោយអ្នកលក់ដូចគ្នានឹង "អ្នករកស៊ីថវិកា" ។ ទោះជាយ៉ាងណាក៏ដោយ 31 បញ្ជីទាំងនេះមានលក្ខណៈខុសគ្នាបន្តិចបន្តួចដូចជាការចាប់ផ្តើមខុសគ្នា។ តម្លៃ, កាលបរិច្ឆេទបញ្ចប់, និងថ្លៃដឹកជញ្ជូន។ នៅក្នុងពាក្យផ្សេងទៀតវាគឺដូចជាប្រសិនបើ "budgetgolfer" កំពុងដំណើរការពិសោធន៍សម្រាប់អ្នកស្រាវជ្រាវ។
បញ្ជីនៃអ្នកបើកបរ Taylormade Burner 09 នេះត្រូវបានលក់ដោយ "budgetgolfer" គឺជាឧទាហរណ៍មួយនៃតារាងដែលបានផ្គូរផ្គងបញ្ជីដែលធាតុដូចគ្នានឹងដូចគ្នាត្រូវបានលក់ដោយអ្នកលក់តែមួយដូចគ្នាប៉ុន្តែរាល់ពេលដែលមានលក្ខណៈខុសគ្នាបន្តិចបន្តួច។ នៅក្នុងកំណត់ហេតុដ៏ធំនៃ eBay មានព្យញ្ជនៈរាប់រយរាប់ពាន់នាក់ដែលពាក់ព័ន្ធនឹងការរាយរាប់លាន។ ដូច្នេះប្រៀបធៀបតម្លៃចុងក្រោយសម្រាប់ការដេញថ្លៃទាំងអស់ជាមួយតម្លៃចាប់ផ្តើមដែលបានផ្តល់ឱ្យ Einav និងមិត្តរួមការងាររបស់គាត់បើប្រៀបធៀបទៅនឹងសំណុំឈុត។ ដើម្បីរួមបញ្ចូលលទ្ធផលពីការប្រៀបធៀបនៅក្នុងសំណុំដែលបានផ្គូផ្គងរាប់ពាន់នាក់នេះ Einav និងមិត្តរួមការងាររបស់គាត់បានសម្តែងនូវតម្លៃចាប់ផ្តើមនិងតម្លៃចុងក្រោយទាក់ទងនឹងតម្លៃយោងនៃធាតុនីមួយៗ (ឧទាហរណ៍តម្លៃលក់ជាមធ្យមរបស់វា) ។ ឧទាហរណ៍ប្រសិនបើអ្នកបើកបរ Taylormade Burner 09 មានតម្លៃ 100 ដុល្លា (ផ្អែកលើការលក់របស់វា) នោះតម្លៃចាប់ផ្តើម 10 ដុល្លានឹងត្រូវបានបង្ហាញជា 0.1 ហើយតម្លៃចុងក្រោយគឺ $ 120 ជា 1.2 ។
រំលឹកឡើងវិញថា Einav និងសហសេវិកបានចាប់អារម្មណ៍លើផលប៉ះពាល់នៃតម្លៃចាប់ផ្តើមនៃលទ្ធផលដេញថ្លៃ។ ដំបូងពួកគេប្រើតំរែតំរង់លីនេអ៊ែរដើម្បីប៉ាន់ស្មានថាតម្លៃចាប់ផ្តើមកាន់តែខ្ពស់នឹងកាត់បន្ថយប្រូបាប៊ីលីតេនៃការលក់ហើយតម្លៃចាប់ផ្តើមខ្ពស់កើនឡើងបង្កើនតម្លៃលក់ចុងក្រោយ (តាមលក្ខខណ្ឌលក់) ។ ដោយខ្លួនពួកគេការប៉ាន់ស្មានទាំងនេះដែលរៀបរាប់ពីទំនាក់ទំនងជាលិកានិងត្រូវបានគិតជាមធ្យមលើគ្រប់ផលិតផលទាំងអស់មិនមែនសុទ្ធតែគួរឱ្យចាប់អារម្មណ៍ទេ។ បន្ទាប់មក Einav និងសហសេវិកបានប្រើទិន្នន័យដ៏ធំសម្បើមរបស់ពួកគេដើម្បីបង្កើតការប៉ាន់ស្មានបន្ថែមទៀត។ ឧទាហរណ៍ដោយការប៉ាន់ស្មានផលប៉ះពាល់ដាច់ដោយឡែកពីគ្នាសម្រាប់តម្លៃចាប់ផ្តើមខុស ៗ គ្នាខុសៗគ្នាពួកគេបានរកឃើញថាទំនាក់ទំនងរវាងតម្លៃចាប់ផ្តើមនិងតម្លៃលក់គឺមិនត្រង់ (រូបភាពទី 2.9) ។ ជាពិសេសសម្រាប់តម្លៃចាប់ផ្តើមរវាង 0,05 និង 0,85 តម្លៃចាប់ផ្តើមមានផលប៉ះពាល់តិចតួចលើតម្លៃលក់ដែលជាការរកឃើញដែលត្រូវបានខកខានទាំងស្រុងដោយការវិភាគដំបូងរបស់ពួកគេ។ លើសពីនេះជាជាងប្រើជាមធ្យមលើធាតុទាំងអស់ Einav និងមិត្តរួមការងាររបស់គាត់បានប៉ាន់ប្រមាណពីផលប៉ះពាល់នៃតម្លៃចាប់ផ្តើមសម្រាប់ធាតុផ្សេងៗគ្នា 23 ប្រភេទ (ឧទាហរណ៍ការផ្គត់ផ្គង់សត្វចិញ្ចឹមអេឡិចត្រូនិចនិងវត្ថុចងចាំកីឡា) (រូបភាព 2.10) ។ ការប៉ាន់ប្រមាណទាំងនេះបង្ហាញថាសម្រាប់ធាតុប្លែកៗដូចជាតម្លៃចាប់ផ្តើមមានតម្លៃទាបមានផលប៉ះពាល់តិចតួចទៅលើប្រូបាប៊ីលីតេនៃការលក់និងផលប៉ះពាល់ធំធេងទៅលើតម្លៃលក់ចុងក្រោយ។ លើសពីនេះទៀតសម្រាប់ធាតុទំនិញបន្ថែមទៀតដូចជាឌីវីឌីជាដើមតម្លៃចាប់ផ្តើមស្ទើរតែគ្មានផលប៉ះពាល់លើតម្លៃចុងក្រោយ។ នៅក្នុងពាក្យផ្សេងទៀតជាមធ្យមដែលរួមបញ្ចូលគ្នានូវលទ្ធផលពី 23 ប្រភេទផ្សេងគ្នានៃធាតុលាក់ភាពខុសគ្នាដ៏សំខាន់រវាងធាតុទាំងនេះ។
ទោះបីជាអ្នកមិនចាប់អារម្មណ៏លើការដេញថ្លៃនៅលើ eBay ក៏ដោយអ្នកត្រូវតែកោតសរសើរនូវវិធីដែលតួលេខ 2.9 និងតួលេខ 2.10 ផ្តល់នូវការយល់ដឹងកាន់តែច្រើនអំពី eBay ជាងការប៉ាន់ប្រមាណសាមញ្ញដែលពិពណ៌នាអំពីទំនាក់ទំនងលីនេអ៊ែរនិងរួមបញ្ចូលគ្នានូវប្រភេទផ្សេងៗគ្នាជាច្រើន។ លើសពីនេះទៅទៀតបើទោះបីជាវាអាចមានលក្ខណៈវិទ្យាសាស្ត្រដើម្បីបង្កើតការប៉ាន់ស្មានដែលមានលក្ខណៈពិសោធន៏បន្ថែមទៀតជាមួយនឹងការពិសោធន៍លើវាលតម្លៃនឹងធ្វើឱ្យការធ្វើពិសោធន៍បែបនេះមិនអាចទៅរួចទេ។
ដូចជាការពិសោធន៍ធម្មជាតិមានវិធីមួយចំនួនដែលការផ្គូផ្គងអាចនាំឱ្យមានការប៉ាន់ស្មានអាក្រក់។ ខ្ញុំគិតថាការព្រួយបារម្ភធំជាងគេជាមួយនឹងការប៉ាន់ស្មានត្រូវគ្នាគឺថាពួកគេអាចត្រូវបានលម្អៀងដោយរឿងដែលមិនត្រូវបានប្រើក្នុងការផ្គូផ្គង។ ឧទាហរណ៏, នៅក្នុងលទ្ធផលសំខាន់របស់ពួកគេ, Einav និងមិត្តរួមការងាររបស់គាត់បានធ្វើការផ្គូរផ្គងលើលក្ខណៈបួនយ៉ាងដូចជាលេខសម្គាល់អ្នកលក់ប្រភេទធាតុចំណងជើងនិងចំណងជើងរង។ ប្រសិនបើធាតុមានភាពខុសគ្នាតាមវិធីដែលមិនត្រូវបានប្រើសម្រាប់ការផ្គូផ្គងនោះវាអាចបង្កើតការប្រៀបធៀបមិនយុត្តិធម៌។ ឧទាហរណ៍ប្រសិនបើ "budgetgolfer" បញ្ចុះតម្លៃសម្រាប់អ្នកបើកបរ Taylormade Burner 09 នៅរដូវរងា (នៅពេលដែលក្លឹបកីឡាវាយកូនគោលមិនសូវមានប្រជាប្រិយភាព) នោះវាអាចបង្ហាញថាតម្លៃចាប់ផ្ដើមទាបជាងមុននាំឱ្យតម្លៃទាបនៅពេលដែលវាជាវត្ថុបុរាណនៃ បំរែបំរួលតាមរដូវកាល។ វិធីសាស្រ្តមួយដើម្បីដោះស្រាយកង្វល់នេះគឺកំពុងព្យាយាមប្រភេទផ្សេងគ្នានៃការផ្គូផ្គង។ ឧទាហរណ៍ Einav និងសហសេវិកបានធ្វើការវិភាគឡើងវិញនូវការវិភាគរបស់ពួកគេខណៈពេលដែលខុសគ្នានូវផ្ទាំងពេលវេលាដែលត្រូវបានប្រើសម្រាប់ការផ្គូរផ្គង (សំណុំដែលបានផ្គូរផ្គងរួមបញ្ចូលធាតុដែលដាក់លក់ក្នុងរយៈពេលមួយឆ្នាំក្នុងរយៈពេលមួយខែនិងក្នុងពេលដំណាលគ្នា) ។ ជាសំណាងល្អពួកគេបានរកឃើញលទ្ធផលស្រដៀងគ្នាសម្រាប់បង្អួចពេលវេលាទាំងអស់។ ការព្រួយបារម្ភបន្ថែមទៀតជាមួយការផ្គូផ្គងកើតឡើងពីការបកប្រែ។ ការប៉ាន់ប្រមាណពីការផ្គូផ្គងត្រូវបានអនុវត្តចំពោះទិន្នន័យដែលត្រូវគ្នាតែប៉ុណ្ណោះ។ ពួកគេមិនអនុវត្តចំពោះករណីដែលមិនអាចផ្គូផ្គងបានទេ។ ឧទាហរណ៍ដោយកំណត់ការស្រាវជ្រាវរបស់ពួកគេទៅនឹងមុខទំនិញដែលមានបញ្ជីច្រើន Einav និងមិត្តរួមការងាររបស់គាត់កំពុងផ្តោតទៅលើអ្នកលក់អាជីពនិងពាក់កណ្តាលវិជ្ជាជីវៈ។ ដូច្នេះនៅពេលបកស្រាយការប្រៀបធៀបទាំងនេះយើងត្រូវតែចងចាំថាពួកគេគ្រាន់តែអនុវត្តទៅសំណុំរងនៃ eBay នេះ។
ការផ្គូផ្គងគឺជាយុទ្ធសាស្ត្រដ៏មានឥទ្ធិពលមួយសម្រាប់ការស្វែងរកការប្រៀបធៀបដោយយុត្តិធម៌នៅក្នុងទិន្នន័យដែលមិនមានការពិសោធន៍។ ចំពោះអ្នកវិទ្យាសាស្ត្រសង្គមការផ្គូផ្គងមានលក្ខណៈល្អប្រសើរជាងការពិសោធន៍ប៉ុន្តែនេះគឺជាជំនឿដែលអាចកែលម្អបន្តិចបន្តួច។ ការផ្គូផ្គងទិន្នន័យដ៏ធំអាចមានភាពល្អប្រសើរជាងការពិសោធន៍វាលមួយចំនួនតូចនៅពេល (1) ភាពមិនធម្មតានៅក្នុងផលប៉ះពាល់គឺសំខាន់ហើយ (2) អថេរសំខាន់ចាំបាច់សម្រាប់ការផ្គូផ្គងត្រូវបានវាស់។ តារាង 2.4 ផ្តល់នូវឧទាហរណ៏ផ្សេងទៀតមួយចំនួនអំពីវិធីផ្គូផ្គងអាចត្រូវបានប្រើប្រាស់ជាមួយប្រភពទិន្នន័យធំ ៗ ។
ការផ្តោតសំខាន់ | ប្រភពទិន្នន័យធំ | សេចក្តីយោង |
---|---|---|
ឥទ្ធិពលនៃការបាញ់ប្រហារទៅលើអំពើហិង្សារបស់ប៉ូលីស | កំណត់ត្រាបញ្ឈប់និងហ្វ្រង់ស៊ីស | Legewie (2016) |
ឥទ្ធិពលនៃថ្ងៃទី 11 ខែកញ្ញាឆ្នាំ 2001 ទៅលើគ្រួសារនិងអ្នកជិតខាង | កំណត់ត្រាបោះឆ្នោតនិងកំណត់ហេតុបរិច្ចាក | Hersh (2013) |
ការរីករាលដាលសង្គម | ការទំនាក់ទំនងនិងទិន្នន័យការអនុម័តផលិតផល | Aral, Muchnik, and Sundararajan (2009) |
សរុបមកការប៉ាន់ប្រមាណផលប៉ះពាល់ពីទិន្នន័យដែលមិនមែនជាការពិសោធន៍គឺពិបាកប៉ុន្តែវិធីសាស្ត្រដូចជាការធ្វើពិសោធន៍ធម្មជាតិនិងការលៃតម្រូវស្ថិតិ (ឧទាហរណ៍ការផ្គូផ្គង) អាចត្រូវបានប្រើ។ ក្នុងករណីមួយចំនួនវិធីសាស្ដ្រទាំងនេះអាចមានកំហុសខុសគ្នាប៉ុន្តែនៅពេលត្រូវបានប្រើប្រាស់យ៉ាងប្រុងប្រយ័ត្នវិធីសាស្រ្តទាំងនេះអាចជាការបំពេញបន្ថែមមានប្រសិទ្ធភាពចំពោះវិធីសាស្រ្តពិសោធន៍ដែលខ្ញុំរៀបរាប់នៅក្នុងជំពូក 4. លើសពីនេះវិធីសាស្រ្តទាំងពីរនេះហាក់ដូចជាទទួលបានអត្ថប្រយោជន៍ពីការរីកចម្រើននៃការប្រើប្រាស់ - លើប្រព័ន្ធទិន្នន័យធំ ៗ ។