ទោះបីជាវាអាចជាស្មុគស្មាញ, ដែលបានស្នើសុំវិសេសវិសាលថែមទៀតអាចត្រូវបានមានអនុភាព។
វិធីសាស្រ្តផ្សេងគ្នាដើម្បីដោះស្រាយជាមួយភាពមិនពេញលេញនៃទិន្នន័យដានឌីជីថលនេះគឺដើម្បីបង្កើនវាដោយផ្ទាល់ជាមួយទិន្នន័យស្ទង់មតិ, ដំណើរការដែលខ្ញុំនឹងហៅសួរបានបង្កើនមួយ។ ឧទាហរណ៍មួយនៃការស្នើសុំតុបតែងបន្ថែមគឺជាការសិក្សានៃ Burke and Kraut (2014) , ដែលខ្ញុំបានរៀបរាប់មុននៅក្នុងជំពូកនេះ (ផ្នែកទី 3.2), អំពីថាតើការធ្វើអន្តរកម្មនៅលើហ្វេសប៊ុកបង្កើនកម្លាំងមិត្តភាព។ ក្នុងករណីនោះ Burke និង Kraut រួមបញ្ចូលគ្នាទិន្នន័យការស្ទាបស្ទង់មតិជាមួយទិន្នន័យកំណត់ហេតុហ្វេសប៊ុក។
ការកំណត់ដែល Burke និង Kraut នាក់កំពុងធ្វើការនៅ, ទោះជាយ៉ាងណា, មានន័យថាពួកគេមិនមានការដោះស្រាយជាមួយនឹងបញ្ហាធំពីរដែលអ្នកស្រាវជ្រាវបានធ្វើបានបង្កើនការប្រឈមមុខនឹងការស្នើសុំ។ ជាដំបូងពិតជាភ្ជាប់ទំនាក់ទំនងរវាងការរួមគ្នាជាមួយសំណុំដំណើរការនេះហៅថាការភ្ជាប់បណ្តាទិន្នន័យកំណត់ត្រាការផ្គូផ្គងនៃកំណត់ត្រាក្នុងសំណុំទិន្នន័យមួយដែលមានកំណត់ត្រាដែលសមរម្យនៅក្នុងផ្សេងទៀតសំណុំទិន្នន័យ-អាចជាការលំបាកនិងការដែលឆាប់មានកំហុស (យើងនឹងឃើញឧទាហរណ៍នៃបញ្ហានេះខាងក្រោម ) ។ បញ្ហាចម្បងទីពីរនៃការស្នើសុំតុបតែងបន្ថែមគឺថាគុណភាពដានឌីជីថលញឹកញាប់នឹងមានការលំបាកសម្រាប់អ្នកស្រាវជ្រាវធ្វើការវាយតម្លៃ។ ឧទាហរណ៍ពេលខ្លះដំណើរការតាមរយៈការដែលវាត្រូវបានប្រមូលបានគឺមានកម្មសិទ្ធិនិងអាចជាងាយនឹងជាច្រើននៃបញ្ហាដែលបានរៀបរាប់ក្នុងជំពូកទី 2. នៅក្នុងពាក្យផ្សេងទៀត, ដែលបានស្នើសុំជាញឹកញាប់ពាក់ព័ន្ធនឹងការនឹងត្រូវបានបង្កើនមានកំហុសការភ្ជាប់ការស្ទង់មតិទៅនឹងប្រភពទិន្នន័យ-ប្រអប់ខ្មៅរបស់ដែលមិនស្គាល់ គុណភាព។ ទោះបីជាមានការព្រួយបារម្ភដែលថាបញ្ហាទាំងពីរនេះបង្ហាញពីការ, វាគឺអាចធ្វើទៅបានដើម្បីធ្វើការស្រាវជ្រាវនឹងយុទ្ធសាស្រ្តជាការសំខាន់ត្រូវបានបង្ហាញដោយលោក Stephen Ansolabehere និង Eitan HershE នេះ (2012) ក្នុងការស្រាវជ្រាវរបស់ខ្លួននៅលើលំនាំបោះឆ្នោតនៅសហរដ្ឋអាមេរិក។ វាមានប្រយោជន៍ដើម្បីទៅនៅលើការសិក្សានេះនៅក្នុងលម្អិតមួយចំនួនដោយសារតែមនុស្សជាច្រើននៃយុទ្ធសាស្រ្តដែលបានអភិវឌ្ឍ Ansolabehere និង HershE ជាមានប្រយោជន៍ក្នុងការនឹងកម្មវិធីផ្សេងទៀតនៃការស្នើសុំបង្កើន។
ចំនួនអ្នកទៅបោះឆ្នោតបានក្លាយជាប្រធានបទនៃការស្រាវជ្រាវយ៉ាងទូលំទូលាយនៅក្នុងវិទ្យាសាស្រ្តនយោបាយនិងក្នុងពេលកន្លងមក, ការយល់ដឹងអ្នកស្រាវជ្រាវនៃអ្នកដែលបោះឆ្នោតជ្រើសរើសហើយហេតុអ្វីបានជាជាទូទៅត្រូវបានផ្អែកលើការវិភាគទិន្នន័យការស្ទង់មតិនេះ។ ការបោះឆ្នោតនៅសហរដ្ឋអាមេរិកទោះជាយ៉ាងណា, គឺជាឥរិយាបទដែលមិនប្រក្រតីនៅក្នុងនោះរបាយការណ៍របស់រដ្ឋាភិបាលថាតើប្រជាពលរដ្ឋបានបោះឆ្នោតគាំទ្រ (ពិតណាស់រដ្ឋាភិបាលមិនបានកត់ត្រាដែលបោះឆ្នោតរាល់ពលរដ្ឋសម្រាប់ការ) ។ អស់រយៈពេលជាច្រើនឆ្នាំ, កំណត់ត្រាបោះឆ្នោតរដ្ឋាភិបាលដែលមាននៅលើអ្នកទាំងនេះត្រូវបានទម្រង់ក្រដាស, កន្លែងនៅក្នុងការិយាល័យរដ្ឋាភិបាលក្នុងតំបន់នានានៅទូទាំងប្រទេស។ នេះធ្វើឱ្យវាមានការលំបាក, ប៉ុន្តែមិនអាចទៅរួចសម្រាប់អ្នកវិទ្យាសាស្ដ្រនយោបាយដើម្បីឱ្យមានរូបភាពពេញលេញនៃការបោះឆ្នោតនិងដើម្បីប្រៀបធៀបអ្វីដែលមនុស្សនិយាយថានៅក្នុងការស្ទង់មតិអំពីការបោះឆ្នោតទៅឥរិយាបថការបោះឆ្នោតពិតប្រាកដរបស់ខ្លួន (Ansolabehere and Hersh 2012) ។
ប៉ុន្តែឥឡូវកំណត់ត្រាបោះឆ្នោតនេះត្រូវបាន digitized និងចំនួននៃក្រុមហ៊ុនឯកជនមួយបានប្រមូលជាលក្ខណៈប្រព័ន្ធនិងកំណត់ត្រាបោះឆ្នោតទាំងនេះបានរួមបញ្ចូលគ្នាក្នុងការផលិតឯកសារដែលបានបោះឆ្នោតមេទូលំទូលាយដែលកត់ត្រាឥរិយាបថបោះឆ្នោតរបស់ជនជាតិអាមេរិកទាំងអស់។ Ansolabehere និង HershE ដៃគូជាមួយក្រុមហ៊ុនមួយក្នុងចំណោមក្រុមហ៊ុន-Catalist ទាំងនេះ LCC នៅក្នុងគោលបំណងដើម្បីប្រើឯកសារបោះឆ្នោតរបស់ម្ចាស់ដើម្បីជួយអភិវឌ្ឍនូវរូបភាពល្អប្រសើរជាងមុននៃការបោះឆ្នោតនេះ។ លើសពីនេះទៀតដោយសារតែវាពឹងផ្អែកលើកំណត់ត្រាឌីជីថលបានប្រមូលនិងរៀបចំដឹកនាំដោយក្រុមហ៊ុនមួយ, វាបានផ្ដល់នូវចំនួននៃគុណសម្បត្តិជាងការខិតខំប្រឹងប្រែងពីមុនដោយអ្នកស្រាវជ្រាវដែលត្រូវបានគេធ្វើបានដោយគ្មានការជួយពីក្រុមហ៊ុននិងការប្រើប្រាស់កំណត់ត្រាអាណាឡូកមួយ។
ដូចមនុស្សជាច្រើននៃប្រភពដានឌីជីថលនៅក្នុងជំពូកទី 2 ឯកសារមេ Catalist មិនបានរួមបញ្ចូលជាច្រើននៃការពប្រជាសាស្ត្រ, ឥរិយាបទនិងអាកប្បកិរិយាដែល Ansolabehere និង HershE ត្រូវការជាចាំបាច់។ លើសពីនេះទៀតព័តមាននេះ, Ansolabehere និង HershE ត្រូវបានគេចាប់អារម្មណ៍ជាពិសេសនៅក្នុងការប្រៀបធៀបឥរិយាបថបោះឆ្នោតបានរាយការណ៍ទៅកាន់ការបោះឆ្នោតធ្វើឱ្យមានសុពលភាពឥរិយាបទ (មានន័យថាពនៅក្នុងមូលដ្ឋានទិន្នន័យ Catalist) ។ ដូច្នេះក្រុមអ្នកស្រាវជ្រាវបានប្រមូលទិន្នន័យដែលពួកគេចង់បានជាផ្នែកមួយនៃការសិក្សាសហសភាការបោះឆ្នោត (CCES), ការស្ទង់មតិសង្គមធំ។ បន្ទាប់, អ្នកស្រាវជ្រាវបានផ្តល់ទិន្នន័យនេះដើម្បី Catalist និង Catalist អ្នកស្រាវជ្រាវបានគាំទ្រប្រទានឱ្យឯកសារដែលបានបញ្ចូលគ្នាដែលរួមមានធ្វើឱ្យមានសុពលភាពទិន្នន័យឥរិយាបថការបោះឆ្នោត (ពី Catalist) ឥរិយាបថបោះឆ្នោតខ្លួនឯង (ពី CCES) និងប្រជាសាស្ត្រនិងឥរិយាបថនៃអ្នកឆ្លើយសំណួរ (ពី CCES ) ។ នៅក្នុងពាក្យផ្សេងទៀត Ansolabehere និង HershE បានបង្កើនទិន្នន័យបោះឆ្នោតជាមួយនឹងទិន្នន័យស្ទង់មតិ, និងឯកសារដែលជាលទ្ធផលអាចឱ្យច្របាច់បញ្ចូលគ្នានេះពួកគេបានធ្វើអ្វីមួយដែលមិនបានបើកជាលក្ខណៈបុគ្គលឯកសារ។
ដោយ enriching ឯកសារទិន្នន័យមេ Catalist ជាមួយទិន្នន័យស្ទង់មតិ, Ansolabehere និង HershE ទៅដល់ការសន្និដ្ឋានសំខាន់បី។ ជាលើកដំបូង, នៅលើការធ្វើសេចក្តីរាយការណ៍នៃការបោះឆ្នោតគឺទោរទន់ទៅ: ស្ទើរតែពាក់កណ្តាលមិនទៅបោះឆ្នោតដែលបានរាយការណ៍បោះឆ្នោត។ ឬវិធីមួយផ្សេងទៀតនៃការសម្លឹងមើលវាជាប្រសិនបើនរណាម្នាក់បានរាយការណ៍ថាការបោះឆ្នោតមានតែ 80% ដែលជាឱកាសដែលពួកគេពិតជាបានបោះឆ្នោត។ ទីពីរនៅលើការធ្វើសេចក្តីរាយការណ៍គឺមិនមែនចៃដន្យ! នៅលើការធ្វើសេចក្តីរាយការណ៍គឺកើតមានជាទូទៅក្នុងចំណោមអ្នកដែលមានប្រាក់ចំណូលខ្ពស់, ដែលមានការអប់រំល្អ, partisans ដែលត្រូវបានចូលរួមក្នុងកិច្ចការសាធារណៈ។ នៅក្នុងពាក្យផ្សេងទៀត, មនុស្សដែលមានភាគច្រើនទំនងជានឹងបោះឆ្នោតគឺភាគច្រើនទំនងជាធ្វើឱ្យកុហកអំពីការបោះឆ្នោត។ ទីបី, និងសំខាន់បំផុត, ដោយសារតែជាប្រព័ន្ធលើការរាយការណ៍, ភាពខុសគ្នាពិតប្រាកដរវាងអ្នកបោះឆ្នោតនិងមិនទៅបោះឆ្នោតដែលមានទំហំតូចជាងពួកវាលេចឡើងគ្រាន់តែពីការស្ទង់មតិ។ ឧទាហរណ៍, អ្នកដែលមានសញ្ញាបត្របរិញ្ញាបត្រដែលមានប្រមាណ 22 ភាគរយពិន្ទុទំនងជាដើម្បីរាយការណ៍អំពីការបោះឆ្នោតបន្ថែមទៀតប៉ុន្តែមានតែ 10 ភាគរយច្រើនជាងនេះទំនងជាធ្វើឱ្យការបោះឆ្នោតពិតប្រាកដ។ លើសពីនេះទៀតទ្រឹស្តីដែលមានស្រាប់ធនធានដែលមានមូលដ្ឋាននៃការបោះឆ្នោតគឺមានច្រើនល្អប្រសើរជាងមុននៅព្យាករថាអ្នកដែលនឹងរាយការណ៍ពីការបោះឆ្នោតបានសំឡេងឆ្នោតច្រើនជាងដែលពិតជាការរកឃើញជាក់ស្ដែងថាការអំពាវនាវឱ្យទ្រឹស្តីថ្មីដើម្បីយល់និងទស្សន៍ទាយបោះឆ្នោត។
ប៉ុន្តែរបៀបជាច្រើនយើងគួរទុកចិត្ដលទ្ធផលទាំងនេះ? ចូរចងចាំថាលទ្ធផលទាំងនេះពឹងផ្អែកទៅលើកំហុសភ្ជាប់ទិន្នន័យទៅក្នុងប្រអប់ខ្មៅជាមួយនឹងបរិមាណមិនស្គាល់កំហុស។ ពិសេសជាងនេះទៅទៀត, លទ្ធផលជំហានសំខាន់អាស្រ័យលើចំនួនពីរ: 1) សមត្ថភាពនៃ Catalist បញ្ចូលគ្នានូវប្រភពទិន្នន័យខុសគ្នាជាច្រើនក្នុងការផលិត datafile ត្រឹមត្រូវមេនិង 2) សមត្ថភាពនៃ Catalist ដើម្បីភ្ជាប់ទិន្នន័យស្ទង់មតិនេះដើម្បី datafile ជំនាញរបស់ខ្លួន។ គ្នានៃជំហានទាំងនេះគឺមានការលំបាកណាស់ហើយកំហុសនៅជំហានទាំងអាចនាំអ្នកស្រាវជ្រាវសន្និដ្ឋានខុស។ ទោះជាយ៉ាងណា, ទាំងពីរដំណើរការទិន្នន័យនិងការផ្គូផ្គងគឺសំខាន់ដើម្បីអត្ថិភាពជាបន្តរបស់ Catalist ជាក្រុមហ៊ុនមួយដូច្នេះវាអាចវិនិយោគធនធាននៅក្នុងការដោះស្រាយបញ្ហាទាំងនេះជាញឹកញាប់នៅក្នុងទ្រង់ទ្រាយដែលថាគ្មានការសិក្សាស្រាវជ្រាវបុគ្គលឬក្រុមនៃអ្នកស្រាវជ្រាវអាចផ្គូផ្គង។ នៅក្នុងការអានបន្ថែមទៀតនៅចុងបញ្ចប់នៃជំពូកនេះ, ខ្ញុំបានរៀបរាប់អំពីបញ្ហាទាំងនេះនៅក្នុងលម្អិតបន្ថែមទៀតនិងរបៀប Ansolabehere និង HershE កសាងទំនុកចិត្តក្នុងលទ្ធផលរបស់ពួកគេ។ ទោះបីជាសេចក្តីលម្អិតទាំងនេះគឺជាក់លាក់ចំពោះការស្រាវជ្រាវនេះ, បញ្ហាស្រដៀងគ្នាទៅនឹងទាំងនេះនឹងកើតឡើងសម្រាប់ក្រុមអ្នកស្រាវជ្រាវផ្សេងទៀតដែលមានបំណងចង់តភ្ជាប់ទៅប្រភពទិន្នន័យដានឌីជីថលប្រអប់ខ្មៅ។
តើអ្វីទៅជាមេរៀនទូទៅអ្នកស្រាវជ្រាវអាចគូរពីការសិក្សានេះមានអ្វីខ្លះ? ជាដំបូងមានតម្លៃយ៉ាងខ្លាំងពីការបង្កើនឡើនដានឌីជីថលជាមួយនឹងទិន្នន័យស្ទង់មតិ។ ទីពីរទោះបីជាទាំងនេះបានប្រមូលផ្តុំប្រភពទិន្នន័យពាណិជ្ជកម្មមិនគួរត្រូវបានចាត់ទុកជា "ការពិតដី", នៅក្នុងករណីខ្លះពួកគេអាចមានប្រយោជន៍។ នៅក្នុងការពិត, វាគឺជាការល្អបំផុតដើម្បីប្រៀបធៀបទាំងនេះប្រភពទិន្នន័យមិនឱ្យសេចក្តីពិតទាំងស្រុង (ពីការដែលពួកគេតែងតែនឹងធ្លាក់ចុះខ្លី) ។ ផ្ទុយទៅវិញវាជាការល្អប្រសើរជាងមុនដើម្បីប្រៀបធៀបពួកគេទៅនឹងប្រភពទិន្នន័យដែលអាចប្រើបានផ្សេងទៀតដែលផុសមានកំហុសផងដែរ។