ផ្នែកនេះគឺត្រូវបានរចនាឡើងដើម្បីត្រូវបានប្រើជាសេចក្ដីយោងជាជាងការដើម្បីត្រូវបានអានក្នុងនិទានកថាវិញ។
មនុស្សជាច្រើននៃស្បែកនៅក្នុងជំពូកនេះត្រូវបានបន្ទរក្នុងអាសយដ្ឋានប្រធានាធិបតីថ្មីនៅសមាគមអាមេរិមតិស្រាវជ្រាវសាធារណៈ (AAPOR), ដូចជា Dillman (2002) , Newport (2011) , Santos (2014) , និង Link (2015) ។
សម្រាប់ផ្ទៃខាងក្រោយប្រវត្តិសាស្រ្តបន្ថែមទៀតអំពីការអភិវឌ្ឍនៃការស្រាវជ្រាវអង្កេតនេះបានមើលឃើញ Smith (1976) និងការ Converse (1987) ។ ចំពោះការបន្ថែមទៀតលើគំនិតនៃយុគសម័យទាំងបីនៃការស្រាវជ្រាវស្ទង់មតិនេះសូមមើល Groves (2011) និង Dillman, Smyth, and Christian (2008) (ដែលបំបែកឡើងសម័យចំនួនបីផ្សេងគ្នាបន្តិច) ។
កម្រិតខ្ពស់បំផុតនៅក្នុងការផ្លាស់ប្តូរពីដំបូងទៅសម័យទីពីរក្នុងការស្រាវជ្រាវស្ទង់មតិមួយគឺ Groves and Kahn (1979) ដែលបានធ្វើការប្រៀបធៀបក្បាលទៅក្បាលលម្អិតរវាងមុខទៅមុខនិងការស្ទាបស្ទង់តាមទូរស័ព្ទ។ Brick and Tucker (2007) មើលទៅត្រឡប់មកវិញនៅក្នុងការអភិវឌ្ឍប្រវត្តិសាស្រ្តនៃវិធីសាស្រ្តគំរូហៅខ្ទង់ចៃដន្យ។
For ស្រាវជ្រាវបន្ថែមទៀតពីរបៀបក្នុងពេលកន្លងមកបានផ្លាស់ប្តូរនៅក្នុងការឆ្លើយតបទៅនឹងការផ្លាស់ប្តូរក្នុងសង្គមសូមមើល Tourangeau (2004) , Mitofsky (1989) , និង Couper (2011) ។
ការរៀនអំពីស្ថានភាពខាងក្នុងដោយសួរសំណួរអាចជាបញ្ហាដោយសារតែពេលខ្លះការឆ្លើយតបដោយខ្លួនឯងមិនបានដឹងពីបណ្តារដ្ឋផ្ទៃក្នុងរបស់ខ្លួន។ ឧទាហរណ៍ Nisbett and Wilson (1977) មានក្រដាសក្តីការអស្ចារ្យដែលមានចំណងជើងថា: "ការប្រាប់ច្រើនជាងយើងអាចដឹងថា: ។ របាយការណ៍ស្តីពីដំណើរនៃចិត្តពាក្យសំដី" នៅក្នុងក្រដាសអ្នកស្រាវជ្រាវបានសន្និដ្ឋានថា: «មុខវិជ្ជាគឺមានពេលខ្លះ (ក) មិនដឹងនៃ អត្ថិភាពនៃការជំរុញសេដ្ឋកិច្ចដែលរងឥទ្ធិពលពីការឆ្លើយតបមួយដែលសំខាន់មួយ (ខ) ដឹងនៃអត្ថិភាពនៃការឆ្លើយតបនិង (គ) មិនដឹងថាសកម្មភាពនេះបានរងផលប៉ះពាល់ការឆ្លើយតប»។
សម្រាប់អាគុយម៉ង់ថាអ្នកស្រាវជ្រាវគួរចូលចិត្តឥរិយាបថសង្កេតឃើញឥរិយាបថរាយការណ៍ឬអាកប្បកិរិយាឃើញ Baumeister, Vohs, and Funder (2007) (ចិត្តវិទ្យា) និង Jerolmack and Khan (2014) និងការឆ្លើយតប (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (ផ្នែកសង្គមវិជ្ជា) ។ ភាពខុសគ្នារវាងការសួរនិងការសង្កេតផងដែរកើតឡើងនៅក្នុងសេដ្ឋកិច្ចដែលជាកន្លែងដែលក្រុមអ្នកស្រាវជ្រាវបាននិយាយអំពីចំណង់ចំណូលចិត្តបានបញ្ជាក់និងបានបង្ហាញ។ ឧទាហរណ៍, អ្នកស្រាវជ្រាវអាចសួរថាតើពួកគេចូលចិត្តអ្នកឆ្លើយតបបរិភោគការ៉េមឬកាយវប្បកម្ម (ចំណង់ចំណូលចិត្តថ្លែង) ឬការស្រាវជ្រាវនេះអាចសង្កេតមើលពីរបៀបដែលមនុស្សជាញឹកញាប់បរិភោគការ៉េមនិងចូលទៅកន្លែងហាត់ប្រាណ (ចំណង់ចំណូលចិត្តបានបង្ហាញ) ។ មានការសង្ស័យជ្រៅប្រភេទជាក់លាក់នៃទិន្នន័យចំណង់ចំណូលចិត្តមានចែងក្នុងសេដ្ឋកិច្ចគឺ (Hausman 2012) ។
ស្បែកចម្បងពីកិច្ចពិភាក្សាទាំងនេះគឺថាឥរិយាបទរបាយការណ៍គឺមិនតែងតែត្រឹមត្រូវ។ ប៉ុន្តែឥរិយាបទដែលបានកត់ត្រាទុកដោយស្វ័យប្រវត្តិអាចនឹងមិនត្រឹមត្រូវអាចនឹងមិនត្រូវបានប្រមូលលើគំរូនៃការចាប់អារម្មណ៍ជាមួយនិងប្រហែលជាមិនអាចចូលដំណើរការបានដល់អ្នកស្រាវជ្រាវ។ ដូច្នេះនៅក្នុងស្ថានភាពមួយចំនួន, ខ្ញុំគិតថាឥរិយាបថរបាយការណ៍អាចជាមានប្រយោជន៍។ លើសពីនេះទៅទៀតប្រធានបទសំខាន់ទីពីរពីកិច្ចពិភាក្សាទាំងនេះគឺថាសេចក្តីរាយការណ៍ពីអារម្មណ៍, ចំនេះដឹង, ការរំពឹងទុក, និងមតិមិនតែងតែត្រឹមត្រូវ។ ប៉ុន្តែប្រសិនបើជារដ្ឋផ្ទៃក្នុងអំពីការទាំងនេះគឺត្រូវបានត្រូវការដោយក្រុមអ្នកស្រាវជ្រាវ-ទាំងដើម្បីជួយពន្យល់ពីឥរិយាបថមួយចំនួនឬជារឿងដែលនឹងត្រូវបានពន្យល់-បន្ទាប់មកបានអោយអាចនឹងត្រឹមត្រូវ។
សម្រាប់ការព្យាបាលប្រវែងសៀវភៅស្តីពីកំហុសការស្ទង់មតិសរុប, មើលឃើញ Groves et al. (2009) បានឬ Weisberg (2005) ។ សម្រាប់ប្រវត្តិសាស្រ្តនៃការអភិវឌ្ឍនៃកំហុសការស្ទង់មតិចំនួនសរុបសូមមើល Groves and Lyberg (2010) ។
នៅក្នុងលក្ខខណ្ឌនៃការតំណាងដែលជាសេចក្តីណែនាំយ៉ាងខ្លាំងទៅនឹងបញ្ហានៃការមិនឆ្លើយតបនិងភាពលំអៀងដែលមិនមែនជាការឆ្លើយតបគឺមានរបាយការណ៍ស្តីពីក្រុមប្រឹក្សាស្រាវជ្រាវជាតិនៅក្នុងការអង្កេតវិទ្យាសាស្រ្ត Nonresponse សង្គម: របៀបវារៈមួយស្រាវជ្រាវ (2013) ។ ទិដ្ឋភាពទូទៅមានប្រយោជន៍មួយផ្សេងទៀតត្រូវបានផ្ដល់ដោយ (Groves 2006) ។ ដូចគ្នានេះផងដែរ, បញ្ហាពិសេសទាំងមូលនៃទិនានុប្បវត្តិនៃស្ថិតិផ្លូវការ, មតិសាធារណៈប្រចាំត្រីមាសនិងកំណត់ត្រាប្រវត្តិសាស្ត្ររបស់អាមេរិកនិងបណ្ឌិតសភាវិទ្យាសាស្ត្រសង្គមនយោបាយនេះបានត្រូវបានបោះពុម្ពនៅលើប្រធានបទនៃការមិនឆ្លើយតប។ ជាចុងក្រោយ, មានវិធីផ្សេងគ្នាពិតជាច្រើននៃការគណនាអត្រាឆ្លើយតបគឺ; វិធីសាស្រ្តទាំងនេះគឺត្រូវបានរៀបរាប់នៅក្នុងលម្អិតនៅក្នុងរបាយការណ៍ដោយសមាគមអាមេរិមតិសាធារណៈក្រុមអ្នកស្រាវជ្រាវ (AAPOR) មួយ (Public Opinion Researchers} 2015) ។
នេះជាឆ្នាំ 1936 ការស្ទង់មតិអក្សរសាស្ត្រត្រូវបានគេបានសិក្សាសង្ខេបនៅក្នុងលម្អិត (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) ។ វាត្រូវបានគេប្រើជាពាក្យប្រស្នាទៅព្រមានប្រឆាំងនឹងការប្រមូលទិន្នន័យដោយចៃដន្យ (Gayo-Avello 2011) ។ នៅឆ្នាំ 1936 លោក George ក្រុមហ៊ុន Gallup បានគេប្រើជាទម្រង់ទំនើបបន្ថែមទៀតនៃការរៀបចំសំណាកគំរូនិងអាចផលិតប៉ាន់ស្មានត្រឹមត្រូវបន្ថែមទៀតជាមួយនឹងការគំរូតូចជាងច្រើន។ ការទទួលបានជោគជ័យក្រុមហ៊ុន Gallup រយៈពេលអក្សរសាស្ត្រជាសមិទ្ធផលអភិវឌ្ឍន៍សង្ខេបការស្រាវជ្រាវស្ទង់មតិមួយបានមួយ (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) ។
នៅក្នុងលក្ខខណ្ឌនៃការវាស់វែងដែលជាធនធានដំបូងអស្ចារ្យសម្រាប់សំណួរការរចនាគឺ Bradburn, Sudman, and Wansink (2004) ។ សម្រាប់ការព្យាបាលជាច្រើនទៀតបានផ្តោតជាពិសេសលើសំណួរអាកប្បកិរិយាឃើញ Schuman and Presser (1996) ។ ច្រើនទៀតនៅលើសំណួរមុនការធ្វើតេស្តគឺអាចរកបាននៅ Presser and Blair (1994) , Presser et al. (2004) , និងជំពូកទី 8 នៃ Groves et al. (2009) ។
ការព្យាបាលបុរាណ, សៀវភៅប្រវែងនៃពាណិជ្ជកម្មបិទរវាងការចំណាយការស្ទង់មតិនិងកំហុសការស្ទង់មតិគឺ Groves (2004) ។
ការព្យាបាលសៀវភៅប្រវែងបុរាណនៃគំរូស្តង់ដារនិងការប៉ាន់ស្មានប្រូបាប៊ីលីតេមាន Lohr (2009) (ណែនាំជាច្រើនទៀត) និង Särndal, Swensson, and Wretman (2003) (កម្រិតខ្ពស់បន្ថែមទៀត) ។ ការព្យាបាលបុរាណសៀវភៅប្រវែងនៃវិធីសាស្រ្តក្រោយការ stratification និងពាក់ព័ន្ធគឺ Särndal and Lundström (2005) ។ នៅក្នុងការកំណត់អាយុឌីជីថលមួយចំនួន, អ្នកស្រាវជ្រាវបានដឹងបន្តិចអំពីការមិនមែនជាការឆ្លើយតប, ដែលមិនមែនជាញឹកញាប់ការពិតនៅក្នុងអតីតកាល។ ទម្រង់ផ្សេងគ្នានៃការលៃតម្រូវមិនមែនជាការឆ្លើយតបគឺអាចធ្វើទៅបាននៅពេលដែលអ្នកស្រាវជ្រាវដែលមិនមានការឆ្លើយតបអំពី- (Kalton and Flores-Cervantes 2003; Smith 2011) ។
ការសិក្សារបស់ Xbox របស់ Wang et al. (2015) បានប្រើបច្ចេកទេសមួយដែលគេហៅថាតំរែតំរង់ multilevel និងក្រោយការ stratification (MRP, ពេលខ្លះបានហៅថា "នំ Mister P បាន") ដែលអនុញ្ញាតឱ្យអ្នកស្រាវជ្រាវបានប៉ាន់ស្មានថាកោសិកាមានន័យថាសូម្បីតែនៅពេលមានមនុស្សជាច្រើនកោសិកាជាច្រើន។ ទោះបីជាមានការជជែកពិភាក្សាគ្នាមួយចំនួនអំពីគុណភាពនៃការប៉ាន់ប្រមាណពីច្ចេកទេសនេះវាហាក់ដូចជាតំបន់ជោគជ័យដើម្បីរុករក។ បច្ចេកទេសនេះត្រូវបានប្រើជាលើកដំបូងនៅ Park, Gelman, and Bafumi (2004) , និងមានការប្រើប្រាស់ជាបន្តបន្ទាប់និងការជជែកពិភាក្សា (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) ។ ចំពោះការបន្ថែមទៀតលើការតភ្ជាប់រវាងបុគ្គលនិងទម្ងន់ទម្ងន់កោសិកាដែលមានមូលដ្ឋាននៅមើលឃើញ Gelman (2007) ។
ចំពោះវិធីសាស្រ្តផ្សេងទៀតដើម្បីស្ទង់មតិបណ្ដាញទម្ងន់, មើលឃើញ Schonlau et al. (2009) , Valliant and Dever (2011) , និង Bethlehem (2010) ។
ផ្គូផ្គងគំរូស្នើឡើងដោយ Rivers (2007) ។ Bethlehem (2015) បានអះអាងថាការសម្តែងនៃការប្រកួតគំរូនេះពិតជានឹងមានវិធីសាស្រ្តផ្សេងទៀតដែលស្រដៀងគ្នាទៅនឹងគំរូ (ឧទាហរណ៍គំរូ stratified) និងវិធីសាស្រ្តការលៃតម្រូវផ្សេងទៀត (ឧទាហរណ៍ក្រោយការ stratification) ។ ចំពោះការបន្ថែមទៀតលើបន្ទះអនឡាញសូមមើល Callegaro et al. (2014) ។
ពេលខ្លះអ្នកស្រាវជ្រាវបានរកឃើញថាសំណាកប្រូនិងគំរូដែលមិនមានផលការប៉ាន់ស្មាននៃប្រូបាប៊ីលីតេគុណភាពស្រដៀងគ្នា (Ansolabehere and Schaffner 2014) , ប៉ុន្តែការប្រៀបធៀបផ្សេងទៀតបានរកឃើញថាសំណាកដែលមិនប្រូធ្វើឱ្យអាក្រក់ (Malhotra and Krosnick 2007; Yeager et al. 2011) ។ មូលហេតុដែលអាចធ្វើបានមួយសម្រាប់ភាពខុសគ្នាទាំងនេះគឺថាមិនមែនជាគំរូមានភាពប្រសើរឡើងជាងប្រូបាប៊ីលីតេពេល។ សម្រាប់ទិដ្ឋភាពទុទិដ្ឋិនិយមនៃវិធីសាស្រ្តដែលមិនមែនជាគំរូប្រូបាប៊ីលីតេឃើញក្រុមការងារពិសេស AAPOR លើគំរូដែលមិនមែនជាប្រូបាប (Baker et al. 2013) , ហើយខ្ញុំបានផ្តល់អនុសាសន៍អានអត្ថាធិប្បាយដែលខាងក្រោមរបាយការណ៍សង្ខេបនេះ។
ចំពោះការវិភាគលើផលប៉ះពាល់នៃទំងន់ដើម្បីកាត់បន្ថយភាពលំអៀងក្នុងសំណាកដែលមិនមែនជាប្រូបាប៊ីលីតេសូមមើលតារាង 2.4 នៅ Tourangeau, Conrad, and Couper (2013) ដែលនាំអ្នកនិពន្ធនេះដើម្បីបញ្ចប់ "ការលៃតម្រូវហាក់ដូចជាមានប្រយោជន៍ប៉ុន្តែ fallible កែ។ ។ "។
Conrad and Schober (2008) ផ្ដល់នូវទំហំដែលបានកែសម្រួលចំណងជើងថានូវបទសម្ភាសន៍ការស្ទង់ envisioning នៃការនាពេលអនាគតហើយវាបានដោះស្រាយជាច្រើននៃស្បែកនៅក្នុងផ្នែកនេះ។ Couper (2011) បានថ្លែងស្បែកស្រដៀងគ្នា, និង Schober et al. (2015) បានផ្តល់នូវឧទាហរណ៍ស្រស់ស្អាតនៃរបៀបវិធីសាស្រ្តប្រមូលទិន្នន័យដែលត្រូវបានតម្រូវទៅនឹងការកំណត់ថ្មីអាចបណ្តាលនៅក្នុងទិន្នន័យដែលមានគុណភាពខ្ពស់ជាងមុន។
គួរឱ្យចាប់អារម្មណ៍ជាឧទាហរណ៍មួយទៀតនៃការប្រើកម្មវិធីហ្វេសប៊ុកសម្រាប់ការស្ទង់មតិផ្នែកវិទ្យាសាស្រ្តសង្គម, មើលឃើញ Bail (2015) ។
សម្រាប់ការផ្តល់ដំបូន្មានបន្ថែមទៀតនៅលើការធ្វើឱ្យការស្ទង់មតិជាបទពិសោធរីករាយនិងមានតម្លៃសម្រាប់អ្នកចូលរួមសូមមើលវិធីសាស្រ្តការងារនៅលើ Tailored រចនា (Dillman, Smyth, and Christian 2014) ។
Stone et al. (2007) បានផ្តល់នូវការព្យាបាលប្រវែងនៃការវាយតម្លៃមួយភ្លែតសៀវភៅនិងវិធីសាស្រ្តដែលទាក់ទងនឹងអេកូឡូស៊ី។
Judson (2007) បានរៀបរាប់ពីដំណើរការនៃការរួមបញ្ចូលគ្នារវាងការស្ទង់មតិនិងទិន្នន័យរដ្ឋបាលដែលជា«ការរួមបញ្ចូលព»ពិភាក្សាអំពីគុណសម្បត្តិមួយចំនួននៃវិធីសាស្រ្តនេះនិងផ្តល់នូវឧទាហរណ៍មួយចំនួន។
វិធីមួយទៀតដែលអ្នកស្រាវជ្រាវអាចប្រើដានឌីជីថលនិងទិន្នន័យរដ្ឋបាលគឺជាស៊ុមគំរូមួយសម្រាប់មនុស្សដែលមានលក្ខណៈជាក់លាក់។ ទោះជាយ៉ាងណា, ការចូលដំណើរការកត់ត្រាទាំងនេះនឹងត្រូវបានប្រើផងដែរគំរូស៊ុមអាចបង្កើតសំណួរដែលទាក់ទងទៅនឹងភាពជាឯកជន (Beskow, Sandler, and Weinberger 2006) ។
ទាក់ទងនឹងការស្នើសុំបានពង្រីកឱ្យធំ, វិធីសាស្រ្តនេះមិនមែនជាថ្មីដូចដែលវាអាចលេចឡើងពីរបៀបដែលខ្ញុំបានរៀបរាប់ពីវា។ វិធីសាស្រ្តនេះមានការតភ្ជាប់ជ្រៅទៅក្នុងតំបន់បីធំក្រោយការ stratification ស្ថិតិមានមូលដ្ឋានម៉ូដែល (Little 1993) , imputation (Rubin 2004) , និងការប៉ាន់ស្មានតំបន់តូច (Rao and Molina 2015) ។ វាត្រូវបានទាក់ទងផងដែរទៅនឹងការប្រើអថេរក្នុងការស្រាវជ្រាវវេជ្ជសាស្រ្តដែលពពោះជំនួសគេនោះ (Pepe 1992) ។
ក្នុងការបន្ថែមទៅនឹងបញ្ហាវិជ្ជាជីវៈដែលទាក់ទងនឹងការចូលដំណើរការទិន្នន័យដានឌីជីថល, ដែលបានស្នើសុំបានពង្រីកឱ្យធំអាចត្រូវបានប្រើដើម្បីសន្និដ្ឋានលក្ខណៈរសើបថាមនុស្សអាចនឹងមិនជ្រើសរើសដើម្បីបង្ហាញក្នុងការអង្កេតមួយ (Kosinski, Stillwell, and Graepel 2013) ។
នេះជាការប៉ាន់ប្រមាណការចំណាយនិងពេលវេលានៅក្នុង Blumenstock, Cadamuro, and On (2015) យោងបន្ថែមទៀតដើម្បីចំណាយអថេរចំណាយនៃការចំណាយការស្ទង់មតិនិងបន្ថែមមិនរួមបញ្ចូលការជួសជុលមួយដូចជាការចំណាយសមាតនិងដំណើរការទិន្នន័យការហៅនេះ។ នៅក្នុងទូទៅ, ដែលបានស្នើសុំបានពង្រីកឱ្យធំនឹងប្រហែលជាមានការចំណាយលើការជួសជុលនិងការចំណាយខ្ពស់ទាបស្រដៀងគ្នាទៅនឹងអថេរពិសោធន៍ឌីជីថល (មើលជំពូក 4) ។ សេចក្ដីលម្អិតបន្ថែមទៀតលើទិន្នន័យដែលបានប្រើនៅ Blumenstock, Cadamuro, and On (2015) ក្រដាសមាននៅក្នុងការ Blumenstock and Eagle (2010) និង Blumenstock and Eagle (2012) ។ វិធីសាស្រ្តពី imputuation ច្រើន (Rubin 2004) អាចជួយក្នុងការប៉ាន់ស្មានការចាប់យកភាពមិនច្បាស់លាស់ពីសួររីកធំឡើង។ ប្រសិនបើការស្នើសុំឱ្យអ្នកស្រាវជ្រាវធ្វើបានពង្រីកឱ្យធំចំនួនសរុបខ្វល់អំពីជាជាងលក្ខណៈបុគ្គលកម្រិតតែប៉ុណ្ណោះ, បន្ទាប់មកវិធីសាស្រ្តក្នុងការ King and Lu (2008) និង Hopkins and King (2010) ប្រហែលជាមានប្រយោជន៍។ ចំពោះបន្ថែមអំពីវិធីសាស្រ្តរៀនម៉ាស៊ីននៅ Blumenstock, Cadamuro, and On (2015) សូមមើល James et al. (2013) (ណែនាំទៀត) ឬ Hastie, Tibshirani, and Friedman (2009) (កម្រិតខ្ពស់បន្ថែមទៀត) ។ សៀវភៅរៀនម៉ាស៊ីនពេញនិយមមួយផ្សេងទៀតគឺ Murphy (2012) ។
ទាក់ទងនឹងការស្នើសុំវិសេសវិសាលថែមទៀត, លទ្ធផលក្នុង Ansolabehere និង HershE (2012) ការ hinge លើជំហានសំខាន់ពីរ: 1) សមត្ថភាពនៃ Catalist បញ្ចូលគ្នានូវប្រភពទិន្នន័យខុសគ្នាជាច្រើនក្នុងការផលិត datafile មួយដែលមានភាពត្រឹមត្រូវនិងម្ចាស់ 2) សមត្ថភាពរបស់ Catalist ដើម្បីភ្ជាប់ទិន្នន័យស្ទង់មតិនេះដើម្បី datafile ជំនាញរបស់ខ្លួន។ ដូច្នេះ Ansolabehere និង HershE ពិនិត្យមើលគ្នានៃជំហានទាំងនេះដោយប្រុងប្រយ័ត្ន។
ដើម្បីបង្កើត datafile មេ Catalist រួមបញ្ចូលគ្នានិងសមស្របពពីប្រភពផ្សេងគ្នាជាច្រើនរួមទាំង: រូបថតច្រើនកំណត់ត្រាបោះឆ្នោតបានមកពីរដ្ឋនីមួយទិន្នន័យពីការផ្លាស់ប្តូរជាតិនៃការិយាល័យចុះបញ្ជីអាសយដ្ឋានភ្នំពេញប៉ុស្តិ៍, និងទិន្នន័យពីអ្នកផ្តល់សេវាពាណិជ្ជកម្មមិនបានបញ្ជាក់ផ្សេងទៀត។ សេចក្តីលម្អិតអំពីរបៀបទាំងអស់ដែលគួរឱ្យខ្ពើមរអើមនេះនិងរួមបញ្ចូលគ្នារវាងសម្អតកើតមានឡើងជាមានលើសពីវិសាលភាពនៃសៀវភៅនេះនោះទេប៉ុន្តែដំណើរការនេះ, គ្មានបញ្ហាថាតើមានការប្រុងប្រយ័ត្ននឹងបង្កើតកំហុសក្នុងប្រភពទិន្នន័យដើមហើយនឹងណែនាំកំហុស។ ទោះបីជា Catalist មានបំណងពិភាក្សាដំណើរការទិន្នន័យរបស់ខ្លួននិងការផ្តល់នូវខ្លះនៃទិន្នន័យឆៅរបស់ខ្លួនវាគឺជាការមិនអាចទៅរួចនោះទេគ្រាន់តែសម្រាប់អ្នកស្រាវជ្រាវដើម្បីពិនិត្យបំពង់បង្ហូរទិន្នន័យ Catalist ទាំងមូល។ ផ្ទុយទៅវិញក្រុមអ្នកស្រាវជ្រាវនេះបានស្ថិតនៅក្នុងស្ថានភាពដែលជាកន្លែងដែលឯកសារទិន្នន័យ Catalist មានដែលមិនស្គាល់, និងប្រហែលជាស្គាល់ព្រះបានទេមួយចំនួនមានកំហុសមួយ។ នេះជាក្តីបារម្ភធ្ងន់ធ្ងរដោយសារតែការរិះគន់មួយអាចគិតថាភាពខុសគ្នាខ្លាំងរវាងរបាយការណ៍អង្កេតលើ CCES និងឥរិយាបថនៅក្នុងឯកសារទិន្នន័យមេ Catalist នេះត្រូវបានបង្កឡើងដោយការមានកំហុសនៅក្នុងឯកសារទិន្នន័យមេមិនមែនដោយ misreporting ដោយឆ្លើយតប។
Ansolabehere និង HershE បានយកវិធីសាស្រ្តពីរផ្សេងគ្នាដើម្បីដោះស្រាយការព្រួយបារម្ភដែលមានគុណភាពទិន្នន័យ។ គណបក្សដំបូង, នៅក្នុងការបន្ថែមទៅនឹងការប្រៀបធៀបការបោះឆ្នោតដោយខ្លួនឯងបានរាយការណ៍ទៅបោះឆ្នោតនៅក្នុងឯកសារមេ Catalist, អ្នកស្រាវជ្រាវបានផងដែរបើធៀបខ្លួនឯង, ការប្រណាំងស្ថានភាពចុះឈ្មោះបោះឆ្នោត (ឧចុះបញ្ជីឬមិនបានចុះឈ្មោះ) និងវិធីសាស្រ្តក្នុងការបោះឆ្នោត (ឧទាហរណ៍នៅក្នុងមនុស្សម្នាក់, អវត្តមាន សន្លឹកឆ្នោត, ល) ទៅតម្លៃដែលអ្នកដែលរកឃើញនៅក្នុងមូលដ្ឋានទិន្នន័យ Catalist ។ សម្រាប់អថេរប្រជាសាស្ត្រទាំងបួននាក់នេះអ្នកស្រាវជ្រាវបានរកឃើញថាកម្រិតខ្ពស់នៃកិច្ចព្រមព្រៀងរវាងរបាយការណ៍ស្ទង់មតិនិងទិន្នន័យក្នុងឯកសារមេ Catalist ជាងការបោះឆ្នោត។ ដូច្នេះឯកសារទិន្នន័យមេ Catalist ហាក់ដូចជាមានព័គុណភាពខ្ពស់សម្រាប់លក្ខណៈផ្សេងទៀតជាងការបោះឆ្នោតលើកឡើងថាវាមិនមែនជារបស់ដែលមានគុណភាពរួមក្រីក្រ។ ទីពីរនៅក្នុងផ្នែកមួយដោយប្រើទិន្នន័យពី Catalist, Ansolabehere និងការអភិវឌ្ឍវិធានការបី HershE ខុសគ្នានៃគុណភាពនៃការបោះឆ្នោតខោនធីកំណត់ត្រាហើយពួកគេបានរកឃើញថាអត្រាប៉ាន់ប្រមាណថាមានចំនួនជាងការធ្វើសេចក្តីរាយការណ៍នៃការបោះឆ្នោតគឺជាការសំខាន់មិនទាក់ទងទៅនឹងការណាមួយនៃការទាំងនេះវិធានការដែលមានគុណភាពទិន្នន័យ, ការរកឃើញមួយដែល បានបង្ហាញថាអត្រាខ្ពស់នៃជាងការរាយការណ៍មិនត្រូវបានជំរុញដោយប្រទេសដែលមានគុណភាពទិន្នន័យកម្រិតទាបខុសធម្មតា។
ដែលបានផ្ដល់ឱ្យបង្កើតឯកសារបោះឆ្នោតមេនេះ, ជាប្រភពទីពីរនៃសក្តានុពលនេះត្រូវបានភ្ជាប់ទំនាក់ទំនងរវាងកំហុសការអង្កេតនេះបានកំណត់ត្រាទៅវា។ ឧទាហរណ៍ប្រសិនបើទំនាក់ទំនងនេះត្រូវបានធ្វើមិនត្រឹមត្រូវវាអាចនាំឱ្យមានការប៉ាន់ប្រមាណនៃភាពខុសគ្នារវាងឥរិយាបទបោះឆ្នោតរាយការណ៍និងធ្វើឱ្យមានសុពលភាព (Neter, Maynes, and Ramanathan 1965) ។ ប្រសិនបើមនុស្សជារៀងរាល់មានកំណត់ពិសេសមួយដែលមានស្ថេរភាពដែលមាននៅក្នុងប្រភពទិន្នន័យទាំងពីរបន្ទាប់មកភ្ជាប់នឹងមានរឿងតូចតាច។ នៅក្នុងប្រទេសផ្សេងទៀតរបស់សហរដ្ឋអាមេរិកនិងភាគច្រើនបំផុត, ទោះជាយ៉ាងណា, មិនមានគ្រឿងសម្គាល់សកល។ លើសពីនេះបើទោះបីជាមានដូចជាមនុស្សជាគ្រឿងសម្គាល់ប្រហែលជានឹងជាស្ទាក់ស្ទើរក្នុងការផ្តល់ការវាក្នុងការស្ទង់មតិអ្នកស្រាវជ្រាវ! ដូច្នេះ Catalist ត្រូវតែធ្វើការភ្ជាប់ដោយប្រើអត្តសញ្ញាណដែលមិនល្អឥតខ្ចោះក្នុងរឿងក្តីនេះចំនួនបួនបំណែកនៃអំពីអ្នកឆ្លើយតបគ្នា: ឈ្មោះភេទឆ្នាំកំណើតនិងអាសយដ្ឋានផ្ទះ។ ឧទាហរណ៍ Catalist បានសម្រេចចិត្តប្រសិនបើ Homie ក្រុមហ៊ុន J Simpson ក្នុង CCES នេះគឺជាមនុស្សដូចគ្នាជា Homer លោក Jay Simpson នៅក្នុងឯកសារទិន្នន័យមេរបស់ពួកគេ។ នៅក្នុងការអនុវត្តការផ្គូផ្គងគឺជាដំណើរការលំបាកនិងស្មុគស្មាញ, និងដើម្បីធ្វើឱ្យបញ្ហាកាន់តែអាក្រក់សម្រាប់ក្រុមអ្នកស្រាវជ្រាវនេះបានចាត់ទុកបច្ចេកទេសដែលផ្គូផ្គង Catalist របស់ខ្លួនដើម្បីឱ្យមានកម្មសិទ្ធិ។
ក្នុងគោលបំណងដើម្បីធ្វើឱ្យមានសុពលភាពក្បួនដោះស្រាយការផ្គូផ្គងដែលពួកគេពឹងផ្អែកលើបញ្ហាប្រឈមពីរ។ ជាដំបូង Catalist ចូលរួមនៅក្នុងការប្រកួតប្រជែងមួយដែលត្រូវបានផ្គូផ្គងដំណើរការដោយឯករាជ្យភាគីទីបី: សាជីវកម្មក្រុមហ៊ុនមី។ ក្រុមហ៊ុនមីបានផ្តល់ឯកសារទិន្នន័យអ្នកចូលរួមទាំងអស់សំឡេងរំខានពីរទៅត្រូវបានផ្គូផ្គងនិងក្រុមផ្សេងគ្នារួមប្រកួតប្រជែងក្នុងការវិលត្រឡប់ទៅកាន់ក្រុមហ៊ុនមីផ្គូផ្គងល្អបំផុត។ ដោយសារតែក្រុមហ៊ុនមីខ្លួនវាបានដឹងថានេះផ្គូផ្គងត្រឹមត្រូវពួកគេអាចស៊ុតបាល់បញ្ចូលទីក្រុម។ ក្នុងចំណោមក្រុមហ៊ុន 40 ដែលចូលរួមប្រកួត, Catalist មកនៅក្នុងកន្លែងទីពីរ។ ប្រភេទនៃឯករាជ្យការវាយតម្លៃបក្សភាគបីនៃច្ចេកវិទ្យាកម្មសិទ្ធិនេះគឺពិតជាមានតម្លៃនិងមិនគួរឱ្យជឿកម្រ! វាគួរតែផ្តល់ឱ្យយើងនូវទំនុកចិត្តថានីតិវិធីដែលផ្គូផ្គង Catalist គឺសំខាន់នៅរដ្ឋនៃសិល្បៈ។ ប៉ុន្តែគឺជារដ្ឋនៃសិល្បៈល្អគ្រប់គ្រាន់ទេ? ក្រៅពីការប្រកួតប្រជែងការប្រកួតនេះ Ansolabehere និង HershE បានបង្កើតជាបញ្ហាប្រឈមដែលផ្គូផ្គងរបស់ពួកគេសម្រាប់ Catalist ។ ពីគម្រោងមុននេះ Ansolabehere និង HershE បានប្រមូលកំណត់ត្រាឈ្មោះអ្នកបោះឆ្នោតបានមកពីរដ្ឋ Florida ។ ពួកគេបានផ្តល់មួយចំនួននៃកំណត់ត្រាទាំងនេះជាមួយនឹងការមួយចំនួននៃវាលរបស់ពួកគេលុបចោលទៅ Catalist ហើយបន្ទាប់មកបើធៀបរបាយការណ៍របស់វាល Catalist ទាំងនេះទៅតម្លៃពិតប្រាកដរបស់ខ្លួន។ ជាសំណាងល្អរបស់គេមានសេចក្តីរាយការណ៍ Catalist ជិតស្និទ្ធទៅនឹងតម្លៃកាត់ទុកបង្ហាញថា Catalist អាចផ្គូផ្គងនឹងកំណត់ត្រាឈ្មោះអ្នកបោះឆ្នោតដោយផ្នែកលើឯកសារទិន្នន័យមេរបស់ពួកគេ។ បញ្ហាប្រឈមទាំងនេះពីរនាក់គឺម្នាក់ជាភាគីទីបីហើយនិងមួយដោយ Ansolabehere HershE, ផ្តល់ឱ្យយើងនូវជំនឿចិត្តបន្ថែមទៀតក្នុងក្បួនដោះស្រាយផ្គូផ្គង Catalist បើទោះបីជាយើងមិនអាចពិនិត្យឡើងវិញការអនុវត្តពិតប្រាកដរបស់ពួកខ្លួនយើង។
មានការប៉ុនប៉ងជាច្រើនដើម្បីធ្វើឱ្យមានសុពលភាពកាលពីមុនការបោះឆ្នោត។ ចំពោះទិដ្ឋភាពទូទៅនៃអក្សរសិល្ប៍ថាសូមមើល Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , និង Hanmer, Banks, and White (2014) ។
វាជាការសំខាន់ក្នុងការសំគាល់ថាទោះបីជាក្នុងករណីនេះក្រុមអ្នកស្រាវជ្រាវត្រូវបានគេលើកទឹកចិត្តដោយគុណភាពនៃទិន្នន័យពី Catalist ការវាយតម្លៃផ្សេងទៀតនៃអ្នកលក់ពាណិជ្ជកម្មបានសាទរតិច។ អ្នកស្រាវជ្រាវបានរកឃើញថាគុណភាពក្រីក្រនៅពេលទិន្នន័យពីការស្ទង់មតិឱ្យមានការប្រើប្រាស់ឯកសារពីទីផ្សារក្រុមប្រព័ន្ធ (ដែលខ្លួនវាបានរួមបញ្ចូលគ្នាជាមួយគ្នាទិន្នន័យពីអ្នកផ្តល់សេវាបី: Acxiom, Experian និង InfoUSA) (Pasek et al. 2014) ។ នោះគឺជា, ឯកសារទិន្នន័យមិនត្រូវគ្នាក្រុមអ្នកស្រាវជ្រាវការឆ្លើយតបការស្ទង់មតិមួយដែលគេរំពឹងថានឹងត្រឹមត្រូវ, datafile បានទិន្នន័យសម្រាប់មួយចំនួនធំនៃសំណួរនិងលំនាំទិន្នន័យដែលបាត់ខ្លួនបានបាត់ខ្លួនត្រូវបានទាក់ទងទៅនឹងការស្ទង់មតិបានរាយការណ៍ថាតម្លៃ (នៅក្នុងពាក្យផ្សេងទិន្នន័យដែលបាត់នោះគឺមានលក្ខណៈជាប្រព័ន្ធ មិនមែនចៃដន្យ) ។
ចំពោះការបន្ថែមទៀតលើទំនាក់ទំនងរវាងការស្ទង់មតិលើកំណត់ត្រានិងទិន្នន័យរដ្ឋបាលមើលឃើញ Sakshaug and Kreuter (2012) និង Schnell (2013) ។ ចំពោះការបន្ថែមទៀតនៅលើកំណត់ត្រាភ្ជាប់បណ្តាញនៅក្នុងទូទៅ, មើលឃើញ Dunn (1946) និង Fellegi and Sunter (1969) (ប្រវត្តិសាស្រ្ត) និង Larsen and Winkler (2014) (សម័យទំនើប) ។ វិធីសាស្រ្តស្រដៀងគ្នានេះត្រូវបានបង្កើតឡើងនៅក្នុងវិទ្យាសាស្ដ្រកុំព្យូទ័រនៅក្រោមឈ្មោះដូចជា deduplication ទិន្នន័យកំណត់អត្តសញ្ញាណឧទាហរណ៍ផ្គូផ្គងឈ្មោះ, ការរកឃើញស្ទួននិងបានរកឃើញកំណត់ត្រាស្ទួន (Elmagarmid, Ipeirotis, and Verykios 2007) ។ មានវិធីសាស្រ្តមានភាពឯកជនការរក្សាទំនាក់ទំនងដែលមានដើម្បីកត់ត្រាមិនទាមទារការឆ្លងនៃការកំណត់អត្តសញ្ញាណផ្ទាល់ផងដែរព (Schnell 2013) ។ អ្នកស្រាវជ្រាវនៅឯក្រុមហ៊ុន Facebook បានបង្កើតនីតិវិធីដើម្បីភ្ជាប់ probabilisticsly កំណត់ត្រារបស់ពួកគេឱ្យទៅជាការបោះឆ្នោត (Jones et al. 2013) ; ភ្ជាប់បណ្តាញនេះត្រូវបានធ្វើដើម្បីវាយតំលៃពិសោធន៍ដែលខ្ញុំនឹងប្រាប់អ្នកអំពីក្នុងជំពូកទី 4 (Bond et al. 2012) ។
ឧទាហរណ៍មួយទៀតនៃការអង្កេតរបស់សង្គមភ្ជាប់ពីទ្រង់ទ្រាយធំទៅកាន់កំណត់ត្រារដ្ឋបាលរបស់រដ្ឋាភិបាលមកពីការស្ទង់មតិសុខភាពនិងចូលនិវត្តន៍និងរដ្ឋបាលសន្តិសុខសង្គម។ ចំពោះការបន្ថែមទៀតលើការសិក្សាមួយដែលរួមបញ្ចូលទាំងការអំពីនីតិវិធីយល់ព្រមសូមមើល Olson (1996) និង Olson (1999) ។
ដំណើរការនៃការរួមបញ្ចូលគ្នារវាងប្រភពជាច្រើននៃកំណត់ត្រារដ្ឋបាលទៅជាមេ datafile ដែលបានដំណើរការដែល Catalist បុគ្គលិកគឺជារឿងធម្មតានៅក្នុងការរិយាល័យស្ថិតិនៃរដ្ឋាភិបាលជាតិមួយចំនួន។ អ្នកស្រាវជ្រាវពីរពីស្ថិតិស៊ុយអ៊ែបានសរសេរសៀវភៅមួយដែលមានលម្អិតស្តីពីប្រធានបទនេះ (Wallgren and Wallgren 2007) ។ ឧទាហរណ៍មួយនៃវិធីសាស្រ្តក្នុងស្រុកតែមួយនៅសហរដ្ឋអាមេរិចនេះ (Olmstead ខោនធីក្នុងរដ្ឋ Minnesota ផ្ទះរបស់ក្រុម Mayo Clinic) មើលឃើញ Sauver et al. (2011) ។ ចំពោះការបន្ថែមទៀតនៅលើកំហុសដែលអាចលេចឡើងក្នុងកំណត់ត្រារដ្ឋបាលសូមមើល Groen (2012) ។