3.4 ដើម្បីសួរតើនរណា

យុគសម័យឌីជីថលកំពុងធ្វើឱ្យការប៉ាន់ស្មានប្រូបាប៊ីលីតេក្នុងការអនុវត្តជាក់ស្តែងកាន់តែរឹងមាំជាងមុនហើយកំពុងបង្កើតឱកាសថ្មីៗសម្រាប់ការជ្រើសរើសគំរូដែលមិនអាចកើតឡើងបាន។

នៅក្នុងប្រវត្តិសាស្ត្រគំរូមានវិធីសាស្រ្តប្រកួតប្រជែងចំនួនពីរ: វិធីសាស្រ្តគំរូប្រូបាប៊ីលីតេនិងវិធីសាស្ត្រគំរូដែលមិនអាចកើតឡើងបាន។ ទោះបីជាវិធីសាស្រ្តទាំងពីរនេះត្រូវបានប្រើនៅក្នុងថ្ងៃដំបូងនៃគំរូ, គំរូប្រូបាប៊ីលីតេត្រូវបានគ្របដណ្តប់ហើយអ្នកស្រាវជ្រាវសង្គមជាច្រើនត្រូវបានបង្រៀនឱ្យមើលគំរូសំណាកមិនប្រូបាប៊ីលីត្រជាមួយនឹងការសង្ស័យដ៏អស្ចារ្យ។ ទោះជាយ៉ាងណាក៏ដោយដូចដែលខ្ញុំនឹងរៀបរាប់ខាងក្រោមការផ្លាស់ប្តូរដែលបង្កើតឡើងដោយអាយុឌីជីថលមានន័យថាវាដល់ពេលដែលក្រុមអ្នកស្រាវជ្រាវធ្វើការពិចារណាឡើងវិញពីគំរូមិនប្រូបាប៊ីលីតេ។ ជាពិសែសការបែើបែស់សុីតែូវបានធ្វើការលំបាកក្នុងការអនុវត្តជាក់ស្តែងហើយការគែប់គែាងមិនសា្គាល់បានទទួលលឿនជាងថោកនិងល្អជាងមុន។ ការស្ទាបស្ទង់ល្បឿនលឿននិងថោកមិនត្រឹមតែបញ្ចប់ដោយខ្លួនឯងប៉ុណ្ណោះទេតែវាបើកឱកាសថ្មីដូចជាការស្ទង់មតិញឹកញាប់និងទំហំគំរូធំ។ ឧទាហរណ៍ដោយប្រើវិធីសាស្រ្តដែលមិនអាចធ្វើទៅបានការសិក្សាពីការបោះឆ្នោតសភា (CCES) អាចមានអ្នកចូលរួមប្រហែល 10 ដងច្រើនជាងការសិក្សាមុន ៗ ដោយប្រើគំរូប្រូបាប។ គំរូដ៏ធំនេះអនុញ្ញាតឱ្យក្រុមអ្នកស្រាវជ្រាវនយោបាយសិក្សាអំពីការប្រែប្រួលនៃអាកប្បកិរិយានិងអាកប្បកិរិយានៅតាមក្រុមរងនិងបរិបទសង្គម។ លើសពីនេះទៀតទំហំទាំងអស់នេះបានកើនឡើងដោយមិនមានការថយចុះគុណភាពនៃការប៉ាន់ប្រមាណ (Ansolabehere and Rivers 2013)

បច្ចុប្បន្ននេះវិធីសាស្រ្តលេចធ្លោចំពោះគំរូសម្រាប់ការស្រាវជ្រាវសង្គមគឺ ការជ្រើសរើសប្រូបាប៊ីលីតេ ។ នៅក្នុងគំរូប្រូបាបអ្នកទាំងអស់នៃប្រជាជនគោលដៅត្រូវបានគេស្គាល់ថាជាប្រូបាប៊ីលីតេ nonzero ដែលត្រូវបានគេជ្រើសរើសហើយមនុស្សទាំងអស់ដែលត្រូវបានគេឆ្លើយតបនឹងការស្ទង់មតិ។ នៅពេលដែលលក្ខខណ្ឌទាំងនេះត្រូវបានឆ្លើយតបលទ្ធផលគណិតវិទ្យាឆើតឆាយផ្តល់នូវការធានាដែលអាចធានាបានអំពីសមត្ថភាពរបស់អ្នកស្រាវជ្រាវក្នុងការប្រើប្រាស់គំរូដើម្បីធ្វើការសន្និដ្ឋានអំពីចំនួនប្រជាជនគោលដៅ។

ទោះយ៉ាងណាក៏ដោយនៅក្នុងពិភពលោកពិតប្រាកដណាស់លក្ខខណ្ឌដែលមានមូលដ្ឋានលើលទ្ធផលគណិតវិទ្យាទាំងនេះកម្រនឹងត្រូវបានជួបប្រទះ។ ឧទាហរណ៍មានកំហុសជាញឹកញាប់និងមិនឆ្លើយតប។ ដោយសារបញ្ហាទាំងនេះអ្នកស្រាវជ្រាវតែងតែត្រូវធ្វើការសម្របសម្រួលតាមស្ថិតិជាច្រើនដើម្បីបង្ហាញពីការសន្និដ្ឋានពីគំរូរបស់ពួកគេដល់ប្រជាជនគោលដៅ។ ដូច្នេះវាជាការសំខាន់ដើម្បីបែងចែករវាង គំរូប្រូបាប៊ីលីតេនៅក្នុងទ្រឹស្ដី ដែលមានការធានាខាងទ្រឹស្តីរឹងមាំនិង គំរូប្រូបាបនៅក្នុងការអនុវត្ត ដែលមិនផ្តល់ការធានាបែបនេះនិងអាស្រ័យលើភាពខុសគ្នានៃការកែតម្រូវស្ថិតិ។

ក្នុងពេលកន្លងមកភាពខុសគ្នារវាងគំរូប្រូបាបនៅក្នុងទ្រឹស្ដីនិងគំរូប្រូបាប៊ីលីតេនៅក្នុងការអនុវត្តត្រូវបានកើនឡើង។ ឧទហរណ៍អ្របឡងអ្រេសនើនបានកើនឡើងជាលំដាប់ទោះបីមានការអង្កែតមានគុណភាពខ្ពស់និងមានតម្ល្រខ្ពស់ (រូបភាពទី 3.5) (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) ។ អត្រាមិនឆ្លើយតបគឺខ្ពស់ជាងនៅក្នុងការស្ទង់មតិទូរសព្ទពាណិជ្ជកម្ម - ជួនកាលសូម្បីតែខ្ពស់រហូតដល់ 90% (Kohut et al. 2012) ។ ការកើនឡើងនៃការមិនឆ្លើយតបនេះគំរាមកំហែងគុណភាពនៃការប៉ាន់ប្រមាណពីព្រោះការប៉ាន់ប្រមាណពឹងផ្អែកកាន់តែខ្លាំងទៅលើគំរូស្ថិតិដែលអ្នកស្រាវជ្រាវប្រើដើម្បីលៃតម្រូវចំពោះការមិនឆ្លើយតប។ លើសពីនេះទៀតការថយចុះគុណភាពនេះបានកើតឡើងបើទោះបីជាការខិតខំប្រឹងប្រែងកាន់តែខ្លាំងឡើងដោយក្រុមអ្នកស្រាវជ្រាវដើម្បីរក្សាអត្រាឆ្លើយតបខ្ពស់ក៏ដោយ។ មនុស្សមួយចំនួនមានការភ័យខ្លាចថានិន្នាការភ្លោះនៃការថយចុះគុណភាពនិងការបង្កើនការចំណាយគំរាមកំហែងដល់មូលដ្ឋានគ្រឹះនៃការស្រាវជ្រាវ (National Research Council 2013)

រូបភាពទី 3.5: Nonresponse កាន់តែមានស្ថេរភាពសូម្បីតែក្នុងការស្ទាបស្ទង់តម្លៃខ្ពស់ដែលមានគុណភាពខ្ពស់ (ក្រុមប្រឹក្សាស្រាវជ្រាវជាតិឆ្នាំ 2013 B.D. Meyer, Mok និង Sullivan 2015) ។ អត្រ្របតិបត្តិការមិនសូវពនរើនខ្ពស់សម្រ្រប់ការស្ទង់មតិទូរស័ព្ទពាណិជ្ជកម្មជួនកាលរហូតដល់ 90% (Kohut et al ។ , 2012) ។ និន្នាការវែងឆ្ងាយនៃការមិនឆ្លើយតបនោះមានន័យថាការប្រមូលទិន្នន័យមានតម្លៃថ្លៃហើយការប៉ាន់ស្មានមិនសូវជឿជាក់។ ប្រែសម្រួលពីខ។ ឌី។ Meyer, Mok, និង Sullivan (ឆ្នាំ 2015), តួលេខ 1 ។

រូបភាពទី 3.5: Nonresponse កាន់តែមានស្ថេរភាពសូម្បីតែនៅក្នុងការស្ទាបស្ទង់តម្លៃខ្ពស់ដែលមានគុណភាពខ្ពស់ (National Research Council 2013; BD Meyer, Mok, and Sullivan 2015) ។ អត្រ្របតិបត្តិការមិនសូវពនរើនខ្ពស់សម្រ្រប់ការស្ទង់មតិទូរស័ព្ទពាណិជ្ជកម្មជួនកាលរហូតដល់ 90% (Kohut et al. 2012) ។ និន្នាការវែងឆ្ងាយនៃការមិនឆ្លើយតបនោះមានន័យថាការប្រមូលទិន្នន័យមានតម្លៃថ្លៃហើយការប៉ាន់ស្មានមិនសូវជឿជាក់។ ប្រែប្រួលពី BD Meyer, Mok, and Sullivan (2015) , តួលេខទី 1 ។

ក្នុងពេលជាមួយគ្នានេះដែរវាមានការកើនឡើងនូវការលំបាកសម្រាប់វិធីសាស្រ្តជ្រើសរើសប្រូបាប៊ីលីតេក៏មានការវិវត្តន៍គួរឱ្យរំភើបនៅក្នុង វិធីសាស្រ្តគំរូដែលមិនទំនង ។ មានភាពខុសគ្នានៃរចនាប័ទ្មនៃវិធីសាស្រ្តគំរូដែលមិនអាចកើតឡើងបានប៉ុន្តែរឿងមួយដែលពួកគេមានដូចគ្នានោះគឺថាពួកគេមិនអាចងាយស្រួលក្នុងក្របខ័ណ្ឌគណិតវិទ្យានៃគំរូប្រូបាប៊ីលីតេ (Baker et al. 2013) ។ នៅក្នុងពាក្យផ្សេងទៀតនៅក្នុងវិធីសាស្រ្តគំរូដែលមិនមែនជាប្រូបាប៊ីលីតេមិនគ្រប់គ្នាមានប្រូបាប៊ីលីតេដែលត្រូវបានគេស្គាល់និង nonzero នៃការដាក់បញ្ចូល។ វិធីសាស្រ្តគំរូមិនទំនងអាចមានកេរ្តិ៍ឈ្មោះអាក្រក់ក្នុងចំណោមក្រុមអ្នកស្រាវជ្រាវសង្គមហើយពួកគេត្រូវបានផ្សារភ្ជាប់ជាមួយនឹងការបរាជ័យមួយចំនួនធំបំផុតនៃអ្នកស្រាវជ្រាវដែលស្ទង់មតិដូចជា fiasco Literary Digest (ដែលបានពិភាក្សាខាងលើ) និង "Dewey Defeats Truman" ព្យាករណ៍មិនត្រឹមត្រូវអំពីសហរដ្ឋអាមេរិក។ ការបោះឆ្នោតប្រធានាធិបតីឆ្នាំ 1948 (រូបភាពទី 3.6) ។

រូបភាពទី 3.6: ប្រធានាធិបតីលោកហារីទ្រូម៉ាន់ (Harry Truman) កំពុងកាន់ដំណែងនៃកាសែតដែលបានប្រកាសមិនត្រឹមត្រូវអំពីបរាជ័យរបស់គាត់។ ចំណងជើងនេះត្រូវបានផ្អែកជាផ្នែកមួយលើការប៉ាន់ស្មានពីសំណាកមិនប្រូបាប៊ីលីតេ (Mosteller 1949 Bean 1950, Freedman, Pisani, និង Purves 2007) ។ ទោះបីជា Dewey ឈ្នះ Truman ក្នុងឆ្នាំ 1948 ក៏ដោយក៏វានៅតែជាហេតុផលមួយដែលក្រុមអ្នកស្រាវជ្រាវមួយចំនួនមានការសង្ស័យអំពីការប៉ាន់ប្រមាណពីសំណាកមិនប្រូបាប៊ីលីតេ។ ប្រភព: បណ្ណាល័យនិងសារមន្ទីរលោក Harry S. Truman ។

រូបភាពទី 3.6: ប្រធានាធិបតីលោកហារីទ្រូម៉ាន់ (Harry Truman) កំពុងកាន់ដំណែងនៃកាសែតដែលបានប្រកាសមិនត្រឹមត្រូវអំពីបរាជ័យរបស់គាត់។ ចំណងជើងនេះត្រូវបានផ្អែកជាផ្នែកមួយលើការប៉ាន់ស្មានពីសំណាកមិនប្រូបាប៊ីលីតេ (Mosteller 1949; Bean 1950; Freedman, Pisani, and Purves 2007) ។ ទោះបីជា "Dewey Defeats Truman" បានកើតឡើងក្នុងឆ្នាំ 1948 ក៏ដោយក៏វានៅតែជាហេតុផលមួយដែលក្រុមអ្នកស្រាវជ្រាវមួយចំនួនមានការសង្ស័យអំពីការប៉ាន់ប្រមាណពីសំណាកមិនប្រូបាប៊ីលីតេ។ ប្រភព: បណ្ណាល័យនិងសារមន្ទីរលោក Harry S. Truman

សំណុំបែបបទគំរូមួយដែលមិនមែនជាប្រូបាប៊ីលីតេដែលសមស្របទៅនឹងអាយុឌីជីថលគឺការប្រើប្រាស់ បន្ទះអនឡាញ ។ ក្រុមអ្នកស្រាវជ្រាវដែលប្រើបន្ទះអនឡាញពឹងផ្អែកលើអ្នកផ្តល់បន្ទះអេឡិចត្រូនិកមួយចំនួន - ជាទូទៅក្រុមហ៊ុន, រដ្ឋាភិបាលឬសាកលវិទ្យាល័យ - ដើម្បីបង្កើតក្រុមមនុស្សចម្រុះដែលមានភាពខុសគ្នាដែលយល់ព្រមធ្វើជាអ្នកឆ្លើយតបសម្រាប់ការស្ទង់មតិ។ អ្នកចូលរួមបន្ទះទាំងនេះត្រូវបានជ្រើសរើសជាញឹកញាប់ដោយប្រើវិធីសាស្រ្តពិសេសៗជាច្រើនដូចជាការផ្សាយពាណិជ្ជកម្មលើបដាតាមអ៊ីនធឺណិត។ បន្ទាប់មកអ្នកស្រាវជ្រាវម្នាក់អាចបង់ប្រាក់ទៅឱ្យអ្នកផ្តល់សេវាកម្មបន្ទះអេឡិចត្រូនិកដើម្បីទទួលបានគំរូនៃអ្នកឆ្លើយសំណួរដែលមានលក្ខណៈចង់បាន (ឧទាហរណ៏អ្នកតំណាងថ្នាក់ជាតិនៃមនុស្សពេញវ័យ) ។ បន្ទះអនឡាញទាំងនេះគឺជាវិធីសាស្រ្តដែលមិនអាចកើតឡើងបានពីព្រោះមិនមែនគ្រប់គ្នាមានប្រូបាប៊ីលីតេដែលមិនស្គាល់។ ថ្វីបើកម្រងអ៊ីនធឺណេតមិនទំនងអាចត្រូវបានប្រើប្រាស់ដោយក្រុមអ្នកស្រាវជ្រាវសង្គម (ឧទាហរណ៍ CCES) ក៏ដោយក៏នៅតែមានការពិភាក្សាមួយចំនួនអំពីគុណភាពនៃការប៉ាន់ប្រមាណដែលបានមកពីពួកគេ (Callegaro et al. 2014)

ទោះបីជាមានការពិភាក្សាទាំងនេះក៏ដោយខ្ញុំគិតថាមានហេតុផលពីរដែលហេតុអ្វីបានជាពេលវេលាគឺសមស្របសម្រាប់អ្នកស្រាវជ្រាវសង្គមដើម្បីធ្វើការពិចារណាអំពីការជ្រើសរើសគំរូមិនប្រូបាប៊ីលីតេ។ ដំបូងក្នុងយុគសម័យឌីជីថលមានការវិវត្តន៍ជាច្រើនក្នុងការប្រមូលនិងវិភាគគំរូមិនប្រូបាប៊ីលីតេ។ វិធីសាស្រ្តថ្មីៗទាំងនេះមានភាពខុសគ្នាគ្រប់គ្រាន់ពីវិធីដែលបណ្តាលមកពីបញ្ហាកាលពីមុនដែលខ្ញុំគិតថាវាសមហេតុផលក្នុងការគិតថាពួកគេជា "គំរូមិនប្រូបាប៊ីលីតេ 2.0" ។ មូលហេតុទី 2 ដែលអ្នកស្រាវជ្រាវគួរតែពិចារណាឡើងវិញអំពីការជ្រើសរើសគំរូដែលមិនអាចកើតឡើងបានគឺដោយសារតែការជ្រើសរើសប្រូបាប៊ីលីតេនៅក្នុង ការអនុវត្តត្រូវបានក្លាយជាការលំបាកកាន់តែខ្លាំងឡើង។ នៅពេលដែលមានអត្រាខ្ពស់នៃការមិនឆ្លើយតប - ដូចដែលមាននៅក្នុងការស្ទង់មតិពិតប្រាកដនាពេលបច្ចុប្បន្ននេះប្រូបាប៊ីលីតេពិតប្រាកដនៃការដាក់បញ្ចូលចំពោះអ្នកឆ្លើយសំណួរមិនត្រូវបានគេដឹងហើយដូច្នេះសំណាកប្រូបាបនិងសំណាកដែលមិនមានប្រតិកម្មមិនខុសគ្នាដូចអ្នកស្រាវជ្រាវជាច្រើនជឿទេ។

ដូចដែលខ្ញុំបាននិយាយពីមុនគំរូមិនប្រូបាប៊ីលីតេត្រូវបានគេមើលឃើញដោយមន្ទិលសង្ស័យយ៉ាងខ្លាំងដោយក្រុមអ្នកស្រាវជ្រាវសង្គមជាច្រើនដែលមួយផ្នែកដោយសារតែតួនាទីរបស់ពួកគេនៅក្នុងការបរាជ័យមួយចំនួនធំបំផុតនៅថ្ងៃដំបូងនៃការសិក្សាស្រាវជ្រាវ។ ឧទាហរណ៏ច្បាស់លាស់មួយអំពីថាតើយើងបានមកជាមួយសំណាកដែលមិនអាចធ្វើទៅបានគឺការស្រាវជ្រាវដោយវៃវ៉ាងលោក David Rothschild លោក Sharad Goel និងលោក Andrew Gelman (2015) ដែលបានរកឃើញលទ្ធផលនៃការបោះឆ្នោតអាមេរិកឆ្នាំ 2012 ដោយត្រឹមត្រូវដោយប្រើគំរូមិនសូវទំនង អ្នកប្រើប្រាស់ Xbox របស់អាមេរិក - ជាគំរូមិនច្បាស់ចាញ់របស់អាមេរិក។ អ្នកស្រាវជ្រាវបានជ្រើសរើសអ្នកឆ្លើយឆ្លងព័ត៌មានពីប្រព័ន្ធលេងហ្គេម Xbox ហើយតាមដែលអ្នកអាចរំពឹងទុកគំរូ Xbox មានកម្រិតបុរសនិងមានវ័យក្មេងដែលមានអាយុពី 18 ទៅ 29 ឆ្នាំដែលមានចំនួន 19% នៃអ្នកបោះឆ្នោតប៉ុន្តែ 65% នៃគំរូ Xbox និងបុរស មាន 47% នៃអ្នកបោះឆ្នោតប៉ុន្តែ 93% នៃគំរូ Xbox (រូបភាព 3.7) ។ ដោយសារតែភាពលម្អៀងផ្នែកប្រជាសាស្ត្រដ៏រឹងមាំទាំងនេះទិន្នន័យ Xbox ឆៅគឺជាសូចនាករខ្សោយនៃការបោះឆ្នោត។ វាបានទស្សន៍ទាយថាជ័យជម្នះរបស់ Mitt Romney លើ Barack Obama ។ ជាថ្មីម្តងទៀតនេះគឺជាឧទាហរណ៏មួយទៀតនៃគ្រោះថ្នាក់នៃគំរូមិនប្រក្រតីឆៅដែលមិនត្រូវបានកែតម្រូវហើយវាមានលក្ខណៈដូចទៅនឹង អក្ខរាវិរុទ្ធអក្សរសិល្ប៍

រូបភាពទី 3.7: ប្រជាសាស្ដ្ររបស់អ្នកឆ្លើយសំណួរនៅក្នុង W. Wang et al ។ (ឆ្នាំ 2015) ។ ដោយសារតែអ្នកឆ្លើយសំណួរត្រូវបានជ្រើសរើសពី XBox ពួកគេទំនងជាក្មេងហើយទំនងជាបុរសជាងអ្នកបោះឆ្នោតនៅក្នុងការបោះឆ្នោតឆ្នាំ 2012 ។ សម្របខ្លួនពីលោក W. Wang et al ។ (ឆ្នាំ 2015) តាង 1 ។

រូបភាពទី 3.7: ប្រជាសាស្ដ្ររបស់អ្នកឆ្លើយសំណួរនៅក្នុង W. Wang et al. (2015) ។ ដោយសារតែអ្នកឆ្លើយសំណួរត្រូវបានជ្រើសរើសពី XBox ពួកគេទំនងជាក្មេងហើយទំនងជាបុរសជាងអ្នកបោះឆ្នោតនៅក្នុងការបោះឆ្នោតឆ្នាំ 2012 ។ សម្របខ្លួនពី W. Wang et al. (2015) 1 ។

ទោះជាយ៉ាងណាក៏ដោយលោកវ៉ាងនិងមិត្តរួមការងាររបស់គាត់បានដឹងពីបញ្ហាទាំងនេះហើយបានព្យាយាមកែតម្រូវរបៀបជ្រើសរើសគំរូមិនចៃដន្យរបស់ពួកគេនៅពេលធ្វើការប៉ាន់ស្មាន។ ជាពិសេសពួកគេបានប្រើ stratification ក្រោយ ដែលជាបច្ចេកទេសមួយដែលត្រូវបានគេប្រើយ៉ាងទូលំទូលាយដើម្បីសំរួលគំរូប្រូបាបដែលមានកំហុសគ្របដណ្តប់និងការមិនឆ្លើយតប។

គំនិតចម្បងនៃការបែងចែកក្រោយគឺត្រូវប្រើព័ត៌មានបន្ថែមអំពីប្រជាជនគោលដៅដើម្បីជួយធ្វើឱ្យប្រសើរឡើងនូវការប៉ាន់ប្រមាណដែលមកពីគំរូមួយ។ នៅពេលប្រើ stratification ក្រោយដើម្បីធ្វើឱ្យការប៉ាន់ស្មានពីសំណាកមិនប្រូបាប៊ីលីតរបស់ពួកគេវ៉ាងនិងមិត្តរួមការងារបានកាត់បន្ថយចំនួនប្រជាជនចូលទៅក្នុងក្រុមផ្សេងគ្នាបានប៉ាន់ប្រមាណថាការគាំទ្រដល់លោកអូបាម៉ានៅក្នុងក្រុមនីមួយៗហើយបន្ទាប់មកបានយកជាមធ្យមនៃការប៉ាន់ស្មានរបស់ក្រុមដើម្បីបង្កើតការប៉ាន់ស្មានជារួម។ ឧទាហរណ៍ពួកគេអាចបំបែកចំនួនប្រជាជនជាពីរក្រុម (បុរសនិងស្ត្រី) បានប៉ាន់ប្រមាណការគាំទ្រចំពោះលោកអូបាម៉ាក្នុងចំណោមបុរសនិងស្ត្រីហើយបន្ទាប់មកបានប៉ាន់ប្រមាណថាការគាំទ្រជាទូទៅសម្រាប់លោកអូបាម៉ាដោយយកជាមធ្យមទម្ងន់ដើម្បីគណនាការពិតដែលថាស្ត្រីធ្វើ កើនឡើង 53% នៃអ្នកបោះឆ្នោតនិងបុរស 47% ។ ប្រហែលការបោសសំអាតបន្ទាប់បន្សំជួយកែតម្រូវគំរូសំណាកដែលមិនមានតុល្យភាពដោយនាំយកព័ត៌មានជំនួយអំពីទំហំនៃក្រុម។

គន្លឹះសំខាន់ក្នុងការបែងចែកការបែងចែកគឺដើម្បីបង្កើតជាក្រុមត្រឹមត្រូវ។ ប្រសិនបើអ្នកអាចកាត់បន្ថយចំនួនប្រជាជនចូលទៅក្នុងក្រុមដូចគ្នាដូចគ្នានឹងការឆ្លើយតបរបស់មនុស្សដូចគ្នាសម្រាប់មនុស្សគ្រប់គ្នាក្នុងក្រុមនិមួយៗនោះការធ្វើ stratification ក្រោយនឹងធ្វើឱ្យមានការប៉ាន់ប្រមាណដោយមិនលំអៀង។ ម៉្យាងទៀតការបែងចែកក្រោយតាមភេទនឹងបង្កើតការប៉ាន់ប្រមាណដោយមិនលំអៀងប្រសិនបើបុរសទាំងអស់មានទំនោរឆ្លើយតបហើយស្ត្រីទាំងអស់មានទំនោរឆ្លើយតបដូចគ្នា។ ការសន្មត់នេះត្រូវបានគេហៅថាការសន្មត់ ដូចគ្នា - ការឆ្លើយតប - ទំនោរ - ក្នុងក្រុម ហើយខ្ញុំពណ៌នាវាបន្ថែមទៀតនៅក្នុងកំណត់ត្រាគណិតវិទ្យានៅចុងបញ្ចប់នៃជំពូកនេះ។

ជាការពិតណាស់វាហាក់ដូចជាមិនទំនងដែលថាទំនោរឆ្លើយតបនឹងដូចគ្នាចំពោះបុរសនិងស្ត្រីទាំងអស់នោះទេ។ ទោះជាយ៉ាងណាក៏ដោយការសន្មត់ដូចគ្នានឹងការឆ្លើយឆ្លងគ្នាទៅវិញទៅមកមានភាពជឿនលឿនជាងនៅពេលចំនួនក្រុមកើនឡើង។ ប្រហែលវាកាន់តែងាយស្រួលជាងមុនក្នុងការកាប់ប្រជាជនចូលក្នុងក្រុមដូចគ្នាប្រសិនបើអ្នកបង្កើតក្រុមច្រើន។ ឧទាហរណ៍វាហាក់ដូចជាមិនសមហេតុផលដែលស្ត្រីទាំងអស់មានទំនោរឆ្លើយតបដូចគ្នានឹងទេប៉ុន្តែវាហាក់ដូចជាមានភាពជឿនលឿនបន្ថែមទៀតដែលមានទំនោរឆ្លើយតបដូចគ្នាសម្រាប់ស្ត្រីទាំងអស់ដែលមានអាយុ 18-29 ឆ្នាំដែលបានបញ្ចប់ការសិក្សានៅមហាវិទ្យាល័យហើយដែលរស់នៅរដ្ឋកាលីហ្វ័រនីញ៉ា ។ ដូច្ន្រះហើយដ្រលចំនួនក្រុមដ្រលប្រើប្រស់នៅក្រ្រមកាលវ្រងបានធំជាងមុនការសន្មតដ្រលចាំបាច់ដើម្របីទ្រទ្រង់វិធីសាស្រ្តន្រះកាន់ត្រច្រើន។ ដោយបានផ្តល់ហេតុការណ៍នេះអ្នកស្រាវជ្រាវតែងតែចង់បង្កើតក្រុមមួយចំនួនធំសម្រាប់ការធ្វើ stratification ក្រោយ។ ទោះជាចំនួនក្រុមកើនឡើងក៏ដោយក៏ក្រុមអ្នកស្រាវជ្រាវបានជួបប្រទះបញ្ហាខុសគ្នា។ ប្រសិនបើមានមនុស្សតិចតួចប៉ុណ្ណោះនៅក្នុងក្រុមនីមួយៗនោះការប៉ាន់ប្រមាណនឹងមិនមានភាពច្បាស់លាស់ទេហើយក្នុងករណីធ្ងន់ធ្ងរដែលមានក្រុមដែលគ្មានអ្នកឆ្លើយសំណួរបន្ទាប់មកការបែងចែកក្រោយការបែងចែកត្រូវបានបញ្ចប់ទាំងស្រុង។

មានវិធីពីរយ៉ាងចេញពីភាពតានតឹងដែលមានស្រាប់រវាងភាពគួរអោយជឿជាក់នៃការសន្មត់ដូចគ្នា - ការឆ្លើយតប - ទំនោរ - ក្នុងក្រុមនិងតម្រូវការសម្រាប់ទំហំគំរូដែលសមហេតុផលនៅក្នុងក្រុមនីមួយៗ។ ទី 1 អ្នកស្រាវជ្រាវអាចប្រមូលសំណាកចម្រុះធំជាងនិងចម្រុះដែលជួយធានានូវទំហំគំរូសមល្មមក្នុងក្រុមនីមួយៗ។ ទីពីរពួកគេអាចប្រើគំរូស្ថិតិដែលទំនើបសម្រាប់ការប៉ាន់ប្រមាណក្នុងក្រុម។ ហើយជាការពិតជួនកាលអ្នកស្រាវជ្រាវធ្វើទាំងពីរនេះខណៈពេលដែលវ៉ាងនិងមិត្តរួមការងាររបស់គាត់បានធ្វើការសិក្សាអំពីការបោះឆ្នោតដោយប្រើប្រាស់អ្នកឆ្លើយសំណួរពី Xbox ។

ដោយសារតែពួកគេបានប្រើវិធីសាស្រ្តគំរូមិនប្រូបាប៊ីលីតេជាមួយការសម្ភាសដែលគ្រប់គ្រងដោយកុំព្យូទ័រ (ខ្ញុំនឹងនិយាយបន្ថែមអំពីការសម្ភាសដែលគ្រប់គ្រងដោយកុំព្យូទ័រនៅក្នុងផ្នែកទី 3.5) លោកវ៉ាងនិងសហការីបានប្រមូលទិន្នន័យដែលមានតំលៃថោកដែលអាចឱ្យពួកគេប្រមូលព័ត៌មានពីអ្នកចូលរួមមានចំនួន 345,858 នាក់ ជាចំនួនដ៏ធំមួយតាមស្តង់ដារនៃការបោះឆ្នោត។ ទំហំគំរូដ៏ធំនេះបានធ្វើឱ្យពួកគេបង្កើតបានជាចំនួនដ៏ធំនៃក្រុមក្រោយការបែងចែក។ ចំណែកឯ Wang និងសហសេវិកបានបែងចែកប្រជាជនទៅជា 176.256 ក្រុមដែលបានកំណត់ដោយភេទ (2 ប្រភេទ) ការប្រណាំង (4 ប្រភេទ) អាយុ (4 ប្រភេទ) ការអប់រំ (4 ប្រភេទ) រដ្ឋ (51 ប្រភេទ) ID គណបក្ស (3 ប្រភេទ) មនោគមវិជ្ជា (3 ប្រភេទ) និង 2008 បោះឆ្នោត (3 ប្រភេទ) ។ និយាយម្យ៉ាងទៀតទំហំគំរូដ៏ធំរបស់ពួកគេដែលត្រូវបានអនុញ្ញាតដោយការប្រមូលទិន្នន័យដែលមានតម្លៃទាបបានធ្វើឱ្យពួកគេអាចធ្វើការសន្មតបានច្រើនក្នុងដំណើរការប៉ាន់ប្រមាណរបស់ពួកគេ។

ទោះជាមានអ្នកចូលរួមតែ 345.858 នាក់ក៏ដោយក៏នៅតែមានក្រុមជាច្រើនដែលវ៉ាងនិងមិត្តរួមការងាររបស់គាត់ស្ទើរតែគ្មានអ្នកឆ្លើយសំណួរ។ ដូច្ន្រះពួកគ្របានប្រើប្រ្រស់បច្ច្រកទ្រសដ្រលហៅថា តំរែតំរង់ពហុវ្រល ដើម្របីបា៉ាន់សា្ម្រនការគាំទ្រនៅក្នុងក្រុមនីមួយៗ ជាមូលដ្ឋានដើម្បីប៉ាន់ស្មានការគាំទ្រចំពោះលោកអូបាម៉ានៅក្នុងក្រុមជាក់លាក់មួយការតំរែតំរង់ពហុវែលបានប្រមូលពត៌មានពីក្រុមដែលទាក់ទងជិតស្និទ្ធជាច្រើន។ ឧទាហរណ៍ស្រមៃមើលការព្យាយាមដើម្បីប៉ាន់ស្មានការគាំទ្រដល់លោកអូបាម៉ាក្នុងចំណោមស្ត្រីនិយាយភាសាអេស្ប៉ាញអាយុចន្លោះពី 18 ឆ្នាំនិង 29 ឆ្នាំដែលជានិស្សិតបញ្ចប់ការសិក្សានៅមហាវិទ្យាល័យដែលបានចុះបញ្ជីគណបក្សប្រជាធិបតេយ្យដែលកំណត់អត្តសញ្ញាណខ្លួនឯងថាជាអ្នកសម្របសម្រួលនិងអ្នកដែលបានបោះឆ្នោតឱ្យលោកអូបាម៉ាក្នុងឆ្នាំ 2008 ។ ក្រុមជាក់លាក់មួយហើយវាអាចទៅរួចដែលថាគ្មាននរណាម្នាក់នៅក្នុងគំរូដែលមានលក្ខណៈទាំងនេះទេ។ ដូច្នេះដើម្បីធ្វើការប៉ាន់ប្រមាណអំពីក្រុមនេះការតំរែតំរង់ពហុវែលប្រើគំរូតាមស្ថិតិដើម្បីរួមបញ្ចូលគ្នានូវការប៉ាន់ស្មានពីមនុស្សនៅក្នុងក្រុមស្រដៀងគ្នា។

ដូច្នេះលោកវ៉ាងនិងសហការីបានប្រើវិធីសាស្រ្តមួយដែលបញ្ចូលការតំរែតំរង់ពហុវែលនិងការវិភាគបន្ទាប់បន្សំដូច្នេះពួកគេបានហៅយុទ្ធសាស្ត្រ ពហុវត្ស របស់ពួកវា ជាមួយការបែងចែកក្រោយ ឬច្រើនថែមទៀត "។ នៅពេលដែលវ៉ាងនិងមិត្តរួមការងាររបស់គាត់ប្រើប៉ភីដើម្បីធ្វើការប៉ាន់ស្មានពីសំណាកគំរូមិនប្រូបាប៊ីលីតេរបស់ XBox ពួកគេបានបង្កើតការប៉ាន់ស្មានយ៉ាងជិតស្និទ្ធទៅនឹងការគាំទ្រជាទូទៅដែលលោកអូបាម៉ាបានទទួលនៅក្នុងការបោះឆ្នោតឆ្នាំ 2012 (រូបភាព 3.8) ។ ការពិតការប៉ាន់ប្រមាណរបស់ពួកគេមានភាពត្រឹមត្រូវជាងការប្រមូលផ្តុំមតិសាធារណៈជាទូទៅ។ ដូច្ន្រះនៅក្នុងករណីន្រះការក្រសម្រួលតាមស្ថិតិ - ជាពិស្រសលោកភី។ - ហាក់ដូចជាធ្វើការងារល្អដើម្របីកែលំអលំអៀងនូវទិន្នន័យមិនទំនង។ ភាពលំអៀងដែលអាចមើលឃើញយ៉ាងច្បាស់នៅពេលអ្នកមើលការប៉ាន់ប្រមាណពីទិន្នន័យរបស់ Xbox ដែលមិនបានកែសម្រួល។

រូបភាពទី 3.8: ការប៉ាន់ប្រមាណពី W. Wang et al ។ (ឆ្នាំ 2015) ។ គំរូ XBox មិនទាន់កែតម្រូវបានបង្កើតការប៉ាន់ស្មានមិនត្រឹមត្រូវ។ ប៉ុន្តែគំរូ XBox ទម្ងន់ដែលបានបង្កើតការប៉ាន់ប្រមាណដែលមានភាពត្រឹមត្រូវជាងការស្ទង់មតិជាមធ្យមនៃការស្ទាបស្ទង់តាមទូរស័ព្ទ។ សម្របខ្លួនពីលោក W. Wang et al ។ (ឆ្នាំ 2015) រូបទី 2 និងទី 3 ។

រូបភាពទី 3.8: ការប៉ាន់ប្រមាណពី W. Wang et al. (2015) ។ គំរូ XBox មិនទាន់កែតម្រូវបានបង្កើតការប៉ាន់ស្មានមិនត្រឹមត្រូវ។ ប៉ុន្តែគំរូ XBox ទម្ងន់ដែលបានបង្កើតការប៉ាន់ប្រមាណដែលមានភាពត្រឹមត្រូវជាងការស្ទង់មតិជាមធ្យមនៃការស្ទាបស្ទង់តាមទូរស័ព្ទ។ សម្របខ្លួនពី W. Wang et al. (2015) រូបទី 2 និងទី 3 ។

មានមេរៀនសំខាន់ពីរពីការសិក្សារបស់វ៉ាងនិងសហការី។ ដំបូងគំរូមិនអាចកែតម្រូវមិនបានកែសម្រួលអាចនាំទៅដល់ការប៉ាន់ស្មានមិនល្អ។ នេះគឺជាមេរៀនដែលអ្នកស្រាវជ្រាវជាច្រើនបានលឺពីមុនមក។ មេរៀនទីពីរទោះជាយ៉ាងណាក៏ដោយគំរូសំណាកដែលមិនអាចធ្វើបាននៅពេលវិភាគបានត្រឹមត្រូវអាចបង្កើតការប៉ាន់ស្មានល្អ។ សំណាកដែលមិនអាចធ្វើទៅបានមិនចាំបាច់នាំទៅរកអ្វីមួយដូចជា fiasco អក្សរសាស្ត្រអក្សរសាស្រ្ត

ទៅមុខប្រសិនបើអ្នកកំពុងព្យាយាមសម្រេចចិត្តដោយប្រើវិធីសាស្រ្តជ្រើសរើសប្រូបាប៊ីលីតេហើយវិធីសាស្រ្តគំរូដែលមិនអាចកើតឡើងបានអ្នកប្រឈមនឹងជម្រើសពិបាក។ ជួនកាលអ្នកស្រាវជ្រាវចង់បានក្បួនរហ័សនិងរឹងមាំ (ឧ។ តែងតែប្រើវិធីសាស្រ្តគំរូប្រូបាប) ប៉ុន្តែវាកាន់តែពិបាកក្នុងការផ្តល់នូវច្បាប់បែបនេះ។ អ្នកស្រាវជ្រាវប្រឈមនឹងជម្រើសដ៏លំបាករវាងវិធីសាស្រ្តជ្រើសរើសប្រូបាប៊ីលីតេក្នុងការអនុវត្ត - ដែលមានតំលៃថ្លៃកាន់តែខ្លាំងឡើងនិងឆ្ងាយពីលទ្ធផលទ្រឹស្តីដែលបង្ហាញពីភាពត្រឹមត្រូវនៃការប្រើប្រាស់និងវិធីសាស្រ្តគំរូដែលមិនមានប្រូបាប៊ីលីតេ - ដែលមានតំលៃថោកនិងលឿនជាងប៉ុន្តែមិនសូវស្គាល់និងផ្លាស់ប្តូរច្រើន។ ទោះជាយ៉ាងណាក៏ដោយរឿងមួយច្បាស់លាស់គឺថាប្រសិនបើអ្នកត្រូវបានគេបង្ខំឱ្យធ្វើការជាមួយគំរូមិនច្បាស់ឬប្រភពទិន្នន័យធំ ៗ ដែលមិនតំណាង (គិតពីជំពូក 2) បន្ទាប់មកមានហេតុផលដ៏រឹងមាំមួយដើម្បីជឿថាការប៉ាន់ប្រមាណធ្វើឡើងដោយប្រើការបែងចែកក្រោយនិង បច្ចេកទេសពាក់ព័ន្ធនឹងមានភាពប្រសើរជាងការប៉ាន់ស្មានឆៅ ៗ ។