កំណត់ត្រាគណិតវិទ្យា

នៅក្នុងឧបទ្វីបនេះខ្ញុំនឹងរៀបរាប់ពីគំនិតខ្លះៗពីជំពូកនេះក្នុងសំណុំបែបបទគណិតវិទ្យាបន្តិចបន្តួច។ គោលបំណងនៅទីនេះគឺដើម្បីជួយអ្នកឱ្យមានសុភមង្គលជាមួយក្រដាសកំណត់និងក្របខ័ណ្ឌគណិតវិទ្យាដែលត្រូវបានប្រើដោយក្រុមអ្នកស្រាវជ្រាវការស្ទង់មតិដើម្បីឱ្យអ្នកអាចផ្លាស់ប្តូរសម្ភារៈបច្ចេកទេសមួយចំនួនដែលបានសរសេរនៅលើប្រធានបទទាំងនេះ។ ខ្ញុំនឹងចាប់ផ្តើមដោយណែនាំគំរូប្រូបាប៊ីលីតេ, បន្ទាប់មកផ្លាស់ទីទៅគំរូប្រូបាប៊ីលីតេជាមួយ nonresponse និងទីបំផុតគំរូមិន probability ។

គំរូប្រូបាប

ក្នុងនាមជាឧទាហរណ៏មួយដែលកំពុងរត់, សូមពិចារណាគោលដៅនៃការប៉ាន់ប្រមាណអត្រាគ្មានការងារធ្វើនៅក្នុងសហរដ្ឋអាមេរិក។ អនុញ្ញាត \(U = \{1, \ldots, k, \ldots, N\}\) ជាចំនួនគោលដៅនិងអនុញ្ញាត \(y_k\) ដោយតម្លៃនៃអថេរលទ្ធផលសម្រាប់មនុស្ស \(k\) ។ ក្នុងឧទាហរណ៍នេះ \(y_k\) គឺថាតើមនុស្ស \(k\) គ្មានការងារធ្វើ។ ទីបំផុតសូមឱ្យ \(F = \{1, \ldots, k, \ldots, N\}\) ជាប្រភាគស៊ុមដែលសម្រាប់ជាប្រយោជន៍ភាពសាមញ្ញត្រូវបានគេសន្មតថាដូចគ្នានឹងចំនួនប្រជាជនគោលដៅ។

ការរៀបចំសំណាកជាគំរូគឺជាគំរូចៃដន្យសាមញ្ញដោយមិនចាំបាច់ជំនួស។ ក្នុងករណីនេះមនុស្សម្នាក់ៗទំនងជាត្រូវបានបញ្ចូលក្នុងគំរូ \(s = \{1, \ldots, i, \ldots, n\}\) ។ នៅពេលដែលទិន្នន័យត្រូវបានប្រមូលជាមួយការរចនាគំរូនេះក្រុមអ្នកស្រាវជ្រាវអាចប៉ាន់ប្រមាណអត្រាគ្មានការងារធ្វើរបស់ប្រជាជនជាមួយនឹងមធ្យមគំរូ:

\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]

ដែលជាកន្លែងដែល \(\bar{y}\) គឺជាអត្រាអ្នកអត់ការងារធ្វើក្នុងចំនួនប្រជាជននិង \(\hat{\bar{y}}\) ជាការប៉ាន់ប្រមាណនៃអត្រាគ្មានការងារធ្វើនេះ ( \(\hat{ }\) គឺជាទូទៅ បានប្រើដើម្បីបង្ហាញការប៉ាន់ស្មានមួយ) ។

តាមការពិតអ្នកស្រាវជ្រាវកម្រប្រើគំរូចៃដន្យសាមញ្ញដោយមិនចាំបាច់ជំនួស។ សម្រាប់ហេតុផលផ្សេងៗគ្នា (មួយក្នុងចំណោមអ្វីដែលខ្ញុំនឹងរៀបរាប់ក្នុងពេលតែមួយ) អ្នកស្រាវជ្រាវតែងតែបង្កើតគំរូដែលមានភាពមិនស្មើគ្នានៃការបញ្ចូល។ ឧទាហរណ៍អ្នកស្រាវជ្រាវអាចជ្រើសរើសមនុស្សនៅរដ្ឋផ្លរីដាជាមួយនឹងការចូលរួមខ្ពស់ជាងមនុស្សនៅកាលីហ្វ័រនីញ៉ា។ ក្នុងករណីនេះមធ្យោបាយគំរូ (ឧ 3.1) អាចមិនជាការប៉ាន់ប្រមាណល្អ។ ផ្ទុយទៅវិញនៅពេលមានការប៉ាន់ស្មានមិនស្មើគ្នានៃការដាក់បញ្ចូលអ្នកស្រាវជ្រាវប្រើ

\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]

ដែលជាកន្លែងដែល \(\hat{\bar{y}}\) ជាការប៉ាន់ប្រមាណនៃអត្រាគ្មានការងារធ្វើនិង \(\pi_i\) គឺជាមនុស្ស \(i\) 's បានប្រូបាប៊ីលីតេនៃការដាក់បញ្ចូល។ បន្ទាប់ពីអនុវត្តតាមស្តង់ដារខ្ញុំនឹងហៅការប៉ាន់ស្មានក្នុង eq ។ 3.2 ការប៉ាន់ស្មានរបស់ Horvitz-Thompson ។ ការប៉ាន់ប្រមាណរបស់ Horvitz-Thompson គឺមានប្រយោជន៍ខ្លាំងណាស់ព្រោះវានាំទៅរកការប៉ាន់ស្មានមិនលំអៀងចំពោះការរៀបចំសំណាកគំរូណាមួយ (Horvitz and Thompson 1952) ។ ដោយសារតែការប៉ាន់ស្មាន Horvitz-Thompson មកជាញឹកញាប់ដូច្នេះវាជាការមានប្រយោជន៍ក្នុងការកត់សម្គាល់ថាវាអាចត្រូវបានសរសេរឡើងវិញ

\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]

ដែល \(w_i = 1 / \pi_i\) ។ ក្នុងនាមជាអេកូ។ 3.3 បានបង្ហាញថាការប៉ាន់ស្មានរបស់ Horvitz-Thompson គឺជាមធ្យោបាយគំរូដែលមានទម្ងន់ដែលទាក់ទងទៅនឹងប្រូបាប៊ីលីតេនៃការជ្រើសរើស។ និយាយម៉្យាងទៀតមនុស្សតិចតួចបំផុតត្រូវបានបញ្ចូលក្នុងគំរូ, ទម្ងន់កាន់តែច្រើនដែលមនុស្សគួរតែទទួលបាននៅក្នុងការប៉ាន់ប្រមាណ។

ដូចដែលបានរៀបរាប់ខាងលើក្រុមអ្នកស្រាវជ្រាវជារឿយៗធ្វើតេស្តទៅលើមនុស្សដែលមានភាពមិនស្មើគ្នានៃការបញ្ចូល។ ឧទាហរណ៍មួយនៃការរចនាដែលអាចនាំឱ្យមានការសន្និដ្ឋានមិនសមស្របក្នុងការដាក់បញ្ចូលគឺ ការជ្រើសរើសគំរូ stratified ដែលជាការសំខាន់ក្នុងការយល់ព្រោះវាជាប់ទាក់ទងយ៉ាងជិតស្និទ្ធទៅនឹងនីតិវិធីប៉ាន់ស្មានដែលគេហៅថា stratification ក្រោយ ។ នៅក្នុងគំរូ stratified អ្នកស្រាវជ្រាវបានបែងចែកប្រជាជនគោលដៅទៅជា \(H\) ផ្តាច់មុខនិងហត់នឿយទៅវិញទៅមក។ ក្រុមទាំងនេះត្រូវបានគេហៅថា strata និងត្រូវបានចង្អុលបង្ហាញជា \(U_1, \ldots, U_h, \ldots, U_H\) ។ នៅក្នុងឧទាហរណ៍នេះស្រទាប់គឺជារដ្ឋ។ ទំហំនៃក្រុមត្រូវបានបង្ហាញជា \(N_1, \ldots, N_h, \ldots, N_H\) ។ អ្នកស្រាវជ្រាវម្នាក់អាចចង់ប្រើគំរូគំរូដើម្បីធ្វើឱ្យប្រាកដថាគាត់មានមនុស្សគ្រប់គ្រាន់ក្នុងរដ្ឋនីមួយៗដើម្បីធ្វើការប៉ាន់ប្រមាណថ្នាក់រដ្ឋអំពីភាពអត់ការងារធ្វើ។

នៅពេលដែលចំនួនប្រជាជនត្រូវបានគេបំបែកទៅជា ស្រទាប់ , សន្មតថាអ្នកស្រាវជ្រាវជ្រើសរើសគំរូចៃដន្យសាមញ្ញមួយដោយមិនមានការជំនួសទំហំ \(n_h\) ដោយឯករាជ្យពីថ្នាក់នីមួយៗ។ លើសពីនេះទៀតសន្មតថាគ្រប់គ្នាដែលបានជ្រើសរើសនៅក្នុងគំរូនឹងក្លាយជាអ្នកឆ្លើយតប (ខ្ញុំនឹងដោះស្រាយការមិនឆ្លើយតបនៅក្នុងផ្នែកបន្ទាប់) ។ ក្នុងករណីនេះប្រូបាប៊ីលីតេនៃការដាក់បញ្ចូលគឺ

\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]

ដោយសារប្រូបាប៊ីនាត្រទាំងនេះអាចប្រែប្រួលពីមនុស្សម្នាក់ទៅមនុស្សនៅពេលធ្វើការប៉ាន់ស្មានពីការរចនាគំរូនេះក្រុមអ្នកស្រាវជ្រាវត្រូវវាស់ទម្ងន់លើអ្នកឆ្លើយសំណួរដោយច្រាសនៃប្រូបាប៊ីលីតេរបស់វាដោយប្រើការប៉ាន់ស្មាន Horvitz-Thompson (ឧ។ 3.2) ។

ថ្វីបើអ្នកប៉ាន់ស្មានរបស់ Horvitz-Thompson មិនលំអៀងក៏ដោយអ្នកស្រាវជ្រាវអាចបង្កើតការប៉ាន់ប្រមាណដែលមានភាពសុក្រិតជាងមុន (ឧ។ ទាបជាងការវាស់វែង) ដោយការផ្សំគំរូជាមួយ ព័ត៌មានជំនួយ ។ មនុស្សមួយចំនួនយល់ថាវាគួរឱ្យភ្ញាក់ផ្អើលដែលនេះគឺជាការពិតនៅពេលដែលមានការប៉ាន់ស្មានប្រូបាប៊ីលីតេ។ បច្ចេកទេសទាំងនេះដោយប្រើព័ត៌មានជំនួយគឺមានសារៈសំខាន់ជាពិសេសព្រោះដូចដែលខ្ញុំនឹងបង្ហាញនៅពេលក្រោយពត៌មានជំនួយគឺមានសារៈសំខាន់សម្រាប់ការប៉ាន់ស្មានពីគំរូប្រូបាប៊ីលីតេដែលមិនឆ្លើយតបនិងពីគំរូដែលមិនមានប្រូបាប៊ីលីតេ។

បច្ចេកទេសទូទៅមួយសម្រាប់ប្រើប្រាស់ព័ត៌មានជំនួយគឺជា ការបែងចែកក្រោយ ។ ជាឧទាហរណ៍សូមស្រមៃគិតថាអ្នកស្រាវជ្រាវម្នាក់ដឹងចំនួនបុរសនិងស្ដ្រីនៅក្នុងរដ្ឋនីមួយៗក្នុងចំណោម 50 រដ្ឋ។ យើងអាចបញ្ជាក់ទំហំក្រុមទាំងនេះជា \(N_1, N_2, \ldots, N_{100}\) ។ ដើម្បីបញ្ចូលព័ត៌មានជំនួយនេះជាមួយគំរូគំរូអ្នកស្រាវជ្រាវអាចបំបែកគំរូទៅជា \(H\) ក្រុម (ក្នុងករណីនេះ 100) បង្កើតការប៉ាន់ស្មានសម្រាប់ក្រុមនីមួយៗហើយបន្ទាប់មកបង្កើតមធ្យមទម្ងន់នៃក្រុមទាំងនេះមានន័យថា:

\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]

ប្រហែល, ការប៉ាន់ស្មានក្នុងអេកូ។ 3.5 ទំនងជាមានភាពត្រឹមត្រូវជាងមុនព្រោះវាប្រើព័ត៌មានប្រជាជនដែលស្គាល់ - \(N_h\) មធ្យោបាយមួយដើម្បីគិតអំពីវាគឺថាការបែងចែកក្រោយគឺដូចជាការប៉ាន់ស្មានការធ្វើ stratification បន្ទាប់ពីទិន្នន័យត្រូវបានប្រមូលរួចហើយ។

ជាសរុបទៅផ្នែកនេះបានពិពណ៌នាអំពីគំរូគំរូមួយចំនួន: គំរូចៃដន្យសាមញ្ញដោយគ្មានការជំនួសការជ្រើសរើសគំរូដែលមានភាពមិនស្មើគ្នានិងការបែងចែកគំរូ។ វាក៏បានពណ៌នាអំពីគំនិតសំខាន់ពីរអំពីការប៉ាន់ស្មាន: ការប៉ាន់ស្មាន Horvitz-Thompson និងការបែងចែកក្រោយ។ ចំពោះនិយមន័យជាផ្លូវការបន្ថែមទៀតនៃការរៀបចំសំណាកគំរូប្រូបាបអាចមើលជំពូកទី 2 នៃ Särndal, Swensson, and Wretman (2003) ។ ចំពោះការព្យាបាលជាផ្លូវការនិងពេញលេញនៃគំរូ stratified សូមមើលផ្នែកទី 3.7 នៃ Särndal, Swensson, and Wretman (2003) ។ ចំពោះការពិពណ៌នាបច្ចេកទេសអំពីលក្ខណៈសម្បត្តិនៃការប៉ាន់ស្មាន Horvitz-Thompson សូមមើល Horvitz and Thompson (1952) Overton and Stehman (1995) ឬផ្នែក 2.8 នៃ @ sarndal_model_2003 ។ ចំពោះការព្យាបាលជាផ្លូវការបន្ថែមទៀតនៃការធ្វើ stratification បន្ទាប់មកសូមមើល Holt and Smith (1979) , Smith (1991) , Little (1993) ឬផ្នែកទី 7,6 នៃ Särndal, Swensson, and Wretman (2003)

ប្រូបាប៊ីលីតេប្រូបាប៊ីលីតេជាមួយនឹងចម្លើយដែលមិនឆ្លើយតប

ស្ទង់មតិពិតប្រាកដស្ទើរតែទាំងអស់មានចម្លើយដែលមិនឆ្លើយតប។ នោះគឺមិនមែនគ្រប់គ្នានៅក្នុងប្រជាជនគំរូបានឆ្លើយគ្រប់សំណួរ។ មានចម្លើយដែលមិនឆ្លើយតបចំនួនពីរប្រភេទគឺៈ មិនឆ្លើយតប និង ចម្លើយដែលមិនឆ្លើយតប ។ ក្នុងចម្លើយដែលមិនឆ្លើយតបសំនួរមួយចំនួនមិនឆ្លើយតបនឹងធាតុមួយចំនួន (ឧ។ ជួនកាលអ្នកឆ្លើយឆ្លងព័ត៌មានមិនចង់ឆ្លើយសំណួរដែលពួកគេគិតថាមានលក្ខណៈរសើប) ។ នៅក្នុងការឆ្លើយតបឯកតាមនុស្សខ្លះដែលត្រូវបានជ្រើសរើសសម្រាប់ប្រជាជនគំរូមិនឆ្លើយតបទៅនឹងការស្ទង់មតិទាល់តែសោះ។ មូលហេតុពីរដែលសាមញ្ញបំផុតចំពោះការមិនឆ្លើយតបរបស់អង្គភាពគឺថាមនុស្សគំរូមិនអាចទាក់ទងបានទេហើយអ្នកស្នើសុំត្រូវបានទាក់ទងប៉ុន្តែបដិសេធមិនចូលរួម។ នៅក្នុងផ្នែកនេះខ្ញុំនឹងផ្តោតទៅលើការឆ្លើយតបរបស់អង្គភាព។ អ្នកអានដែលមានចំណាប់អារម្មណ៍លើធាតុដែលមិនឆ្លើយតបនឹងឃើញ Little និង Rubin (2002)

អ្នកស្រាវជ្រាវជារឿយៗគិតអំពីការស្ទង់មតិជាមួយនឹងការមិនឆ្លើយតបរបស់ក្រុមដែលជាដំណើរការគំរូពីរដំណាក់កាល។ នៅក្នុងដំណាក់កាលដំបូងនេះក្រុមអ្នកស្រាវជ្រាវបានជ្រើសរើសសំណាកគំរូ \(s\) ដូចដែលមនុស្សម្នាក់មានប្រូបាប៊ីលីតេនៃការដាក់បញ្ចូលជា \(\pi_i\) (ដែលជាកន្លែងដែល \(0 < \pi_i \leq 1\) ) ។ បន្ទាប់មកនៅដំណាក់កាលទី 2 មនុស្សដែលត្រូវបានជ្រើសរើសនៅក្នុងសំណាកគំរូឆ្លើយតបនឹងប្រូបាប៊ីលីតេ \(\phi_i\) (ដែល \(0 < \phi_i \leq 1\) ) ។ ដំណើរការពីរដំណាក់កាលនេះជាលទ្ធផលនៃអ្នកឆ្លើយឆ្លងព័ត៌មានចុងក្រោយបំផុត \(r\) ។ ភាពខុសគ្នាដ៏សំខាន់រវាងដំណាក់កាលទាំងពីរនេះគឺថាអ្នកស្រាវជ្រាវត្រួតពិនិត្យលើដំណើរការនៃការជ្រើសរើសគំរូប៉ុន្តែពួកគេមិនត្រួតត្រាលើមនុស្សគំរូទាំងនោះដែលបានក្លាយទៅជាអ្នកឆ្លើយតប។ ការដាក់ដំណើរការទាំងពីរនេះរួមគ្នាប្រូបាប៊ីលីតេដែលនរណាម្នាក់នឹងក្លាយជាអ្នកឆ្លើយតប

\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]

សម្រាប់ជាប្រយោជន៍នៃភាពសាមញ្ញខ្ញុំនឹងពិចារណាករណីដែលការរចនាគំរូដើមគឺគំរូចៃដន្យសាមញ្ញដោយគ្មានការជំនួស។ ប្រសិនបើអ្នកស្រាវជ្រាវជ្រើសយកគំរូនៃទំហំ \(n_s\) ដែលផ្តល់ចម្លើយដល់អ្នកឆ្លើយឆ្លង \(n_r\)

\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]

ដែលជាកន្លែងដែល \(cor(\phi, y)\) គឺការជាប់ទាក់ទងចំនួនប្រជាជនរវាងទំនោរការឆ្លើយតបនិងលទ្ធផល (ឧទាហរណ៍, ស្ថានភាពអត្រាគ្មានការងារធ្វើ), \(S(y)\) ត្រូវបានប្រជាជនដែលគម្លាតគំរូនៃលទ្ធផល (ឧទាហរណ៍, អត្រាគ្មានការងារធ្វើ ស្ថានភាព), \(S(\phi)\) គឺចំនួនប្រជាជនគម្លាតគំរូនៃទំនោរការឆ្លើយតបនិង \(\bar{\phi}\) គឺចំនួនប្រជាជនដែលមានន័យថាទំនោរជាការឆ្លើយតប (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4)

Eq ។ 3.7 បង្ហាញថាការមិនឆ្លើយតបនឹងមិនផ្តល់នូវភាពលំអៀងប្រសិនបើមានល័ក្ខខ័ណ្ឌដូចខាងក្រោម:

  • គ្មានភាពប្រែប្រួលក្នុងស្ថានភាពគ្មានការងារធ្វើទេ \((S(y) = 0)\)
  • មិនមានបំរែបំរួលក្នុងការឆ្លើយតបទ្រឹស្តី \((S(\phi) = 0)\)
  • មិនមានទំនាក់ទំនងរវាងទំនោរឆ្លើយតបនិងស្ថានភាពគ្មានការងារធ្វើទេ \((cor(\phi, y) = 0)\)

ជាអកុសលគ្មានលក្ខខណ្ឌទាំងនេះទេ។ វាហាក់ដូចជាមិនគួរអោយជឿថានឹងគ្មានការប្រែប្រួលនៅក្នុងស្ថានភាពការងារឬថានឹងគ្មានការប្រែប្រួលនៅក្នុងទំនោរឆ្លើយតបទេ។ ដូច្នះពាក្យគន្លឹះក្នុង eq ។ 3.7 គឺជាទំនាក់ទំនង: \(cor(\phi, y)\) ។ ជាឧទាហរណ៍ប្រសិនបើមនុស្សដែលគ្មានការងារធ្វើទំនងជាឆ្លើយតបនោះអត្រាការងារដែលប៉ាន់ស្មាននឹងមានភាពលំអៀង។

ល្បិចដើម្បីធ្វើការប៉ាន់ប្រមាណនៅពេលមានចម្លើយដែលមិនឆ្លើយតបគឺត្រូវប្រើព័ត៌មានជំនួយ។ ឧទាហរណ៍វិធីមួយដែលអ្នកអាចប្រើព័ត៌មានជំនួយគឺការបែងចែកក្រោយ (រំលឹកពីអេកូ 3.5 ពីខាងលើ) ។ វាប្រែថាភាពលំអៀងនៃការប៉ាន់ស្មានក្រោយការធ្វើ stratification គឺ:

\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]

ដែលជាកន្លែងដែល \(cor(\phi, y)^{(h)}\) , \(S(y)^{(h)}\) , \(S(\phi)^{(h)}\) , និង \(\bar{\phi}^{(h)}\) ត្រូវបានកំណត់ដូចខាងលើប៉ុន្តែបានដាក់កម្រិតដល់មនុស្សនៅក្នុងក្រុម \(h\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) ។ ដូច្នេះការលំអៀងជាទូទៅនឹងមានតិចតួចបើសិនជាភាពលំអៀងនៅក្នុងក្រុមបន្ទាប់បន្សំគឺតូច។ មានពីរវិធីដែលខ្ញុំចូលចិត្តគិតអំពីការធ្វើឱ្យលំអៀងតូចនៅក្នុងក្រុមក្រោយការបែងចែកគ្នា។ ដំបូងអ្នកចង់ព្យាយាមបង្កើតក្រុមដូចគ្នាដែលមានការប្រែប្រួលតិចតួចនៅក្នុងទំនោរឆ្លើយតប ( \(S(\phi)^{(h)} \approx 0\) ) និងលទ្ធផល ( \(S(y)^{(h)} \approx 0\) ) ។ ទីពីរអ្នកចង់បង្កើតជាក្រុមដែលមនុស្សដែលអ្នកឃើញគឺដូចមនុស្សដែលអ្នកមើលមិនឃើញ \(cor(\phi, y)^{(h)} \approx 0\) ) ។ ប្រៀបធៀប eq ។ 3.7 និងអេកូ។ 3.8 ជួយបញ្ជាក់នៅពេលការច្នៃប្រឌិតក្រោយអាចកាត់បន្ថយភាពលម្អៀងដែលបណ្តាលមកពីការមិនឆ្លើយតប។

ជាចុងបញ្ចប់ផ្នែកនេះបានផ្តល់គំរូសម្រាប់ការជ្រើសរើសយកប្រូប៉ាប៊ីលីតេជាមួយនឹងការមិនឆ្លើយតបហើយបានបង្ហាញពីភាពលំអៀងដែលថាចម្លើយដែលមិនឆ្លើយតបអាចបង្ហាញទាំងដោយមិនចាំបាច់និងដោយការកែតម្រូវក្រោយការបែងចែក។ Bethlehem (1988) ផ្តល់នូវភាពលំអៀងនៃភាពលំអៀងដែលបណ្តាលមកពីការមិនឆ្លើយតបចំពោះការរចនាគំរូជាទូទៅ។ សម្រាប់ព័ត៌មានបន្ថែមអំពីការប្រើ stratification ក្រោយសម្រាលដើម្បីលៃតម្រូវការមិនឆ្លើយតបសូមមើល Smith (1991) និង Gelman and Carlin (2002) ។ ការបោសសំអាតក្រោយគឺជាផ្នែកមួយនៃបច្ចេកទេសគ្រួសារទូទៅដែលហៅថាការប៉ាន់ស្មានការវាស់ស្ទង់មើល Zhang (2000) សម្រាប់ការព្យាបាលដែលមានប្រវែងអត្ថបទនិង Särndal and Lundström (2005) សម្រាប់ការព្យាបាលរយៈពេលវែង។ សម្រាប់ព័ត៌មានបន្ថែមអំពីវិធីសាស្ត្រទំងន់ដទៃទៀតសម្រាប់ការកែតម្រូវនូវចម្លើយដែលមិនឆ្លើយតបសូមមើល Kalton and Flores-Cervantes (2003) Brick (2013) និង Särndal and Lundström (2005)

គំរូមិនទំនង

គំរូមិនទំនងរួមបញ្ចូលទាំងការរចនាខុសៗគ្នាជាច្រើន (Baker et al. 2013) ។ ដោយផ្តោតជាពិសេសលើគំរូអ្នកប្រើប្រាស់របស់ Xbox ដោយវ៉ាងនិងសហការី (W. Wang et al. 2015) អ្នកអាចគិតពីប្រភេទគំរូនេះជាផ្នែកមួយនៃផ្នែកគំរូនៃការជ្រើសរើសគំរូមិនមែន \(\pi_i\) ( ការប៉ាន់ស្មានរបស់អ្នកស្រាវជ្រាវដែលត្រូវបានគេដាក់បញ្ចូល) ប៉ុន្តែ \(\phi_i\) (ទំនោរឆ្លើយតបឆ្លើយតបដែលត្រូវបានឆ្លើយតប) ។ ជាធម្មតាវាមិនល្អទេព្រោះ \(\phi_i\) មិនស្គាល់។ ប៉ុន្តែខណៈដែលលោកវ៉ាងនិងមិត្តរួមការងារបានបង្ហាញថាប្រភេទនៃការជ្រើសរើសយកគំរូនេះសូម្បីតែពីស៊ុមគំរូដែលមានកំហុសគ្របដណ្ដប់យ៉ាងធំធេងក៏មិនចាំបាច់មានគ្រោះមហន្តរាយដែរប្រសិនបើអ្នកស្រាវជ្រាវមានព័ត៌មានជំនួយល្អនិងគំរូស្ថិតិល្អដើម្បីដោះស្រាយបញ្ហាទាំងនេះ។

Bethlehem (2010) ពង្រីកការដកចេញជាច្រើននៃការបែងចែកក្រោយដើម្បី stratification ដើម្បីរួមបញ្ចូលទាំងការមិនឆ្លើយតបនិងកំហុសការពារ។ បន្ថែមលើការបែងចែកក្រោយបច្ចេកទេសផ្សេងទៀតសម្រាប់ធ្វើការជាមួយសំណាកដែលមិនមានប្រូបាប៊ីលីតេនិងសំណាកប្រូបាបដែលមានកំហុសគ្របដណ្តប់និងមិនឆ្លើយតប - រួមមានការផ្គូផ្គងគំរូ (Ansolabehere and Rivers 2013; ??? ) , ទម្ងន់ទំនាញពិន្ទុ (Lee 2006; Schonlau et al. 2009) និងការក្រិតតាមខ្នាត (Lee and Valliant 2009) ។ ប្រធានបទមួយក្នុងចំណោមបច្ចេកទេសទាំងនេះគឺការប្រើប្រាស់ព័ត៌មានជំនួយ។