Kanthi conto non-kemungkinan, bobot awak kebo bisa batalaken distorsi disebabake proses sampling ing wiwit.
Ing cara sing peneliti nimbang respon saka conto kemungkinan, padha uga bisa nimbang respon saka conto non-kemungkinan. Contone, minangka alternatif kanggo ing CPS, mbayangno sing diselehake iklan banner ing ewu situs kanggo nganakake panambahan peserta kanggo survey kanggo ngira tingkat pengangguran. Alamiah, sampeyan bakal mamang sing tegese prasaja saka sampel bakal ngira apik saka tingkat pengangguran. skepticism Panjenengan mbokmenawa amarga sampeyan mikir sing sawetara wong liyane kamungkinan kanggo ngrampungake survey saka liyane. Contone, wong sing ora nglampahi akèh sing wektu ing web sing kurang kamungkinan kanggo ngrampungake survey.
Kita weruh ing bagean pungkasan, Nanging, yen kita ngerti carane sampel kapilih-kita apa karo kemungkinan conto-banjur kita bisa batalaken distorsi disebabake proses sampling. Sayange, nalika nggarap conto non-kemungkinan, aku ora ngerti carane sampel kapilih. Nanging, kita bisa nggawe pemanggih bab proses sampling lan banjur aplikasi nimbang ing cara sing padha. Yen pemanggih iki bener, banjur nimbang bakal batalaken distorsi disebabake proses sampling.
Contone, mbayangno sing nanggepi iklan banner, sampeyan direkrut 100.000 penjawab. Nanging, sampeyan ora pracaya 100.000 penjawab iki sampel acak prasaja saka wong diwasa Amérika. Ing kasunyatan, nalika mbandhingaké penjawab menyang populasi US, sampeyan nemokake sing wong saka sawetara negara (eg, New York) iku liwat-dituduhake lan wong saka sawetara negara (eg, Alaska) ana ing-dituduhake. Mangkono, tingkat pengangguran saka sampel iku kamungkinan dadi ngira ala saka tingkat pengangguran ing populasi target.
Salah siji cara kanggo batalaken distorsi sing kedaden ing proses sampling kanggo nemtokake bobot kanggo saben wong; bobot ngisor kanggo wong saka negara sing liwat-dituduhake ing sampel (eg, New York) lan bobot luwih kanggo wong saka negara sing ing-dituduhake ing sampel (eg, Alaska). More khusus, bobot kanggo saben responden gegandhengan lazim ing sampel relatif kanggo lazim ing populasi US. Prosedur nimbang iki diarani kirim-stratification, lan idea saka ngebotake kudu ngelingake sampeyan tuladha ing bagean 3.4.1 ngendi penjawab saka Rhode Island padha diwenehi kurang bobot saka penjawab saka California. Post-stratification mbutuhake sing ngerti cukup kanggo sijine penjawab menyang kelompok lan ngerti babagan saka populasi target ing saben klompok.
Senajan nimbang saka sampel kemungkinan lan saka sampel non-kemungkinan sing matématis padha (ndeleng sesambungan technical), padha bisa uga ing kahanan sing beda-beda. Yen peneliti wis kemungkinan sampel sampurna (IE, ora kesalahan jangkoan lan ora non-nanggepi), banjur nimbang bakal gawé prakiraan adil kanggo kabeh sipat ing kasus. njamin teori kuwat iki kok penasehat ukum saka conto kemungkinan mau ketemu mangkono atraktif. Ing tangan liyane, nimbang conto non-kemungkinan mung bakal gawé prakiraan adil kanggo kabeh sipat yen propensities nanggepi sing padha kanggo wong-wong ing saben klompok. Ing tembung liyane, mikir bali kanggo conto kita, nggunakake kirim-stratification bakal gawé adil prakiraan yen wong-wong ing New York wis kemungkinan padha Agencies lan wong-wong ing Alaska wis kemungkinan padha Agencies lan ing. Panyangka iki diarani Panyangka podho-nanggepi-propensities-ing-kelompok, lan main peran tombol ing ngerti yen kirim-stratification bisa uga karo conto non-kemungkinan.
Sayange, ing tuladha kita, Panyangka podho-nanggepi-propensities-ing-kelompok jek dipercaya dadi bener. Kang, dadi misale jek dipercaya sing everyone in Alaska wis kemungkinan padha kang ing survey. Nanging, ana telung nilai penting kanggo mbudidaya babagan kirim-stratification, kabeh kang wis koyone liyane janjeni.
First, Panyangka podho-nanggepi-propensities-ing-kelompok dadi luwih mlebu nalar minangka klompok-klompok mundhak. Lan, paneliti ora winates kanggo kelompok mung adhedhasar ukuran geografis siji. Contone, kita bisa nggawe kelompok adhedhasar negara, umur, jinis, lan tingkat pendidikan. Iku misale jek liyane mlebu nalar sing ana propensities nanggepi kabeh podho ing klompok 18-29, lulusan wadon, college manggen ing Alaska saka ing klompok kabeh wong sing manggen ing Alaska. Mangkono, minangka klompok-klompok digunakake kanggo kirim-stratification mundhak, pemanggih needed kanggo ndhukung iku dadi luwih cukup. Given kasunyatan iki, misale jek kaya peneliti bakal pengin nggawe nomer ageng kelompok kanggo kirim-stratification. Nanging, minangka klompok-klompok mundhak, peneliti mbukak menyang masalah beda: sparsity data. Yen ana mung sawetara cilik wong ing saben klompok, banjur prakiran bakal luwih pesthi lan ing cilik nemen ngendi ana grup sing ora penjawab, banjur kirim-stratification rampung ngilangi mudhun. Ana rong cara metu saka tension gawan iki antarane plausibility saka homogeneous- Panyangka nanggepi-propensity-ing-kelompok lan dikarepake kanggo ukuran sampel cukup ing saben klompok. Salah pendekatan iku kanggo pindhah menyang model statistik luwih canggih kanggo ngitung bobot lan liyane kanggo ngumpulake sing luwih gedhe, luwih warna sampel, kang mbantu mesthekake ukuran sampel cukup ing saben klompok. Lan, kadhangkala peneliti nindakake loro-lorone, kaya aku bakal njlèntrèhaké ing liyane rinci ing ngisor.
A wawasan liya nalika digunakake karo post-stratification saka conto non-kemungkinan iku Panyangka podho-nanggepi-propensity-ing-kelompok wis kerep digawe nalika nganalisa conto kemungkinan. Alesan sing mbantah asumsi iki perlu kanggo conto kemungkinan ing laku iku conto kemungkinan duwe non-nanggepi, lan cara sing paling umum kanggo nyetel kanggo non-nanggepi kirim-stratification kaya ing ndhuwur. Mesthi, mung amarga akeh peneliti nggawe Panyangka tartamtu ora ateges kowe kudu banget. Nanging, iku ora ateges sing nalika mbandingaken conto non-kemungkinan kanggo conto kemungkinan ing laku, kita kudu mbudidaya sing loro gumantung pemanggih lan informasi tambahan supaya gawé prakiraan. Ing setelan paling nyata, ana mung ora pendekatan Panyangka-free kanggo kesimpulan.
Akhire, yen sing Care babagan siji prakiran tartamtu ing conto pengangguran kita rate-sampeyan kudu kondisi ora pati roso saka Panyangka podho-nanggepi-propensity-ing-kelompok. Khusus, sampeyan ora perlu kanggo nganggep sing everyone wis respon propensity padha, sampeyan mung kudu nganggep yen ana korélasi nanggepi propensity lan tingkat pengangguran ing saben klompok. Mesthi, malah kondisi ora pati roso iki ora bakal terus ing sawetara kahanan. Contone, mbayangno ngitung babagan Amerika sing nindakake karya volunteer. Yen wong sing nglakoni karya volunteer luwih kamungkinan kanggo setuju kanggo ing survey, banjur peneliti bakal runtut liwat-ngira jumlah lilo tanpo pekso, sanajan padha nindakake pangaturan kirim-stratification, asil sing wis tontonan empirically dening Abraham, Helms, and Presser (2009) .
Nalika aku ngandika sadurungé, conto non-kemungkinan sing viewed karo skepticism gedhe dening ilmuwan sosial, ing sisih amarga perané ing sawetara saka gagal paling wadhi ing dina awal saka riset survey. Conto langit carane adoh kita wis teka karo conto non-kemungkinan punika riset Wei Wang, David Rothschild, Madhuvanti Goel, lan Andrew Gelman sing bener mbalekake kasil saka Pemilu 2012 US nggunakake sampel non-kemungkinan kedhaftar American Xbox -a sampel jelas non-acak Amerika (Wang et al. 2015) . Peneliti direkrut penjawab saka sistem game Xbox, lan sing bisa nyana, sampel Xbox skewed lanang lan skewed enom: 18 - tuwone 29 taun arupi 19% saka electorate nanging 65% saka sampel Xbox lan wong arupi 47% saka electorate lan 93% saka Xbox sampel (Figure 3.4). Amarga iki biases demografi kuwat, data Xbox mentahan ana indikator miskin ngasilake Pemilu. Mbadek kamenangan kuwat kanggo Mitt Romney liwat Barack Obama. Maneh, iki conto liyane saka beboyo saka mentahan, conto non-kemungkinan unadjusted lan iku kaya ing fiasco Literary Digest.
Nanging, Wang lan kolega padha weruh masalah lan nyoba kanggo nimbang penjawab kanggo mbenerake kanggo proses sampling. Ing tartamtu, sing padha digunakake wangun luwih canggih saka post-stratification Dakkandhakake marang kowe kabeh. Iku worth learning dicokot liyane babagan pendekatan sing amarga di bangun roso babagan kirim-stratification, lan versi tartamtu Wang lan kolega digunakake iku salah siji saka cedhak paling macem kanggo conto non-kemungkinan nimbang.
Ing conto prasaja kita ngitung pengangguran ing bagean 3.4.1, kita dipérang populasi menyang kelompok adhedhasar negara panggonan. Ing kontras, Wang lan kolega dipérang populasi menyang menyang 176.256 kelompok ditetepake dening: Jenis Kelamin (2 kategori), lomba (4 kategori), umur (4 kategori), pendidikan (4 kategori), negara (51 kategori), ID party (3 kategori), ideologi (3 kategori) lan 2008 vote (3 kategori). Kanthi kelompok liyane, peneliti ngarep-arep sing bakal saya kamungkinan sing ing saben klompok, nanggepi propensity ana uncorrelated karo support kanggo Obama. Sabanjure, tinimbang mbangun bobot individu-tingkat, kita iya ing conto kita, Wang lan kolega digunakake model Komplek kanggo ngira babagan wong ing saben klompok sing bakal milih Obama. Akhire, padha digabungake prakiraan klompok iki support karo ukuran dikenal saben klompok kanggo gawé tingkat sakabèhé kira saka support. Ing tembung liyane, padha disigar munggah populasi menyang beda kelompok, kira-kira ing support kanggo Obama ing saben klompok, lan banjur njupuk bobot rata-rata saka prakiraan grup kanggo gawé ngira sakabèhé.
Mangkono, ing tantangan amba ing pendekatan sing kanggo ngira support kanggo Obama ing saben 176.256 kelompok. Senajan panel sing klebu 345.858 peserta unik, nomer ageng dening standar polling Pemilu, ana akeh, akeh kelompok sing Wang lan kolega wis meh ora penjawab. Mulane, kanggo ngira support ing saben klompok padha digunakake technique disebut kemunduran multilevel karo post-stratification, kang peneliti affectionately nelpon Pak P. Ateges, kanggo ngira support kanggo Obama ing klompok tartamtu, Mr. P. pools informasi saka akeh rapet kelompok related. Contone, nimbang tantangan ngitung support kanggo Obama antarane wadon, Hispanics, antarane lawas 18-29 taun, sing lulusan College, sing kedhaftar Demokrat, sing poto-ngenali minangka moderates, lan sing milih kanggo Obama ing 2008. Iki iku klompok banget, banget tartamtu, lan mungkin ana sing sapa ing sampel karo ciri iki. Mulane, kanggo nggawe prakiraan babagan grup iki, Mr. P. pools bebarengan prakiraan saka wong ing kelompok banget padha.
Nggunakake strategi analisis iki, Wang lan kolega padha bisa nggunakake Xbox sampel non-kemungkinan kanggo banget rapet ngira support sakabèhé sing Obama ditampa ing Pemilu 2012 (Figure 3.5). Ing kasunyatan prakiraan sing padha luwih akurat saka agrégat saka Jajak Pendapat masyarakat. Mangkono, ing kasus iki, nimbang-khusus Mr. P.-jek apa proyek apik mbeneraké ing biases ing data non-kemungkinan; biases sing katon nalika katon ing prakiraan saka data Xbox unadjusted.
Ana rong piwulang utama saka sinau saka Wang lan kolega. First, unadjusted conto non-kemungkinan bisa mimpin kanggo prakiraan ala; iki wulangan sing akeh peneliti wis krungu sadurunge. Nanging, ing wulangan kapindho iku conto non-kemungkinan, nalika bobot mlaku, bisa bener gawé prakiraan cukup apik. Ing kasunyatan, prakiraan sing padha luwih akurat saka prakiraan saka pollster.com, lan pengumpulan luwih Jajak Pendapat Pemilu tradisional.
Akhire, ana watesan penting kanggo apa kita bisa sinau saka siji sinau tartamtu. Mung amarga kirim-stratification makarya uga ing kasus tartamtu, ana ora njamin sing bakal bisa uga ing kasus liyane. Ing kasunyatan, pemilihan sing mbok menawa siji saka setelan paling gampang amarga pollsters wis sinau pemilu kanggo meh 100 taun, ana saran biasa (kita bisa ndeleng sing menang pemilu), lan identifikasi party lan ciri demografi relatif prediktif pamungutan swara. Ing jalur iki, kita lack teori ngalangi lan pengalaman empiris ngerti nalika pangukuran pangaturan kanggo conto non-kemungkinan bakal gawé prakiraan cekap akurat. Siji bab sing cetha, Nanging, yen sampeyan dipeksa kanggo bisa karo conto non-kemungkinan, banjur ana alesan kuwat kanggo pracaya prakiraan diatur bakal luwih saka prakiraan non-diatur.