Le neo-sampaill coltachd, cuideaman urrainn undo char adhbharachadh le bheachd samplachaidh phròiseas.
Anns an aon dòigh a-rannsachaidh cuideam freagairtean bho coltachd shampaill, faodaidh iad cuideachd cuideam freagairtean bho neo-sampaill coltachd. Mar eisimpleir, mar eadar-dhealaichte gus an CPS, Smaoinich gu bheil thu a 'bhratach a chur sanasan air na mìltean de làraichean-lìn a thàladh a com-pàirtichean airson suirbhidh air tuairmse a dhèanamh air ìre cion-cosnaidh. Gu Nàdarrach, bhiodh tu a 'chreids gur sìmplidh cuibheas de shampall agad biodh tuairmse mhath a dhèanamh de chion-cosnaidh. Do dh'aindheoin cheistean-dearbhaidh a tha 's dòcha a chionn thu a' smaoineachadh gu bheil cuid de dhaoine nas buailtiche a lìonadh a-steach suirbhidh do na feadhainn eile. Mar eisimpleir, daoine aig nach eil a 'cur seachad tòrr ùine air an eadar-lìon cho buailteach a lìonadh agad suirbhidh.
Mar a chunnaic sinn ann an earrann mu dheireadh, ge-tà, ma tha fios againn ciamar a tha an sampall a thaghadh mar-sinn a 'dèanamh le coltachd-sampaill an uair sin faodaidh sinn undo char adhbharachadh leis an samplachadh phròiseas. Gu mì-fhortanach, nuair a bhios ag obair còmhla ri neo-sampaill coltachd, chan eil fhios againn ciamar a tha an sampall a thaghadh. Ach, 's urrainn dhuinn a dhèanamh barailean mu samplachaidh pròiseas agus an uair sin a' buntainn cothromachd anns an aon dòigh. Ma tha na barailean a tha ceart, an uair sin an cuideam a bhios a 'char undo adhbharachadh leis an samplachadh phròiseas.
Mar eisimpleir, smaoineachadh gur ann gus freagairt air do bhratach sanasan, tha thu fhastadh 100,000 luchd-freagairt. Ge-tà, nach eil thu 'creidsinn gu bheil na 100,000 luchd-freagairt shìmplidh air thuaiream sampall de Ameireaganach inbhich. Gu dearbh, nuair a bhios tu coimeas a dhèanamh do luchd-fhreagairt gu na SA sluagh, lorg thu gu bheil daoine bho cuid de stàitean (me, New York) Tha còrr is riochdachadh agus gu bheil daoine bho cuid de stàitean (me, Alasga) Tha fo-riochdaichte. Mar sin, tha ìre cion-cosnaidh de shampall agad e coltach gum bi droch tuairmse de chion-cosnaidh ann an targaid sluaigh.
Aon dòigh air a 'undo Distortion a thachair ann an samplachadh pròiseas a shònrachadh cuideaman do gach neach; na b 'ìsle cuideaman ri daoine bho na stàitean a tha thar-riochdachadh ann am ball-sampaill (me, New York) agus nas àirde cuideaman ri daoine bho na stàitean a tha fo-riochdachadh ann am ball-sampaill (me, Alasga). Tuilleadh sònraichte, an cuideam airson gach neach-freagairt a tha co-cheangailte ri an cuid cho pailt ann do ball-sampaill an coimeas ri an cuid cho pailt ann an àireamh-sluaigh nan Stàitean Aonaichte. Seo cuideam modh-obrach ris an canar dreuchd-stratification, agus an smuain de 'cothromachadh a bu chòir cuimhne thu an eisimpleir ann an Earrann 3.4.1 far a bheil luchd-freagairt bho Rhode Island Fhuair cuideam nas lugha na luchd-freagairt bho California. Post-stratification ag iarraidh gum bi fios agad gu leòr a chur air luchd-freagairt a-steach do bhuidhnean agus gus fios a 'chuibhreann de na targaid sluagh anns gach buidheann.
Ged a tha an cuideam ann an coltachd agus ball-sampaill an neo-coltachd shampall tha an aon mhatamataigeach (faic Pàipear-taice teicnigeach), tha iad ag obair gu math ann an diofar shuidheachaidhean. Ma tha an neach-rannsachaidh aig a bheil coltachd foirfe shampall (ie, nach eil craoladh mearachd agus nach eil neo-freagairt), an uair sin bidh cuideam neo-thaobhach a 'dèanamh tuairmsean airson a h-uile traits anns gach cùis. Làidir seo teòiridheach barantas carson a tha luchd-tagraidh coltachd sampaill a lorg iad cho tarraingeach. Air an làimh eile, cuideam neo-coltachd sampaill bidh a-mhàin a 'dèanamh tuairmsean neo-thaobhach airson a h-uile traits ma tha freagairt propensities tha na h-aon do gach neach anns gach buidheann. Ann am briathran eile, a 'smaoineachadh air ais gu ar n-eisimpleir, a' cleachdadh post-stratification Cruthaichidh neo-thaobhach ma tha tuairmsean a h-uile duine ann an New York aig an aon de coltachd a 'gabhail pàirt agus a h-uile duine ann an Alasga aig a bheil an aon de coltachd a' gabhail pàirt agus mar sin air adhart. Tha seo nas coltaiche buileach nuair a ghairm an homogeneous-fhreagairt-propensities-taobh a-staigh buidhnean-bharail, agus e a 'cluich pàirt chudromach ann a fios ma post-stratification bhios ag obair gu math le neo-sampaill coltachd.
Gu mì-fhortanach, ann ar n-eisimpleir, an homogeneous-fhreagairt-propensities-taobh a-staigh buidhnean-Barail eu-coltach a bhith fìor. Is e sin, tha e eu-coltach gun h-uile duine ann an Alasga aig a bheil an aon coltachd a bhith agad ann an suirbhidh. Ach, tha trì puingean cudthromach a chumail ann an inntinn mu dheidhinn dreuchd-stratification, a h-uile coltas a tha ga dhèanamh nas gealltanach.
A 'chiad, homogeneous-fhreagairt-propensities-taobh a-staigh buidhnean-bharail a' fàs nas dh'amannan mar an àireamh de bhuidhnean ag àrdachadh. Agus, chan eil luchd-rannsachaidh cuingealaichte ri buidhnean stèidhichte air dìreach aon taobh cruinn-eòlasach. Mar eisimpleir, b 'urrainn dhuinn a chruthachadh buidhnean stèidhichte air staid, aois, gnè, agus ìre foghlaim. Tha e coltach tuilleadh dh'amannan gu bheil homogeneous propensities freagairt taobh a-staigh a 'bhuidhinn 18-29, boireann, luchd-ceumnachaidh colaiste a' fuireach ann an Alasga seach taobh a-staigh a h-uile buidheann de dhaoine a 'fuireach ann an Alasga. Mar sin, mar an àireamh de bhuidhnean a chleachdadh airson post-stratification àrdachadh, tha na barailean a tha a dhìth gus taic a chumail ris a 'fàs nas reusanta. Leis seo dearbh, tha e coltach mar a bhiodh luchd-rannsachaidh ag iarraidh a chruthachadh àireamh mhòr de bhuidhnean airson dreuchd-stratification. Ach, mar an àireamh de bhuidhnean àrdachadh, luchd-rannsachaidh a 'ruith a-steach dhan eadar-dhealaichte duilgheadas: dàta gainnead. Ma tha, chan eil ach àireamh bheag de dhaoine anns gach buidheann, agus an uair sin na tuairmsean bidh barrachd neo-chinnteach, agus ann an fhìor chùis far a bheil a 'bhuidheann aig nach eil luchd-freagairt, an uair sin dreuchd-stratification tur briseadh sìos. Tha dà dhòigh a-mach à seo shocair eadar plausibility de homogeneous--freagairt propensity-taobh a-staigh buidhnean-Barail agus an t-iarrtas airson reusanta sampallan beaga anns gach buidheann. Aon dòigh-obrach a tha airson gluasad nas ionnsaichte staitistigeil mhodail airson obrachadh a-mach an cuideam agus na eile a tha a chruinneachadh nas motha, nas eadar-mheasgte shampall, a 'cuideachadh le bhith dèanamh cinnteach gu reusanta sampallan beaga anns gach buidheann. Agus, uaireannan rannsachaidh a dhèanamh an dà chuid, mar a tha mi a 'mìneachadh nas mionaidiche gu h-ìosal.
Chaidh an dàrna beachdachadh nuair a tha ag obair le post-stratification bho neo-sampaill coltachd gu bheil homogeneous-fhreagairt-propensity-taobh a-staigh buidhnean-bharail a tha mar-thà nuair a tric a 'dèanamh mion-sgrùdadh sampaill coltachd. An t-adhbhar gu bheil seo nas coltaiche buileach nuair a tha a dhìth airson coltachd sampaill ann an cleachdadh gu bheil coltachd a tha sampaill neo-freagairt, agus an dòigh as cumanta airson mion-atharrachadh airson neo-freagairt a tha an dreuchd-stratification mar a chaidh a mhìneachadh gu h-àrd. Gu dearbh, dìreach a chionn mòran rannsachaidh a dhèanamh air cuid de bharail nach eil a 'ciallachadh gum bu chòir dhut a dhèanamh cuideachd. Ach, tha ea 'ciallachadh nuair a' dèanamh coimeas eadar coltachd neo-sampaill gus coltachd sampaill ann chleachdadh, feumaidh sinn cuimhneachadh gu bheil an dà chuid an crochadh air barail agus luchd-cuideachaidh am fiosrachadh ann an òrdugh a thoirt gu buil tuairmsean. Sa mhòr chuid de shuidheachaidhean fìor, tha dìreach nach eil barail-asgaidh dòigh-obrach gus inference.
Mu dheireadh, ma tha fo ur cùram mu dheidhinn aon tuairmeas gu h-àraidh ann an ar-eisimpleir ìre cion-cosnaidh-uair sin feumaidh tu an staid nas laige na homogeneous-fhreagairt-propensity-taobh a-staigh buidhnean-bharail. Gu sònraichte, cha leig thu leas a bhith den bheachd gun robh h-uile duine aig a bheil an aon fhreagairt propensity, tha thu a-mhàin a dh'fheumas a bhith den bheachd nach eil co-dhàimh eadar freagairt propensity agus ìre cion-cosnaidh taobh a-staigh gach buidheann. Gu dearbh, fiù 's nas laige seo staid cha chumail ann an cuid de shuidheachaidhean. Mar eisimpleir, smaoinich air tuairmse a dhèanamh air a 'chuibhreann de Ameirigeanaich a' dèanamh obair saor-thoileach. Ma tha daoine a 'dèanamh gu saor-thoileach an obair a tha nas buailtiche a bhith ag aontachadh a bhith ann an suirbhidh, an uair sin rannsachaidh a-eagarachail thar-tuairmse a dhèanamh air an t-suim de shaor-thoileach, fiù' s ma tha iad a 'dèanamh for-stratification atharrachaidhean mar thoradh air a bhith air a dhearbhadh empirically le Abraham, Helms, and Presser (2009) .
Mar a thuirt mi na bu tràithe, neo-coltachd sampaill thathar a 'faicinn le mòr dh'aindheoin cheistean-dearbhaidh le luchd-saidheans sòisealta, ann am pàirt air sgàth an àite ann an cuid de na mhaslaidh fàilligidhean sna làithean tràtha de suirbhidh rannsachadh. A soilleir eisimpleir de cho fada 'sa tha sinn air tighinn còmhla neo-coltachd sampaill a tha a' rannsachadh Wei Wang, Daibhidh Rothschild, Sharad Goel, agus Anndra Gelman sin ceart ais toradh an 2012 US taghadh cleachdadh neo-coltachd sampall de Ameireaganach Xbox luchd-cleachdaidh -a decidedly neo-thuaiream sampall de dh'Ameireaganaich (Wang et al. 2015) . Tha luchd-rannsachaidh air am fastadh luchd-fhreagairt bho na Xbox gaming siostam, agus mar a shaoileadh tu, an Xbox shampall skewed fireann agus skewed òga: 18 - 29 bliadhna a dh'aois a 'dèanamh suas 19% den luchd-bhòtaidh ach 65% de na Xbox shampall agus fir a' dèanamh suas 47% den luchd-bhòtaidh agus 93% den t-sampall Xbox (Figear 3.4). Air sgàth sin làidir deamografach biases, amh Xbox dàta bha bochd comharra taghaidh tilleadh. Tha e an dùil làidir buaidh Mitt Romney thairis air Barack Obama. A-rithist, tha seo na eisimpleir eile de na cunnartan amh, unadjusted neo-sampaill coltachd agus tha e coltach ris an Literary chnàmh Fiasco.
Ach, Wang agus co-oibrichean a bha mothachail air na duilgheadasan sin agus a 'feuchainn ri cuideam an luchd-fhreagairt ceartachadh airson an samplachadh phròiseas. Gu sònraichte, tha iad a 'cleachdadh nas ionnsaichte cruth na dreuchd-stratification dh'innis mi dhut mu dheidhinn. 'S fhiach beagan ionnsachadh barrachd mun dòigh-obrach oir tha e a' togail Intuition mu dheidhinn dreuchd-stratification, agus gu h-àraidh dreach Wang agus co-oibrichean a chleachdadh 'S e aon de na dòighean as inntinniche airson cuideam neo-sampaill coltachd.
Ann an ar sìmplidh mar eisimpleir mu tuairmse cion-cosnaidh ann an Earrann 3.4.1, tha sinn a 'roinn an t-sluaigh a-steach buidhnean a tha stèidhichte air staid còmhnaidh. Ann an coimeas ri seo, Wang agus co-oibrichean air a roinn an t-sluaigh a-steach a-steach 176.256 buidhnean a mhìneachadh le: gnè (2 roinnean-seòrsa), cinneadh (4 roinnean-seòrsa), aois (4 roinnean-seòrsa), foghlam (4 roinnean-seòrsa), stàit (51 roinnean-seòrsa), pàrtaidh a 'Chlàir (3 roinnean-seòrsa), follaiseach (3 roinnean) is 2008 bhòt (3 roinnean). Le barrachd bhuidhnean, an luchd-rannsachaidh an dòchas gum biodh e a 'sìor fhàs coltach gun taobh a-staigh gach buidheann, freagairt propensity bha uncorrelated le taic do Obama. An ath-, seach a bhith a 'togail fa leth-ìre cuideaman, mar a rinn sinn ann ar n-eisimpleir, Wang agus co-oibrichean a' cleachdadh modail iom-fhillte gus tuairmse a 'chuibhreann de dhaoine anns gach buidheann a bhiodh a' bhòtadh airson Obama. Mu dheireadh, seo buidheann iad còmhla tuairmsean de thaic ris an canar meud gach buidheann a thoirt gu buil gu h-iomlan timcheall ìre de thaic. Ann am briathran eile, tha iad a 'gearradh suas an t-sluaigh a-steach buidhnean eadar-dhealaichte, a' meas an taic airson Obama anns gach buidheann, agus an uair sin ghabh fhiodhan fo chudrom cuibheasachd na buidhne tuairmsean a thoirt gu buil gu h-iomlan an tuairmse.
Mar sin, an dùbhlan mòr ann an dòigh-obrach a tha air tuairmse a dhèanamh air an taic airson Obama anns gach aon de na buidhnean 176.256. Ged aca pannal gabhail a-steach com-pàirtichean 345.858 sònraichte, àireamh mhòr le na h-ìrean taghaidh bhòtaidh, bha mòran, mòran bhuidhnean airson a Wang agus co-oibrichean a bha cha mhòr nach eil an luchd-fhreagairt. Uime sin, gus tuairmse a dhèanamh air taic anns gach buidheann iad a 'cleachdadh dòigh-obrach ris an canar multilevel regression le post-stratification, a luchd-rannsachaidh gràdhach ghairm Mr P. Gu bunaiteach, gus tuairmse a dhèanamh air taic do Obama taobh a-staigh buidheann sònraichte, Mr P. amaran fiosrachadh bho iomadh dlùth buidhnean co-cheangailte. Mar eisimpleir, a 'beachdachadh air an dùbhlan a' toirt tuairmse na taic do Obama am measg bhoireannach, Hispanics, eadar 18-29 bliadhna a dh'aois, a tha a 'cholaiste luchd ceumnachaidh, a tha clàraichte Dheamocratach, a tha a' fèin-aithneachadh mar Modarataich, agus a bhòt airson Obama ann an 2008. Tha seo a ' 'S e fìor bhuidheann sònraichte, agus tha e coltach nach eil duine san t-sampall le na feartan sin. Uime sin, tha tuairmsean a dhèanamh mu dheidhinn a 'bhuidheann seo, Mr P. amaran còmhla thuairmse bho dhaoine ann glè choltach buidhnean.
A 'cleachdadh mion-sgrùdadh air ro-innleachd seo, Wang agus co-oibrichean a bha comasach air a chleachdadh an Xbox neo-coltachd shampall gu math dlùth tuairmse na h-iomlan taic a fhuair Obama ann an taghadh 2012 (Figear 3.5). Gu dearbh bha aca tuairmsean nas neo-mhearachdaiche seach oigreachdan poblach cunntasan bheachd. Mar sin, sa chùis seo, cothromachd-sònraichte Mr P.-rèir coltais a 'dèanamh obair mhath a' ceartachadh an biases ann an neo-coltachd dàta; biases a tha follaiseach nuair a sheallas tu air an tuairmsean bho unadjusted Xbox dàta.
Tha dà phrìomh leasain bho sgrùdadh Wang agus co-oibrichean. A 'chiad, unadjusted neo-coltachd sampaill a dh'fhaodas droch tuairmsean; 'S e seo an leasan gu bheil mòran luchd-rannsachaidh air a chluinntinn roimhe. Ach, an dara leasan gu bheil neo-sampaill coltachd, nuair sìos gu ceart, 's urrainn dha-rìribh a' dèanamh math tuairmsean. Gu dearbh, bha aca tuairmsean nas neo-mhearachdaiche na na tuairmsean bho pollster.com, an cruinneachadh de nas traidiseanta taghadh cunntasan-bheachd.
Mu dheireadh, tha cudromach bacadh air dè as urrainn dhuinn ionnsachadh bho seo aon cuspair sgrùdaidh shònraichte. Dìreach air sgàth dreuchd-stratification ag obair gu math sa chùis shònraichte seo, chan eil cinnt sam bith ann gun obraich e gu math ann an suidheachaidhean eile. Gu dearbh, tha taghaidhean a tha 's dòcha aon de na suidheachaidhean as fhasa oir pollsters air a bhith a' dèanamh taghaidhean airson cha mhòr 100 bliadhna, tha beachd gu cunbhalach (chì sinn cò bhuannaicheas taghaidhean), agus am pàrtaidh a 'comharrachadh agus deamografach na feartan a tha an ìre mhath predictive bhòtaidh. Aig an àm seo, tha sinn gann de cruaidh teòiridh agus deuchainneach eòlas a-mach cuin Weighting atharrachaidhean gu neo-sampaill coltachd a 'cruthachadh gu leòr ceart tuairmsean. Aon rud a tha soilleir, ge-tà, ma tha thu a 'fheudar a bhith ag obair le neo-coltachd shampaill, agus an uair sin tha adhbhar làidir a' creidsinn gu bheil atharrachadh tuairmsean a bhios nas fheàrr na neo-ath-chòireachadh tuairmsean.