Le samplaí nach dóchúlacht, is féidir meáchain Cealaigh saobhadh de bharr an phróisis samplála Glactar.
Ar an mbealach céanna go bhfuil taighdeoirí meáchain freagraí ó shamplaí dóchúlachta, is féidir leo meáchan freisin freagraí ó shamplaí nach dóchúlacht. Mar shampla, mar mhalairt ar an CPS, a shamhlú gur chuir tú banner ads ar na mílte de láithreáin ghréasáin rannpháirtithe a earcú le haghaidh suirbhé chun meastachán ráta dífhostaíochta. Ar ndóigh, go mbeadh tú a bheith skeptical go mbeadh an meán simplí ar do sampla bheith meastachán maith ar an ráta dífhostaíochta. Tá do amhras dócha mar a cheapann tú go bhfuil roinnt daoine níos mó seans ann a chur i gcrích do shuirbhé ná a chéile. Mar shampla, tá daoine nach bhfuil a chaitheamh go leor ama ar an ngréasán níos lú seans ann a chur i gcrích do suirbhé.
Mar a chonaic muid sa chuid seo caite, mar sin féin, má tá a fhios againn conas roghnaíodh-mar an sampla a dhéanaimid le dóchúlacht samplaí-ansin is féidir linn a saobhadh de bharr an phróisis samplála Cealaigh. Ar an drochuair, iad ag obair le samplaí nach dóchúlacht, níl a fhios againn conas a roghnaíodh an sampla. Ach, is féidir linn a boinn tuisceana maidir leis an bpróiseas samplála a dhéanamh agus a chur i bhfeidhm ualú ar an mbealach céanna. Má tá na boinn tuisceana i gceart, ansin beidh an t-ualú Cealaigh an saobhadh de bharr an phróisis samplála.
Mar shampla, a shamhlú go mar fhreagra ar do banner ads, earcaíodh tú 100,000 freagróirí. Mar sin féin, ní gá duit a chreidiúint, go bhfuil na 100,000 freagróir sampla randamach simplí de dhaoine fásta Mheiriceá. Go deimhin, nuair a tá tú i gcomparáid le do thug freagra ar an daonra SAM, a fhaigheann tú go bhfuil daoine ó roinnt stát (m.sh., Nua-Eabhrac) ró-ionadaíocht agus gur féidir le daoine ó roinnt stát (m.sh., Alaska) atá faoi ghannionadaíocht. Dá bhrí sin, is dócha go mbeidh meastachán droch an ráta dífhostaíochta sa spriocdhaonra an ráta dífhostaíochta ar do sampla.
Is bealach amháin chun Cealaigh an saobhadh a tharla sa phróiseas samplála a meáchain do gach duine a shannadh; meáchain ísle do dhaoine ó stáit a bhfuil ró-ionadaíocht sa sampla (m.sh., Nua-Eabhrac) agus meáchain níos airde do dhaoine ó stáit a bhfuil dóthain ionadaíochta sa sampla (m.sh., Alaska). Go sonrach, tá an meáchan le gach freagróir a bhaineann lena leitheadúlacht i do sampla i gcoibhneas lena leitheadúlacht sa daonra na Stát Aontaithe. Tá an nós imeachta ar a dtugtar ualú iar-srathú, agus ba chóir an smaoineamh a mheá i gcuimhne duit ar an sampla i Roinn 3.4.1 áit ar tugadh fhreagróirí ó Oileán Rhode meáchan níos lú ná freagróirí ó California. Éilíonn Iar-srathú go bhfuil a fhios agat go leor chun a chur ar do fhreagróirí ina ngrúpaí agus a fhios ag an cion den spriocdhaonra i ngach grúpa.
Cé go bhfuil ualú na sampla dóchúlacht agus an sampla neamh-dóchúlacht an mathematically céanna (féach aguisín teicniúil), oibríonn siad go maith i suímh éagsúla. Má tá an taighdeoir sampla dóchúlacht foirfe (is é sin, aon earráid chlúdach agus ní neamhfhreagartha), ansin beidh ualú meastacháin neamhchlaonta do gach tréithe i ngach cás. Tá an ráthaíocht teoiriciúil láidir cén fáth a fhaigheann abhcóidí ar shamplaí dóchúlachta acu tarraingteach sin. Ar an láimh eile, beidh ualú samplaí neamh-dóchúlacht tháirgeadh ach meastacháin neamhchlaonta do gach tréithe má tá na propensities freagartha an gcéanna do gach duine i ngach grúpa. I bhfocail eile, ag smaoineamh siar ar an sampla, ag baint úsáide as iar-srathú a meastacháin neamhchlaonta má tá gach duine i Nua-Eabhrac ar an dóchúlacht chéanna rannpháirteach agus tá gach duine i Alaska an dóchúlacht chéanna rannpháirteach agus mar sin de. Tá an toimhde a dtugtar an toimhde aonchineálach-freagairt-propensities-taobh istigh-ghrúpaí, agus tá ról lárnach ag a fhios agam más rud é go mbeidh iar-srathú ag obair go maith le samplaí nach dóchúlacht.
Ar an drochuair, inár shampla, is cosúil leis an toimhde aonchineálach-freagairt-propensities-laistigh-ghrúpaí ní dócha go mbeidh fíor. Is é sin, is cosúil nach dócha go bhfuil gach duine in Alaska an dóchúlacht chéanna a bheith i do shuirbhé. Ach, tá trí phointe tábhachtach a choinneáil i gcuimhne mar gheall ar iar-srathú, gach ceann acu a dhéanamh dealraíonn sé níos mó gealladh fúthu.
Gcéad dul síos, thiocfaidh chun bheith aonchineálach freagairt-propensities-laistigh-ghrúpaí toimhde níos sochreidte mar a mhéadaíonn líon na ngrúpaí. Agus, ní taighdeoirí teoranta do ghrúpaí ach bunaithe ar gné geografach amháin. Mar shampla, d'fhéadfadh muid grúpaí a chruthú bunaithe ar stáit, aois, gnéas, agus leibhéal oideachais. Dealraíonn sé níos sochreidte go bhfuil propensities freagartha aonchineálach laistigh den ghrúpa de 18-29, céimithe ban, coláiste ina gcónaí i Alasca ná laistigh den ghrúpa de na daoine atá ina gcónaí i Alaska. Dá bhrí sin, mar líon na ngrúpaí a úsáidtear le haghaidh méaduithe iar-srathú, na toimhdí is gá chun tacaíocht a thabhairt dó a bheith níos réasúnta. Mar gheall ar an bhfíric, dealraíonn sé cosúil go mbeadh taighdeoirí ag iarraidh a chruthú le líon mór de ghrúpaí haghaidh iar-srathú. Ach, mar a mhéadaíonn líon na ngrúpaí, á reáchtáil taighdeoirí isteach difriúil fadhb: sparsity sonraí. Muna bhfuil ach líon beag daoine i ngach grúpa, ansin beidh na meastacháin a bheith níos éiginnte, agus i gcás mhór sa chás go bhfuil grúpa nach bhfuil aon freagróirí, sosanna ansin iar-srathú hiomlán síos. Tá dhá bhealach amach as an teannas gné dhílis idir bailíocht na homogeneous- toimhde freagartha-claonadh laistigh-ghrúpaí-agus an t-éileamh méid na samplaí réasúnta i ngach grúpa. Cur chuige amháin chun bogadh go dtí múnla staitistiúil níos sofaisticiúla do meáchain a ríomh agus an ceann eile a bhailiú níos mó, sampla níos éagsúla, rud a chabhraíonn a chinntiú samplamhéideanna réasúnta i ngach grúpa. Agus, uaireanta a dhéanamh thaighdeoirí, mar beidh mé cur síos go mion thíos.
Tá an dara bhreithniú agus iad ag obair le iar-srathú ó shamplaí neamh-dóchúlacht go bhfuil an toimhde aonchineálach-freagairt-claonadh laistigh-ghrúpaí-cheana go minic déanta nuair a anailísiú shamplaí dóchúlachta. Is é an chúis go bhfuil an toimhde ag teastáil le haghaidh shamplaí dóchúlachta i gcleachtas go bhfuil shamplaí dóchúlachta neamhfhreagartha, agus is é an modh is coitianta chun coigeartú do neamhfhreagartha iar-srathú mar a mhínítear thuas. Ar ndóigh, ach mar a dhéanann go leor taighdeoirí nach bhfuil toimhde áirithe a rá gur chóir duit é a dhéanamh chomh maith. Ach, chiallaíonn sé go nuair a chur i gcomparáid samplaí nach dóchúlacht le shamplaí dóchúlachta i gcleachtas, ní mór dúinn a choinneáil i gcuimhne go bhfuil an dá i muinín toimhdí agus faisnéis cúnta chun meastacháin tháirgeadh. I suíomhanna is réadúla, níl aon chur chuige toimhde-saor in aisce a thátal níl ach.
Mar fhocal scoir, má tá tú cúram faoi amháin meastachán go háirithe-in ár mar shampla dífhostaíocht ráta-ansin is gá duit choinníoll níos laige ná mar aonchineálach-freagairt-claonadh-taobh istigh-ghrúpaí toimhde. Go sonrach, ní gá duit a glacadh leis go bhfuil gach duine an claonadh freagartha céanna, is gá duit ach a glacadh leis nach bhfuil aon comhghaol idir claonadh freagartha agus ráta dífhostaíochta laistigh de gach grúpa. Ar ndóigh, ní bheidh fiú an coinníoll níos laige shealbhú i roinnt cásanna. Mar shampla, a shamhlú meastachán a dhéanamh ar líon na Meiriceánaigh a bhfuil obair dheonach. Má tá daoine a dhéanann obair dheonach níos mó seans chun aontú a bheith i suirbhé, ansin taighdeoirí beidh rianúil thar-meastachán ar an méid obair dheonach, fiú amháin má dhéanann siad coigeartuithe iar-srathú, de bharr go bhfuil sé léirithe empirically ag Abraham, Helms, and Presser (2009) .
Mar a dúirt mé níos luaithe, samplaí nach dóchúlacht Féachtar le amhras mór ag eolaithe sóisialta, i bpáirt mar gheall ar a ról i gcuid de na teipeanna is embarrassing i laethanta tosaigh an taighde suirbhé. Is sampla soiléir cé chomh fada agus atá déanta againn le samplaí nach dóchúlacht an taighde Wei Wang, David Rothschild, Sharad Goel, agus Andrew Gelman a aisghabháil i gceart ar thoradh an Poist toghcháin 2012 trí shampla neamh-dóchúlacht na n-úsáideoirí American Xbox -a sampla decidedly neamh-randamach de Meiriceánaigh (Wang et al. 2015) . Na taighdeoirí earcaithe freagróirí ón gcóras cearrbhachais Xbox, agus mar a d'fhéadfá a bheith ag súil, sceabhach an sampla Xbox fireann agus sceabhach óg: 18-29 bliana d'aois a dhéanamh suas 19% de na toghthóirí, ach 65% den sampla Xbox agus fir a dhéanamh suas 47% na dtoghthóirí agus 93% den sampla Xbox (Figiúr 3.4). Mar gheall ar na nósanna imeachta chun laofachtaí láidre déimeagrafacha, ba é an Xbox sonraí amha táscaire droch tuairisceáin toghcháin. thuar sé bua láidir le Mitt Romney thar Barack Obama. Arís, tá sé seo sampla eile de na contúirtí a bhaineann amh, samplaí neamh-dóchúlacht neamhchoigeartaithe agus tá sé reminiscent an fiasco Liteartha Achoimre.
Mar sin féin, bhí Wang agus comhghleacaithe ar an eolas faoi na fadhbanna seo agus iarracht a meáchan na freagróirí a cheartú don phróiseas samplála. Go háirithe, bhain siad úsáid as foirm níos sofaisticiúla ar an iar-srathú Dúirt mé leat faoi. Is fiú foghlaim le beagán níos mó mar gheall ar a gcur chuige toisc gcuireann sé intuition faoi iar-srathú, agus is é an leagan áirithe Wang agus comhghleacaithe a úsáidtear ar cheann de na cineálacha cur chuige is spreagúla samplaí nach dóchúlacht ualú.
In ár sampla simplí faoi dífhostaíocht mheas i Roinn 3.4.1, roinnte againn ar an daonra i ngrúpaí bunaithe ar staid cónaithe. I gcodarsnacht leis sin, Wang agus comhghleacaithe roinneadh an daonra ina ina 176,256 ghrúpa arna sainiú ag: inscne (2 chatagóir), cine (4 chatagóir), aois (4 chatagóir), oideachas (4 chatagóir), stáit (51 catagóirí), ID páirtí (3 catagóirí), idé-eolaíocht (3 chatagóir) agus 2008 vóta (3 chatagóir). Le grúpaí níos mó, ag súil na taighdeoirí go mbeadh sé níos dóichí go laistigh de gach grúpa, bhí claonadh freagartha uncorrelated le tacaíocht a thabhairt do Obama. Next, seachas a thógáil meáchain aonair-leibhéal, mar a rinne muid inár shampla, Wang agus comhghleacaithe a úsáidtear samhail casta a mheas ar líon na ndaoine i ngach grúpa a bheadh vótáil ar son Obama. Ar deireadh, in éineacht siad na meastacháin grúpa tacaíochta leis an méid ar a dtugtar de gach grúpa a thabhairt ar aird leibhéal foriomlán measta tacaíochta. I bhfocail eile, mionghearrtha siad suas an daonra i ngrúpaí difriúla, mheas an tacaíocht a thabhairt do Obama i ngach grúpa, agus ansin ghlac an meán ualaithe na meastacháin ghrúpa meastachán foriomlán.
Dá bhrí sin, is é an dúshlán mór i gcur chuige chun meastachán ar an tacaíocht do Obama i ngach ceann de na 176,256 ngrúpaí. Cé áireamh a bpainéal 345,858 rannpháirtí ar leith, líon mór ag na caighdeáin na vótaíochta toghcháin, bhí go leor, go leor grúpaí a Wang agus comhghleacaithe a bhí beagnach aon fhreagróir. Dá bhrí sin, chun meastachán a dhéanamh ar an tacaíocht i ngach grúpa úsáid siad teicníc ar a dtugtar aischéimniú multilevel le iar-srathú, ina mbeidh taighdeoirí glaoch affectionately tUasal P. Go bunúsach, chun meastachán a tacaíocht a thabhairt do Obama laistigh de ghrúpa ar leith, faisnéis linnte P. ó go leor dlúth le grúpaí gaolmhara. Mar shampla, mheas an dúshlán a bhaineann le meastachán a dhéanamh ar thacaíocht do Obama i measc na Hispanics baineann,, idir 18-29 bliain d'aois, atá ina céimithe coláiste, atá Daonlathach cláraithe, a féin-aithint mar moderates, agus a vótáladh i gcóir Obama in 2008. Is grúpa an-, an-sonrach, agus is féidir go bhfuil aon duine sa sampla leis na saintréithe sin. Dá bhrí sin, meastacháin faoin ghrúpa seo a dhéanamh, linnte P. meastacháin chéile ó dhaoine i ngrúpaí an-chosúil.
Ag baint úsáide as an straitéis anailís, Wang agus comhghleacaithe bhí siad in ann a bhaint as an Xbox sampla neamh-dóchúlacht a mheas an-dlúth leis an tacaíocht fhoriomlán a fuair Obama sa toghchán 2012 (Figiúr 3.5). Go deimhin bhí a gcuid meastacháin níos cruinne ná comhiomlán pobalbhreitheanna poiblí. Dá bhrí sin, sa chás seo, ualú-sonrach tUasal P.-is cosúil a dhéanamh post maith a cheartú na nósanna imeachta chun laofachtaí i sonraí neamh-dóchúlacht; nósanna imeachta chun laofachtaí atá le feiceáil nuair a fhéachann tú ar na meastacháin ó na sonraí Xbox neamhchoigeartaithe.
Tá dhá phríomh ceachtanna ó staidéar na Wang agus comhghleacaithe. Gcéad dul síos, is féidir neamhchoigeartaithe samplaí neamh-dóchúlacht thoradh meastacháin dona; tá sé seo le ceacht go bhfuil go leor taighdeoirí éisteacht a fháil sula. Mar sin féin, is é an dara ceacht go shamplaí nach dóchúlacht, nuair ualaithe i gceart is féidir, a tháirgeadh i ndáiríre meastacháin maith go leor. Go deimhin, bhí a gcuid meastacháin níos cruinne ná na meastacháin ó pollster.com, comhiomlánú níos pobalbhreith toghcháin traidisiúnta.
Ar deireadh, tá teorainneacha tábhachtacha leis an méid is féidir linn a fhoghlaim as an staidéar sonrach amháin. Díreach mar d'oibrigh iar-srathú maith sa chás áirithe, níl aon ráthaíocht go mbeidh sé ag obair go maith i gcásanna eile. Go deimhin, tá toghcháin b'fhéidir ar cheann de na suíomhanna is éasca toisc go bhfuil pollsters ag déanamh staidéir toghcháin ar feadh beagnach 100 bliain, tá aiseolas rialta (is féidir linn a fheiceáil a Bhuaigh an toghcháin), agus a aithint páirtí agus tá tréithe déimeagrafacha sách thuarthach na vótála. Ag an bpointe seo, nach bhfuil muid teoiric soladach agus taithí eimpíreach go mbeadh a fhios nuair a bheidh coigeartuithe ualú samplaí neamh-dóchúlacht tháirgeadh meastacháin sách cruinn. , Áfach Rud amháin atá soiléir, má tá tú i iallach a bheith ag obair le samplaí nach dóchúlacht, ansin go bhfuil cúis láidir aige chun a chreidiúint go mbeidh meastacháin choigeartaithe bheith níos fearr ná meastacháin nach coigeartaithe.