Cé gur féidir é a bheith messy, is féidir iarraidh shaibhrithe a bheith cumhachtach.
Tá cur chuige difriúil leis déileáil leis an neamhiomláine sonraí rian digiteach a shaibhriú go díreach agus sonraí ó shuirbhéanna, próiseas a beidh mé glaoch iarraidh saibhrithe. Sampla amháin de iarraidh saibhrithe staidéar ar Burke and Kraut (2014) , a bhfuil cur síos mé níos luaithe sa chaibidil (Alt 3.2), faoi cé acu idirghníomhú ar Facebook méaduithe neart cairdeas. Sa chás sin, Burke agus Kraut éineacht shonraí suirbhé le sonraí logáil Facebook.
An suíomh a bhí Burke agus Kraut ag obair i, áfach, chiallaigh nach raibh ag déileáil le dhá fadhbanna móra a taighdeoirí ag déanamh saibhrithe aghaidh ag iarraidh. Gcéad dul síos, i ndáiríre nascadh le chéile na sraitheanna-a sonraí a phróiseáil ar a dtugtar nasc taifead, meaitseáil na taifid i gceann CCD leis an taifead iomchuí sa chás eile CCD-a bheith deacair agus earráid-seans maith (beidh orainn a fheiceáil sampla de an bhfadhb seo thíos ). Is í an dara fhadhb is mó de iarraidh saibhrithe go mbeidh an caighdeán na rianta digiteach a bheith go minic deacair do thaighdeoirí a mheas. Mar shampla, uaireanta an próiseas trína bhfuil sé bailithe dílseánaigh agus d'fhéadfadh sé a bheith so-ghabhálach i go leor de na fadhbanna a bhfuil cur síos i gCaibidil 2. I bhfocail eile, a bheidh i gceist iarraidh saibhrithe go minic earráid-seans maith nascadh suirbhéanna ar fhoinsí sonraí dubh-bosca de anaithnid cáilíochta. In ainneoin an imní go bhfuil na dhá fhadhb isteach, is féidir, ar bhonn taighde tábhachtach leis an straitéis seo mar a léiríodh ag Stephen Ansolabehere agus Eitan Hersh (2012) ina gcuid taighde ar phatrúin vótála i SAM. Is fiú dul thar an staidéar go mion mar gheall ar go leor de na straitéisí a Ansolabehere agus Hersh fhorbair a bheith úsáideach in iarratais eile iarraidh saibhrithe.
Tá vótálaí slua ina n-ábhar taighde fairsing san eolaíocht pholaitiúil, agus san am atá caite, tuiscint dtaighdeoirí ar a vótaí agus cén fáth go bhfuil sí bunaithe go ginearálta ar an anailís ar shonraí an tsuirbhé. Vótáil i SAM, áfach, ar iompar neamhghnách sa mhéid is go taifid an rialtas an bhfuil a vótáil gach saoránach (ar ndóigh, nach bhfuil an rialtas a thaifeadadh bhfuil gach vótaí saoránach do). Le blianta fada, bhí na taifid vótála rialtais atá ar fáil ar fhoirmeacha páipéir, scaipthe in oifigí rialtais áitiúla éagsúla ar fud na tíre. Seo rinne sé deacair, ach ní dodhéanta, d'eolaithe polaitiúla go mbeadh pictiúr iomlán de na toghthóirí agus a chur i gcomparáid cad a rá le daoine i suirbhéanna faoi vótáil a n-iompar vótála iarbhír (Ansolabehere and Hersh 2012) .
Ach, anois tá na taifid vótála a dhigitiú, agus roinnt cuideachtaí príobháideacha a bailíodh go córasach agus a chumasc leis na taifid vótála a thabhairt ar aird comhaid cuimsitheacha vótála máistir a thaifeadadh an t-iompar de na Meiriceánaigh vótála. Ansolabehere agus Hersh gcomhpháirtíocht le ceann de na cuideachtaí-Catalist CCL-chun úsáid a bhaint as a gcuid comhad vótála mháistir chun cuidiú pictiúr níos fearr ar na toghthóirí a fhorbairt. Thairis sin, mar gheall ar bhraith sé ar thaifid dhigiteacha a bailíodh agus feighlithe ag cuideachta, thairg sé roinnt buntáistí níos mó ná iarrachtaí roimhe ag taighdeoirí a bhí déanta gan chúnamh gcuideachtaí agus ag baint úsáide taifid aschur.
Cosúil le go leor de na foinsí rian digiteach i gCaibidil 2, ní raibh an mháistirchomhad Catalist san áireamh cuid mhaith den eolas déimeagrafach, dearcaidh, agus iompraíochta a Ansolabehere agus Hersh teastáil. Chomh maith leis an t-eolas, Ansolabehere agus Hersh bhí spéis ar leith i gcomparáid le hiompar vótála tuairiscíodh don iompraíocht vótála deimhnithe (ie, an t-eolas sa bhunachar sonraí Catalist). Mar sin, bailíodh na taighdeoirí na sonraí a bhí siad mar chuid den Staidéar Comharchumann Congressional Toghcháin (CCES), suirbhé sóisialta mór. Next, thug na taighdeoirí sonraí seo a Catalist, agus Catalist thug na taighdeoirí ar ais comhad a chumasc sonraí a áireamh iompraíocht vótála deimhnithe (ó Catalist), an t-iompar vótála féintuairiscithe (ó CCES) agus an déimeagrafaic agus dearcadh na bhfreagróirí (ó CCES ). I bhfocail eile, Ansolabehere agus Hersh shaibhriú na sonraí vótála agus sonraí ó shuirbhéanna, agus ar chumas an comhad a chumasc mar thoradh orthu rud éigin go ní comhad ar chumas aonar a dhéanamh.
Trí shaibhriú comhad sonraí Catalist máistir agus sonraí ó shuirbhéanna, tháinig Ansolabehere agus Hersh le trí conclúidí tábhachtacha. Gcéad dul síos, níos mó ná-tuairisciú vótáil rampant: beagnach leath de na neamh-vótálaithe tuairiscíodh vótáil. Nó, tá ar bhealach eile de ag féachaint ar sé má thuairiscigh duine éigin vótála, níl ach seans 80% go vótáil siad i ndáiríre. Dara, ró-tuairisciú Níl randamach; Is ró-tuairisciú níos coitianta i measc ard-ioncaim, dea-oilte, partisans atá i mbun gnóthaí poiblí. I bhfocail eile, is iad na daoine atá is dócha chun vóta a chaitheamh chomh maith is dócha a bheidh faoi vótáil. Sa tríú háit, agus is go criticiúil, mar gheall ar nádúr córasach thar-tuairiscithe, is iad na difríochtaí iarbhír idir vótálaithe agus neamh-vótálaithe níos lú ná láithreoidh siad díreach ó shuirbhéanna. Mar shampla, tá daoine a raibh céim bachelors thart ar 22 pointe céatadáin níos mó seans vótáil a thuairisciú, ach níl ach 10 pointe céatadáin níos mó seans vótáil iarbhír. Thairis sin, tá teoiricí bunaithe ar acmhainní atá ann cheana vótáil i bhfad níos fearr ag tuar a thuairisciú vótáil ná a iarbhír vótaí, fionnachtain eimpíreach bhfuil gá le haghaidh teoiricí nua a thuiscint agus a vótálann thuar.
Ach, cé mhéad ba chóir dúinn muinín na torthaí seo? Cuimhnigh ar na torthaí ag brath ar earráid-seans maith nascadh le sonraí dubh-bhosca le méideanna anaithnid earráide. Go sonrach, na torthaí hinge ar dhá phríomhchéim: 1) an cumas Catalist a chur le chéile go leor foinsí sonraí díchosúla a thabhairt ar aird ar datafile máistir cruinn agus 2) an cumas Catalist leis na sonraí suirbhé a nascadh lena datafile máistir. Gach ceann de na céimeanna seo deacair go leor agus d'fhéadfadh earráidí ag ceachtar céim mar thoradh taighdeoirí na conclúidí mícheart. Mar sin féin, tá sonraí a phróiseáil agus meaitseáil an dá ríthábhachtach do mharthain leanúnach Catalist mar chuideachta ionas gur féidir é acmhainní a infheistiú i réiteach ar na fadhbanna, go minic ar scála nach féidir aon taighdeoir acadúil aonair nó grúpa taighdeoirí mheaitseáil. I léamh níos mó ag deireadh na caibidle, cur síos mé na fadhbanna níos mine agus conas Ansolabehere agus Hersh muinín i gcuid torthaí a thógáil. Cé go bhfuil na sonraí sonracha a ghabhann leis an staidéar seo, beidh ceisteanna cosúil leis na cinn do thaighdeoirí eile ar mian leo nascadh le foinsí sonraí rian digiteach dubh-bhosca.
Cad iad na ceachtanna ginearálta is féidir le taighdeoirí a bhaint as an staidéar seo? Gcéad dul síos, tá luach iontach ó saibhrithe rianta digiteach agus sonraí ó shuirbhéanna. Dara, cé comhiomlánú seo, foinsí sonraí tráchtála Níor cheart go measfaí "fhírinne talamh", i gcásanna áirithe is féidir leo a bheith úsáideach. Go deimhin, is fearr a chur i gcomparáid leis na foinsí sonraí gan Fírinne iomlán (as a mbeidh siad ag titim i gcónaí gearr). Ina ionad sin, tá sé níos fearr chun iad a chur i gcomparáid le foinsí sonraí eile atá ar fáil, a bhfuil i gcónaí earráidí chomh maith.