Tha an earrann seo air a dhealbh gus a bhith air a chleachdadh mar iomradh, seach a bhith a 'leughadh mar narrative.
Tha mòran de na cuspairean anns a 'chaibideil seo cuideachd air a bhith air feadh nam bruachan ann o chionn ghoirid a' Chinn-suidhe seòlaidhean aig an Ameireaganach Comann Beachd a 'Phobaill Rannsachaidh (AAPOR), leithid Dillman (2002) , Newport (2011) , Santos (2014) , agus Link (2015) .
Airson tuilleadh cùl-fhiosrachadh eachdraidheil mu leasachadh suirbhidh rannsachadh, faic Smith (1976) agus Converse (1987) . Airson tuilleadh air an smuain nan trì amannan air suirbhidh rannsachadh, faic Groves (2011) agus Dillman, Smyth, and Christian (2008) (a 'briseadh suas nan trì amannan beagan eadar-dhealaichte).
A 'bheinn taobh a-staigh a' ghluasad bhon a 'chiad don dàrna linn ann an suirbhidh rannsachadh Groves and Kahn (1979) , a tha a' dèanamh mionaideach ceann-ri-ceann coimeas eadar aghaidh-ri-aghaidh agus suirbhidh fòn. Brick and Tucker (2007) coimhead air ais air an leasachadh eachdraidheil de thuaiream figear dialing samplachaidh dhòighean.
Airson tuilleadh mar suirbhidh rannsachadh air atharrachadh san àm a dh'fhalbh gus freagairt air atharrachaidhean ann an comann-sòisealta, chì Tourangeau (2004) , Mitofsky (1989) , agus Couper (2011) .
Ag ionnsachadh mu na stàitean taobh a-staigh le bhith a 'faighneachd cheistean a dh'fhaodas a bhith na dhuilgheadas oir uaireannan an luchd-fhreagairt fhèin chan eil iad mothachail air an taobh a-staigh na stàitean. Mar eisimpleir, Nisbett and Wilson (1977) tha mìorbhaileach pàipear le drùidhteach tiotal: "Telling còrr is urrainn dhuinn fios: Verbal aithisgean air pròiseasan inntinneil." Anns a 'phàipear na h-ùghdaran co-dhùnadh: "cuspairean a tha uaireannan (a) mothachail air an bith de bhrosnachadh gun cudromaiche buaidh a fhreagairt, (b) mothachail air an robh an fhreagairt, agus (c) mothachail gu bheil a 'bhrosnachadh a thug buaidh air freagairt. "
Airson argamaidean gun rannsachaidh bu chòir fheàrr leibh fa'near an giùlan gus aithris giùlan no seasamh dhaoine, fhaicinn Baumeister, Vohs, and Funder (2007) (sìc-eòlas) agus Jerolmack and Khan (2014) agus na freagairtean (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (soiseòlas). An diofar eadar a bhith ag iarraidh agus ag amharc cuideachd dh'èireas ann an eaconamachd, far a bheil luchd-rannsachaidh a 'bruidhinn mu dheidhinn a ràdh agus sheall roghainnean. Mar eisimpleir, rannsaiche dh'fhaodadh luchd-freagairt co-dhiù a tha iad ag ithe fhearr reòiteag no a 'dol a gym (roghainnean a ràdh) no a' rannsachadh a b 'urrainn faicinn dè cho tric daoine ag ithe reòiteagan agus a dhol dhan gym (follais roghainnean). Tha domhainn dh'aindheoin cheistean-dearbhaidh de sheòrsaichean àraid de dh ràdh roghainnean dàta ann an eaconamachd (Hausman 2012) .
Tha prìomh chuspair bho na deasbadan a tha sin giùlan chan eil e daonnan ceart. Ach, gu fèin-obrachail a chlàradh giùlan dòcha nach bi e ceart, chan fhaodar a chruinneachadh air sampall de ùidh, is dòcha nach bi e ruigsinneach do luchd-rannsachaidh. Mar sin, ann an cuid de shuidheachaidhean, tha mi smaointinn gun chlàraichte giùlan dh'fhaodas a bhith feumail. Nas fhaide, an dara prìomh chuspair bho na deasbadan gu bheil aithisgean mu dheidhinn faireachdainnean, eòlas, sùileachadh, agus beachdan nach eil an-còmhnaidh neo-mhearachdach. Ach, ma tha fiosrachadh mu bhith a-staigh na stàitean a tha a dhìth bho rannsaichean-an dara cuid gus cuideachadh le mìneachadh cuid de giùlan no mar an ni a bhith Mhìnich-uair sin a 'faighneachd dh'fhaodadh a bhith iomchaidh.
Airson leabhar dh'fhaid air leigheasan uile gu lèir suirbhidh mearachd, fhaicinn Groves et al. (2009) no Weisberg (2005) . Airson eachdraidh de leasachadh iomlan an t-suirbhidh mearachd, fhaicinn Groves and Lyberg (2010) .
A thaobh riochdachaidh, mòr toirt a-steach gu na cùisean neo-fhreagairt agus neo-freagairt Claonadh a tha Nàiseanta Comhairle Rannsachaidh aithisg air Nonresponse ann an Saidheans Sòisealta Sgrùdaidhean: Rannsachaidh Clàr-Gnothaich (2013) . Another feumail sealladh air a thoirt le (Groves 2006) . Cuideachd, fad cùisean sònraichte den 'Journal of Ceanglaichean Staitistig, Beachd a' Phobaill Ràitheil, agus an Annals of the Acadamaidh Ameireagaidh poileataigeach is Saidheans Sòisealta air a bhith a chaidh fhoillseachadh air a 'chuspair neo-freagairt. Mu dheireadh, tha dha-rìribh iomadh diofar dhòighean obrachadh a-mach an ìre freagairt; na modhan sin a tha air am mìneachadh gu mionaideach anns an aithisg leis an Ameireaganach Comann Beachd a 'Phobaill rannsachaidh (AAPOR) (Public Opinion Researchers} 2015) .
Tha an 1936 Literary chnàmh bhòtaidh a bhith air a sgrùdadh gu mionaideach (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) . Tha e cuideachd air a chleachdadh mar chosamhlachd ri rabhadh a thoirt an aghaidh thuiteamach cruinneachadh dàta (Gayo-Avello 2011) . Ann an 1936, Seòras Gallup chleachdadh nas ionnsaichte riochd Samplaidh, agus bha e comasach air a dhèanamh nas neo-mhearachdaiche tuairmsean le mòran nas lugha sampall. Gallup soirbheachadh thar nan Literary chnàmh Bha clach-mhìle an leasachadh suirbhidh rannsachadh (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) .
A thaobh tomhas, mòr a 'chiad ghoireas airson dealbhadh ceisteachain a tha Bradburn, Sudman, and Wansink (2004) . Airson tuilleadh adhartach leigheas ag amas gu sònraichte air beachd ceistean, faic Schuman and Presser (1996) . Tuilleadh air ceistean ro-dheuchainnean a tha ri fhaotainn ann an Presser and Blair (1994) , Presser et al. (2004) , agus an Caibidil 8 den Groves et al. (2009) .
Tha e clasaig, leabhar-dh'fhaid leigheas an-mhalairt eadar-suirbhidh sgrùdadh air cosgaisean agus tha mearachdan Groves (2004) .
Classic leabhar-dh'fhaid leigheas coitcheann coltachd samplachadh agus mheas tha Lohr (2009) (tuilleadh tòiseachaidh) agus Särndal, Swensson, and Wretman (2003) (nas adhartaiche). A classic leabhar-leigheis fad na dreuchd-stratification agus dhòighean-obrach co-cheangailte a tha Särndal and Lundström (2005) . Ann an cuid de shuidheachaidhean didseatach aois, luchd-rannsachaidh fios gu math beagan mu neo-luchd-freagairt, nach robh tric fìor san àm a dh'fhalbh. Diofar sheòrsaichean neo-freagairt adjustment tha comasach nuair a luchd-rannsachaidh air fiosrachadh mu neo-luchd-fhreagairt (Kalton and Flores-Cervantes 2003; Smith 2011) .
Tha an Xbox sgrùdadh Wang et al. (2015) a 'cleachdadh dòigh-obrach ris an canar multilevel regression agus dreuchd-stratification (MRP, ris an canar uaireannan "Mister D") a leigeas le luchd-sgrùdaidh tuairmse cealla a' ciallachadh fiù 's nuair a tha mòran, mòran ceallan. Ged a tha beagan deasbaid mu chàileachd na tuairmsean bho dòigh seo, tha e coltach mar gealltanach sgìre a rannsachadh. Tha an dòigh-obrach a chaidh a chleachdadh an toiseach ann an Park, Gelman, and Bafumi (2004) , agus an sin air a bhith a 'cleachdadh an dèidh sin agus deasbad (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) . Airson tuilleadh air an ceangal eadar cuideaman fa leth agus cealla-stèidhichte cuideaman fhaicinn Gelman (2007) .
Airson dòighean-obrach eile gus cuideam lìn suirbhidhean, a 'faicinn Schonlau et al. (2009) , Valliant and Dever (2011) , agus Bethlehem (2010) .
Sample a fhreagras air a mholadh le Rivers (2007) . Bethlehem (2015) ag argamaid gu bheil a 'coileanadh nan sampall a fhreagras air an dearbh bheir seo coltach ri feadhainn eile samplachaidh dòighean-obrach (me, stratified samplachaidh) agus dòighean-obrach eile adjustment (me, an dèidh stratification). Airson tuilleadh air-loidhne pannalan, fhaicinn Callegaro et al. (2014) .
Uaireannan rannsachaidh air lorg gu bheil coltachd agus sampaill neo-coltachd sampaill striochdadh tuairmsean Cluicheadairean càileachd (Ansolabehere and Schaffner 2014) , ach eile coimeas a dhèanamh air lorg nach robh neo-coltachd sampaill a dhèanamh nas miosa (Malhotra and Krosnick 2007; Yeager et al. 2011) . Aon ghabhas adhbhar airson eadar-dhealachaidhean sin gu bheil coltachd neo-sampaill air leasachadh thar ùine. Airson tuilleadh Beachd dubhach air ìre sealladh neo-coltachd samplachaidh dòighean faic na AAPOR Task Force air Neo-coltachd Samplaidh (Baker et al. 2013) , agus tha mi cuideachd a 'moladh a' leughadh an aithris a leanas an geàrr-chunntas aithisg.
Airson meta-mion-sgrùdadh air a 'bhuaidh a thaobh cudromachd a lùghdachadh leiteachas ann an neo-sampaill coltachd, faic Clàr 2.4 ann Tourangeau, Conrad, and Couper (2013) , tha a' leantainn na h-ùghdaran a 'co-dhùnadh "atharrachaidhean a rèir coltais, a bhith feumail ach fallible ceartachaidhean. . . "
Conrad and Schober (2008) a 'toirt a dheasachadh leabhar leis an tiotal Envisioning an Suirbhidh Agallamh ri Teachd, agus e a' bruidhinn ri mòran de na cuspairean anns an earrainn seo. Couper (2011) a 'bruidhinn coltach ris na cuspairean, agus Schober et al. (2015) a 'tabhann laghach eisimpleir de mar a cruinneachadh dàta dòighean a tha air a thàillearachd gus an suidheachadh ùr urrainn thoradh ann an àrd-ìre càileachd dàta.
Airson eile eisimpleir inntinneach a bhith a 'cleachdadh Facebook aplacaidean airson saidheans sòisealta suirbhidhean, a' faicinn Bail (2015) .
Airson tuilleadh comhairle air a bhith a 'dèanamh suirbhidhean tlachdmhor is eòlas luachmhor do chom-pàirtichean, a' faicinn obair air tàillearachd Dealbhadh Method (Dillman, Smyth, and Christian 2014) .
Stone et al. (2007) a 'tabhann leabhar de dh'fhaid leigheas momentary eag-eòlais agus measadh co-cheangailte ris dhòighean.
Judson (2007) mìneachadh a 'phròiseas co-mheasgachadh de shuirbhidhean agus rianachd dàta mar "fiosrachadh amalachadh," a' bruidhinn air cuid de na buannachdan an dòigh seo, agus a 'tabhann grunn eisimpleirean.
Another dòigh a gheibh luchd-rannsachaidh a 'cleachdadh comharran didseatach agus rianachd dàta tha samplachadh frèam airson daoine le feartan sònraichte. Ge-tà, cothrom air na clàran seo a bhith a 'cleachdadh frèam samplachaidh urrainn cuideachd chruthachadh ceistean co-cheangailte ri prìobhaideachd (Beskow, Sandler, and Weinberger 2006) .
A thaobh stèidh nas daingne faighneachd, dòigh-obrach seo cho ùr mar a bhiodh e a 'nochdadh bho mar a chuir mi gur e. Tha an dòigh seo tha domhainn ceanglaichean ri trì raointean mòra ann an staitistig-modail-dreuchd stèidhichte-stratification (Little 1993) , cur às leth (Rubin 2004) , agus àite beag mheas (Rao and Molina 2015) . Tha e cuideachd co-cheangailte ri cleachdadh ionadair caochladairean ann an rannsachadh meidigeach (Pepe 1992) .
A thuilleadh air na cùisean beusanta a thaobh inntrigeadh do didseatach sgeul dàta, stèidh nas daingne faighneachd fhaodadh cuideachd gun cleachdar a infer traits mothachail gum faodadh daoine nach do thagh a thoirt am follais ann an sgrùdadh (Kosinski, Stillwell, and Graepel 2013) .
Tha a 'chosgais agus an ùine tuairmsean ann Blumenstock, Cadamuro, and On (2015) iomradh tuilleadh gu caochlaideach cosgais cosgais aon a bharrachd-suirbhidh agus chan eil gabhail a-steach cosgaisean stèidhichte leithid prìs a ghlanadh agus làimhseachadh dàta a' ghairm. San fharsaingeachd, thèid faighneachd stèidh nas daingne dòcha àrd stèidhichte air cosgaisean agus ìosal cosgaisean caochlaideach coltach ri didseatach deuchainnean (faic Caibideal 4). Tuilleadh fiosrachaidh air an dàta air a chleachdadh ann an Blumenstock, Cadamuro, and On (2015) pàipear a tha ann an Blumenstock and Eagle (2010) agus Blumenstock and Eagle (2012) . Dòighean-obrach bho iomadh imputuation (Rubin 2004) a dh'fhaodadh cuideachadh a ghlacadh mì-chinnt ann tuairmsean bho stèidh nas daingne faighneachd. Ma tha luchd-rannsachaidh a 'dèanamh stèidh nas daingne a' faighneachd a-mhàin cùram mu dheidhinn cunntadh oigreachdan, seach fa leth-ìre traits, an uair sin ann an dòighean King and Lu (2008) agus Hopkins and King (2010) dh'fhaodadh a bhith feumail. Airson tuilleadh fiosrachaidh mu na inneal modhan ionnsachaidh ann Blumenstock, Cadamuro, and On (2015) , faic James et al. (2013) (tuilleadh tòiseachaidh) no Hastie, Tibshirani, and Friedman (2009) (nas adhartaiche). Coiteanta eile inneal ionnsachaidh teacsa a tha Murphy (2012) .
A thaobh saidhbhreas a thoirt do faighneachd, toraidhean ann an Ansolabehere agus Hersh (2012) hinge air dà phrìomh cheuman: 1) comas Catalist a chur còmhla iomadh eadar-dhealaichte tobraichean dàta a chur ri chèile ceart mhaighstir datafile agus 2) comas Catalist a 'ceangal an dàta suirbhidh gus a mhaighstir datafile. Uime sin, Ansolabehere agus Hersh sùil gach aon de na ceumannan seo gu cùramach.
A chruthachadh a 'mhaighstir datafile, Catalist cothlamadh agus harmonizes fiosrachadh bho iomadh diofar thobraichean gabhail a-steach: ioma-bhòtaidh clàran gheàrr-dhealbhannan bho gach staid, dàta bho Oifis a' Phuist Nàiseanta Atharrachadh Seòlaidh Chlàraidh, agus dàta bho luchd-solair eile unspecified malairteach. Tha gòrach fiosrachaidh mu ciamar a h-uile seo glanadh agus aonadh thachras a tha taobh a-muigh sgòp an leabhar seo, ach phròiseas seo, ge bith dè cho cùramach, bidh propagate mearachdan anns a 'chiad tobraichean dàta is Cuiridh mearachdan. Ged Catalist bha deònach gus bruidhinn mu dàta a làimhseachadh agus a 'toirt seachad cuid de na bun-dàta, bha e dìreach do-dhèanta do luchd-rannsachaidh gus sgrùdadh a dhèanamh air fad Catalist dàta loidhne-phìoban. An àite, an luchd-rannsachaidh a bha ann an suidheachadh far an Catalist dàta faidhle bha cuid neo-aithnichte, agus 's dòcha neo-aithnichte, suim de mhearachd. 'S e seo air sgàth droch dragh a lèirmheasaiche dh'fhaodadh beachdachadh gu bheil an eadar-dhealachaidhean mòra eadar an t-suirbhidh aithisgean air an CCES agus an giùlan ann an Catalist mhaighstir dàta faidhle chaidh adhbhrachadh le mearachdan anns a' mhaighstir faidhle dàta, chan ann le misreporting le luchd-freagairt.
Ansolabehere Hersh agus ghabh dà diofar dhòighean air dèiligeadh ris an dàta càileachd dragh. A 'chiad, a bharrachd air a' dèanamh coimeas eadar fèin-aithris bhòtaidh gus bhòtadh ann an Catalist mhaighstir faidhle, an luchd-rannsachaidh cuideachd coimeas fèin-aithris phàrtaidh, cinneadh, neach-bhòtaidh an inbhe mu chlàradh (me, clàraichte no nach eil clàraichte) agus a 'bhòtadh dòigh (me, ann an neach, neo-làthaireach baileat, msaa) gus na luachan sin a lorg ann an stòr-dàta Catalist. Airson nan ceithir deamografach caochladairean, an luchd-rannsachaidh a lorg mòran ìrean nas àirde de aonta eadar an t-suirbhidh agus an aithisg dàta ann an Catalist mhaighstir faidhle seach airson bhòtadh. Mar sin, Catalist mhaighstir dàta faidhle coltach gu bheil deagh fhiosrachadh airson traits eile thuilleadh air bhòtadh, gur dòcha nach eil e na bochdan càileachd iomlan. Dàrna, ann am pàirt, a 'cleachdadh dàta bho Catalist, Ansolabehere agus Hersh leasachadh trì ceumannan eadar-dhealaichte de càileachd siorrachd clàran bhòtaidh, agus iad gun robh a' meas ìre de thar-aithris robh an siostam bhòtaidh deatamach aig nach eil ceangal sam bith den dàta sin càileachd ceumannan, rud a moladh gu bheil an ìrean àrda thar-aithris nach eilear air a stiùireadh le siorrachdan le neo-àbhaisteach ìosal càileachd an dàta.
Leis a 'cruthachadh seo mhaighstir faidhle bhòtaidh, an dara tobar comas mearachdan a tha a' ceangal chlàran an t-suirbhidh a tha e. Mar eisimpleir, ma tha seo ceangal a dhèanamh ceàrr e Dh'fhaodadh an còrr-tuairmeas air an eadar-dhealachadh eadar aithris air a dhearbhadh agus bhòtaidh giùlan (Neter, Maynes, and Ramanathan 1965) . Ma tha a h-uile neach a bha seasmhach, aithnichear sònraichte a bha an dà chuid ann tobraichean dàta, an uair sin ceangal a bhiodh glè bheag. Anns na Stàitean Aonaichte agus dùthchannan eile as, ge-tà, chan eil ÀIREAMH AITHNE choitcheann. Nas fhaide, fiù 's ma bha a leithid sin de ÀIREAMH AITHNE bhiodh daoine' s dòcha gum bi hesitant a thoirt seachad e do luchd-rannsachaidh suirbhidh! Mar sin, Catalist bha ri dhèanamh an ceangal neo-iomlan a 'cleachdadh aithnichearan, sa chùis seo ceithir pìosan fiosrachaidh mu gach neach-freagairt: ainm, gnè, bliadhna breith, agus seòladh na dachaigh. Mar eisimpleir, bha Catalist gu co-dhùnadh ma tha Homie J Simpson ann an CCES B 'e an aon duine mar Homer Jay Simpson ann am maighstir dàta faidhle. Ann an cleachdadh, a fhreagras Tha e doirbh agus bùrachail phròiseas, agus, gus cùisean a dhèanamh nas miosa airson luchd-rannsachaidh, Catalist beachdachadh air a fhreagras air an dòigh-obrach a bhith dìlseanach.
Ann gus a dhearbhadh a fhreagras air an aontaran, iad an crochadh air dà dùbhlain. A 'chiad, Catalist pàirt a ghabhail ann a fhreagras air an co-fharpais a chaidh a ruith le neo-eisimeileach, treas-phàrtaidh: an MITRE Corporation. MITRE a thoirt seachad a h-uile com-pàirtichean dà fuaimneach faidhlichean dàta a bhith air a mhaidseadh, agus na sgiobaidhean eadar-dhealaichte farpais tilleadh gu MITRE as fheàrr a fhreagras air. Seach MITRE fhèin eòlach ceart a fhreagras air an robh iad comasach air sgòr na sgiobaidhean. De na 40 companaidhean a 'farpais, Catalist thàinig anns an dàrna àite. Tha an seòrsa neo-eisimeileach, treas-phàrtaidh measadh dìlseanach teicneòlas gu math tearc agus leth luachmhor; bu chòir gun toir e dhuinn muinghin Catalist a fhreagras air an dòighean-obrach a tha an ìre mhath aig an stàit-na-h-ealain. Ach tha an stàit-na-h-ealain math gu leòr? A thuilleadh air seo a fhreagras air an co-fharpais, agus Ansolabehere Hersh aca fhèin a chruthachadh a fhreagras air an dùbhlan airson Catalist. Bho pròiseact na bu tràithe, Ansolabehere agus Hersh a chruinnich neach-bhòtaidh clàraidhean bho Florida. Thug iad seachad cuid de na clàran seo le cuid de na h-achaidhean TARRAING gu Catalist agus an uair sin an coimeas Catalist aithisgean de na h-achaidhean aca fhèin luachan. Gu fortanach, Catalist aithisgean a bha faisg air a 'chleith, luachan, a' sealltainn gum b 'urrainn Catalist maidseadh pàirt neach-bhòtaidh air na clàran aca mhaighstir dàta faidhle. Tha an dà dùbhlain, aon le treas-phàrtaidh agus fear eile le Ansolabehere agus Hersh, a 'toirt dhuinn barrachd misneachd ann an Catalist fhreagras air aontaran, fiù' s ged nach urrainn dhuinn sgrùdadh a dhèanamh air an dearbh buileachadh oirnn fhìn.
Tha mòran air a bhith roimhe oidhirpean gus dearbhadh a 'bhòtadh. Airson tar-shealladh air gu bheil litreachas, fhaicinn Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , agus Hanmer, Banks, and White (2014) .
Tha e cudromach toirt fa-near ged nach robh sa chùis seo rannsachaidh a chaidh a bhrosnachadh le càileachd an dàta bho Catalist, measaidhean eile mhalairteach reiceadairean air a bhith cho dealasach. Tha luchd-rannsachaidh a lorg truagh nuair dàta bho sgrùdadh luchd-ceannach-faidhle bho Margaideachd Siostaman Buidheann (a tha i fhèin còmhla ri chèile dàta bho thrì sholaraichean: Acxiom, Experian, agus InfoUSA) (Pasek et al. 2014) . 'S e sin, an dàta faidhle Cha do fhreagair an suirbhidh freagairtean gu bheil luchd-rannsachaidh an dùil a bhith ceart, a' datafile bha air chall dàta airson àireamh mhòr de cheistean, agus a 'chall dàta Chaidh am pàtran correlated ri aithris sgrùdadh luach (ann am faclan eile a dhìth dàta bha rianail , cha random).
Airson tuilleadh air a 'chlàr ceanglaichean eadar sgrùdaidhean agus rianachd dàta, fhaicinn Sakshaug and Kreuter (2012) agus Schnell (2013) . Airson tuilleadh air a 'chlàr ceangal san fharsaingeachd, chì Dunn (1946) agus Fellegi and Sunter (1969) (eachdraidh) agus Larsen and Winkler (2014) (latha an-diugh). Cluicheadairean dòighean-obrach cuideachd air a bhith a leasachadh ann an saidheans coimpiutaireachd fo na h-ainmean leithid dàta deduplication, mar eisimpleir aithneachaidh, ainm a fhreagras air, dùblaichte lorgaidh, agus mac-samhail 'chlàr-lorgaidh (Elmagarmid, Ipeirotis, and Verykios 2007) . Tha cuideachd prìobhaideachd gleidheadh dòighean-obrach a chlàradh ceangal nach eil feum air an sgaoileadh gu pearsanta comharrachadh fiosrachadh (Schnell 2013) . Tha luchd-rannsachaidh aig Facebook leasachadh modh-obrach a tha a 'ceangal probabilisticsly na clàran aca gu bhòtaidh giùlan (Jones et al. 2013) ; seo ceangal a dhèanamh gus measadh a dhèanamh air an deuchainn sin innsidh mi dhut mu dheidhinn ann an Caibideil 4 (Bond et al. 2012) .
Mar eisimpleir eile de 'ceangal mòr-sgèile sòisealta suirbhidh gus riaghaltas clàran rianachd a' tighinn bho na Slàinte agus cluaineis Sgrùdadh is na Tèarainteachd Shòisealta Rianachd. Airson barrachd fiosrachaidh mu sgrùdadh, leithid fiosrachadh mu bhith a 'mhodh cead, fhaicinn Olson (1996) agus Olson (1999) .
Tha am pròiseas còmhla mòran thobraichean rianachd chlàran a-steach do mhaighstir-datafile a 'phròiseas a Catalist-obrach a tha cumanta ann an oifisean staitistigeil cuid de na riaghaltasan nàiseanta. Dà-rannsachaidh bhon t-Suain Staitistig air sgrìobhte mionaideach leabhar air a 'chuspair (Wallgren and Wallgren 2007) . Airson eisimpleir den dòigh-obrach seo ann an aon siorrachd anns na Stàitean Aonaichte (Olmstead County, Minnesota; dachaigh Comunn na Clinic), fhaicinn Sauver et al. (2011) . Airson tuilleadh air mearachdan a dh'fhaodas nochdadh ann an clàran rianachd, fhaicinn Groen (2012) .