Tevî ku dikare bibe ew di rojevê de, dipirsî, dewlemendkirî dikare bibe hêz.
A nêzîkatiyên cuda ji bo mijûlbûna bi incompleteness ên data şopên dîjîtal e ji bo dewlemendiyê de rasterast bi daneyên lêkolînê, pêvajoyeke ku ez ê xwe dipirsî, xwe dewlemendtir bikin. Yek mînak ji xwe dipirsî, moderin di xebatê de ji e Burke and Kraut (2014) , ku ez berê di beşê, ku ka gelo bi hevdu re li ser Facebook zede hêza dostaniya şirove (Beş 3.2). Di vê rewşê de, Burke û Kraut bi hev re daneyên lêkolînê bi daneya log Facebook.
Mîhengên ji ku Burke û Kraut di xebatê de bûn, lê belê, di wateya ku ew ne ji bo ku bi du pirsgirêkên mezin ku lêkolîneran çi dewlemendkirî rûyê pirsîn. Yekem, di rastiyê de bi hev re linking li sets-a welat pêvajoya bi navê girêdanek di qeyda, li hevcotî ji qeyda di yek dataset bi record guncaw di ya din de mînakeke dataset-dikare zehmet be û error-janên (em ê bibînin ku vê pirsgirêkê li jêr ). Ku pirsgirêka sereke ya duyem ya xwe dipirsî, moderin e ku kalîteya şopên dîjîtal gelek caran zehmet ji bo lêkolînerên ji bo nirxandina wê. Ji bo nimûne, carna pêvajoya bi riya ku ew berhev kirin bixwedî e û nikaribû hessas in ji bo gelek ji pirsgirêkên ku di Beşa 2. Bi gotineke din be, dipirsî, dewlemendkirî gelek caran wê tevli têkiliya error-janên anket ji bo çavkaniyên daneyan reş-box yên nenas çêwe. Tevî ku fikarên ku van her du pirsgirêkên nasandin, mimkun e ji bo tetbîqkirina girîng bi vê stratejiya ku ji aliyê Stephen Ansolabehere û Eitan Hersh xwepêşandan kirin (2012) di lêkolînên xwe li ser qalibên dengdanê de li Amerîka. Ev bi avêde e ji bo li ser vê xebatê de here hinek hûrgilî ji ber ku gelek ji yên stratejiyên ku Ansolabehere û Hersh pêşxistin li sepanên din ji xwe dipirsî, moderin dê bi feyde be.
serok komariya hatiye mijara lêkolînên berfireh li zanista siyasî de, û di dema borî de, têgihîştina lêkolînerên 'yên ku dengên wan û çima hatiye giştî dîtin li ser analîzên daneyên lêkolînê bingeha. Dengdana li Amerîka, lê belê, şêlên nedîtî in ku qeydên ku hikûmeta gelo her welatiyekî deng daye e (bê guman, hikûmet ku her votes hemwelatiyê ji bo tomara ne). Ji bo gelek salan, van qeydên dengdanê dewletê li ser formên rojnameyê bûn, belav di nivîsgehên cuda yên hikûmeta herêmî li seranserê welêt. Ev jî gelek zehmet e, di heman demê de nabe, ne, ji bo zanistên siyasî ji bo ku picture bi temamî ya di hibijartinan de û ji bo bimînînim çi kes di kadastroyê de dibêjin, ser dengdanê bi şêlên dengdanê rastî wan (Ansolabehere and Hersh 2012) .
Lê, niha ev qeydên dengdanê hatine dîjîtal hatine, û hejmarek ji şîrketên taybet bi awayekî komkirin û van qeydên dengdanê, CVAE û ji bo hilberîna files berfireh master dengdanê ku tevgêrên dengdanê ji hemû Amerîkî tomar bikin. Ansolabehere û Hersh bi yek ji van şîrketên-Crawling LCC-ji bo bikaranîna di master file dengdanê xwe ji bo alîkariya pêş wêneyeke baştir ji hibijartinan de bûya. Din, ji ber ku ew li ser records dîjîtal komkirin û Seyîdvan ji aliyê şîrketa xwe dispart, ew pêşkêşî hejmarek ji avantajên li ser hewldanên berê ji aliyê lêkolînerên ku bêyî alîkariya şirketên û bikaranîna records analog çi çêbûye.
Weke gelek ji çavkaniyên şopên digital li Chapter 2, li file master Crawling ew pir ji agahî ên demografîk, attitudinal, û tevgerî ku Ansolabehere û Hersh pêwîst de ne. Ji bilî vê agahiyê, Ansolabehere û Hersh bi taybetî di danberheva helwesta dengdanê ragihand ku helwesta dengdanê vîze (ango, ku agahiyên di nav HTMLê da heye Crawling) bala bûn. Bi vî awayî, lêkolînerên ku ji daneyên ku ew wek beşek ji Study a Hevkariya di Kongreyê de Hilbijartinê (ABBA), a lêkolînê mezin civakî xwest komkirin. Next, lêkolînerên ku ev welat ji bo Crawling da, û Crawling da ku lêkolîner û pişta a file perexistinê Daneyên ku vîze têde helwest dengdanê (ji Crawling), tevgêrên dengdanê-self ragihand (ji ABBA) û demografîk û helwestên ji beşadaran (ji ABBA ). Bi gotineke din, Ansolabehere û Hersh dewlemendkirî welat dengdanê ya bi daneyên lêkolînê, û file perexistinê encama derfetê dide wan ji bo tiştekî ku ne file bi serê xwe be.
By zaxkirina malxwê file welat Crawling bi daneyên lêkolînê, Ansolabehere û Hersh ji bo sê encamên girîng hat. Pêşî, li ser-rapor dengdanê belabûyîye e: hema hema nîvê non-hilbijêrên dengdanê ragihandin. An jî, bi awayekî din ji nêrî ew e, eger yekî ragihandin dengdanê, ew e ku tenê şansê 80%, ku ew di rastiyê de deng dan. Duyemîn, li ser-raporên e random ne; ser-raporên nav-hatina bilind hevbeş zêdetir e, baş-perwerde, girêdayî ku di karûbarên giştî de digrin. Bi gotineke din, kesên ku bi îhtîmaleke mezin ji bo dengdanê ne jî herî îhtîmal e ku li ser dengdanê derew in. Sêyem, û herî rexneyî, ji ber karaktera sîstematîk ya li ser-raporên, ku cudahiyên rastî di navbera hilbijêr û non-hilbijêrên biçûktir ji wan tenê ji anketên xuya bibe. Ji bo nimûne, wan bi bawernama bekaloriyosê li ser 22 xalan ji sedî dikarin bêtir ji bo raporkirina dengdanê, lê tenê 10 ji sedî bêtir ji dengan bi rastî. Bêhtir, teorî-dispêre çavkaniyên heyî yên dengdanê li encama ku dê dengdanê ji bilî ku di rastiyê de votes, an komkirin û îdiayên ku banga ji bo teoriyên nû fêm bikin û pêşbînîkirin, dengdanê de rapor gelek çêtir in.
Lê belê, çiqas divê em van encamên bawer? Bîr van encamên li ser têkiliya error-janên girêdayî daneyên reş-box bi mîqdarên nenas ji error. Bi taybetî, ku encamên li ser du gav key hinge: 1) qabîliyeta Crawling bi hev re gelek çavkaniyên daneyan şundamayî ji bo hilberîna an datafile master rasteqîne û 2) qabîliyeta Crawling berve daneyên lêkolînê ya ji bo datafile master xwe. Her yek ji van gavan pir dijwar e û şaşiyên at yan gav nikaribû ku lêkolîner encamên xelet rê. Lê belê, herdu processing welat û lêhatî ji bo hebûna xwe berdewam yên Crawling wek şîrketa krîtîk in, da ku ew dikarin çavkaniyên di çareserkirina van pirsgirêkan razînin, gelek caran li pîvaneke ku tu lêkolîner akademîk an komeke lêkolîner dikarin nagirin. Di xwendina din li dawiya beşê de, ez van pirsgirêkan bi berfirehî zêdetir û çawa Ansolabehere û Hersh avakirina baweriyê di encamên wan salix. Tevî ku ev hûragahiyan li vê xebatê de ne, mijarên mîna van dê ji bo yên din, lêkolînerên ku dixwazin berve reş-box şopên dîjîtal çavkaniyên daneyan rabe.
dersên giştî lêkolîner dikarin ji vê xebatê de balê çi ne? Yekem, e nirxê mezin ji zaxkirina şopên digital bi daneyên lêkolînê heye. Duyemîn, tevî ku van -şandîyên, çavkaniyên daneyan bazirganî divê nirxandin ne bê "rastî erdê", di hin rewşan de, ew nikare bibe kêrhatî. Di rastiyê de, baş ew e ku bişibînin van çavkaniyên daneyan ne ji bo Rastî mitleq (ji ku ew her tim bikeve kurt). Lê belê, çêtir e ku ji wan re bimînînim din çavkaniyên daneyan tune, ku venadin, çewtî hene û herweha.