Թեեւ դա կարող է լինել կեղտոտ, հարստացել խնդրում կարող է լինել հզոր.
Մեկ այլ մոտեցում, որը զբաղվում է թերի թվային հետքի տվյալների հարստացնել այն ուղղակիորեն հետ հետազոտության տվյալների, մի գործընթացի, որը ես կզանգահարեմ հարստացված հարցնում. Մեկ օրինակ հարստացված հարցնելով է ուսումնասիրություն Burke and Kraut (2014) , Որը ես նկարագրված ավելի վաղ գլխում (Բաժին 3.2) մասին, թե արդյոք շփվել Facebook- ում մեծացնում բարեկամության ուժը: Այդ դեպքում, Burke եւ Kraut համակցված հետազոտության տվյալների Facebook համակարգ տվյալները:
Ընդլայնված է, որ Burke եւ Կրաուտը են աշխատում, սակայն, նշանակում է, որ նրանք չեն գործ ունենք երկու մեծ խնդիրներ, որոնք հետազոտողները անում հարստացրել խնդրելով դեմքը: Նախ, ըստ էության, կապելով միասին տվյալների սահմանում, մի գործընթաց, որը կոչվում ռեկորդային կապ, որ համապատասխան մի ռեկորդ մեկի dataset հետ համապատասխան արձանագրության մյուս dataset կարող է լինել բարդ է եւ սխալ է, հակված (կտեսնենք օրինակ այս խնդրի ստորեւ ): Երկրորդ հիմնական խնդիրը հարստացված հարցնելով, որ որակը թվային հետքերի հաճախ է դժվար լինել հետազոտողների համար է գնահատել: Օրինակ, երբեմն այդ գործընթացը, որի միջոցով այն հավաքագրվում է գույքային եւ կարող է ենթակա է բազմաթիվ խնդիրների նկարագրված է Գլուխ 2. Այլ կերպ ասած, հարստացրել խնդրելով հաճախ ներգրավել սխալը հակված կապելով է հարցումներ սեւ արկղ տվյալների աղբյուրներից հայտնի չէ որակի. Չնայած մտահոգություններին, որ այս երկու խնդիրները ներկայացնել, դա հնարավոր է իրականացնել կարեւոր հետազոտություններ այս ռազմավարության, ինչպես նաեւ ցուցադրվեց Սթիվեն Ansolabehere եւ Eitan Hersh (2012) իրենց հետազոտությունների վրա քվեարկության նախշերով ԱՄՆ-ում: Այն արժանի է գնալ ավելի այս ուսումնասիրության որոշ մանրամասներով, քանի որ շատերը ռազմավարությունների, որոնք Ansolabehere եւ Հերշը զարգացած օգտակար կլինի այլ դիմումների հարստացված հարցնելու.
Ընտրողների մասնակցությունը եղել առարկա ծավալուն հետազոտությունների քաղաքագիտության, իսկ անցյալում, հետազոտողները հասկանալ, թե ով է քվեարկում եւ ինչու ընդհանուր առմամբ հիմնված վերլուծության հետազոտության տվյալները. Քվեարկելը ԱՄՆ-ում, սակայն, այն է, անսովոր վարքագիծը, որ կառավարությունը գրառումների թե յուրաքանչյուր քաղաքացի քվեարկել է (իհարկե, կառավարությունը չի արձանագրել ով յուրաքանչյուր քաղաքացու ձայներ է): Երկար տարիներ է, այդ կառավարական քվեարկության արձանագրություններն էին հասանելի թղթե ձեւերի, ցրված տարբեր տեղական ինքնակառավարման գրասենյակների ամբողջ երկրում. Այս կատարել այն դժվար է, բայց անհնար է, որովհետեւ քաղաքագետները է ունենալ ամբողջական պատկերացում ընտրազանգվածի եւ համեմատել, թե ինչ են մարդիկ ասում, հարցումների մասին, քվեարկությունից իրենց փաստացի քվեարկության վարքագծի (Ansolabehere and Hersh 2012) :
Սակայն, այժմ այդ քվեարկության գրառումները թվայնացվել, եւ մի շարք մասնավոր ընկերություններ հավաքվում եւ միացվել այդ քվեարկության գրառումները արտադրել համապարփակ վարպետ քվեարկության ֆայլեր, որոնք գրի քվեարկության վարքագիծը բոլոր ամերիկացիների. Ansolabehere եւ Հերշը համագործակցում մեկի հետ այդ ընկերությունների-catalist ՍՊԸ-նպատակով օգտագործել իրենց վարպետության քվեարկության ֆայլ օգնել զարգացնել ավելի լավ պատկերացում ընտրազանգվածի: Բացի այդ, քանի որ այն ապավինում թվային գրառումների հավաքած եւ համադրող ընկերության կողմից, այն առաջարկվում է մի շարք առավելություններ է ավելի քան նախորդ ջանքերով, ըստ հետազոտողների, որ արվել է առանց օգնության ընկերությունների եւ օգտագործելու անալոգային գրառումները.
Հավանել շատերը թվային հետքի աղբյուրներից գլխի 2-catalist վարպետ ֆայլը չի ներառել շատ ժողովրդագրական, աշխարհայացքային, եւ վարքագծային տեղեկատվություն, որ Ansolabehere եւ Հերշը անհրաժեշտ. Ի լրումն այդ տեղեկությունների, Ansolabehere եւ Հերշը հատկապես հետաքրքրում համեմատելով հաղորդում է քվեարկության վարքը վավերացված քվեարկության վարքի (այսինքն, տեղեկատվության catalist մասնակի): Այնպես որ, հետազոտողները հավաքվել տվյալները, որ ուզում է որպես մաս Կոոպերատիվների Կոնգրեսի ընտրական ուսումնասիրության (CCES), մեծ սոցիալական հարցման. Հաջորդը, հետազոտողները տվել է այս տվյալները, որպեսզի catalist, եւ catalist տվեց հետազոտողները սատարել է միաձուլված տվյալների ֆայլ, որը ներառում վավերացված քվեարկության վարքը (- ից catalist), իսկ ինքնուրույն հաղորդում քվեարկության վարքագիծ (- ից CCES) եւ ժողովրդագրական ու վերաբերմունքը հարցվածների (ից CCES ): Այլ կերպ ասած, Ansolabehere եւ Հերշը հարստացել քվեարկության տվյալների հետազոտության տվյալների, եւ արդյունքում միավորված ֆայլը թույլ է տալիս նրանց դա անել մի բան, որը ոչ ֆայլը միացված անհատապես:
Ըստ հարստացնելով catalist վարպետության տվյալների ֆայլ հետազոտության տվյալների, Ansolabehere եւ Հերշը եկան երեք կարեւոր եզրակացությունների: Առաջին հերթին, շուրջ-հաշվետվության քվեարկության է rampant գրեթե կեսը ոչ-ընտրողների հաղորդում քվեարկությունը: Կամ, այլ կերպ են նայում այն է, որ եթե ինչ-որ մեկը հաղորդում է քվեարկություն, կա միայն 80% - ը հնարավորություն է, որ նրանք, ըստ էության, կողմ է քվեարկել: Երկրորդ, ավելի հաշվետու չէ պատահական. ավելի-հաշվետվությունների ավելի տարածված է բարձր եկամուտ, լավ կրթված, պարտիզաններն ովքեր զբաղվում են հասարակական գործերին: Այլ կերպ ասած, այն մարդիկ, ովքեր, ամենայն հավանականությամբ, պետք է քվեարկել են նաեւ, ամենայն հավանականությամբ, ստում մասին քվեարկության: Երրորդ, եւ առավել քննադատաբար, քանի որ համակարգային բնույթի մասին ավելի հաշվետու, փաստացի տարբերությունները ընտրողների եւ ոչ ընտրողների փոքր են, քան նրանք հայտնվում հենց հարցումների: Օրինակ, նրանք, ովքեր բակալավրի աստիճան են մոտ 22 տոկոսային կետով ավելի հավանական է, որպեսզի հաղորդել քվեարկությունը, բայց միայն 10 տոկոսային կետով ավելի հավանական է փաստացի քվեարկության: Բացի այդ, գոյություն ունեցող ռեսուրսների վրա հիմնված տեսությունները քվեարկության շատ ավելի լավ է գուշակում, թե ով պետք է զեկուցել քվեարկությունը, քան թե ով է իրականում քանակը, էմպիրիկ եզրահանգումն է, որ կոչ է անում նոր տեսություններ է հասկանալ եւ կանխատեսել քվեարկությունը:
Բայց, որքան մենք պետք է վստահել այդ արդյունքները. Հիշել այդ արդյունքները կախված սխալի հակված կապող սեւ արկղ տվյալների անհայտ գումարների սխալի. Ավելի կոնկրետ, արդյունքները առանցք երկու առանցքային քայլերից `1) ունակությունը catalist է համատեղել շատ ամենատարբեր տվյալների աղբյուրների արտադրել ճշգրիտ վարպետության datafile 2) ունակությունը catalist կապել հարցման տվյալները իր վարպետ datafile. Յուրաքանչյուր այդ քայլերից բավականին բարդ է եւ սխալներ է երկու քայլ կարող է հանգեցնել հետազոտողներին սխալ եզրակացությունների: Սակայն, թե տվյալների մշակման եւ համապատասխանող են կարեւոր է շարունակական գոյության catalist որպես ընկերության, այնպես որ դա կարող է ներդրումներ ռեսուրսներ այդ խնդիրների լուծմանը, հաճախ սանդղակով, որ ոչ մի անհատական ակադեմիական գիտաշխատող, կամ խումբ հետազոտողների կարող են համընկնում: Ի հետագա ընթերցմամբ վերջում գլխի, ես նկարագրել, այդ խնդիրները ավելի հանգամանորեն եւ ինչպես Ansolabehere եւ Հերշը վստահություն դրանց արդյունքների. Չնայած նրան, որ այդ մանրամասները, որոնք հատուկ են այս ուսումնասիրության, հարցեր նման դրանք կառաջանան այլ հետազոտողների, որոնք ցանկանում են կապել է սեւ արկղ թվային հետքի տվյալների աղբյուրների:
Որոնք են ընդհանուր դասերը հետազոտողները կարող է անել այս ուսումնասիրության. Նախ, կա հսկայական արժեք է հարստացնելով թվային հետքեր հետ հետազոտության տվյալները. Երկրորդ, թեեւ դրանք միավորվում, առեւտրային տվյալների աղբյուրները չպետք է համարել "ground ճշմարտություն է», որոշ դեպքերում նրանք կարող են օգտակար լինել: Ի դեպ, դա լավ է համեմատել այդ տվյալների աղբյուրները ոչ թե բացարձակ ճշմարտություն (որից նրանք միշտ ընկնում կարճ): Ավելի շուտ, դա ավելի լավ է համեմատել դրանք այլ առկա տվյալների աղբյուրների, ինչը միշտ ունեն սխալներ, ինչպես նաեւ.