Лас болуы мүмкін, тіпті, байытылған Сұрау қуатты болуы мүмкін.
Сандық ізі деректер толық айналысатын басқа көзқарас, зерттеу деректерімен тікелей Мен байытылған көзделуде қоңырау шаламыз процесін оны байыту болып табылады. Байытылған сұрағаннан Бір мысал зерттеу болып табылады Burke and Kraut (2014) I тарауда бұрын (Бөлім 3.2) бойынша, Facebook бойынша өзара іс-қимыл достық мықтылығын арттырады ма туралы сипатталған. Бұл жағдайда, Burke және Kraut Facebook арқылы кіріңіз деректерімен зерттеу деректерін аралас.
Burke және Kraut жұмыс істейтін болды параметр, алайда, олар зерттеушілер бетін сұрап байытылған істеп, екі үлкен проблемаларды шешуге жоқ екенін білдіреді. Біріншіден, шын мәнінде бірге рекордтық байланыс деп аталатын процесс деректер-а жиынын байланыстыратын басқа тиісті жазбасымен бір деректер жазба сәйкес келетін қиын және қатеге бейім деректер жиынының-мүмкін (біз төменде осы проблеманы мысалын көресіз ). байытылған сұрағаннан екінші басты мәселе зерттеушілер бағалау үшін сандық іздері сапасы жиі қиын болады екен. Мысалы, кейде бұл жиналған асырылатын процесс жеке меншігі болып табылады және басқа сөзбен айтқанда 2-тарау сипатталған проблемалар көптеген сезімтал болуы мүмкін, байытылған Сұрау жиі белгісіз қара жәшік деректер көздеріне сауалнама қате бейім қосылуын қатысады сапасы. Осы екі проблемалар енгізу деп алаңдаушылық қарамастан, ол Стивен Ansolabehere және Eitan Герш арқылы көрсетілді ретінде осы стратегияның маңызды зерттеулер жүргізуге болады (2012) АҚШ-та дауыс беру заңдылықтары, олардың ғылыми-зерттеу. Ansolabehere және Герш дамыған стратегияларды көптеген байытылған сұрағаннан басқа қосымшаларда пайдалы болады, себебі кейбір егжей-тегжейлі Осы зерттеудің астам баруға тұр.
Сайлаушылардың келуі саясаттану мол Зерттеудің пәні болды, және өткен, дауыс және неліктен кім зерттеушілердің түсіну, әдетте, сауалнама деректерінің талдау негізінде болды. АҚШ-та дауыс беру, алайда, (әрине, мемлекеттік ДДҰ әр азамат дауыс жазу жоқ) әрбір азамат дауыс берді ма деп мемлекеттік жазбаларына ерекше мінез-құлық болып табылады. Көптеген жылдар бойы, осы үкіметтік дауыс беру жазбалар бүкіл еліміз бойынша әр әкімдіктердің бытырап қағаз нысандары, қол жетімді болды. Бұл саясаттанушылар сайлаушылардың толық суретін болуы және адам олардың нақты дауыс беру мінез-құлық үшін дауыс беру туралы зерттеулер айтады салыстыру үшін, мүмкін емес қиын, бірақ жасалған (Ansolabehere and Hersh 2012) .
Бірақ, қазір бұл дауыс беру жазбалар цифрланған болатын, сондай-ақ жеке компаниялар саны жүйелі жиналған және барлық американдықтардың дауыс беру мінез-жазып, жан-жақты мастер дауыс беруге файлдарды шығару үшін осы дауыс беру жазбаларын біріктіріледі. Ansolabehere және Герш осы компаниялардың-Catalist LCC-электорат жақсы суретін дамытуға көмектесу үшін, олардың шеберлік дауыс беру файлын пайдалану үшін бірімен әріптестік. ол компанияның жинаған және жетекшілік ететін сандық жазбалар сүйенеді, өйткені, бұдан әрі, ол компаниялардың көмегінсіз және аналогтық жазбаларды пайдалана отырып жасалса зерттеушілер өткен күш-жігерін астам бірқатар артықшылықтары ұсынды.
2-тарауда сандық ізі көздерінің көптеген сияқты, Catalist мастер файл, демографиялық көп мінез, және Ansolabehere және Герш қажетті мінез-құлық ақпаратты қамтиды жоқ. Осы ақпаратқа қосымша, Ansolabehere және Герш тексерілген дауыс беру мінез-құлық (Catalist дерекқорда яғни, ақпараттық) хабарлады дауыс беру мінез-салыстыру әсіресе қызығушылық танытты. Сондықтан, зерттеушілер, олар кооперативтік Конгресс сайлау зерттеу (БҒСБК), ірі әлеуметтік сауалнама бөлігі ретінде іздеуде деректер жиналған. Келесі, зерттеушілер Catalist осы деректерді берді, және Catalist артқы БҒСБК бастап (Catalist бастап) тексерілген сайлаушылардың мінез енгізілген біріктірілген деректер файлын (БҒСБК дейін) өзін-өзі хабарлады дауыс беру мінез-құлқын және респонденттердің демографиялық және қарым-қатынасты (зерттеушілердің берді ). Басқаша айтқанда, Ansolabehere және Герш зерттеу деректерімен дауыс беру туралы деректердi байытылған, және нәтижесінде біріккен файл де файл жекелей қосылған нәрсе істеу мүмкіндік береді.
зерттеу деректерімен Catalist мастер деректер файлын байыту арқылы Ansolabehere және Герш үш маңызды тұжырымға келді. Біріншіден, артық есеп дауыс беру кеңінен етек алған емес сайлаушылардың жартысына жуығы дауыс беру хабарлады. Немесе, ол қарап тағы бір жолы біреу дауыс беру хабарлады болса, олар шын мәнінде дауыс берді деп тек 80% мүмкіндігі бар болып табылады. Екіншіден, артық есеп кездейсоқ емес; артық есеп, мемлекеттік істерге айналысатын табысы жоғары, сондай-ақ білімді, партизандар арасында көп таралған болып табылады. Басқаша айтқанда, дауыс беру, ең алдымен, адамдар, сондай-ақ дауыс беру туралы өтірік, ең алдымен, болып табылады. Үшіншіден, және ең сыни, өйткені артық есептілік жүйелі сипаттағы, сайлаушылардың және емес сайлаушылар арасындағы нақты айырмашылықтар олар жай ғана сауалнама пайда аз. Мысалы, мамандығы бойынша бакалаврларды сол дауыс беру хабарлауға шамамен 22 пайыздық тармаққа неғұрлым ықтимал болып табылады, бірақ нақты дауыс беру тек 10 пайыздық тармаққа неғұрлым ықтимал болып табылады. Әрі қарай, дауыс беру қолданыстағы ресурстық негізделген теориялар шын мәнінде дауыс қарағанда дауыс беруді, жаңа теориялар түсіну және дауыс беру болжау шақырады эмпирикалық қортынды есеп береді, кім болжау кезінде әлдеқайда жақсы болып табылады.
Бірақ, қанша біз осы нәтижелерге арқа сүйеуіміз керек? Бұл нәтижелер қате белгісіз мөлшерде қара жәшік деректерге қате бейім байланысу тәуелді есте сақтаңыз. дәл мастер datafile және 2 өндіруге көптеген бытыраңқы деректер көздерін біріктіру Catalist 1) қабілеті) оның мастер datafile үшін сауалнама деректерін байланыстыру Catalist қабілеті: Нақтырақ айтқанда, нәтижелерін екі негізгі қадамдар туралы шарнир. Осы қадамдардың Әрбір өте қиын болып табылады және кез келген сатысында қателер қате қорытындылар зерттеушілер әкелуі мүмкін. ол зерттеушілердің жоқ жеке оқу зерттеуші немесе топтық сәйкес келуі мүмкін екенін жиі ауқымда, осы проблемаларды шешу қаражат салуға болады, сондықтан Алайда, деректер өңдеу және сәйкес келетін де компания ретінде Catalist үздіксіз болуына маңызды. тараудың соңында бұдан әрі оқу жылы мен егжей-тегжейлі және қалай Ansolabehere және Герш олардың нәтижелеріне сенімді нығайту осы проблемаларды сипаттайды. Бұл мәліметтер осы зерттеу үшін арнайы болғанымен, бұл ұқсас мәселелер қара жәшік сандық ізі деректер көздеріне сілтейді ниет білдірген басқа да зерттеушілер үшін пайда болады.
зерттеушілер осы зерттеу жасауға болады, жалпы сабақ қандай? Біріншіден, зерттеу деректерімен сандық іздері байыта түскен орасан зор мән бар. Екіншіден, бұл біріктірілген тіпті, коммерциялық деректер көздері кейбір жағдайларда олар пайдалы болуы мүмкін, «жер правда» қарастырылуы тиіс. Шын мәнінде, ол (олар әрқашан қысқа түседі, оның) емес абсолютті шындық осы деректер көздерін салыстыру үздік болып табылады. Керісінше, бұл үнемі сондай қателер бар басқа қол жетімді деректер көздеріне, оларды салыстыруға жақсы.