විමසනු ලැබුවහොත්, සමීක්ෂණ දත්ත දත්ත සමුදායේ විශාල දත්ත මූලාශ්රයක් වටා සන්දර්භයක් නිර්මාණය කරයි.
සමීක්ෂණ දත්ත සහ විශාල දත්ත මුලාශ්ර ඒකාබද්ධ කිරීම සඳහා එක් ක්රමයක් නම්, මා සුබවාදී ඉල්ලීමක් කරන ක්රියාවලියකි. විශාල දත්ත දත්ත මූලාශ්රයක් අඩංගු වැදගත් මිනුම් කිහිපයක් අඩංගු වුවද, වෙනත් මිනුම් නොමැති නිසා පර්යේෂකයා සමීක්ෂණයක් තුල මෙම අතුරුදහන් මිනුම් එකතු කර පසුව දත්ත මූලාශ්ර දෙකට සම්බන්ධ කරයි. Burke and Kraut (2014) විසින් අධ්යයනය කර ඇති එක් උදාහරණයක් නම්, ෆේස් බුක් මත අන්තර් ක්රියාකාරිත්වය වැඩිදියුණු කර ගැනීමෙන්, මිත්රත්වයේ ශක්තිය වැඩි කර ගැනීමයි. එම අවස්ථාවේදී බර්ක් සහ ක්රුට් ෆේස්බුක් ලොග් දත්ත සමඟ සමීක්ෂණ දත්ත සමගින් ඒකාබද්ධ විය.
කෙසේ වෙතත් බර්ක් හා ක්රූට් වැඩ කල අතර, ඔවුන් පර්යේෂකයන් සාමාන්යයෙන් මුහුණට මුහුණ පෑමට කරන ලද විශාල ගැටළු දෙකක් සමඟ කටයුතු කිරීමට නොකළ යුතු බවය. පළමුවෙන්ම, ඒකීය මට්ටමේ දත්ත කට්ටල එකට සම්බන්ධ කිරීම, වාර්තාගත සම්බන්ධතාවයක් ලෙස හැඳින්වෙන ක්රියාවලියක්, එක් දත්ත කට්ටලයේ නිවැරදි වාර්තාවට ගැලපෙන පරිදි සහතික කිරීම සඳහා යොදා ගත හැකි දත්ත මූලාශ්ර දෙකෙහි අද්විතීය හඳුනාගැනීමක් නොමැති නම්, අපහසු විය හැකිය අනෙකුත් දත්ත කට්ටලවල. පෝෂණය කරන දෙවන ප්රධාන ගැටළුව වන්නේ විශාල දත්ත ප්රභවයේ ගුණාත්මක භාවය පර්යේෂකයන්ට දත්තයන් නිර්මාණය කරන ලද ක්රියාවලියක් වන බැවින් ඒවා පරික්ෂා කිරීම සඳහා අපහසු වන බවය. දෙවන පරිච්ඡේදයේ විස්තර කර ඇති ගැටලු බොහොමයකට ලක් විය හැකි බැවිනි. වෙනත් වචනවලින් කිවහොත්, පොහොසත් වන අසාමාන්ය තත්ත්වයේ කළු කුට්ටි දත්ත මූලාශ්ර සමීක්ෂණ සඳහා නිරීක්ෂණ සම්බන්ධ කිරීම වැරදි ලෙස පැටවීම අසාමාන්ය ලෙස ඉල්ලා ඇත. කෙසේවෙතත්, මෙම ගැටලු තිබියදීත්, ඇමෙරිකාවේ ඡන්ද චේතනාවල රටාවන් පිළිබඳ ඔවුන්ගේ පර්යේෂණයන් තුළ ස්ටීවන් අන්සොලබීර් සහ ඉයන්න් හර්ෂ (2012) විසින් විදහා දැක්වෙන පරිදි වැදගත් පර්යේෂණ පැවැත්වීම සඳහා යොදාගැනේ.
ඡන්දදායකයින්ගේ සහභාගිත්වය දේශපාලන විද්යාව පිළිබඳ පුළුල් පර්යේෂණ විෂයයක් වී ඇති අතර, අතීතයේ දී, සමීක්ෂණ දත්ත විශ්ලේෂණය පදනම් කර ගත් අය කවුද සහ ඇයි කවුරුන් ද යන්න ගැන පර්යේෂකයන්ගේ අවබෝධය. කෙසේවෙතත්, එක්සත් ජනපදයේ ඡන්දය ප්රකාශ කිරීම අසාමාන්ය හැසිරීමකි. සෑම පුරවැසියෙක්ම ඡන්දය භාවිතා කර තිබේ දැයි වාර්තා කර ඇත (ඇත්ත වශයෙන්ම, එක් එක් පුරවැසියෙක් කවුරුන්දැයි වාර්තා නොකෙරේ). වසර ගණනාවක් තිස්සේ රට පුරා විවිධ පළාත් පාලන කාර්යාලවල විසිරී ඇති කඩදාසි ආකෘති පත්ර මෙම රාජ්ය පාලන වාර්තා ලබාගත හැකිය. මෙය දේශපාලනඥයින්ට ඡන්දදායකයින්ගේ සම්පූර්ණ පින්තූරයක් ලබා ගැනීමට සහ ඔවුන්ගේ සැබෑ (Ansolabehere and Hersh 2012) හැසිරීම සමග ඡන්දය ප්රකාශ කිරීම පිළිබඳ සමීක්ෂණවලින් මිනිසුන් පවසන දේ සසඳා බැලීම ඉතා දුෂ්කර වූ නමුත්, එය කළ නොහැකි විය. (Ansolabehere and Hersh 2012) .
නමුත් මෙම ඡන්ද වාර්තා දැන් ඩිජිටල්කරණය කර ඇති අතර, බොහෝ ඇමෙරිකානුවන්ගේ ඡන්ද චර්යාවන් අඩංගු වන පුළුල් මනෝවිද්යාත්මක ලිපිගොනු බිහි කිරීම සඳහා පෞද්ගලික සමාගම් කිහිපයක් ක්රමානුකූලව එකතු කර ඒවා ඒකාබද්ධ කර ඇත. ඇන්සොලබහර් සහ හර්ෂ හවුලේ සාමාජිකයන් අතර වඩා හොඳ චිත්රයක් වර්ධනය කරගැනීමට ඔවුන්ගේ ප්රධාන ඡන්දදායකයන් භාවිතා කිරීම සඳහා මෙම කැටලිස්ට් LCC සමාගම සමඟ හවුල් විය. තවද, ඔවුන්ගේ අධ්යයනය දත්ත රැස් කිරීම සහ සම්මුතිකරණය සඳහා සැලකිය යුතු සම්පත් ආයෝජනය කරන ලද සමාගම විසින් එකතු කරන ලද සහ කෞතුකාගාරය මත පදනම් වූ ඩිජිටල් වාර්තා මත රඳාපවතින නිසා, සමාගම් ආධාරයෙන් තොරව සහ උත්පේ්රර සටහන් භාවිතා කිරීමෙන් පෙර සිදුකරන ලද ප්රයත්නයන්ට වාසි ගණනාවක් ඉදිරිපත් විය.
2 වන පරිච්ඡේදයේ විශාල දත්ත මූලාශ්ර මෙන් මෙන්ම කැටස්ටික් ප්රධාන ගොනුව ඇන්සොලබීර් සහ හර්ෂස් අවශ්ය වූ ජනගහන, ආකල්පමය සහ චර්යාත්මක තොරතුරු ඇතුළත් නොවේ. සැබවින්ම, වලංගු ඡන්දදායක හැසිරීම් සහිත සමීක්ෂණ වල වාර්තාගත ඡන්ද හැසිරීම් වල සංසන්දනය කිරීම (විශේෂයෙන්, කැටිස්ටික් දත්ත ගබඩාවේ තොරතුරු) ඔවුන් සැළකිලිමත් විය. එබැවින් අන්සොලබීර් හා හර්ෂස් මෙම පරිච්ඡේදයේ කලින් සඳහන් කර ඇති CCES ලෙස විශාල සමාජ සමීක්ෂණයක් ලෙස අවශ්ය විය. ඉන්පසු ඔවුන් Catalyst වෙත ඔවුන්ගේ දත්ත ලබා දුනි. කැටලිස්ට් විසින් එය තහවුරු කරන ලද ඡන්දදායක හැසිරීම් (කැටිස්ට්වාදීන්), ස්වයංක්රීයව ඡන්දය ප්රකාශ කිරීමේ හැසිරීම (CCES වෙතින්) සහ ප්රතිචාර දැක්වූවන් (CCES වෙතින්) 3.13). වෙනත් වචනවලින් කියතොත්, අන්සොලබෙහේරා හා හර්ෂල් එක් එක් දත්ත මූලාශ්රය සමග එක් කළ නොහැකි පර්යේෂණ සිදු කිරීම සඳහා සමීක්ෂණ දත්ත සමඟ ඡන්ද දත්ත වාර්තා එකතු කරන ලදි.
ඔවුන්ගේ ඒකාබද්ධ දත්ත ගොනුවේ ඇන්සොලබීර් සහ හර්ෂස් වැදගත් නිගමන තුනකට පැමිණියහ. මුලින්ම ඡන්දය ප්රකාශ කිරීම ගැන අතිශයෝක්තියක් නැත: ඡන්ද දායකයින්ගෙන් අඩක් පමණ ඡන්දය ප්රකාශ කළහ. ඡන්දය ප්රකාශ කළහොත් ඡන්දය ප්රකාශ කළහොත් 80% ක්ම ඔවුන් ඡන්දය දුන්හ. දෙවනුව, වාර්තා කිරීම අහඹු ලෙස නොසැලකේ. රාජ්ය කටයුතු වල යෙදී සිටින ඉහල ආදායම් ලබන, හොඳින් දැනුවත් උන්නතියක, පක්ෂපාතී වූවන් අතර අතිශයින් ජනප්රිය වෙමින් පවතී. වෙනත් වචන වලින් කිවහොත්, ඡන්දය දීමට බොහෝ විට ඉඩ ඇති අය ඡන්දය ගැන බොරු කීමට බොහෝ ඉඩ තිබේ. තෙවනුව, වඩාත්ම විවේචනාත්මකව, අධික ලෙස වාර්තාකරණයේ ක්රමානුකූල ස්වභාවය නිසා ඡන්දදායකයන් සහ නොගැටුම්කරුවන් අතර සැබෑ වෙනස කුඩා ය. නිදසුනක් වශයෙන්, ගණකාධිකරණ උපාධිධාරීන්ගෙන් සියයට 22 ක් වැඩි ඡන්ද සංඛ්යාවක් වාර්තා කිරීමට ඉඩ තිබේ. එහෙත් ඇත්ත වශයෙන්ම ඡන්දය ප්රකාශ කිරීමට ඇත්තේ සියයට 10 ක් පමණි. ඡන්දය ප්රකාශ කිරීමේ දී පවතින සම්පත් මත පදනම් වූ න්යායන් ඇත්ත වශයෙන්ම ඡන්දය දෙන්නේ කවුරුන්දැයි අනාවැකි පල කිරීමකට වඩා ඡන්දදායකයින් වාර්තා කිරීම (කලින් අතීතයේ භාවිතා කරන ලද දත්තයන් කවරේ ද යන්න පිලිබඳව අනාවැකි පළ කරන්නේ කවුරුන්දැයි යන්න වඩාත් විශ්මයට පත් විය හැකිය). මේ අනුව, Ansolabehere and Hersh (2012) සොයා ගැනීම ඡන්දය ප්රකාශ කිරීම සහ අනාවැකි පළ කිරීමට නව න්යායන් සඳහා කැඳවුම් කරයි.
නමුත් අපි මෙම ප්රතිඵල විශ්වාස කළ යුතුද? මතක තබාගන්න, මෙම ප්රතිඵල නොගැලපෙන දෝෂ සහිතව කළු-පෙට්ටි දත්ත වෙත සම්බන්ධ කිරීම වැරදි දිරායන මත රඳා පවතී. වඩාත් විශේෂයෙන්, ප්රධාන පියවර දෙකක කේන්ද්රගත කර ගත් ප්රතිඵල: (1) නිවැරදි දත්ත සමුදායක් නිපදවීම සඳහා විවිධාකාර දත්ත මූලාශ්ර එකතු කිරීම සඳහා කැටිස්ටිස්හි ඇති හැකියාව සහ (2) සමීක්ෂණ දත්ත සිය ප්රධාන දත්ත ගොනුවට සම්බන්ධ කිරීමට කැටලිස්ට් හැකියාව. මේ සෑම පියවරක්ම අපහසු වන අතර එක් පියවරක දෝශයන් පර්යේෂකයන් වැරදි නිගමනවලට මඟ පෙන්වනු ලැබේ. කෙසේ වෙතත්, දත්ත සැකසීම හා සම්බන්ධ කිරීම යන දෙකම සමාගමක් ලෙස කැටිස්ටිස් සමාගමක් ලෙස පවත්වාගෙන යාම සඳහා තීරනාත්මක වන අතර, එම ගැටළු විසඳීමට සම්පත් ආයෝජනය සඳහා සම්පත් ආයෝජනය කළ හැකිය. ඔවුන්ගේ පත්රිකාවේ Ansolabehere සහ Hersh මෙම පියවර දෙකේ ප්රතිඵල පරීක්ෂා කිරීම සඳහා පියවර කිහිපයක් අනුගමනය කරති-ඒවායින් සමහරක් ඒවා හිමිකාරීත්වයන් වන අතර, මෙම චෙක්පත් සමීක්ෂන දත්ත සම්බන්ධ කිරීමට බලාපොරොත්තු වන අනෙකුත් පර්යේෂකයන්ට ප්රයෝජනවත් වනු ඇත. ආරංචි මාර්ග පවසයි.
පර්යේෂකයන්ට මෙම පාඩමෙන් ලබාගත හැකි පොදු පාඩම් මොනවාද? පළමුව, සමීක්ෂණ දත්ත සමගින් විශාල දත්ත මූලාශ්ර පොහොසත් කිරීමෙන් සහ විශාල දත්ත ප්රභවයන් සමීක්ෂණ දත්ත පොහොසත්වීමෙන් (මෙම අධ්යයනය දෙස බැලීමේදී දකින්නට පුළුවන). මෙම දත්ත මූලාශ්ර දෙක ඒකාබද්ධ කිරීමෙන් පර්යේෂකයන්ට තනි තනිවම කළ නොහැකි දෙයක් කිරීමට හැකි විය. දෙවැනි පොදු පාඩම වන්නේ, කැටලිස්ට්වාදීන්ගෙන් දත්ත, වාණිජමය දත්ත මූලාශ්රයන් වුවද, "මූලික සත්යය" ලෙස සැලකිය නොහැක්කේ නම් ඒවා ප්රයෝජනවත් විය හැකිය. Skeptics සමහර විට සම සම්පුර්ණ සත්යයක් සහිත මෙම සමුච්චිත, වාණිජ දත්ත මූලාශ්රය සසඳා බලා මෙම දත්ත ප්රභවයන් කෙටි බව පෙන්වා දෙයි. කෙසේ වෙතත්, මෙම සිද්ධියේදී, සංශයවාදීන්ගේ වැරදි සසඳා බැලීම සිදු කරයි: පර්යේෂකයන් නියත සත්යයේ අඩුවෙන් භාවිතා කරන දත්ත. ඒ වෙනුවට, සමස්ථ දත්ත සමුදායන් සමග සමපේක්ෂන දත්ත සමුදා සන්සන්දනය කිරීම වඩා සුදුසුය (නිදසුනක් ලෙස, ස්වයං-වාර්තාගත ඡන්ද චර්යාවක් ලෙස) සංසන්දනය කිරීම අනිවාර්යයෙන්ම දෝෂ ඇත. අවසාන වශයෙන්, අන්සොලබෙහේරා සහ හර්ෂගේ අධ්යයනයෙහි තුන්වන පොදු පාඩම වන්නේ, සමහර අවස්ථාවන්හිදී, සංකීර්ණ සමාජ දත්ත සමූහයන් එකතු කිරීම සහ ඒවා හසුරුවමින් බොහෝ පෞද්ගලික සමාගම් විසින් සිදු කරන දැවැන්ත ආයෝජනයන්ගෙන් ප්රයෝජන ගත හැකි බවයි.