பல மக்கள் ஒரு பெரிய தரவு மூலம் ஒரு சில மக்கள் கணக்கெடுப்பு தரவு இணைக்க முன்கணிப்பு மாதிரி பயன்படுத்தி கேட்டு பெரிதாக்கப்பட்டது.
கணக்கெடுப்பு மற்றும் பெரிய தரவு ஆதாரங்களை ஒன்றிணைப்பதற்கான ஒரு வித்தியாசமான வழி, நான் கேட்கும் பெருக்கம் என்று அழைக்கிறேன். கேட்டல் பெருகிய முறையில், ஒரு ஆராய்ச்சியாளர் ஒரு சிறிய அளவிலான கணக்கெடுப்பு தரவை ஒரு பெரிய அளவிலான தரவு மூலத்தை இணைக்க ஒரு முன்மாதிரி மாதிரியைப் பயன்படுத்துகிறது. பெருமளவிலான கேள்விகளை கேட்கும் ஒரு முக்கியமான உதாரணம், ஜோஷ்வா ப்ளூம்ஸ்டாக் நிறுவனத்தின் வேலைகளில் இருந்து வருகிறது, ஏழை நாடுகளில் வழிகாட்டலை மேம்படுத்துவதற்கு உதவக்கூடிய தரவுகளை சேகரிக்க விரும்பினேன். கடந்த காலத்தில், இத்தகைய தரவு சேகரிக்கும் ஆராய்ச்சியாளர்கள் பொதுவாக இரண்டு அணுகுமுறைகளில் ஒன்றை எடுத்துக் கொள்ள வேண்டும்: மாதிரி ஆய்வுகள் அல்லது மக்கள் தொகை கணக்கெடுப்புகள். ஆய்வாளர்கள் ஒரு சிறிய எண்ணிக்கையிலான நபர்களை பேட்டி காண்பிக்கும் மாதிரி ஆய்வுகள் நெகிழ்வான, சரியான நேரத்தில், ஒப்பீட்டளவில் மலிவானவை. எனினும், இந்த ஆய்வுகள், அவை ஒரு மாதிரி அடிப்படையிலானவை என்பதால், பெரும்பாலும் அவற்றின் தீர்மானத்தில் குறைவாகவே உள்ளன. ஒரு மாதிரி கணக்கெடுப்புடன், குறிப்பிட்ட புவியியல் பகுதிகள் அல்லது குறிப்பிட்ட மக்கள் குழுக்களுக்கு மதிப்பீடு செய்ய கடினமாக உள்ளது. மறுபுறம் மக்கள் தொகை கணக்கெடுப்பு, அனைவருக்கும் பேட்டி அளிக்க முயற்சி செய்கின்றன, எனவே அவை சிறிய புவியியல் பகுதிகள் அல்லது மக்கள்தொகை குழுக்களுக்கான மதிப்பீடுகளை உருவாக்க பயன்படுத்தப்படுகின்றன. ஆனால் மக்கள் தொகை கணக்கெடுப்புகள் பொதுவாக விலை உயர்ந்தவை (அவை சிறிய எண்ணிக்கையிலான கேள்விகளை மட்டுமே கொண்டுள்ளன), மற்றும் சரியான நேரத்தில் அல்ல (ஒவ்வொரு 10 ஆண்டுகளிலும் ஒரு குறிப்பிட்ட கால அட்டவணையில் நடக்கும்) (Kish 1979) . ஆராய்ச்சியாளர்கள் இருவரின் சிறந்த சிறப்பியல்புகளை இணைத்துக்கொள்ள முடியுமா என கற்பனை செய்து கொள்ளுங்கள். ஒவ்வொரு நாளும் ஒவ்வொரு ஆண்டும் ஒவ்வொரு கேள்வியும் ஆராய்ச்சியாளர்கள் கேட்க முடியுமா என்று கற்பனை செய்து பாருங்கள். வெளிப்படையாக, இந்த எங்கும், எப்பொழுதும்-கணக்கெடுப்பு ஒரு வகையான சமூக அறிவியல் கற்பனை. ஆனால் பல நபர்களிடமிருந்து டிஜிட்டல் தடயங்களைக் கொண்ட ஒரு சிறிய எண்ணிக்கையிலான மக்களிடமிருந்து கணக்கெடுப்பு கேள்விகளை இணைப்பதன் மூலம் இதை தோராயமாக ஆரம்பிக்க முடியும் என்று தோன்றுகிறது.
ருவாண்டாவில் மிகப்பெரிய மொபைல் ஃபோன் வழங்குனருடன் பங்கெடுத்தபோது ப்ளூம்ஸ்டாக் ஆராய்ச்சி தொடங்கியது. 2005 மற்றும் 2009 ஆம் ஆண்டுகளுக்கு இடையே சுமார் 1.5 மில்லியன் வாடிக்கையாளர்களிடமிருந்து அனாமெய்டு பரிவர்த்தனை பதிவுகள் வழங்கப்பட்டது. இந்த பதிவுகளில் ஒவ்வொரு அழைப்பு மற்றும் உரை செய்தியைப் பற்றிய தகவல்கள் உள்ளன, தொடக்க நேரம், காலம் , மற்றும் அழைப்பாளர் மற்றும் பெறுநரின் தோராயமான புவியியல் இருப்பிடம். புள்ளிவிவர சிக்கல்களைப் பற்றி பேசுவதற்கு முன்பு, இந்த முதல் படி பல ஆராய்ச்சியாளர்களுக்கு கடினமான ஒன்றாகும் என்று சுட்டிக்காட்டும் மதிப்பு. நான் 2-ஆம் அதிகாரத்தில் விவரித்துள்ளபடி, மிகப்பெரிய தரவு ஆதாரங்கள் ஆராய்ச்சியாளர்களுக்கு அணுக முடியாதவை . தொலைபேசி மெட்டா டேட்டா குறிப்பாக குறிப்பாக அணுக முடியாதது என்பதால், இது அநாமதேயத்திற்கு அத்தியாவசியமற்றதாக உள்ளது மற்றும் பங்கேற்பாளர்கள் முக்கியமானவைகளை (Mayer, Mutchler, and Mitchell 2016; Landau 2016) கருத்தில் (Mayer, Mutchler, and Mitchell 2016; Landau 2016) நிச்சயமாக உள்ளது. இந்த குறிப்பிட்ட வழக்கில், ஆராய்ச்சியாளர்கள் தரவைப் பாதுகாக்க கவனமாக இருந்தனர் மற்றும் அவர்களின் வேலை மூன்றாம் தரப்பினரால் மேற்பார்வை செய்யப்பட்டது (அதாவது, அவர்களின் IRB). அத்தியாயம் 6-ல் இன்னும் விரிவாக இந்த நெறிமுறைகளுக்கு நான் திரும்புவேன்.
செல்வத்தையும் அளவையும் அளவிடுவதில் ப்ளூமென்ஸ்டாக் ஆர்வமாக இருந்தார். ஆனால் இந்த குணங்கள் நேரடியாக அழைப்பு பதிவில் இல்லை. வேறு வார்த்தைகளில் கூறுவதானால், இந்த அழைப்பு பதிவுகள் இந்த ஆராய்ச்சிக்கு முழுமையடையாதது -அத்தியாயம் 2-ல் விரிவாக விவாதிக்கப்படும் பெரிய தரவு ஆதாரங்களின் பொதுவான அம்சம். எனினும், அழைப்புப் பதிவுகள் அநேகமாக சில தகவல்களைப் பெற்றுள்ளன, அவை மறைமுகமாக செல்வத்தைப் பற்றிய தகவலை நன்கு இருப்பது. இந்த சாத்தியம் இருப்பதால், Blumenstock தங்கள் அழைப்பு பதிவுகள் அடிப்படையில் ஒரு கணக்கெடுப்புக்கு ஒருவர் பதிலளிக்கும் எப்படி கணிக்க ஒரு இயந்திர கற்றல் மாதிரி பயிற்சி சாத்தியம் என்பதை கேட்டார். இது சாத்தியமானால், 1.5 மில்லியன் வாடிக்கையாளர்களின் கணக்கெடுப்புகளை முன்னறிவிப்பதற்காக ப்ளூம்ஸ்டாக் இந்த மாதிரியைப் பயன்படுத்த முடியும்.
அத்தகைய மாதிரியை உருவாக்க மற்றும் பயிற்சியளிப்பதற்கு, க்யூலியி இன்ஸ்டிடியூட் ஆஃப் சைன்ஸ் அண்ட் டெக்னாலஜி நிறுவனத்தின் பிளமன்ஸ்டாக் மற்றும் ஆராய்ச்சி உதவியாளர்களால் ஆயிரம் வாடிக்கையாளர்களைப் பற்றிய ஒரு சீரற்ற மாதிரி என்று அழைக்கப்பட்டது. ஆராய்ச்சியாளர்கள் பங்கேற்பாளர்களின் திட்டத்தின் இலக்குகளை விளக்கினர், அழைப்பு பதில்களுக்கு கணக்கெடுப்பு பதில்களை இணைக்க தங்கள் ஒப்புதலுக்காக கேட்டனர், பின்னர் தங்கள் செல்வத்தையும் அளவையும் அளவிடுவதற்கு தொடர்ச்சியான கேள்விகளைக் கேட்டனர். வானொலி? "மற்றும்" நீங்கள் ஒரு சைக்கிள் வைத்திருக்கிறீர்களா? "(பகுதியளவு பட்டியலுக்கு பார்க்க 3.14 ஐப் பார்க்கவும்). கணக்கெடுப்பில் பங்கு பெற்ற அனைவரும் நிதியளித்தனர்.
அடுத்து, ப்ரூமென்ஸ்டாக் இயந்திர கற்றல் பொதுவாக இரண்டு படிநிலை நடைமுறைகளைப் பயன்படுத்தினார்: அம்ச பொறியியல், தொடர்ந்து கண்காணிக்கப்பட்ட கற்றல். முதலாவதாக, அம்சம் பொறியியல் படியில், பேட்டி என்று அனைவருக்கும் ஏற்ற, Blumenstock அழைப்புப் பதிவுகளின் படி ஒவ்வொரு நபர் பற்றிய குணாதிசயங்களை ஒரு தொகுப்பு மாற்றப்படுகிறது; தரவு விஞ்ஞானிகள் இந்த பண்புகளை "அம்சங்கள்" என்று அழைக்கலாம் மற்றும் சமூக விஞ்ஞானிகள் "மாறிகள்" என்று அழைக்கலாம். உதாரணமாக, ஒவ்வொரு நபருக்கும் Blumenstock கணக்கிடப்பட்ட நாட்களின் எண்ணிக்கை, ஒரு நபரின் தனிப்பட்ட தொடர்பு காலகட்டத்தில் செலவழிக்கப்பட்ட தொகை, மற்றும் பல. விமர்சன ரீதியாக, நல்ல அம்ச பொறியியல், ஆராய்ச்சி அமைப்பை அறிந்திருக்க வேண்டும். உதாரணமாக, உள்நாட்டு மற்றும் சர்வதேச அழைப்புகளுக்கு இடையில் வேறுபடுவது முக்கியமானது என்றால் (சர்வதேச அளவில் சர்வதேச அளவில் அழைக்கப்படும் நபர்களை நாங்கள் எதிர்பார்க்கலாம்), இது அம்சம் பொறியியல் படிவத்தில் செய்யப்பட வேண்டும். ருவாண்டாவைப் பற்றி கொஞ்சம் புரிந்த ஒரு ஆராய்ச்சியாளர் இந்த அம்சத்தைக் கொண்டிருக்கக்கூடாது, பின்னர் அந்த மாதிரி முன்கணிப்பு செயல்திறன் பாதிக்கப்படும்.
அடுத்து, மேற்பார்வை செய்யப்பட்ட கற்கைநெறிகளில், Blumenstock ஆனது ஒவ்வொரு நபருக்கும் அவர்களின் அம்சங்களை அடிப்படையாகக் கொண்ட கணக்கெடுப்பு பதிலை முன்னறிவிப்பதற்கான மாதிரியை உருவாக்கியது. இந்த வழக்கில், Blumenstock லாஜிஸ்டிக் பின்னடைவைப் பயன்படுத்தினார், ஆனால் அவர் வேறுபட்ட புள்ளிவிவர அல்லது இயந்திர கற்றல் அணுகுமுறைகளை பயன்படுத்தினார்.
அது எவ்வளவு நன்றாக வேலை செய்தது? Blumenstock ஆனது கேள்விகளுக்கு "நீங்கள் ஒரு வானொலியை வைத்திருக்கிறீர்களா?" மற்றும் "நீங்கள் ஒரு சைக்கிளை வைத்திருக்கிறீர்களா?" போன்ற கேள்விகளைப் பதிவு செய்ய முடியுமா? அவரது கணிப்பு மாதிரியின் செயல்திறனை மதிப்பிடுவதற்காக, ப்ளூமன்ஸ்டாக் குறுக்கு-மதிப்பீட்டைப் பயன்படுத்தினார், இது தரவு அறிவியல் பொதுவாக பயன்படுத்தப்படும் நுட்பம் ஆனால் அரிதாக சமூக அறிவியல். குறுக்கு சரிபார்ப்பின் குறிக்கோள், மாதிரியின் முன்கணிப்பு செயல்திறனை மதிப்பீடு செய்வதன் மூலம் அதை பயிற்றுவித்தல் மற்றும் தரவுகளின் வெவ்வேறு உட்பிரிவுகளில் அதைப் பரிசோதித்தல். குறிப்பாக, Blumenstock தனது தரவுகளை ஒவ்வொன்றிலும் 100 நபர்கள் 10 துண்டுகளாக பிரிக்கலாம். பின்னர், அவர் தனது மாதிரியைப் பயிற்றுவிப்பதற்காக ஒன்பது துணிகளைப் பயன்படுத்தினார், பயிற்சி பெற்ற மாதிரியின் முன்கணிப்பு செயல்திறன் மீதமுள்ள துண்டின் மீது மதிப்பீடு செய்யப்பட்டது. இந்த செயல்முறையை 10 முறை திரும்பத் திரும்பச் செய்தார் - ஒவ்வொரு துண்டையும் தரவு ஒரு திருப்புமுனையைத் தரவல்லது எனவும், முடிவுகள் சராசரியாகவும் இருந்தது.
கணிப்புகள் துல்லியமாக சில பண்புகள் உயர் (புள்ளி 3.14); உதாரணமாக, ஒரு வானொலி சொந்தமாக இருந்தால் Blumenstock 97.6% துல்லியம் கணிக்க முடியும். இது சுவாரஸ்யமானதாக இருக்கலாம், ஆனால் ஒரு எளிய மாற்றுக்கு எதிராக ஒரு சிக்கலான கணிப்பு முறையை ஒப்பிட்டு எப்போதும் முக்கியம். இந்த வழக்கில், அனைவருக்கும் மிகவும் பொதுவான பதில் கொடுக்கும் என்று ஒரு எளிய மாற்று கணிக்க வேண்டும். உதாரணமாக, 97.3% பதிலளித்தவர்களில் ஒரு ரேடியை வைத்திருப்பதாக ப்ளூமென்ஸ்டாக் கூறியிருந்தால், எல்லோரும் ஒரு வானொலி வைத்திருப்பதாக அறிவித்திருந்தால், அவர் 97.3% துல்லியமான துல்லியம் உடையவராக இருந்திருப்பார், இது அவரது சிக்கலான செயல்முறை (97.6% துல்லியம்) . வேறு வார்த்தைகளில் சொன்னால், அனைத்து ஆடம்பரமான தகவல்கள் மற்றும் மாடலிங் ஆகியவை முன்னறிவிப்பின் துல்லியத்தை 97.3% லிருந்து 97.6% வரை அதிகரித்தன. இருப்பினும், "நீங்கள் ஒரு மிதிவண்டி வைத்திருக்கிறீர்களா?" போன்ற பிற கேள்விகளுக்கு, கணிப்புகள் 54.4% இலிருந்து 67.6% வரை அதிகரித்தன. மேலும் பொதுவாக, 3.15 சில குணாதிசயங்களுக்கான பிளமன்ஸ்ஸ்டாக் எளிமையான அடிப்படை கணிப்புத் தரத்தை உருவாக்கும் அளவுக்கு முன்னேறவில்லை, ஆனால் மற்ற பண்புகளுக்கு சில முன்னேற்றம் ஏற்பட்டது. இந்த முடிவுகளை மட்டும் பார்த்தால், இந்த அணுகுமுறை குறிப்பாக உறுதியளிக்கும் என்று நீங்கள் நினைக்கலாம்.
எனினும், ஒரு வருடம் கழித்து, Blumenstock மற்றும் இரு சக ஊழியர்கள்-கேப்ரியல் Cadamuro மற்றும் ராபர்ட் On- கணிசமாக சிறந்த முடிவுகளை அறிவியல் (Blumenstock, Cadamuro, and On 2015) ஒரு காகித வெளியிட்டது. இந்த முன்னேற்றத்திற்கான இரண்டு முக்கிய தொழில்நுட்ப காரணங்கள் இருந்தன: (1) அவர்கள் இன்னும் அதிநவீன வழிமுறைகளை (அதாவது, பொறியியல் அம்சங்களைக் கொண்ட புதிய அணுகுமுறை மற்றும் அம்சங்களிலிருந்து பதில்களைத் தீர்க்கும் ஒரு அதிநவீன மாதிரி) மற்றும் (2) ஆய்வுக் கேள்விகள் (எ.கா., "நீங்கள் ஒரு வானொலியைக் கொண்டிருக்கின்றீர்களா?"), அவர்கள் ஒரு கூட்டுச் செல்வவள குறியீட்டை ஊகிக்க முயன்றனர். இந்த தொழில்நுட்ப முன்னேற்றங்கள், தங்கள் மாதிரிகளில் மக்களுக்கு செல்வத்தை முன்னறிவிப்பதற்கான அழைப்பு பதில்களைப் பயன்படுத்தி அவர்கள் நியாயமான வேலை செய்ய முடியும் என்பதாகும்.
ஆய்வில் உள்ள மக்களின் செல்வத்தை கணிப்பது, ஆய்வின் இறுதி இலக்கு அல்ல. வளரும் நாடுகளில் வறுமை பற்றிய துல்லியமான, உயர் தீர்மானம் மதிப்பீடுகளை தயாரிப்பதற்காக மாதிரி ஆய்வுகள் மற்றும் மக்கள்தொகை கணக்கெடுப்புகளின் சிறந்த சிறப்பியல்புகளை இணைப்பது இறுதி இலக்கு என்று நினைவில் கொள்ளுங்கள். இந்த இலக்கை அடைவதற்கான அவர்களின் திறனை மதிப்பிடுவதற்காக, Blumenstock மற்றும் சக பணியாளர்கள் தங்கள் மாதிரியைப் பயன்படுத்தி தங்கள் பதிவை பயன்படுத்தி 1.5 மில்லியன் மக்களை அழைப்பிற்குள் பதிவு செய்தனர். ஒவ்வொரு நபரின் குடியிருப்பு பகுதியையும் (எண்ணிக்கை 3.17) மதிப்பிடுவதற்காக, அழைப்பின் பதிவுகளில் உட்பொதிக்கப்பட்ட புவிவெப்பியல் தகவலை (ஒவ்வொரு அழைப்புக்குமான அருகிலுள்ள செல் கோபுரத்தின் இருப்பிடத்தை உள்ளடக்கியது). இந்த இரண்டு மதிப்பீட்டை ஒன்றாக சேர்த்து, Blumenstock மற்றும் சக ஊழியர்கள் சந்தாதாரர் செல்வவளத்தின் புவியியல் பரவலை மிகவும் சிறப்பான பிரத்தியேக நுண்ணுயிரிகளால் மதிப்பிட்டனர். உதாரணமாக, அவர்கள் ருவாண்டாவின் 2,148 செல்கள் (நாட்டின் மிகச்சிறந்த நிர்வாக பிரிவு) சராசரி செல்வத்தை மதிப்பிட முடியும்.
இந்த மதிப்பீடுகள் இந்த பிராந்தியங்களில் உண்மையான வறுமை நிலைக்கு எவ்வளவு பொருந்துகின்றன? நான் அந்த கேள்விக்கு பதிலளிக்கும் முன், சந்தேகத்திற்குரிய காரணங்கள் நிறைய உள்ளன என்ற உண்மையை நான் வலியுறுத்த விரும்புகிறேன். உதாரணமாக, தனிப்பட்ட மட்டத்தில் கணிப்புகள் செய்யும் திறன் மிகவும் சத்தமாக இருந்தது (எண்ணிக்கை 3.17). மேலும், ஒருவேளை மிக முக்கியமாக, மொபைல் போன்களைக் கொண்டவர்கள் மொபைல் போன்களை இல்லாமல் மக்களிடமிருந்து முறையாக வேறுபட்டிருக்கலாம். எனவே, நான் முன்பு விவரித்த 1936 இலக்கிய டைஜெஸ்ட் கணக்கெடுப்புக்கு சார்பாக பிளமன்ஸ்ஸ்டாக் மற்றும் சக ஊழியர்கள் கவரேஜ் பிழைகள் வகைப்படுத்தப்படலாம்.
அவற்றின் மதிப்பீடுகளின் தரத்தை அறிந்து கொள்வதற்காக Blumenstock மற்றும் சக ஊழியர்கள் மற்றவர்களுடன் ஒப்பிட்டுப் பார்க்க வேண்டும். அதிர்ஷ்டவசமாக, தங்கள் ஆய்வு அதே நேரத்தில், ஆராய்ச்சியாளர்கள் மற்றொரு குழு ருவாண்டா ஒரு பாரம்பரிய சமூக கணக்கெடுப்பு இயங்கும். பரந்தளவில் மதிக்கப்படும் மக்கள்தொகை மற்றும் சுகாதார ஆய்வு திட்டத்தின் பகுதியாக இருந்த இந்த ஆய்வு, ஒரு பெரிய வரவுசெலவுத் திட்டத்தை கொண்டிருந்தது, உயர் தரமான, பாரம்பரிய முறைகளைப் பயன்படுத்தியது. எனவே, மக்கள் தொகை கணக்கெடுப்பு மற்றும் உடல்நல கணக்கெடுப்பு மதிப்பீடுகள் தங்க மதிப்பீட்டை மதிப்பீடு செய்யலாம். இரண்டு மதிப்பீடுகள் ஒப்பிடும்போது, அவர்கள் மிகவும் ஒத்ததாக இருந்தது (எண்ணிக்கை 3.17). வேறு வார்த்தைகளில் கூறுவதானால், அழைப்பு பதிவுகள் ஒரு சிறிய அளவு கணக்கெடுப்பு தரவு இணைப்பதன் மூலம், Blumenstock மற்றும் சக தங்க-நிலையான அணுகுமுறைகளில் இருந்து அந்த ஒப்பிடக்கூடிய மதிப்பீடுகள் உற்பத்தி முடிந்தது.
ஒரு ஏமாற்றம் இந்த முடிவுகளை ஒரு ஏமாற்றமாக பார்க்கக்கூடும். எல்லாவற்றிற்கும் மேலாக, அவற்றைப் பார்ப்பதற்கு ஒரு வழி பெரிய தரவு மற்றும் இயந்திர கற்றல் மூலம், Blumenstock மற்றும் சகாக்களும் ஏற்கனவே இருக்கும் முறைகளால் இன்னும் நம்பத்தகுந்த வகையில் செய்யக்கூடிய மதிப்பீடுகளை உருவாக்க முடிந்தது. ஆனால் இரண்டு காரணங்களுக்காக இந்த ஆய்வு பற்றி சிந்திக்க சரியான வழி என்று நான் நினைக்கவில்லை. முதலாவதாக, ப்ளூமன்ஸ்டாக் மற்றும் சக ஊழியர்களின் மதிப்பீடுகள் சுமார் 10 மடங்கு வேகமாகவும் 50 மடங்கு மலிவானதாகவும் இருந்தன (மாறி செலவினங்களின் அடிப்படையில் செலவு கணக்கிடப்படும் போது). இந்த அத்தியாயத்தில் நான் முன்பு வாதிட்டது போல, ஆராய்ச்சியாளர்கள் தங்கள் ஆபத்தில் செலவழித்தனர். உதாரணமாக, உதாரணமாக, செலவில் வியத்தகு குறைவு என்பது, ஒவ்வொரு சில வருடங்களுக்கும் மேலாக இயங்குவதைக் காட்டிலும், மக்கள் தொகை கணக்கெடுப்பு மற்றும் சுகாதார ஆய்விற்கான தரநிலையாக இருப்பதால், இந்த வகையான ஆய்வு ஒவ்வொரு மாதமும் இயங்கும், ஆராய்ச்சியாளர்கள் மற்றும் கொள்கைக்கு பல நன்மைகளை வழங்கும் தயாரிப்பாளர்கள். இரண்டாவது ஆய்வு, இந்த ஆய்வு, பல்வேறு ஆராய்ச்சி சூழல்களுக்கு இணங்கக்கூடிய ஒரு அடிப்படை செய்முறையை அளிக்கிறது என்பதில் சந்தேகமே இல்லை. இந்த செய்முறைக்கு இரண்டு பொருட்கள் மற்றும் இரண்டு படிகள் உள்ளன. (1) பரந்த ஆனால் மெல்லிய (அதாவது, பல நபர்கள் இருப்பினும் ஒவ்வொரு நபரைப் பற்றிய தகவலும் இல்லை) மற்றும் (2) குறுகிய ஆனால் தடிமனான ஒரு ஆய்வு (அதாவது, ஒரு சிலர், ஆனால் அந்த மக்களைப் பற்றி உங்களுக்குத் தேவையான தகவலை அது கொண்டுள்ளது). இந்த பொருட்கள் பின்னர் இரண்டு படிகளில் இணைக்கப்படுகின்றன. முதலில், இரு தரவு மூலங்களில் உள்ள மக்களுக்காக, கணக்கெடுப்பு பதில்களை முன்னறிவிப்பதற்காக பெரிய தரவு மூலத்தைப் பயன்படுத்தும் இயந்திர கற்றல் மாதிரியை உருவாக்குங்கள். அடுத்து, பெரிய தரவு மூலத்தில் உள்ள அனைவரின் கணக்கெடுப்பு பதில்களையும் நிரூபிக்க அந்த மாதிரி பயன்படுத்தவும். எனவே, நீங்கள் நிறைய பேர் கேட்க வேண்டும் என்று கேள்வி இருந்தால், நீங்கள் பெரிய தரவு மூல பற்றி கவலை இல்லை என்றால் கூட , அவர்களின் பதில் கணிக்க பயன்படுத்தப்படும் என்று அந்த மக்கள் ஒரு பெரிய தரவு மூலம் பார்க்க. அதாவது, Blumenstock மற்றும் சகவாதிகள் அழைப்பு பதிவுகள் பற்றி இயல்பாகவே அக்கறை காட்டவில்லை; அவர்கள் பதிவுகளை பற்றி மட்டுமே அக்கறை கொண்டார்கள், ஏனெனில் அவர்கள் அக்கறை கொண்ட கணக்கெடுப்பு பதில்களை முன்னறிவிக்க பயன்படுத்தலாம். பெரிய தரவு மூலத்தில் இந்த தனித்தன்மை வாய்ந்த ஒரே மறைமுக ஆர்வம், முன்பு நான் விவரித்திருக்கும் உட்பொதிந்த கோரிக்கையிலிருந்து வேறுபட்டது.
முடிவில், Blumenstock இன் பெருமளவிலான கேட்டு அணுகுமுறை ஒரு கணக்கெடுப்பு தரவு ஒரு பெரிய தரவு மூலம் இணைந்த தங்க மதிப்பீடு இருந்து ஒப்பிடுகையில் மதிப்பீடுகள் உற்பத்தி. இந்த குறிப்பிட்ட எடுத்துக்காட்டு மேலும் கேட்கப்பட்ட மற்றும் பாரம்பரிய கணக்கெடுப்பு வழிமுறைகளுக்கு இடையேயான சில வர்த்தகங்களை தெளிவுபடுத்துகிறது. பெருமளவிலான கேட்டுக் கொண்டிருக்கும் மதிப்பீடுகள் இன்னும் சரியான நேரத்தில், கணிசமாக மலிவானவை, மேலும் சிறுமணி. ஆனால், மறுபுறம், இந்த வகையான பெருமளவிலான கேள்விகளுக்கு இன்னும் வலுவான தத்துவார்த்த அடிப்படை இல்லை. இந்த அணுகுமுறை செயல்படும் போது, இந்த ஒற்றை எடுத்துக்காட்டு காண்பிக்கப்படாது, அது இல்லை, மற்றும் இந்த அணுகுமுறையைப் பயன்படுத்தும் ஆராய்ச்சியாளர்கள் குறிப்பாக யார் சேர்க்கப்பட்டாலும், யார் சேர்க்கப்படவில்லை என்பதையும், மற்றும் அவற்றின் பெரிய தரவு ஆதாரத்தில் சேர்க்கப்படாத சாத்தியக்கூறுகள் பற்றி குறிப்பாக கவலைப்பட வேண்டும். மேலும், விரிவான அணுகுமுறை அணுகுமுறை இன்னும் அதன் மதிப்பீட்டை சுற்றியுள்ள நிச்சயமற்ற தன்மையை அளவிட நல்ல வழிகளில் இல்லை. அதிர்ஷ்டவசமாக, பெரிதும் அதிகரித்துள்ள புள்ளிவிவரங்கள்-சிறிய பகுதி மதிப்பீடு (Rao and Molina 2015) , ஊடுருவல் (Rubin 2004) மற்றும் மாடல் அடிப்படையிலான பிந்தைய-அடுக்குகள் (இது மிக நெருக்கமாக பி. நான் முன்னதாக விவரித்த முறை அத்தியாயம் (Little 1993) . இந்த ஆழமான இணைப்புகளின் காரணமாக, பெருமளவிலான வினவல்களின் பயன்முறை அடித்தளங்கள் விரைவில் மேம்படுத்தப்படும் என்று நான் எதிர்பார்க்கிறேன்.
இறுதியாக, ப்ளூமன்ஸ்டாக் முதல் மற்றும் இரண்டாவது முயற்சிகள் டிஜிட்டல்-வயது சமூக ஆராய்ச்சியைப் பற்றி ஒரு முக்கிய படிப்பினைக் காட்டுகின்றன: ஆரம்பம் முடிவு அல்ல. அதாவது, பல முறை, முதல் அணுகுமுறை சிறந்ததாக இருக்காது, ஆனால் ஆராய்ச்சியாளர்கள் தொடர்ந்து வேலை செய்தால், விஷயங்கள் சிறப்பாக கிடைக்கும். மேலும் பொதுவாக, டிஜிட்டல் வயதில் சமூக ஆராய்ச்சிக்கான புதிய அணுகுமுறைகளை மதிப்பிடும் போது, இரண்டு தனித்தனி மதிப்பீடுகளை செய்வது மிகவும் முக்கியமானதாகும்: (1) இப்போது இது எவ்வாறு வேலை செய்கிறது? மற்றும் (2) தரவு இயற்கை மாற்றங்கள் மற்றும் ஆராய்ச்சியாளர்கள் என எதிர்காலத்தில் இந்த வேலை சிக்கல் இன்னும் கவனம் செலுத்த எவ்வளவு நன்றாக இருக்கும்? ஆராய்ச்சியாளர்கள் முதல் வகையான மதிப்பீடு செய்ய பயிற்சி பெற்ற போதிலும், இரண்டாவது மிக முக்கியமானது.