இந்த அத்தியாயத்தில் சேர்க்கப்படாத ஒரு வகை கவனிக்கத்தக்கது ethnography. டிஜிட்டல் இடைவெளிகளில் Boellstorff et al. (2012) , Boellstorff et al. (2012) ஐப் பார்க்கவும் Boellstorff et al. (2012) , மேலும் கலப்பு டிஜிட்டல் மற்றும் பிசினல் இடைவெளிகளில் எதனோகிராபிக்கில், Lane (2016) .
"பெரிய தரவு" என்ற ஒரே ஒருமித்த வரையறை இல்லை, ஆனால் பல வரையறைகளை "3 Vs": தொகுதி, பல்வேறு மற்றும் வேகம் (எ.கா., Japec et al. (2015) ). De Mauro et al. (2015) பார்க்கவும் De Mauro et al. (2015) வரையறைகளை ஒரு ஆய்வு.
பெரிய தரவு வகையிலான அரசாங்க நிர்வாகத் தரவைக் கொண்டுவருவது ஒரு பிட் அசாதாரணமானது, மற்றவர்கள் இந்த வழக்கை செய்திருந்தாலும், Legewie (2015) , Connelly et al. (2016) , மற்றும் Einav and Levin (2014) . ஆராய்ச்சிக்கான நிர்வாக நிர்வாகத்தின் மதிப்பைப் பற்றி மேலும் அறிய, Card et al. (2010) பலவற்றைக் காண்க Card et al. (2010) , Adminstrative Data Taskforce (2012) , மற்றும் Grusky, Smeeding, and Snipp (2015) அண்ட் Grusky, Smeeding, and Snipp (2015) .
அரசாங்க புள்ளிவிவர முறைமை, குறிப்பாக அமெரிக்க மக்கள்தொகை கணக்கெடுப்பு பணியிடத்தில் இருந்து நிர்வாக ஆராய்ச்சி பற்றிய பார்வைக்காக, Jarmin and O'Hara (2016) ஐப் பார்க்கவும். புள்ளியியல் சுவீடனில் நிர்வாக பதிவுகள் ஆராய்ச்சி புத்தகத்தின் ஒரு நீளமான சிகிச்சைக்காக, Wallgren and Wallgren (2007) .
அத்தியாயம், நான் சுருக்கமாக ட்விட்டர் போன்ற ஒரு சமூக ஊடக தரவு மூலம் பொதுவான சமூக சர்வே (GSS) போன்ற ஒரு பாரம்பரிய ஆய்வு ஒப்பிடும்போது. பாரம்பரிய ஆய்வுகள் மற்றும் சமூக ஊடகத் தரவு ஆகியவற்றுக்கிடையில் ஒரு முழுமையான மற்றும் கவனமான ஒப்பீடுக்காக, Schober et al. (2016) .
பெரிய தரவுகளின் இந்த 10 சிறப்பியல்புகள் பலவிதமான பல்வேறு வழிகளில் வெவ்வேறு வழிகளில் விவரிக்கப்பட்டுள்ளன. இந்த விவகாரங்களில் எனது சிந்தனைக்கு செல்வாக்கு செலுத்துதல் எழுதுதல் Lazer et al. (2009) அடங்கும் Lazer et al. (2009) , Groves (2011) , Howison, Wiggins, and Crowston (2011) , boyd and Crawford (2012) , SJ Taylor (2013) , Mayer-Schönberger and Cukier (2013) , Golder and Macy (2014) , Ruths and Pfeffer (2014) , Tufekci (2014) , Sampson and Small (2015) , K. Lewis (2015b) , Lazer (2015) , Horton and Tambe (2015) , Japec et al. (2015) , மற்றும் Goldstone and Lupyan (2016) .
இந்த அத்தியாயத்தின் முடிவில், நான் டிஜிட்டல் தடயங்களைப் பயன்படுத்தியுள்ளேன் , இது ஒப்பீட்டளவில் நடுநிலைமையாக இருக்கிறது என்று நான் நினைக்கிறேன். டிஜிட்டல் தடயங்கள் மற்றொரு பிரபலமான கால டிஜிட்டல் தடயங்களை உள்ளது (Golder and Macy 2014) , ஆனால் ஹால் Abelson, கென் லீடன், மற்றும் ஹாரி லீவிஸ் (2008) சுட்டிக்காட்ட, ஒரு மிகவும் பொருத்தமான கால ஒருவேளை டிஜிட்டல் கைரேகைகள் உள்ளது. நீங்கள் கால்தடங்களை உருவாக்கும் போது, என்ன நடக்கிறது என்பதையும், உங்கள் அடிச்சுவடுகளை பொதுவாக நீங்கள் தனிப்பட்ட முறையில் கண்டுபிடிக்க முடியாது. உங்கள் டிஜிட்டல் தடங்களுக்கு இது உண்மை இல்லை. உண்மையில், நீங்கள் மிகவும் சிறிய அறிவைக் கொண்டிருக்கும் அனைத்து காலங்களையும் விட்டு விடுகிறீர்கள். மேலும், இந்த தடயங்கள் உங்கள் பெயரைக் கொண்டிருக்கவில்லை என்றாலும், அவர்கள் உங்களை மீண்டும் இணைக்கலாம். வேறு வார்த்தைகளில் கூறுவதானால், அவர்கள் கைரேகைகள் போன்றவை: கண்ணுக்கு தெரியாத மற்றும் தனிப்பட்ட முறையில் அடையாளம் காண்பது.
புள்ளிவிவர சோதனைகள் சிக்கல் நிறைந்ததற்கு ஏன் பெரிய தரவுத்தளங்கள் வழங்கினாலும் M. Lin, Lucas, and Shmueli (2013) மற்றும் McFarland and McFarland (2015) . இந்த பிரச்சினைகள் ஆராய்ச்சியாளர்களை புள்ளிவிவர முக்கியத்துவத்தை விட நடைமுறை முக்கியத்துவத்தில் கவனம் செலுத்த வேண்டும்.
ராஜ் செட்டி மற்றும் சக ஊழியர்களுக்கு வரிச் சான்றுகள் கிடைக்குமா என்பது பற்றி Mervis (2014) .
பெரிய தரவுதளங்கள் ஒரு கணினியின் திறனைத் தாண்டி பொதுவாக கணக்கீட்டு சிக்கல்களை உருவாக்கலாம். எனவே, பெருமளவிலான தரவுத்தளங்களில் கணக்கிடும் ஆராய்ச்சியாளர்கள் பெரும்பாலும் பல கணினிகளில் வேலைகளை பரப்பினர், ஒரு செயல்முறை சில நேரங்களில் இணைய நிரலாக்க என்று அழைக்கப்படுகிறது. இணை நிரலாக்கத்திற்கான ஒரு அறிமுகத்திற்கு, குறிப்பாக ஹடோப் என்ற மொழியில், Vo and Silvia (2016) .
எப்பொழுதும் தரவுகளைப் பற்றி கருத்தில் கொள்ளும்போது, நீங்கள் காலப்போக்கில் சரியான நபர்களை ஒப்பிட்டுப் பார்க்கிறீர்களா அல்லது சில மாறி மாறிவரும் நபர்களை நீங்கள் ஒப்பிடுகிறீர்களோ இல்லையோ, எடுத்துக்காட்டாக, Diaz et al. (2016) .
Nonreactive நடவடிக்கைகள் ஒரு உன்னதமான புத்தகம் Webb et al. (1966) . அந்த புத்தகத்தில் உள்ள உதாரணங்கள் டிஜிட்டல் வயதை முன்வைக்கின்றன, ஆனால் அவை இன்னும் வெளிச்சம். வெகுஜன கண்காணிப்பின் காரணமாக, அவர்களின் நடத்தை மாறும் மக்களுக்கு எடுத்துக்காட்டுக்கு, Penney (2016) மற்றும் Brayne (2014) .
ஆராய்ச்சியாளர்கள் கோரிக்கை விளைவுகளை (Orne 1962; Zizzo 2010) மற்றும் ஹாத்தோர்ன் விளைவு (Adair 1984; Levitt and List 2011) வினைத்திறன் வாய்ந்த தொடர்பு கொண்டது.
Dunn (1946) மற்றும் Fellegi and Sunter (1969) (வரலாற்று) மற்றும் Larsen and Winkler (2014) (நவீன) ஆகியவற்றைப் பார்க்கவும். இதே போன்ற அணுகுமுறைகளும் கணினி விஞ்ஞானத்தில் தரவு துல்லியமாக்கல், (Elmagarmid, Ipeirotis, and Verykios 2007) அடையாளங்கள், பெயர் பொருத்துதல், நகல் கண்டுபிடிப்பு மற்றும் நகல் பதிவு கண்டறிதல் (Elmagarmid, Ipeirotis, and Verykios 2007) . தனிப்பட்ட முறையில் அடையாளம் காணும் தகவல் பரிமாற்றம் தேவையில்லை என்று இணைப்பு பதிவு செய்ய தனியுரிமை-பாதுகாக்கும் அணுகுமுறைகள் உள்ளன (Schnell 2013) . வாக்குப்பதிவு நடத்தைக்கு தங்கள் பதிவை இணைக்க பேஸ்புக் ஒரு செயல்முறையை உருவாக்கியுள்ளது; இந்த அத்தியாயத்தில் 4 (Bond et al. 2012; Jones et al. 2013) பற்றி நான் உங்களுக்கு சொல்லப்போகும் பரிசோதனையை மதிப்பிடுவதற்கு இது செய்யப்பட்டது.
Shadish, Cook, and Campbell (2001) ஆகியவற்றின் Shadish, Cook, and Campbell (2001) அதிகாரத்தைப் பார்க்கவும்.
ஏஓஎல் தேடல் பதிவு தோல்விக்கு மேலும், பார்க்க Ohm (2010) . நான் பரிசோதனையை விவரிக்கும் போது நான்காம் அத்தியாயத்தில் உள்ள நிறுவனங்கள் மற்றும் அரசாங்கங்களுடன் கூட்டுசேர்க்கும் ஆலோசனை வழங்குவேன். அணுக முடியாத தரவுகளை நம்பியிருக்கும் ஆராய்ச்சிகளைப் பற்றி பல ஆசிரியர்கள் தெரிவித்திருக்கிறார்கள், Huberman (2012) மற்றும் boyd and Crawford (2012) .
பல்கலைக்கழக ஆராய்ச்சியாளர்கள் தரவு அணுகல் பெற ஒரு நல்ல வழி ஒரு பயிற்சி அல்லது வருகை ஆராய்ச்சியாளர் ஒரு நிறுவனத்தில் வேலை உள்ளது. தரவு அணுகல் செயல்படுத்த கூடுதலாக, இந்த வழிமுறை ஆராய்ச்சியாளர் ஆய்வு முக்கியம், எப்படி தரவு உருவாக்கப்பட்டது பற்றி மேலும் அறிய உதவும்.
அரசாங்க தரவுகளைப் பெறுவதன் அடிப்படையில், Mervis (2014) ராஜ் செட்டி மற்றும் சகாக்கள் சமூக இயக்கத்தின் மீதான அவர்களின் ஆராய்ச்சியில் பயன்படுத்தப்படும் வரி ஆவணங்களுக்கான அணுகலைப் பெற்றுள்ளனர்.
Kruskal and Mosteller (1979a) Kruskal and Mosteller (1979b) , Kruskal and Mosteller (1979b) , Kruskal and Mosteller (1979c) , மற்றும் Kruskal and Mosteller (1980) Kruskal and Mosteller (1979c) .
ஸ்னோ மற்றும் டால் அண்ட் ஹில்லின் பணியின் சுருக்கமானது சுருக்கமாக இருந்தது. காலரா மீது ஸ்நோவின் வேலை பற்றி மேலும் அறிய, Freedman (1991) . மேலும் பிரிட்டிஷ் டாக்டர்கள் ஆய்வு Doll et al. (2004) பார்க்க Doll et al. (2004) மற்றும் Keating (2014) .
டால் மற்றும் ஹில் பெண் மருத்துவர்கள் மற்றும் 35 வயதிற்குட்பட்ட டாக்டர்களிடமிருந்து தரவை சேகரித்திருந்தாலும், அவற்றின் முதல் பகுப்பாய்வில் வேண்டுமென்றே இந்த தரவைப் பயன்படுத்தவில்லை என்று பல ஆராய்ச்சியாளர்கள் ஆச்சரியப்படுவார்கள். அவர்கள் வாதிட்டது போல்: "நுரையீரல் புற்றுநோய் பெண்களுக்கு 35 வயதிற்கும் குறைவாக இருப்பதால், சில ஆண்டுகளுக்கு வரவிருக்கும் பயனுள்ள குழுக்கள் இந்த குழுக்களில் பெற முடியாதவை. இந்த ஆரம்ப அறிக்கையில் நாங்கள் 35 வயதிற்கும் அதிகமான வயதுடையவர்களுக்கும் எங்கள் கவனத்தைத் தக்கவைத்துள்ளோம். " Rothman, Gallacher, and Hatch (2013) , இது ஆத்திரமூட்டும் தலைப்பு" ஏன் பிரதிநிதித்துவம் தவிர்க்கப்பட வேண்டும், " வேண்டுமென்றே அல்லாத விவரங்களை உருவாக்குதல்.
மொத்த மக்கள்தொகை பற்றிய அறிக்கைகள் செய்ய விரும்பும் ஆய்வாளர்கள் மற்றும் அரசாங்கங்களுக்கெதிராக ஒரு முக்கிய பிரச்சனையாக Nonrepresentativeness உள்ளது. இது பொதுவாக வாடிக்கையாளர்களுக்கு கவனம் செலுத்தும் நிறுவனங்களுக்கான கவலையாக இருக்கிறது. புள்ளிவிவரங்கள் நெதர்லாந்தில் எப்படி பெரிய வணிகத் தரவின் சார்பற்ற தன்மையைக் கருத்தில் கொள்கின்றன என்பதைப் பார்க்க, Buelens et al. (2014) .
ஆராய்ச்சியாளர்கள் பெரிய தரவு ஆதாரங்களின் பிரதிநிதித்துவமற்ற தன்மையைப் பற்றி கவலைப்படுவதைப் பற்றிய எடுத்துக்காட்டுகளுக்கு, K. Lewis (2015b) boyd and Crawford (2012) , K. Lewis (2015b) Hargittai (2015) மற்றும் Hargittai (2015) .
சமூக ஆய்வுகள் மற்றும் நோய் தொற்று ஆய்வுகளின் இலக்குகளை இன்னும் விரிவாக ஒப்பீடு செய்ய, Keiding and Louis (2016) .
வாக்காளர்களைப் பற்றி, குறிப்பாக 2009 ஜேர்மன் தேர்தலில் இருந்து வழக்கை மாற்றுவதற்கான ட்விட்டரைப் பயன்படுத்துவதற்கான முயற்சிகளுக்கு, Jungherr (2013) மற்றும் Jungherr (2015) . Tumasjan et al. (2010) பணியை தொடர்ந்து Tumasjan et al. (2010) உலகெங்கிலும் உள்ள ஆய்வாளர்கள் வெவ்வேறு வகைகளில் பல்வேறு வகைகளைத் தெரிந்துகொள்ள ட்விட்டர் தரவின் திறனை மேம்படுத்துவதற்காக, கட்சிகளின் நேர்மறை மற்றும் எதிர்மறை குறிப்பின்கீழ் வேறுபடுத்தி உணர்ச்சி பகுப்பாய்வுகளைப் பயன்படுத்துவதன் மூலம், ரசிகர் முறைகளைப் பயன்படுத்துகின்றனர் (Gayo-Avello 2013; Jungherr 2015, chap. 7.) . Huberty (2015) தேர்தல்களை முன்கூட்டிக் கணிப்பதற்கான இந்த முடிவுகளின் முடிவுகளை எவ்வாறு சுருக்கிக் கொண்டது:
"சமூக ஊடகங்களின் அடிப்படையிலான அனைத்து அறியப்பட்ட முன்கணிப்பு வழிமுறைகளும் உண்மையான முன்னோக்கு நோக்கிய தேர்தல் முன்னறிவிப்பின் கோரிக்கைகளுக்கு உட்பட்டபோது தோல்வியடைந்தன. இந்த தோல்விகள் வழிமுறை அல்லது நெறிமுறை சிக்கல்களுக்குப் பதிலாக, சமூக ஊடகங்களின் அடிப்படை பண்புகள் காரணமாக தோன்றும். சுருக்கமாக, சமூக ஊடகங்கள் இல்லை, மற்றும் ஒருபோதும் ஒருபோதும், ஒரு நிலையான, நடுநிலையான, பிரதிநிதித்துவமான புகைப்படத்தை வாக்களிப்பதில்லை; மற்றும் சமூக ஊடகங்களின் வசதிக்கான மாதிரிகள் இந்த பிரச்சினைகளை தக்கவைக்க போதுமான தரவு இல்லை. "
அத்தியாயம் 3 ல், நான் மிகவும் விவரம் மாதிரி மற்றும் மதிப்பீடு விவரிக்க வேண்டும். தரவுகள் குறிப்பிடப்படாதவையாக இருந்தாலும், சில நிபந்தனைகளின் கீழ், அவை நல்ல மதிப்பீடுகளை உற்பத்தி செய்ய எடை போடலாம்.
கணினி நகர்வு வெளியே இருந்து பார்க்க மிகவும் கடினமாக உள்ளது. இருப்பினும், MovieLens திட்டம் (அத்தியாயம் 4 இல் விவாதிக்கப்பட்டது) 15 வருடங்களுக்கும் மேலாக ஒரு கல்வி ஆராய்ச்சி குழுவால் இயக்கப்பட்டது. இவ்வாறு, முறைமை காலத்திற்கு (Harper and Konstan 2015) உருவாகியுள்ளதைப் பற்றிய தகவலை ஆவணப்படுத்தவும் பகிர்ந்து கொள்ளவும் முடிந்திருக்கிறது, இது எவ்வாறு பகுப்பாய்வு பாதிக்கக்கூடும் (Harper and Konstan 2015) .
Liu, Kliman-Silver, and Mislove (2014) மற்றும் Tufekci (2014) ஆகியவற்றில் ட்விட்டரில் பல அறிவாளிகள் கவனம் செலுத்துகின்றனர்.
மக்கள் கூட்டத்தை கையாள்வதற்கான ஒரு அணுகுமுறை பயனர்களின் குழுவொன்றை உருவாக்குவதாகும், இது ஆராய்ச்சியாளர்கள் காலப்போக்கில் ஒரே மக்களை ஆய்வு செய்ய அனுமதிக்கிறது, Diaz et al. (2016) .
ஜான் க்ளென்பெர்க் ஒரு பேச்சுக்கு "அல்காரிகிமிக் கவுண்டிங்" என்ற வார்த்தையை நான் முதலில் கேட்டேன், ஆனால் துரதிர்ஷ்டவசமாக நான் எப்போது அல்லது பேச்சு கொடுக்கப்பட்டிருந்தால் எனக்கு நினைவிருக்காது. முதன் முறையாக நான் அந்தப் பிரதியைப் பார்த்தேன் Anderson et al. (2015) , இது டேட்டிங் தளங்கள் பயன்படுத்தும் வழிமுறைகளை ஆராய்ச்சியாளர்களின் திறனை சமூக வலைதளங்களைப் படிக்க இந்த வலைத்தளங்களிலிருந்து தரவுகளைப் பயன்படுத்துவதை சிக்கலாக்கும் என்பதில் ஆர்வமாக உள்ளது. இந்த கவலையை K. Lewis (2015a) எழுப்பினார் Anderson et al. (2014) .
பேஸ்புக் கூடுதலாக, ட்விட்டர் மூடல் என்ற கருத்தை அடிப்படையாகக் கொண்ட பயனாளர்களுக்குப் பயனர்களை மக்கள் பரிந்துரை செய்கிறார்கள்; Su, Sharma, and Goel (2016) . எனவே ட்விட்டரில் முறுக்கு மூடிய நிலை மூவர் மூடல் மற்றும் முக்கோண மூடுமையை மேம்படுத்துவதற்கான சில வழிமுறை போக்கு போன்ற சில மனித போக்குகளின் கலவையாகும்.
சில சமூக விஞ்ஞான கோட்பாடுகள் "என்ஜின்கள் அல்ல கேமிராக்கள்" (அதாவது, அவை உலகத்தை வடிவமைக்கின்றன, மாறாக அதை விவரிப்பதைக் காட்டிலும்) -செ Mackenzie (2008) .
அரசாங்க புள்ளிவிவர முகவர் புள்ளிவிவர தரவு எடிட்டிங் தரவு சுத்தம் அழைப்பு. De Waal, Puts, and Daas (2014) புள்ளிவிவர தரவு எடிட்டிங் நுட்பங்களை கணக்கெடுப்பு தரவரிசைக்கு உருவாக்கி, பெரிய அளவிலான தரவு ஆதாரங்களுக்கு பொருந்தும், மற்றும் Puts, Daas, and Waal (2015) ஒரு பொது பார்வையாளர்.
சமூக போட்களின் கண்ணோட்டத்திற்காக Ferrara et al. (2016) . ட்விட்டரில் ஸ்பேம் கண்டுபிடிப்பதில் கவனம் செலுத்துவதற்கான சில எடுத்துக்காட்டுகளுக்கு Clark et al. (2016) மற்றும் Chu et al. (2012) . இறுதியாக, Subrahmanian et al. (2016) DARPA ட்விட்டர் பாட் சவால் முடிவு விவரிக்கிறது, ட்விட்டர் மீது போட்களை கண்டறியும் அணுகுமுறைகளை ஒப்பிட்டு வடிவமைக்கப்பட்ட ஒரு வெகுஜன ஒத்துழைப்பு.
Ohm (2015) முக்கியமான தகவல் குறித்த யோசனைக்கு முந்தைய ஆய்வுகளை ஆய்வு செய்து பல காரணி சோதனைகளை வழங்குகிறது. அவர் முன்மொழிகின்ற நான்கு காரணங்கள் தீங்குகளின் அளவு, தீங்கின் நிகழ்தகவு, ரகசிய உறவின் இருப்பு, மற்றும் ஆபத்து மனிதாபிமான அக்கறைகளை பிரதிபலிக்கிறதா என்பதாகும்.
நியூயார்க்கில் Camerer et al. (1997) பற்றிய Camerer et al. (1997) ஆய்வு, முந்தைய Camerer et al. (1997) காகிதத் தாள்களின் மூன்று மாறுபட்ட மாதிரிகள் பயன்படுத்தியது. இந்த முந்தைய ஆய்வில், ஓட்டுனர்கள் இலக்கை அடைந்தவர்களாக இருப்பதாகக் கண்டறிந்தனர்: அவர்கள் ஊதியங்கள் அதிகமாக இருந்த நாட்களில் குறைவாகவே வேலை செய்தார்கள்.
அடுத்த வேலைகளில் கிங் மற்றும் சகாக்கள் சீனாவில் ஆன்லைன் தணிக்கை (King, Pan, and Roberts 2014, [@king_how_2016] ) . சீனாவில் ஆன்லைன் தணிக்கை அளவிடுவதற்கு தொடர்புடைய அணுகுமுறைக்கு, Bamman, O'Connor, and Smith (2012) . King, Pan, and Roberts (2013) ஆகியவற்றில் 11 மில்லியன் பதிவுகள் இருப்பதை மதிப்பிடுவதற்குப் பயன்படுத்தப்பட்டுள்ள புள்ளிவிவர முறைகள் பற்றி மேலும் அறிய Hopkins and King (2010) . மேற்பார்வையிடப்பட்ட கற்றலில் மேலும், James et al. (2013) (குறைவான தொழில்நுட்பம்) மற்றும் Hastie, Tibshirani, and Friedman (2009) (மிகவும் தொழில்நுட்பம்).
தொழில்துறை தரவு விஞ்ஞானத்தின் (Mayer-Schönberger and Cukier 2013; Provost and Fawcett 2013) பகுதியாகும் (Mayer-Schönberger and Cukier 2013; Provost and Fawcett 2013) . சமூக ஆய்வாளர்கள் பொதுவாக செய்யப்படுகிற ஒரு வகை முன்கணிப்பு மக்கள் வகைப்பாடு ஆகும்; உதாரணமாக, Raftery et al. (2012) .
Google Flu Trends ஆனது, இப்போது தரவுக் காய்ச்சல் பாதிப்புக்கு தேடல் தரவைப் பயன்படுத்துவதற்கான முதல் திட்டம் அல்ல. உண்மையில், ஐக்கிய மாகாணங்களில் (Polgreen et al. 2008; Ginsberg et al. 2009) மற்றும் ஸ்வீடன் (Hulth, Rydevik, and Linde 2009) ஆராய்ச்சியாளர்கள் குறிப்பிட்ட தேடல் சொற்கள் (எ.கா., "காய்ச்சல்") தேசிய பொது சுகாதார கண்காணிப்பு இது வெளியிடப்பட்டது முன் தரவு. பலர், பல பிற திட்டங்கள் நோய் கண்காணிப்பு கண்டறிதலுக்காக டிஜிட்டல் தரவைப் பயன்படுத்த முயற்சித்துள்ளன; Althouse et al. (2015) பார்க்கவும் Althouse et al. (2015) மதிப்பாய்விற்காக.
சுகாதார விளைவுகளை முன்னறிவிப்பதற்காக டிஜிட்டல் தரவைத் தரவைப் பயன்படுத்துவதோடு கூடுதலாக, தேர்தல் விளைவுகளை முன்னறிவிப்பதற்காக ட்விட்டர் தரவைப் பயன்படுத்தி பெரிய அளவில் வேலை கிடைத்துள்ளது; விமர்சனங்களை பார்க்க Gayo-Avello (2011) , Gayo-Avello (2013) , Jungherr (2015) (அத்தியாயம் 7), மற்றும் Huberty (2015) . மொத்த உள்நாட்டு உற்பத்தி (ஜிடிபி) போன்ற பொருளாதார குறிகாட்டிகளைப் போற்றுதல், மத்திய வங்கிகளிலும் பொதுவானது, Bańbura et al. (2013) . அட்டவணை 2.8 உலகில் சில வகையான நிகழ்வுகளை கணிக்க சில வகையான டிஜிட்டல் சுவடுகளைப் பயன்படுத்தும் ஆய்வுகள் சில உதாரணங்கள் அடங்கும்.
டிஜிட்டல் சுவடு | முடிவு | சான்று |
---|---|---|
ட்விட்டர் | அமெரிக்க திரைப்படங்களில் பாக்ஸ் ஆபிஸின் வருவாய் | Asur and Huberman (2010) |
தேடல் பதிவுகள் | யு.எஸ்ஸில் திரைப்படங்கள், இசை, புத்தகங்கள் மற்றும் வீடியோ விளையாட்டுகள் விற்பனை | Goel et al. (2010) |
ட்விட்டர் | டவ் ஜோன்ஸ் தொழில்துறை சராசரி (அமெரிக்க பங்கு சந்தை) | Bollen, Mao, and Zeng (2011) |
சமூக ஊடக மற்றும் தேடல் பதிவுகள் | அமெரிக்காவில், ஐக்கிய இராச்சியம், கனடா மற்றும் சீனாவில் முதலீட்டாளர் உணர்வு மற்றும் பங்குச் சந்தைகளின் ஆய்வுகள் | Mao et al. (2015) |
தேடல் பதிவுகள் | சிங்கப்பூர் மற்றும் பாங்காக்கில் டெங்கு காய்ச்சல் பரவுதல் | Althouse, Ng, and Cummings (2011) |
இறுதியாக, ஜோன் க்ளீன்பெர்க் மற்றும் சகோ (2015) ஆகியோர், முன்கணிப்புப் பிரச்சினைகள் இரண்டாக மாறி, வெவ்வேறு வகைகளில் விழுந்துவிட்டதாகவும், சமூக விஞ்ஞானிகள் ஒருவரையொருவர் கவனிக்கவும் மற்றவர்களை புறக்கணிக்கவும் முயன்றனர். ஒரு கொள்கை தயாரிப்பாளரை கற்பனை செய்து பாருங்கள், ஒரு வறட்சியை எதிர்கொள்ளும் அண்ணாவை நான் அழைக்கிறேன், மழை வாய்ப்புகளை அதிகரிக்க மழை நடனம் செய்ய ஷமான் ஒன்றை நியமிக்க வேண்டுமா என்று தீர்மானிக்க வேண்டும். இன்னொரு பாலிசி தயாரிப்பாளர், நான் அவளை பெட்டி என்று அழைக்கிறேன், வீட்டிற்குள் ஈரமாக இருப்பதை தவிர்க்க ஒரு குடையை எடுக்க வேண்டுமா என்று தீர்மானிக்க வேண்டும். அன்னா மற்றும் பெட்டி இருவரும் வானிலை உணர்ந்தால் நல்ல முடிவை எடுக்க முடியும், ஆனால் அவர்கள் வெவ்வேறு விஷயங்களை அறிந்து கொள்ள வேண்டும். மழை பெய்யும் மழை பெய்யும் என்பதை அண்ணா புரிந்து கொள்ள வேண்டும். பெட்டி, மறுபுறம், காரணத்திற்காக எதையும் புரிந்து கொள்ள வேண்டிய அவசியமில்லை; அவள் ஒரு துல்லியமான முன்அறிவிப்பு தேவை. சமூக ஆய்வாளர்கள் பெரும்பாலும் அன்னாவால் எதிர்கொள்ளும் பிரச்சினைகள் குறித்து கவனம் செலுத்துகின்றனர்-க்ளீன்ன்பெர்க் மற்றும் சகோ, "மழை நடிப்பு-போன்ற" சிக்கல் பிரச்சினைகள் என அழைக்கின்றனர், ஏனெனில் அவர்கள் காரணகாரியத் தன்மையைக் கொண்டிருப்பார்கள். பெட்டி எதிர்கொள்ளும் ஒரு கேள்வியை க்ளீன்ஸ்பெர்க் மற்றும் சகாக்கள் "குடை போன்ற" கொள்கை சிக்கல்களை அழைக்கிறார்கள்-மிக முக்கியமானதாக இருக்கலாம், ஆனால் சமூக ஆய்வாளர்களிடமிருந்து மிகவும் குறைவான கவனத்தை பெற்றிருக்கிறார்கள்.
இதழ் PS அரசியல் விஞ்ஞானம் பெரிய தரவு, காரணக் கருத்து மற்றும் முறையான கோட்பாடு மற்றும் Clark and Golder (2015) ஒரு பங்களிப்பைக் கொண்டிருந்தது ஒவ்வொரு பங்களிப்பையும் உள்ளடக்கியது. அமெரிக்காவின் அமெரிக்க தேசிய அகாடமி ஆஃப் சயின்சஸ் பத்திரிகையின் பிரகடனங்கள், காரணகாரியமான அனுமானம் மற்றும் பெரிய தரவரிசையில் ஒரு கருத்தரங்கைக் கொண்டிருந்தன, Shiffrin (2016) ஒவ்வொரு Shiffrin (2016) சுருக்கமாகக் கூறுகிறது. பெரிய தரவு ஆதாரங்களின் உள்ளே இயற்கையான சோதனைகள் தானாகவே கண்டறிய முயற்சிக்கும் இயந்திர கற்றல் அணுகுமுறைகளுக்கு, Jensen et al. (2008) , Sharma, Hofman, and Watts (2015) , மற்றும் Sharma, Hofman, and Watts (2016) .
இயற்கையான சோதனைகள் அடிப்படையில், Dunning (2012) பல உதாரணங்கள் கொண்ட அறிமுக, புத்தக நீள சிகிச்சை வழங்குகிறது. இயற்கை சோதனைகள் குறித்த ஒரு சந்தேகத்திற்குரிய பார்வைக்கு, Rosenzweig and Wolpin (2000) (பொருளாதாரம்) அல்லது Sekhon and Titiunik (2012) (அரசியல் அறிவியல்) ஆகியவற்றைப் பார்க்கவும். இயற்கை பரிசோதனைகளில் கவனம் செலுத்துவது ஆராய்ச்சியாளர்களை முக்கியமற்ற விளைவுகளை மதிப்பிடுவதற்கு கவனம் செலுத்தலாம் என்று Deaton (2010) மற்றும் Heckman and Urzúa (2010) வாதிடுகின்றனர்; Imbens (2010) இந்த வாதங்களை இயற்கை பரிசோதனையின் மதிப்பின் மிகச் சிறந்த நம்பிக்கையுடன் கருதுகிறது.
ஒரு ஆய்வாளர் எப்படி செயல்படுவது என்ற முடிவுக்கு ஒரு ஆராய்ச்சியாளர் எவ்வாறு செல்லலாம் என்பதை விவரிக்கும் போது, கருவி மாறிகள் எனப்படும் நுட்பத்தை நான் விவரிக்கின்றேன். Imbens and Rubin (2015) , அவர்களின் அத்தியாயங்களில் 23 மற்றும் 24, ஒரு அறிமுகம் Imbens and Rubin (2015) ஒரு உதாரணம் என வரைவு லாட்டரி பயன்படுத்த. புகார் மீது இராணுவ சேவை விளைவு சில நேரங்களில் இணக்கமான சராசரி காரண விளைவு (CACE) மற்றும் சில நேரங்களில் உள்ளூர் சராசரி சிகிச்சை விளைவு (LATE) அழைக்கப்படுகிறது. Sovey and Green (2011) , Angrist and Krueger (2001) , மற்றும் Bollen (2012) அரசியல் அறிவியல், பொருளாதாரம் மற்றும் சமூகவியல் கருவியாக மாறிகள் பயன்பாடு பற்றிய விமர்சனங்களையும் வழங்க, மற்றும் Sovey and Green (2011) ஒரு "வாசகரின் பட்டியல்" வழங்குகிறது கருவி மாறிகள் பயன்படுத்தி ஆய்வுகள் மதிப்பீடு.
அது 1970 வரைவு லாட்டரி இல்லை, உண்மையில் சரியாக சீரமைக்கப்பட்டது என்று மாறிவிடும்; தூய சீரற்றத்திலிருந்து சிறிய பிழைகள் இருந்தன (Fienberg 1971) . Berinsky and Chatfield (2015) இந்த சிறு விலகல் முக்கியத்துவம் வாய்ந்ததாக இல்லை மற்றும் சரியாக ஒழுங்கமைக்கப்பட்ட சீரற்றமயமாக்கலின் முக்கியத்துவத்தை விவாதிக்கிறது.
பொருந்தும் வகையில், Stuart (2010) ஒரு நம்பிக்கையற்ற ஆய்வுக்காகவும், மற்றும் Sekhon (2009) ஐ ஒரு நம்பிக்கையற்ற ஆய்வுக்காக பார்க்கவும். ஒரு வகையான கத்தரிக்காயைப் பொருத்துவதற்கு, Ho et al. (2007) . ஒவ்வொரு நபர் ஒரு ஒற்றை சரியான பொருத்தம் கண்டறிவது பெரும்பாலும் கடினம், மற்றும் இது சிக்கல்களை பல அறிமுகப்படுத்துகிறது. முதலாவதாக, துல்லியமான போட்டிகள் கிடைக்காதபோது, இரண்டு அலகுகளுக்கு இடையேயான தூரம் எவ்வாறு அளவிடப்பட வேண்டும் என்பதை தீர்மானிக்க வேண்டும். ஆராய்ச்சியாளர்கள் ஒவ்வொரு குழுவிற்கும் பல வழக்குகளை சிகிச்சைக் குழுவில் பயன்படுத்த விரும்பினால் இரண்டாவது சிக்கலான தன்மை ஏற்படுகிறது, ஏனெனில் இது மேலும் துல்லியமான மதிப்பீட்டிற்கு வழிவகுக்கும். இந்த இரண்டு சிக்கல்களும் அத்துடன் மற்றவையும், Imbens and Rubin (2015) 18 ஆம் அதிகாரத்தில் விவரிக்கப்பட்டுள்ளன. பார்க்கவும் இரண்டாம் பகுதி ( ??? ) .
Dehejia and Wahba (1999) ஆகியவற்றைக் Dehejia and Wahba (1999) , ஒரு சீரற்ற கட்டுப்பாட்டு பரிசோதனையுடன் ஒப்பிடுகையில், மதிப்பீட்டு முறைகளை மதிப்பீடு செய்ய முடிந்தது. ஆனால், Arceneaux, Gerber, and Green (2006) மற்றும் Arceneaux, Gerber, and Green (2010) , இதில் சோதனை முறைகள் ஒரு சோதனை பெஞ்ச்மார்க் மீண்டும் உருவாக்கப்படவில்லை.
Rosenbaum (2015) மற்றும் Hernán and Robins (2016) ஆகியவை பெரிய தரவு ஆதாரங்களில் பயனுள்ள ஒப்பீடுகளை கண்டுபிடிப்பதற்கு மற்ற ஆலோசனைகளை வழங்குகின்றன.