பெரிய தரவு ஆதாரங்களில் அளவீடு நடத்தை மாற்ற மிகவும் குறைவாக உள்ளது.
சமூக ஆராய்ச்சிக்கான ஒரு சவாலானது ஆராய்ச்சியாளர்களால் தாங்கள் கவனித்துக் கொண்டிருப்பதை அறிந்திருக்கும்போது மக்கள் தங்கள் நடத்தை மாற்றிக்கொள்ள முடியும். சமூக விஞ்ஞானிகள் பொதுவாக இந்த வினைத்திறனை (Webb et al. 1966) அழைக்கிறார்கள். உதாரணமாக, ஆய்வக ஆராய்ச்சிகளில் விட மக்கள் ஆய்வக ஆராய்ச்சிகளில் அதிக தாராளமாக இருக்க முடியும், ஏனென்றால் முன்னர் அவர்கள் கவனிக்கப்படுகிறார்கள் என்பதையும் (Levitt and List 2007a) கவனிக்கப்படுகின்றனர். பல ஆராய்ச்சியாளர்கள் உறுதியளித்த பெரிய தரவுகளின் ஒரு அம்சம் என்னவென்றால், பங்கேற்பாளர்கள் தங்கள் தரவுகளை கைப்பற்றுவதாக பொதுவாக தெரியவில்லை அல்லது இந்த தரவு சேகரிப்புக்கு இது பழக்கமில்லை, அது இனி அவர்களது நடத்தையை மாற்றாது. பங்குதாரர்கள் nonreactive ஏனெனில், எனவே, பெரிய தரவு பல ஆதாரங்கள் முன்னர் துல்லியமான அளவீடுகளுக்கு இணக்கமற்ற நடத்தை படிக்க பயன்படுத்த முடியும். உதாரணமாக, Stephens-Davidowitz (2014) அமெரிக்காவில் உள்ள பல்வேறு பகுதிகளில் இனவெறி நடவடிக்கைகளை அளவிடுவதற்காக தேடு பொறி வினவல்களில் இனவாத வார்த்தைகளின் பாதிப்புகளைப் பயன்படுத்தியது. சர்வேக்கள் போன்ற மற்ற முறைகள் பயன்படுத்தி கடினமானதாக இருக்கும் தேடல் தரவு செயலாக்க அளவீடுகளின் இயல்பற்ற மற்றும் பெரிய (பிரிவு 2.3.1 ஐப் பார்க்கவும்).
எவ்வாறாயினும், இந்தத் தரவு எப்படியாவது மக்களுடைய நடத்தை அல்லது மனப்போக்குகளின் நேரடி பிரதிபலிப்பு என்பதை உறுதிப்படுத்தாது. உதாரணமாக, பேட்டியில் அடிப்படையாகக் கொண்ட ஆய்வு ஒன்றில் பதிலளித்தவர், "எனக்கு பிரச்சினைகள் இல்லையென்றாலும், பேஸ்புக்கில் அவற்றை வைத்துக் கொள்வது இல்லை" என்று கூறினார் (Newman et al. 2011) . வேறு வார்த்தைகளில் கூறுவதானால், சில பெரிய தரவு ஆதாரங்கள் இயல்பற்றவை என்றாலும், அவை எப்போதும் சமூக விருப்பமின்மை சார்புடையவை அல்ல, மக்களுக்கு மிகச்சிறந்த முறையில் தங்களை முன்வைக்க விரும்புவதற்கான போக்கு. மேலும், நான் அத்தியாயம் பின்னர் விவரிக்க வேண்டும் என, பெரிய தரவு ஆதாரங்களில் கைப்பற்றப்பட்ட நடத்தை சில நேரங்களில் மேடையில் உரிமையாளர்கள் இலக்கு பாதிக்கப்படும், ஒரு சிக்கல் நான் படிமுறை குழப்பம் அழைக்கிறேன். இறுதியாக, ஆராய்ச்சிக்கு சாதகமற்றதாக இருப்பினும், அவர்களின் அனுமதியின்றி, விழிப்புணர்வை இல்லாமல் மக்களின் நடத்தையை கண்காணிப்பது, நான் 6-ஆம் அதிகாரத்தில் விவரிக்கிறேன் என்ற நெறிமுறை கவலைகளை எழுப்புகிறது.
நான் விவரித்துள்ள மூன்று பண்புகள்-பெரிய, எப்போதும்-மீது, மற்றும் nonreactive-பொதுவாக உள்ளன, ஆனால் எப்போதும், சமூக ஆராய்ச்சி சாதகமான. அடுத்து, பெரிய தரவு ஆதாரங்களின் ஏழு பண்புகளை நான் திரும்பச் செய்வேன். முழுமையடையாத, அணுக முடியாத, பிரதிநிதித்துவம் இல்லாத, டிரிஃப்டிங், அல்காரிதிக்மிக்ஸைக் குழப்பம், அழுக்கு மற்றும் உணர்திறன் ஆகியவை பொதுவாக, ஆனால் எப்போதும் ஆராய்ச்சிக்கான பிரச்சனைகளை உருவாக்குகின்றன.