મોટા ડેટા સ્ત્રોતોમાં માપદંડ વર્તણૂક બદલવાની શક્યતા ઓછી છે
સામાજિક સંશોધનનો એક પડકાર એ છે કે લોકો તેમના વર્તનને બદલી શકે છે જ્યારે તેઓ જાણતા હોય છે કે તેઓ સંશોધકો દ્વારા નિહાળવામાં આવી રહ્યાં છે. સામાજીક વૈજ્ઞાનિકો સામાન્ય રીતે આ પ્રતિક્રિયાને (Webb et al. 1966) . ઉદાહરણ તરીકે, લોકો ક્ષેત્ર અભ્યાસ કરતા પ્રયોગશાળાના અભ્યાસોમાં વધુ ઉદાર બની શકે છે કારણ કે ભૂતકાળમાં તેઓ ખૂબ જ વાકેફ છે કે તેઓ (Levitt and List 2007a) જોઇ રહ્યાં છે. ઘણા સંશોધકોએ આશાસ્પદ શોધી કાઢેલ મોટા ડેટાના એક પાસા એ છે કે સહભાગીઓ સામાન્ય રીતે જાણતા નથી કે તેમનો ડેટા કબજે કરવામાં આવી રહ્યો છે અથવા તેઓ આ ડેટા સંગ્રહને ટેવાયેલા બની ગયા છે કે તે હવે તેમના વર્તનને બદલે નહીં. કારણ કે સહભાગીઓ બિનઅનુભવ છે , તેથી, મોટા ડેટાના ઘણા સ્રોતોનો ઉપયોગ વર્તણૂકનો અભ્યાસ કરવા માટે થઈ શકે છે જે અગાઉ ચોક્કસ માપન માટે સક્ષમ ન હતો ઉદાહરણ તરીકે, Stephens-Davidowitz (2014) યુનાઇટેડ સ્ટેટ્સના જુદા જુદા પ્રદેશોમાં Stephens-Davidowitz (2014) માપવા માટે સર્ચ એન્જિન ક્વેરીઝમાં જાતિવાદી શબ્દોનો ઉપયોગ કરે છે. બિન-સક્રિય અને મોટા (વિભાગ 2.3.1 જુઓ) સર્વેક્ષણ જેવા અન્ય પદ્ધતિઓનો ઉપયોગ કરવાનું મુશ્કેલ બનશે તેવા શોધ ડેટાને સક્ષમ કરવામાં આવશે.
બિનપ્રક્રિયા, જો કે, આ માહિતી લોકોના વર્તન અથવા વર્તણૂકોનું કોઈ સીધું પ્રતિબિંબ નથી તેની ખાતરી કરતું નથી. ઉદાહરણ તરીકે, ઇન્ટરવ્યૂ-આધારિત અભ્યાસમાં પ્રતિસાદરૂપે એક વ્યક્તિએ કહ્યું હતું કે, "તે નથી કે મને સમસ્યા નથી, હું તેમને ફેસબુક પર મૂકી રહ્યો નથી" (Newman et al. 2011) . બીજા શબ્દોમાં કહીએ તો, તેમ છતાં કેટલાક મોટા માહિતી સ્ત્રોતો બિનઅનુભવી છે, તેઓ હંમેશા સામાજિક ઇચ્છનીયતા પૂર્વગ્રહથી મુક્ત નથી, લોકોની શ્રેષ્ઠ વલણમાં પોતાને પ્રસ્તુત કરવા માટેનું વલણ. વધુમાં, હું પ્રકરણમાં પાછળથી વર્ણન કરું છું તેમ, મોટા ડેટા સ્ત્રોતોમાં મેળવવામાં આવતી વર્તણૂક ક્યારેક પ્લેટફોર્મ માલિકોના લક્ષ્યો દ્વારા પ્રભાવિત થાય છે, એક મુદ્દો હું એલ્ગોરિધમિક ગૂંચવણને કૉલ કરું છું. છેવટે, બિન-સક્રિયતા સંશોધન માટે ફાયદાકારક છે, તેમ છતાં લોકોની વર્તણૂકની તેમની સંમતિ વિના ટ્રેકિંગ અને જાગરૂકતા એ નૈતિક ચિંતાઓ ઉભી કરે છે કે હું પ્રકરણ 6 માં વિગતવાર વર્ણન કરું છું.
ત્રણ ગુણધર્મ જે મેં હમણાં જ વર્ણવ્યાં છે-મોટા, હંમેશાં, અને બિનઅનુકૂલિત-સામાન્ય રીતે, પરંતુ સામાજિક સંશોધન માટે હંમેશાં લાભકારક નથી આગળ, હું મોટા ડેટા સ્રોતોના સાત ગુણધર્મો-અપૂર્ણ, અપ્રાપ્ય, બિન-પ્રતિનિધિ, ડ્રિફ્ટિંગ, એલ્ગોરિધમિકલી ગૂંચવણભર્યા, ગંદી અને સંવેદનશીલ-સામાન્ય રીતે, પરંતુ હંમેશાં નહીં, સંશોધન માટે સમસ્યા ઊભી કરી શકું છું.