मापन बहुत कम बड़ा डेटा स्रोतों में व्यवहार बदलने की संभावना है।
सामाजिक अनुसंधान में से एक चुनौती है कि लोगों को उनके व्यवहार को बदल सकते हैं, जब वे जानते हैं कि वे शोधकर्ताओं द्वारा मनाया जा रहा है। सामाजिक वैज्ञानिकों आम तौर पर शोधकर्ता माप जेट के जवाब में इस व्यवहार को बदलने फोन (Webb et al. 1966) कि कई शोधकर्ता का वादा खोजना बड़ा डेटा का एक पहलू यह है कि प्रतिभागियों को आम तौर पर पता है कि अपने डेटा पर कब्जा कर लिया जा रहा है या वे इतना है कि यह अब अपने व्यवहार में परिवर्तन इस डेटा संग्रह करने के आदी हो गए हैं नहीं कर रहे हैं। क्योंकि वे गैर प्रतिक्रियाशील रहे हैं, इसलिए, बड़ा डेटा के कई स्रोत व्यवहार कि पहले सही माप के लिए संशोधनीय नहीं किया गया अध्ययन करने के लिए इस्तेमाल किया जा सकता है। उदाहरण के लिए, Stephens-Davidowitz (2014) संयुक्त राज्य अमेरिका के अलग-अलग क्षेत्रों में नस्लीय विरोध को मापने के लिए खोज इंजन प्रश्नों में जातिवाद शर्तों के प्रसार के लिए इस्तेमाल किया। खोज डेटा का गैर प्रतिक्रियाशील और बड़ा (पिछले अनुभाग देखें) प्रकृति सक्षम माप है कि इस तरह के सर्वेक्षणों के रूप में अन्य तरीकों का उपयोग कर मुश्किल होगा।
गैर-जेट, तथापि, यह सुनिश्चित नहीं है कि इन आंकड़ों को किसी भी तरह एक सीधा लोगों के व्यवहार या व्यवहार के प्रतिबिंबित कर रहे हैं। उदाहरण के लिए, एक प्रतिवादी के रूप में बताया Newman et al. (2011) , दूसरे शब्दों में, भले ही कुछ बड़े डेटा स्रोतों गैर प्रतिक्रियाशील रहे हैं, वे हमेशा सामाजिक वांछनीयता पूर्वाग्रह से मुक्त नहीं कर रहे हैं "ऐसा नहीं है कि मैं समस्याओं, मैं सिर्फ उन्हें फेसबुक पर डाल नहीं कर रहा हूँ। जरूरत नहीं है नहीं है" लोगों के लिए प्रवृत्ति सबसे अच्छा तरीका संभव में खुद को पेश करने के लिए चाहते हैं। इसके अलावा, के रूप में मैं और अधिक नीचे का वर्णन करेंगे, इन आंकड़ों के सूत्रों कभी कभी मंच मालिकों के लक्ष्यों से प्रभावित कर रहे हैं, एक समस्या एल्गोरिथम confounding कहा जाता है (अधिक नीचे वर्णित)।
हालांकि गैर जेट अनुसंधान के लिए लाभप्रद है, उनकी सहमति और जागरूकता के बिना लोगों के व्यवहार पर नज़र रखने के नैतिक चिंताओं अध्याय 6. वृद्धि की डिजिटल निगरानी के खिलाफ एक सार्वजनिक प्रतिक्रिया बड़ा डाटा सिस्टम्स नेतृत्व समय के साथ और अधिक प्रतिक्रियाशील बनने के लिए कर सकता है, और मजबूत करने में नीचे और विस्तार से चर्चा उठाती है डिजिटल निगरानी के बारे में चिंता भी गैर representativity (अधिक नीचे वर्णित) के बारे में चिंता बढ़ रही है, पूरी तरह से बाहर निकलना बड़ा डेटा सिस्टम के लिए प्रयास करने के लिए कुछ लोगों को ले जा सकता है।
सामाजिक अनुसंधान-बड़े, हमेशा पर, और गैर प्रतिक्रियाशील आम तौर पर पैदा होती है क्योंकि इन डेटा स्रोतों के अनुसंधान के लिए अनुसंधानकर्ताओं द्वारा नहीं बनाया गया था के लिए बड़ा डेटा के इन तीन अच्छे गुण। अब, मैं बड़ा डेटा स्रोत है कि अनुसंधान के लिए खराब कर रहे हैं के सात गुण को बदल देंगे। इन सुविधाओं को भी उठता क्योंकि इस डेटा शोध के लिए शोधकर्ताओं द्वारा नहीं बनाया गया था जाते हैं।