ठूलो डेटा स्रोतमा मापन व्यवहार व्यवहार परिवर्तन गर्ने सम्भावना कम छ।
सोशल रिसर्चको एक चुनौती यो हो कि व्यक्तिहरूले उनीहरूको व्यवहार परिवर्तन गर्दा उनीहरूले शोधकर्ताहरूले देखेका छन्। सामाजिक वैज्ञानिकहरूले सामान्यतया यो रिएटिटीलाई फोन गर्छन् (Webb et al. 1966) । उदाहरणको लागि, क्षेत्रीय अध्ययन भन्दा प्रयोगशाला प्रयोगशाला अध्ययनमा अधिक उदार हुन सक्छ किनभने पहिले उनीहरूलाई धेरै चिन्ता छ कि उनीहरूलाई (Levitt and List 2007a) देखिन सकिन्छ। ठूलो डेटाको एक पहलू जुन धेरै शोधकर्ताहरूले प्रतिज्ञा पाएका छन् कि सहभागिताहरू सामान्यतः थाहा छैन कि तिनीहरूका डेटाहरू क्याप्चर भइरहेको छ वा तिनीहरू यस डेटा सङ्कलनको आदी बनेका छन् जुन यसले तिनीहरूको व्यवहार परिवर्तन गर्दैन। किनकि सहभागीहरू अनावश्यक छन् , त्यसकारण, ठूलो डाटाका थुप्रै स्रोतहरू व्यवहारको अध्ययन गर्न प्रयोग गर्न सकिन्छ जुन अघिल्लो मापमा उत्तरदायी नहुने छैन। उदाहरणका लागि, Stephens-Davidowitz (2014) ले संयुक्त राज्य अमेरिकाका विभिन्न इलाकाहरूमा नस्मात्मक एनिमसको मात्रामा खोज इन्जिन क्वेरीहरूमा नस्लवादी शब्दहरूको प्रचलन प्रयोग गर्यो। अनावश्यक र ठुलो (खण्ड 2.3.1 हेर्नुहोस्) खोज डेटा सक्षम मापनहरूको प्रकृति जुन अन्य तरिकाहरू प्रयोग गर्नमा गाह्रो हुनेछ, जस्तै सर्वेक्षणहरू।
तथापि, यो डेटा सुनिश्चित गर्न सक्दैन कि यी डेटाहरू कसैको व्यवहार वा मनोवृत्तिको प्रत्यक्ष प्रतिबिम्ब हो। उदाहरणका लागि, एक साक्षात्कार आधारित साक्षात्कारमा भने, "यो मसँग समस्या छैन, म मात्र फेसबुकमा राखिनँ" (Newman et al. 2011) । अर्को शब्दमा, यद्यपि केही ठूला डेटा स्रोतहरू अपरिहार्य छन्, तिनीहरू सधैँ सामाजिक वांछित पूर्वाग्रहहरू मुक्त छैनन्, मानिसहरूका लागि प्रवृत्ति आफूलाई आफूलाई राम्रो तरिकाले प्रस्तुत गर्न चाहन्छन्। यसबाहेक, म पछि अध्यायमा वर्णन गर्नेछु, ठूलो डेटा स्रोतहरूमा कब्जा गरेको व्यवहार कहिलेकाहीं प्लेटफर्म मालिकहरूको लक्ष्यद्वारा प्रभावित हुन्छ, एक समस्याले म एल्गोरिदममलाई ठुलो आवाज दिन्छु। अन्ततः, गैरकानुनीताता अनुसन्धानको लागी फायदेमंद भइरहेको छ भने, उनीहरुको सहमति र जागरूकता बिना ब्यक्तिको व्यवहारलाई नैतिक चिन्ता बढाउँछ जुन म अध्याय 6 मा विस्तारको वर्णन गर्दछु।
मैले मात्र वर्णन गरेको तीन गुणहरू - ठूला, सचेतक, र गैर-निष्क्रिय-सामान्यतया, तर सँधै, सामाजिक अनुसन्धानको लागि फायदेमंद। अर्को, म ठूलो डाटा स्रोतहरू - अपूर्ण, अपर्याप्त, गैर-प्रतिनिधि, बहावट, एल्गोरिदममा घिमिरे, गहिरो, र संवेदनशीलताको सात गुणहरू मा परिणत गर्नेछु, तर सामान्यतया, अनुसन्धानको लागि समस्या सिर्जना गर्नुहोस्।