ठूला डेटा स्रोतहरू सबै ठाउँमा छन्, तर तिनीहरूलाई प्रयोग गरी सामाजिक अनुसन्धानको लागि कठोर हुन सक्छ। मेरो अनुभवमा, डेटाको लागि "कुनै निःशुल्क लंच" नियम जस्तै केही छ: यदि तपाईले यसको इकट्ठा धेरै काममा राख्नुभएन भने, तपाई सम्भवतः धेरै काममा राख्नु पर्छ यसको बारेमा सोच्नुहोस् र यसलाई विश्लेषण गर्नुहोस्।
आजको - र सम्भावित भोलिको ठूलो डेटा स्रोतहरू 10 विशेषताहरू हुन्छन्। यी तीनवटा सामान्यतया (तर सँधै) अनुसन्धानका लागि सहयोगी छैनन्: ठूला, सचेतक, र अनावश्यक। सात सामान्यतया (तर सँधै) अनुसन्धानका लागि समस्याग्रस्त छन्: अपूर्ण, अपर्याप्त, अपरिवर्तनीय, बहाव गर्ने, एल्गोरिदममिक रूपले घिमिरेको, गन्दा र संवेदनशील। यी धेरै विशेषताहरू अन्ततः उठ्छ किनभने सामाजिक अनुसन्धानको उद्देश्यका लागि ठूला डेटा स्रोतहरू सिर्जना भएनन्।
यस अध्यायमा भएका विचारहरूको आधारमा, मलाई लाग्छ कि तीनवटा मुख्य तरिकाहरू छन् जुन ठूलो डेटा स्रोतहरू सामाजिक अनुसन्धानको लागि बहुमूल्य हुनेछन्। पहिलो, उनीहरूले शोधकर्ताहरू सैद्धान्तिक भविष्यवाणीहरूको प्रतिस्पर्धामा निर्णय गर्न सक्षम गर्न सक्छन्। यस प्रकारको कामका उदाहरणहरू Farber (2015) (न्यूयोर्क ट्याक्सी ड्राइवरहरू) र King, Pan, and Roberts (2013) (चीनमा सेंसरशिप)। दोस्रो, ठूला डेटा स्रोतहरूले अब प्रसारणको माध्यमबाट नीतिको लागि सुधारको माप सक्षम गर्न सक्छ। यस प्रकारको कामको उदाहरण Ginsberg et al. (2009) (Google फ्लू रुझान)। अन्तमा, ठूला डेटा स्रोतहरूले शोधकर्ताहरूको प्रयोग बिना प्रयोग चलिरहेको अनुमान अनुमानहरू गर्न सक्छन्। यस प्रकारको कामका उदाहरणहरू Mas and Moretti (2009) (उत्पादकतामा साथीहरूको प्रभाव) र Einav et al. (2015) (eBay मा नीलामियों मा मूल्य शुरू को प्रभाव)। तथापि, यी दृष्टिकोणहरु मध्ये प्रत्येक को शोधकर्ताहरु को डेटा को लागि एकदम धेरै ल्याउन को लागी आवश्यकता हो, जस्तै कि मात्रा को परिभाषा को अनुमान गर्न को लागी महत्त्वपूर्ण छ वा प्रतिस्पर्धात्मक भविष्यवाणी गर्ने दुई सिद्धान्तहरु। यसकारण, मलाई लाग्छ कि कुन ठूलो डेटा स्रोतहरूले गर्न सक्छ भन्ने बारे सोच्ने उत्तम तरिका हो कि उनीहरूले शोधकर्ताहरूलाई रोचक र महत्त्वपूर्ण प्रश्न सोध्न मद्दत गर्न सक्छन्।
समाप्ति गर्नु अघि, मलाई लाग्छ कि यो विचारको लायक छ कि ठूलो डेटा स्रोतहरु डेटा र सिद्धान्त बीच सम्बन्धमा महत्त्वपूर्ण प्रभाव हुन सक्छ। अहिलेसम्म, यो अध्यायले सिद्धान्त-प्रेरित अनुभविक अनुसन्धानको दृष्टिकोण लिइसकेको छ। तर ठूला डेटा स्रोतहरूले शोधकर्ताहरूले व्यावहारिक रूपान्तरणको काम गर्न सक्षम गर्छन्। यो अनुभव, तथ्यहरू, ढाँचाहरू र पेलोहरूप्रति सावधानीपूर्वक संकलन गरेर, शोधकर्ताहरू नयाँ सिद्धान्तहरू निर्माण गर्न सक्छन्। यो विकल्प, डेटाको सिद्धान्तको नयाँ दृष्टिकोण नयाँ छैन, र यो सबै भन्दा बलियो रूपमा बर्नई ग्लेजर र एन्सेल स्ट्रास (1967) द्वारा ग्राउन्ड सिद्धान्तको लागी उनको साथ थियो। यो डाटा-पहिलो दृष्टिकोण, तथापि, "युगको अन्त्य" को लागी संकेत गर्दैन, जस्तै डिजिटल युगमा अनुसन्धानको वरिपरी पत्रकारितामा दाबी गरिएको छ (Anderson 2008) । बरु, डेटा वातावरण परिवर्तनको रूपमा, हामीले डेटा र सिद्धान्त बीचको सम्बन्धमा पुनरुत्थानको अपेक्षा गर्नुपर्छ। एक ठाउँमा जहाँ डेटा संग्रह महंगी थियो, यो केवल डेटा एकत्र गर्न को लागी समझदारी भयो कि सिद्धान्तहरु लाई सबै भन्दा उपयोगी हुनेछ। तर, विश्वमा जहाँ धेरै मात्रामा डेटा निःशुल्क रूपमा उपलब्ध छन्, यसले डेटा-पहिलो दृष्टिकोण प्रयास गर्न पनि अर्थ दिन्छ (Goldberg 2015) ।
मैले यस अध्यायमा देखेको छु जस्तो लाग्छ, शोधकर्ताहरूले धेरै मानिसलाई हेरेर धेरै सिक्न सक्छन्। अर्को तीन अध्यायहरुमा, म वर्णन गर्दछु कि हामी हाम्रो डेटा सङ्कलन गर्न र कसरी सीधा सम्पर्क गर्न सक्नुहुन्छ (अध्याय 3), चलिरहेको प्रयोगहरू (अध्याय 4), र यहाँ पनि समावेश अनुसन्धान प्रक्रियामा सिधै (अध्याय 5)।