अनुरूप उमेर मा, डेटा सङ्कलन व्यवहार-जो, महंगी र त्यसैले, अपेक्षाकृत दुर्लभ जब-थियो के गर्छ। अब, डिजिटल युगमा मानिसहरूले अरबौं को व्यवहार, लिपिबद्ध छन् भण्डारण र analyzable। उदाहरणका लागि, तपाईं वेबसाइटमा क्लिक हरेक समय, आफ्नो सेल फोनमा कल, वा आफ्नो क्रेडिट कार्ड संग केहि तिर्न, आफ्नो व्यवहार को एक डिजिटल रेकर्ड सिर्जना र एक व्यवसाय भण्डारण गरिएको छ। यी डाटा मानिसहरूको हरेक दिन कामको द्वारा-उत्पादन हुन्, ती अक्सर डिजिटल निशान भनिन्छ। कारोबार द्वारा आयोजित यी निशान साथै, सरकारको पनि मानिसहरू र व्यवसायीहरूको दुवै बारेमा अविश्वसनीय धनी डाटा, अक्सर डिजीटल र analyzable छ डाटा छ। सँगै यी व्यापार र सरकारी रेकर्ड अक्सर ठूलो डाटा भनिन्छ।
ठूलो डाटा को कहिल्यै बढ्दो बाढी व्यवहार डाटा जहाँ व्यवहार डाटा धेरै छ संसार गर्न अभाव थियो जहाँ हामी एक संसारबाट सरेको छ भन्ने हो। तर, यी प्रकार डाटा अपेक्षाकृत नयाँ हो किनभने, तिनीहरूलाई प्रयोग अनुसन्धान को एक दुर्भाग्यपूर्ण रकम वैज्ञानिकहरूले आँखा बंद उपलब्ध डाटा chasing जस्तो देखिन्छ। यो अध्याय, बरु डाटा को विभिन्न स्रोतहरूबाट समझलाई एक सैद्धान्तिक दृष्टिकोण प्रदान गर्दछ र तिनीहरू कसरी प्रयोग गर्न सकिन्छ। यो धनी समझ तपाईं राम्रो डाटा को उपयुक्त स्रोतहरू आफ्नो अनुसन्धान प्रश्नहरू मेल मदत गर्नुपर्छ। वा, यदि यस्तो अवस्थित स्रोतहरू कमी छन्, तपाईं भविष्यमा अध्याय मा विचार प्रयोग गरेर आफ्नै डाटा संकलन गर्न विश्वस्त।
अवलोकनीय डाटा: ठूलो डाटा सिक्नु एउटा पहिलो कदम यो डाटा को फराकिलो श्रेणी धेरै वर्ष को लागि सामाजिक अनुसन्धान को लागि प्रयोग गरिएको छ कि को भाग हो भन्ने महसुस गर्न छ। लगभग, अवलोकनीय डाटा केही तरिका मा हस्तक्षेप बिना एक सामाजिक प्रणाली नियालेर देखि परिणाम कुनै पनि डाटा छ। यो सोच्न एक कच्चा बाटो अवलोकनीय डाटा मान्छे (जस्तै, सर्वेक्षण, अध्याय 3 को विषय) वा मानिसहरूको वातावरण (जस्तै, प्रयोग, अध्याय 4 को विषय) परिवर्तन संग कुरा समावेश गर्दैन सबै छ भन्ने छ। त्यसैले, व्यापार र सरकारी रेकर्ड बाहेक, अवलोकनीय डाटा पनि अखबार लेख र उपग्रह फोटो पाठ समावेश गर्दछ।
यो अध्याय तीन भागहरु छ। पहिलो, धारा 2.2 मा, म ठूलो डाटा थप विस्तार वर्णन र यसलाई र साधारण विगतमा सामाजिक अनुसन्धान को लागि प्रयोग गरिएको छ कि डाटा बीच आधारभूत भिन्नता स्पष्ट। त्यसपछि, धारा 2.3 मा, म ठूलो डाटा स्रोतहरु को दस साधारण विशेषताहरु वर्णन। यी विशेषताहरु बुझ्ने हामीलाई तुरुन्तै तागत र विद्यमान स्रोतहरुको कमजोरी पहिचान गर्न र भविष्यमा सिर्जना गरिने नयाँ स्रोतहरू दोहन मदत गर्नेछ सक्षम बनाउँछ। गणना कुराहरू, पूर्वानुमान कुराहरू र एक प्रयोग approximating: अन्तमा, धारा 2.4 मा, म तीन मुख्य अनुसन्धान रणनीति भनेर अवलोकनीय डाटा सिक्न प्रयोग गर्न सक्नुहुन्छ वर्णन।