एनालॉग युग में, के बारे में डेटा इकट्ठा व्यवहार-कौन क्या करता है महंगा है, और इसलिए, अपेक्षाकृत दुर्लभ जब-थी। अब, डिजिटल युग में, लोगों के अरबों के व्यवहार, दर्ज संग्रहीत है, और analyzable रहे हैं। उदाहरण के लिए, हर बार जब आप एक वेबसाइट पर क्लिक करें, अपने सेल फोन पर एक कॉल कर या अपने क्रेडिट कार्ड के साथ कुछ करने के लिए भुगतान करते हैं, अपने व्यवहार का एक डिजिटल रिकॉर्ड बनाया है और एक व्यापार द्वारा संग्रहित है। क्योंकि इन आंकड़ों के लोगों की हर दिन के कार्यों की एक उप-उत्पाद हैं, वे अक्सर डिजिटल निशान कहा जाता है। व्यवसायों द्वारा आयोजित इन निशान के अलावा, सरकारों को भी दोनों लोगों और व्यवसायों के बारे में अविश्वसनीय रूप से समृद्ध डेटा, डेटा जो अक्सर डिजीटल और analyzable है। एक साथ इन व्यापार और सरकार के रिकॉर्ड अक्सर बड़े डेटा कहा जाता है।
बड़ा डेटा की कभी बढ़ती बाढ़ का मतलब है कि हम एक ऐसी दुनिया से चले गए हैं, जहां व्यवहार डेटा ऐसी दुनिया में जहां व्यवहार डेटा बहुतायत से होता है करने के लिए दुर्लभ था। लेकिन, क्योंकि इन प्रकार के डेटा अपेक्षाकृत नए हैं, उन का उपयोग कर अनुसंधान के एक दुर्भाग्यपूर्ण राशि वैज्ञानिकों आँख बंद करके उपलब्ध आंकड़ों का पीछा करते हुए की तरह लग रहा है। यह अध्याय, बजाय, डेटा के विभिन्न स्रोतों को समझने के लिए एक सैद्धांतिक दृष्टिकोण प्रदान करता है और वे कैसे उपयोग किया जा सकता है। यह अमीर समझ में मदद करनी चाहिए आप बेहतर डेटा का उचित सूत्रों के अपने अनुसंधान के सवालों मेल खाते हैं। या, अगर इस तरह के मौजूदा स्रोतों कमी कर रहे हैं, तो आप भविष्य अध्यायों में विचारों का उपयोग कर अपने स्वयं के डेटा एकत्र करने के लिए मनाने की।
अवलोकन डेटा: बड़ा डेटा से सीखने के लिए एक पहला कदम का एहसास है कि यह डेटा की एक व्यापक श्रेणी है कि कई वर्षों के लिए सामाजिक अनुसंधान के लिए इस्तेमाल किया गया है का हिस्सा है। मोटे तौर पर, अवलोकन डेटा किसी भी डेटा है कि किसी तरह से हस्तक्षेप के बिना एक सामाजिक व्यवस्था का अवलोकन का परिणाम है। इसके बारे में सोचने के लिए एक कच्चे रास्ते अवलोकन डेटा सब कुछ है कि लोगों को (जैसे, सर्वेक्षण, अध्याय 3 के विषय) या लोगों के वातावरण (जैसे, प्रयोगों, अध्याय 4 के विषय) को बदलने के साथ बात कर शामिल नहीं करता है। इस प्रकार, व्यापार और सरकारी रिकॉर्ड के अलावा, डेटा अवलोकन भी अखबारों में लेख और उपग्रह तस्वीरों के पाठ की तरह बातें शामिल हैं।
यह अध्याय तीन भागों में है। सबसे पहले, धारा 2.2 में, मैं बड़ा डेटा और अधिक विस्तार से वर्णन है और यह और डेटा है कि आम तौर पर अतीत में सामाजिक अनुसंधान के लिए इस्तेमाल किया गया है जो मौलिक अंतर को स्पष्ट। फिर, धारा 2.3 में, मैं बड़ा डेटा स्रोतों में से दस सामान्य विशेषताओं का वर्णन है। इन विशेषताओं को समझना हमें जल्दी से ताकत और मौजूदा सूत्रों की कमजोरियों को पहचान करने के लिए और हमें नए स्रोत है कि भविष्य में बनाया जाएगा दोहन में मदद मिलेगी सक्षम बनाता है। गिनती बातें, भविष्यवाणी बातें, और एक प्रयोग approximating: अंत में, धारा 2.4 में, मैं तीन मुख्य अनुसंधान रणनीति है कि आप अवलोकन डेटा से जानने के लिए उपयोग कर सकते हैं का वर्णन है।