analog वय, बद्दल माहिती गोळा वर्तन-कोण महाग, आणि म्हणूनच, बऱ्यापैकी दुर्मिळ तेव्हा होती काय करतो. आता, डिजिटल युगात, लोक कोट्यवधी आचरण, रेकॉर्ड संग्रहित आणि analyzable आहेत. उदाहरणार्थ, आपण एक वेबसाइट वर क्लिक करा प्रत्येक वेळी, आपला सेल फोन वर कॉल करा किंवा आपली क्रेडिट कार्ड काहीतरी देय, आपल्या वर्तन एक डिजिटल रेकॉर्ड तयार केले आणि एक व्यवसाय साठवले आहे. या डेटा लोकांच्या दररोज क्रिया-उत्पादनाच्या आहेत कारण, ते अनेकदा डिजिटल मागोवा म्हटले जाते. व्यवसाय आयोजित या मागोवा व्यतिरिक्त, सरकार देखील अनेकदा डिजिटल आणि analyzable आहे डेटा लोक आणि व्यवसाय दोन्ही बद्दल विश्वास बसणार नाही इतका श्रीमंत डेटा आहेत. एकत्र या व्यवसाय आणि सरकारी रेकॉर्ड अनेकदा मोठे डेटा म्हटले जाते.
मोठे डेटा पूर सतत वाढणारी वर्तणुकीशी जेथे डेटा वर्तणुकीशी डेटा फार आहे जगात दुर्मिळ होते जेथे आम्ही एक जगातील हलवले आहे याचा अर्थ असा की. पण, या प्रकारच्या डेटा तुलनेने नवीन आहेत कारण, त्यांना वापरून संशोधन हा दुर्दैवी रक्कम शास्त्रज्ञ विचार न करता उपलब्ध डेटा धावांचे आव्हान दिसते. हा धडा, त्याऐवजी, डेटा विविध स्रोत आकलनशक्ती एक तत्त्वनिष्ठ दृष्टिकोन देते आणि ते कसे वापरले जाऊ शकते. या श्रीमंत समजून आपण चांगले डेटा योग्य स्त्रोत आपल्या संशोधन प्रश्न जुळत मदत पाहिजे. किंवा अशा विद्यमान सूत्रांनी उणीव असाल तर, आपण भविष्यात अध्याय कल्पना वापरून आपल्या स्वत: च्या डेटा गोळा करण्यासाठी पटवणे.
आकलनशक्तीच्या डेटा: मोठे डेटा शिकत एक पहिले पाऊल तो डेटा व्यापक श्रेणी अनेक वर्षे सामाजिक संशोधन वापरले गेले आहे की भाग आहे की विश्वास आहे. अंदाजे, आकलनशक्तीच्या डेटा काही मार्ग मध्यस्ती न सामाजिक प्रणाली निरीक्षण पासून परिणाम कोणताही डेटा आहे. विचार एक क्रूड मार्ग आकलनशक्तीच्या डेटा लोक (उदा, सर्वेक्षण, धडा 3, विषय) किंवा लोकांच्या वातावरणात (उदा, प्रयोग, 4 विषय) बदलत्या बोलत करावे लागत नाही की सर्वकाही आहे. अशा प्रकारे, व्यवसाय आणि सरकारी रेकॉर्ड व्यतिरिक्त, आकलनशक्तीच्या डेटा वृत्तपत्रीय लेखन व उपग्रह फोटो मजकूर यासारख्या गोष्टी समाविष्ट.
हा धडा तीन भाग आहेत. प्रथम विभाग 2.2,, मी मोठे डेटा अधिक तपशील वर्णन आणि तो आणि साधारणपणे गेल्या सामाजिक संशोधन वापरले गेले आहेत की डेटा दरम्यान एक मूलभूत फरक स्पष्ट करतात. मग, िवभाग 2.3 मध्ये, मी मोठा डेटा स्रोत दहा सामान्य वैशिष्ट्ये वर्णन. या वैशिष्ट्ये समजून घेणे आम्हाला त्वरीत ताकद आणि विद्यमान सूत्रांनी दुर्बलतेचा ओळखण्यासाठी आणि आम्हाला भविष्यात निर्माण होईल की नवीन सूत्रांनी जुंपणे मदत करेल सक्षम करते. मोजणी गोष्टी अंदाज गोष्टी आणि एक प्रयोग अंदाज: शेवटी, विभाग 2.4, मी आकलनशक्तीच्या डेटा जाणून घेण्यासाठी वापरू शकता तीन मुख्य संशोधन धोरण वर्णन.