बिग डेटा तयार केला आणि संशोधन पेक्षा इतर कारणांसाठी सरकार गोळा केली जाते. संशोधनासाठी डेटा वापरून, म्हणून, repurposing आवश्यक आहे.
सामाजिक संशोधन एक idealized दृश्य एक शास्त्रज्ञ एक कल्पना येत आणि नंतर त्या कल्पना चाचणी माहिती गोळा फोटो. संशोधन हा प्रकार संशोधन प्रश्न आणि डेटा यांच्यात घट्ट तंदुरुस्त ठरतो, पण एक व्यक्ती संशोधक अनेकदा मोठ्या श्रीमंत आणि राष्ट्रीय-प्रतिनिधी डेटा जसे ते आवश्यक डेटा गोळा करण्यासाठी आवश्यक संसाधने नाही तो मर्यादित आहे. त्यामुळे गेल्या सामाजिक संशोधन भरपूर वापर केला आहे मोठ्या प्रमाणात सामाजिक सर्वेक्षण, अशा सामान्य सामाजिक सर्वेक्षण (GSS), अमेरिकन नॅशनल इलेक्शन अभ्यास (ANES), आणि उत्पन्न प्रेरक शक्ती समिती अभ्यास (PSID) म्हणून. हे मोठ्या प्रमाणात सर्वेक्षण साधारणपणे संशोधक एक संघ चालविण्यात आहेत आणि ते अनेक संशोधक द्वारे वापरले जाऊ शकते असे डेटा तयार करण्यासाठी डिझाइन केले आहेत. या मोठ्या प्रमाणात सर्वेक्षण गोल कारण काळजी डेटा संकलन रचना आणि संशोधक वापरासाठी परिणामी डेटा तयार ठेवण्यात आहे. या डेटा संशोधक आणि संशोधक आहेत.
डिजिटल वय स्त्रोत वापरून हे सर्वात सामाजिक संशोधन, तथापि, मूलतः वेगळे आहे. त्याऐवजी संशोधक आणि संशोधक गोळा डेटा वापरून, तो तयार केले आणि अशा एक नफा करत एक सेवा प्रदान, किंवा कायदा व्यवस्थापन त्यांच्या स्वत: च्या हेतूने व्यवसाय आणि सरकार यांनी संकलित केले डेटा स्रोत वापरते. या व्यवसाय आणि सरकारी डेटा स्रोत मोठे डेटा म्हटले जाऊ आलो आहे. मोठे डेटा संशोधन करत मूलतः संशोधन तयार केला होता, डेटा संशोधन करत पेक्षा भिन्न आहे. उदाहरणार्थ, तुलना, सामाजिक मीडिया वेबसाइट, अशा ट्विटर अशा सामान्य सामाजिक सर्वेक्षण (GSS) म्हणून एक पारंपारिक सार्वजनिक मत सर्वेक्षण आहे. ट्विटर च्या मुख्य ध्येय त्याच्या वापरकर्त्यांना सेवा प्रदान करण्यासाठी आणि नफा करण्यासाठी आहेत. या गोल साध्य प्रक्रियेत, ट्विटर सार्वजनिक मत काही विशिष्ट बाबतीत अभ्यास उपयुक्त असू शकते डेटा तयार. पण, सामान्य सामाजिक सर्वेक्षण (GSS) विपरीत, ट्विटर सामाजिक संशोधन प्रामुख्याने लक्ष केंद्रित आहे.
टर्म मोठे डेटा frustratingly अस्पष्ट आहे, आणि तो गट एकत्र अनेक भिन्न गोष्टी. सामाजिक संशोधन कारणास्तव, मी मोठा तो डेटा स्रोत दोन प्रकारच्या फरक उपयुक्त आहे असे वाटते. सरकार प्रशासकीय रेकॉर्ड आणि व्यवसाय प्रशासकीय रेकॉर्ड त्यांच्या नियमानुसार उपक्रम भाग म्हणून सरकार तयार आहेत की डेटा सरकारने प्रशासकीय नोंदी आहेत. रेकॉर्ड या प्रकारच्या अशा गेल्या अभ्यास जन्म, लग्न, आणि मृत्यू रेकॉर्ड पण सरकार वाढत्या गोळा आणि analyzable फॉर्म मध्ये सविस्तर रेकॉर्ड releasing आहेत demographers म्हणून संशोधक द्वारे वापरले गेले आहे. उदाहरणार्थ, न्यू यॉर्क शहर सरकार शहरात प्रत्येक टॅक्सी आत डिजिटल मीटर स्थापित. या मीटर चालक, प्रारंभ वेळ आणि स्थान, स्टॉप वेळ आणि स्थान, आणि धन समावेश प्रत्येक टॅक्सी सायकल डेटा सर्व प्रकारच्या रेकॉर्ड. एक अभ्यास मी या धड्यातील नंतर सांगू शकाल की, हेन्री Farber (2015) कोणत्याही क्षणी वेतन आणि काम तास संख्या नात्यावर श्रमिक अर्थशास्त्र एक मूलभूत वादविवाद पत्ता या डेटा repurposed.
सामाजिक संशोधन मोठे डेटा दुसऱ्या मुख्य प्रकार व्यवसाय प्रशासकीय रेकॉर्ड आहे. हे असे व्यवसाय त्यांच्या नियमानुसार उपक्रम भाग म्हणून तयार करा आणि डेटा संकलित आहेत. या व्यवसाय प्रशासकीय रेकॉर्ड अनेकदा डिजिटल मागोवा म्हटले जाते, आणि शोध इंजिन क्वेरी नोंदी, सामाजिक मीडिया पोस्ट यासारख्या गोष्टी समाविष्ट, आणि मोबाइल फोन पासून कॉल रेकॉर्ड. बारकाईने, हे व्यवसाय प्रशासकीय रेकॉर्ड फक्त ऑनलाइन वर्तन नाही. उदाहरणार्थ, चेक-आउट स्कॅनर वापर की स्टोअरमध्ये कार्यकर्ता उत्पादन रिअल-टाइम उपाय तयार आहेत. मी नंतर या अध्यायात सांगू शकाल की एक अभ्यासात, अलेक्झांडर Mas आणि एन्रिको Moretti (2009) कामगार 'उत्पादकता त्यांच्या तोलामोलाचा उत्पादन कसे परिणाम आहे अभ्यास, सुपरमार्केट हे चेक-आउट डेटा repurposed.
ही उदाहरणे दोन्ही स्पष्ट म्हणून, repurposing कल्पना मोठे डेटा शिकत मूलभूत आहे. माझे अनुभव, सामाजिक शास्त्रज्ञ आणि डेटा शास्त्रज्ञ या खूप वेगळ्या repurposing संपर्क. संशोधन डिझाइन डेटा काम करण्यासाठी नित्याचा आहेत सामाजिक शास्त्रज्ञ, त्याचे सामर्थ्य दुर्लक्ष करताना repurposed डेटा समस्या दाखविणे जलद आहेत. दुसरीकडे, डेटा शास्त्रज्ञ त्याच्या वर्गावर दुर्लक्ष करताना repurposed डेटा लाभ दाखविणे जलद आहेत. स्वाभाविकच, सर्वोत्तम दृष्टिकोन एक संकरीत होईल. की संशोधक डेटा दोन्ही चांगले आणि वाईट आणि नंतर त्यांना पासून कसे हे जाणून घेण्यासाठी बाहेर आकृती या नवीन स्रोत वैशिष्ट्ये समजून घेणे आवश्यक आहे, आहे. आणि त्या, या धड्याचा उर्वरित योजना आहे. पुढील, मी व्यवसाय आणि सरकारी प्रशासकीय डेटा दहा सामान्य वैशिष्ट्ये वर्णन करेल. नंतर मी तीन संशोधन पध्दती या डेटा, तसेच हा डेटा वैशिष्ट्ये आवडीनुसार पध्दती सह वापरले जाऊ शकते असे वर्णन करेल.