वितरित डेटा संग्रह संभव है, और भविष्य में होने की संभावना प्रौद्योगिकी और निष्क्रिय भागीदारी भी शामिल होगी।
eBird दर्शाता है, वितरित डेटा संग्रह वैज्ञानिक अनुसंधान के लिए इस्तेमाल किया जा सकता है। इसके अलावा, PhotoCity पता चलता है कि नमूना और डेटा की गुणवत्ता से संबंधित समस्याओं को संभावित व्याख्या करने योग्य हैं।
कैसे सामाजिक अनुसंधान के लिए वितरित कर सकते हैं डेटा संग्रह काम करता है? एक अद्भुत उदाहरण सुसान वाटकिंस और मलावी पत्रिकाओं परियोजना पर उनके सहयोगियों के काम से आता है (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) । इस परियोजना में, 22 स्थानीय "" पत्रकारों निवासियों तथाकथित -kept "संवादी पत्रिकाओं" यही है, दर्ज की विस्तार से बातचीत में वे आम लोगों के दैनिक जीवन में एड्स के बारे में सुन ली (समय पर परियोजना शुरू किया, वयस्कों के बारे में 15% मलावी में एचआईवी से संक्रमित थे (Bello, Chipeta, and Aberle-Grasse 2006) )। उनकी अंदरूनी सूत्र स्थिति की वजह से, इन पत्रकारों बातचीत है कि सुसान वाटकिंस और उसके पश्चिमी सहयोगियों अनुसंधान के लिए दुर्गम गया हो सकता है सुन पाना (मैं बाद में अध्याय में इस की नैतिकता पर चर्चा करेंगे जब मैं अपने खुद के बड़े पैमाने पर सहयोग परियोजना के डिजाइन के बारे में सलाह देने के लिए सक्षम थे )। मलावी पत्रिकाओं परियोजना से डेटा महत्वपूर्ण निष्कर्ष के एक नंबर करने के लिए प्रेरित किया है। उदाहरण के लिए, पहले इस परियोजना को शुरू किया था, कई बाहरी लोगों का मानना था उप-सहारा अफ्रीका में एड्स के बारे में सन्नाटा था, लेकिन पत्रिकाओं दिखा दिया है कि यह स्पष्ट रूप से मामला नहीं था: पत्रकारों अंत्येष्टि के रूप में विविध रूप, विषय पर बातचीत के सैकड़ों सुन स्थानों में , बार, और चर्चों। इसके अलावा, इन बातचीत की प्रकृति शोधकर्ताओं ने बेहतर कंडोम के इस्तेमाल के लिए प्रतिरोध के कुछ समझने में मदद मिली; तरीका है कि कंडोम के इस्तेमाल सार्वजनिक स्वास्थ्य संदेश में फंसाया गया था जिस तरह से साथ असंगत था कि यह रोजमर्रा की जिंदगी में चर्चा की गई थी (Tavory and Swidler 2009) ।
बेशक, eBird से डेटा की तरह, मलावी पत्रिकाओं परियोजना से डेटा सही नहीं है, एक मुद्दा वाटकिंस और उनके सहयोगियों द्वारा विस्तार से चर्चा की है। उदाहरण के लिए, दर्ज की गई बातचीत के लिए सभी संभव बातचीत का एक यादृच्छिक नमूना नहीं हैं। बल्कि, वे एड्स के बारे में बातचीत की एक अधूरी जनगणना कर रहे हैं। डेटा की गुणवत्ता के संदर्भ में, शोधकर्ताओं का मानना है कि उनके पत्रकारों, उच्च गुणवत्ता वाले संवाददाताओं थे के रूप में पत्रिकाओं के भीतर और पत्रिकाओं में स्थिरता इसका सबूत है। इसके अलावा, जब पर्याप्त पत्रकारों के एक छोटे से पर्याप्त सेटिंग में तैनात किए गए हैं और रिपोर्ट एक विशिष्ट विषय पर ध्यान केंद्रित कर रहे हैं, अतिरेक संभव हो गया है, जो डेटा की गुणवत्ता में आत्मविश्वास बढ़ता है। उदाहरण के लिए, एक सेक्स "स्टेला" नाम के कार्यकर्ता चार अलग अलग पत्रकारों की पत्रिकाओं में कई बार आए थे (Watkins and Swidler 2009) । के रूप में यह PhotoCity में था, अतिरेक के उपयोग का आकलन करने और वितरित डेटा संग्रह परियोजनाओं में डेटा गुणवत्ता सुनिश्चित करने के लिए एक महत्वपूर्ण सिद्धांत है। आदेश में आगे अपने अंतर्ज्ञान का निर्माण करने के लिए, टेबल 5.3 सामाजिक अनुसंधान के लिए वितरित डेटा संग्रह के अन्य उदाहरण दिखाता है।
आकड़ों को एकत्र किया | उद्धरण |
---|---|
मलावी में एचआईवी / एड्स के बारे में विचार-विमर्श | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
स्ट्रीट लंदन में भीख माँग | Purdam (2014) |
पूर्वी कांगो में संघर्ष की घटनाओं | Windt and Humphreys (2016) |
नाइजीरिया और लाइबेरिया में आर्थिक गतिविधियों | Blumenstock, Keleher, and Reisinger (2016) |
इन्फ्लुएंजा निगरानी | Noort et al. (2015) |
इस खंड में वर्णित उदाहरण के सभी सक्रिय भागीदारी शामिल है: पत्रकारों के बातचीत है कि वे सुना लिखित; birders उनकी birding जाँच सूची अपलोड की गई; या खिलाड़ियों से उनकी तस्वीरें अपलोड की गई। लेकिन क्या अगर भागीदारी स्वत था और प्रस्तुत करने के लिए किसी भी विशिष्ट कौशल या समय की आवश्यकता नहीं किया था? यह वादा "भागीदारी संवेदन" या द्वारा की पेशकश की, Pothole पेट्रोल, एमआईटी के वैज्ञानिकों द्वारा एक परियोजना, बोस्टन क्षेत्र में सात टैक्सी कैब के अंदर जीपीएस घुड़सवार सुसज्जित accelerometers है "जन-केंद्रित संवेदन।" उदाहरण के लिए (Eriksson et al. 2008) । क्योंकि एक pothole पर ड्राइविंग एक अलग accelerometer संकेत, इन उपकरणों, जब चलती टैक्सियों के अंदर रखा छोड़ देता है, बोस्टन के pothole नक्शे बना सकते हैं। बेशक, टैक्सियों बेतरतीब ढंग से सड़कों का नमूना नहीं है, लेकिन पर्याप्त टैक्सियों को देखते हुए वे शहर के बड़े हिस्से के बारे में जानकारी प्रदान करने के लिए पर्याप्त कवरेज हो सकता है। निष्क्रिय प्रणाली है कि प्रौद्योगिकी पर निर्भर का एक दूसरा लाभ यह है कि वे de-कौशल डेटा योगदान की प्रक्रिया: एक ओर जहां यह कौशल की आवश्यकता है eBird में योगदान के लिए (क्योंकि आप मज़बूती से पक्षी प्रजातियों की पहचान करने में सक्षम होने की जरूरत है), यह करने के लिए कोई विशेष कौशल की आवश्यकता Pothole गश्ती करने के लिए योगदान करते हैं।
आगे जा रहे हैं, मुझे लगता है कि कई वितरित डेटा संग्रह परियोजनाओं मोबाइल फोन है कि पहले से ही दुनिया भर के अरबों लोगों द्वारा किया जाता है की क्षमताओं का उपयोग करने के लिए शुरू हो जाएगा। ये फोन पहले से ही ऐसे माइक्रोफोन, कैमरा, जीपीएस उपकरण, और घड़ियों के रूप में माप के लिए महत्वपूर्ण सेंसर, की एक बड़ी संख्या है। इसके अलावा, इन मोबाइल फोन पर अंतर्निहित डेटा संग्रह प्रोटोकॉल कुछ नियंत्रण को सक्षम शोधकर्ताओं तीसरी पार्टी क्षुधा समर्थन करते हैं। अंत में, इन फोनों इंटरनेट कनेक्टिविटी है, यह संभव है उन्हें वे डेटा इकट्ठा ऑफ लोड करने के लिए कर रही है। वहाँ सीमित बैटरी जीवन के लिए गलत सेंसरों से कई तकनीकी चुनौतियां हैं, लेकिन इन समस्याओं की संभावना समय के साथ कम होगा प्रौद्योगिकी के रूप में विकसित करता है। गोपनीयता और नैतिकता से संबंधित मुद्दे, दूसरे हाथ पर, प्रौद्योगिकी के रूप में विकसित करता है और अधिक जटिल हो सकता है; जब मैं अपने खुद के बड़े पैमाने पर सहयोग डिजाइन के बारे में सलाह की पेशकश मैं नैतिकता के सवालों को वापस कर देंगे।
वितरित डेटा संग्रह परियोजनाओं में, स्वयंसेवकों दुनिया के बारे में डेटा योगदान करते हैं। यह दृष्टिकोण पहले से ही सफलतापूर्वक इस्तेमाल किया गया है, और भविष्य का उपयोग करता संभावना नमूना और डेटा की गुणवत्ता चिंताओं को दूर करने के लिए होगा। सौभाग्य से, इस तरह के PhotoCity और Pothole गश्ती के रूप में मौजूदा परियोजनाओं के लिए इन समस्याओं के समाधान के सुझाव देते हैं। अधिक परियोजनाओं नाटकीय रूप पैमाने में वृद्धि करनी चाहिए, डेटा है कि बस अतीत में सीमा बंद था एकत्र करने के लिए शोधकर्ताओं सक्षम प्रौद्योगिकी का लाभ यह है कि डी-कुशल और निष्क्रिय भागीदारी सक्षम बनाता है, वितरित लेने के लिए के रूप में डेटा संग्रह परियोजनाओं।