हमेशा चालू बड़ा डेटा अप्रत्याशित घटनाओं और वास्तविक समय माप के अध्ययन के लिए सक्षम बनाता है।
कई बड़े डेटा सिस्टम हमेशा पर कर रहे हैं; वे लगातार डेटा एकत्रित कर रहे हैं। यह हमेशा पर विशेषता अनुदैर्ध्य डेटा के साथ शोधकर्ताओं प्रदान करता है (यानी, समय के साथ डेटा)। हमेशा पर होने के नाते अनुसंधान के लिए दो महत्वपूर्ण प्रभाव पड़ता है।
सबसे पहले, हमेशा पर डेटा संग्रह शोधकर्ताओं तरीके है कि पहले संभव नहीं थे में अप्रत्याशित घटनाओं का अध्ययन करने के लिए सक्षम बनाता है। उदाहरण के लिए, 2013 की गर्मियों में तुर्की में विरोध प्रदर्शन Gezi कब्जा अध्ययन करने में रुचि शोधकर्ताओं आम तौर पर घटना के दौरान प्रदर्शनकारियों के व्यवहार पर ध्यान केंद्रित करेगा। Ceren Budak और डंकन वत्स (2015) , इससे पहले प्रदर्शनकारियों ट्विटर का उपयोग करते हुए अध्ययन करने के लिए ट्विटर का हमेशा पर प्रकृति का उपयोग कर के दौरान से अधिक करने के लिए सक्षम थे, और घटना के बाद। और, वे घटना के बाद (चित्रा 2.1) पहले, दौरान गैर प्रतिभागियों (या जो प्रतिभागियों के विरोध के बारे में कलरव नहीं किया था) की तुलना समूह बनाने के लिए सक्षम थे, और। कुल में उनके पूर्व पद पैनल दो वर्षों में 30,000 लोगों की ट्वीट्स शामिल थे। वे अनुमान लगाने के लिए लोगों को किस प्रकार अधिक Gezi विरोध प्रदर्शन में भाग लेने के लिए और के नजरिए में बदलाव का अनुमान है की संभावना थी सक्षम थे: यह अन्य जानकारी के साथ विरोध प्रदर्शन से अधिक इस्तेमाल किया डेटा बढ़ाने के द्वारा, Budak और वत्स और अधिक जानने के लिए सक्षम थे प्रतिभागियों और गैर प्रतिभागियों, दोनों अल्पावधि में (पूर्व Gezi को Gezi दौरान तुलना) और लंबी अवधि में (पोस्ट-Gezi के लिए पूर्व Gezi तुलना)।
यह सच है कि इनमें से कुछ अनुमान के बिना किया जा सकता था हमेशा पर डेटा संग्रह स्रोतों (जैसे, रवैया परिवर्तन की लंबी अवधि के अनुमानों), हालांकि 30,000 लोगों के लिए इस तरह के डेटा संग्रह काफी महंगा हो गया होता। और, यहां तक कि एक असीमित बजट दिया, मैं किसी भी अन्य तरीका है कि अनिवार्य रूप से शोधकर्ताओं समय में वापस यात्रा करने के लिए और सीधे अतीत में प्रतिभागियों व्यवहार का निरीक्षण की अनुमति देता है के बारे में सोच नहीं सकते हैं। निकटतम वैकल्पिक व्यवहार के पूर्वव्यापी रिपोर्ट एकत्रित करने की होगी, लेकिन इन रिपोर्टों को सीमित विघटन और संदिग्ध सटीकता के लिए किया जाएगा। तालिका 2.1 अध्ययन है कि एक हमेशा पर डेटा स्रोत एक अप्रत्याशित घटना का अध्ययन करने के लिए उपयोग के अन्य उदाहरण प्रदान करता है।
अप्रत्याशित क्षण | हमेशा पर डेटा स्रोत | उद्धरण |
---|---|---|
तुर्की में Gezi आंदोलन पर कब्जा | ट्विटर | Budak and Watts (2015) |
हांगकांग में छतरी विरोध प्रदर्शन | Zhang (2016) | |
न्यूयॉर्क शहर में पुलिस की शूटिंग | बंद और क्रीड़ा करना रिपोर्टों | Legewie (2016) |
व्यक्ति आईएसआईएस में शामिल होने | ट्विटर | Magdy, Darwish, and Weber (2016) |
सितंबर 11, 2001 के हमले | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
सितंबर 11, 2001 के हमले | पेजर संदेश | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
दूसरा, हमेशा पर डेटा संग्रह शोधकर्ताओं वास्तविक समय माप, जो सेटिंग्स जहां नीति निर्माताओं सिर्फ मौजूदा व्यवहार से सबक नहीं करने पर भी यह जवाब चाहता हूँ में महत्वपूर्ण हो सकता है उत्पादन करने के लिए सक्षम बनाता है। उदाहरण के लिए, सामाजिक मीडिया डेटा प्राकृतिक आपदाओं के लिए प्रतिक्रियाओं का मार्गदर्शन करने के लिए इस्तेमाल किया जा सकता है (Castillo 2016) ।
अंत में, हमेशा पर डेटा सिस्टम अप्रत्याशित घटनाओं का अध्ययन करने और नीति निर्माताओं के लिए वास्तविक समय की जानकारी प्रदान करने के लिए सक्षम शोधकर्ताओं। मैं नहीं है, तथापि, का प्रस्ताव किया था कि हमेशा पर डेटा सिस्टम शोधकर्ताओं समय की लंबी अवधि में परिवर्तन ट्रैक करने के लिए सक्षम है। वजह यह है कि कई बड़े डेटा सिस्टम लगातार बदल-एक कर रहे हैं प्रक्रिया को कहा जाता बहाव (धारा 2.3.2.4) है।