2.3.1.2 हमेशा चालू

हमेशा चालू बड़ा डेटा अप्रत्याशित घटनाओं और वास्तविक समय माप के अध्ययन के लिए सक्षम बनाता है।

कई बड़े डेटा सिस्टम हमेशा पर कर रहे हैं; वे लगातार डेटा एकत्रित कर रहे हैं। यह हमेशा पर विशेषता अनुदैर्ध्य डेटा के साथ शोधकर्ताओं प्रदान करता है (यानी, समय के साथ डेटा)। हमेशा पर होने के नाते अनुसंधान के लिए दो महत्वपूर्ण प्रभाव पड़ता है।

सबसे पहले, हमेशा पर डेटा संग्रह शोधकर्ताओं तरीके है कि पहले संभव नहीं थे में अप्रत्याशित घटनाओं का अध्ययन करने के लिए सक्षम बनाता है। उदाहरण के लिए, 2013 की गर्मियों में तुर्की में विरोध प्रदर्शन Gezi कब्जा अध्ययन करने में रुचि शोधकर्ताओं आम तौर पर घटना के दौरान प्रदर्शनकारियों के व्यवहार पर ध्यान केंद्रित करेगा। Ceren Budak और डंकन वत्स (2015) , इससे पहले प्रदर्शनकारियों ट्विटर का उपयोग करते हुए अध्ययन करने के लिए ट्विटर का हमेशा पर प्रकृति का उपयोग कर के दौरान से अधिक करने के लिए सक्षम थे, और घटना के बाद। और, वे घटना के बाद (चित्रा 2.1) पहले, दौरान गैर प्रतिभागियों (या जो प्रतिभागियों के विरोध के बारे में कलरव नहीं किया था) की तुलना समूह बनाने के लिए सक्षम थे, और। कुल में उनके पूर्व पद पैनल दो वर्षों में 30,000 लोगों की ट्वीट्स शामिल थे। वे अनुमान लगाने के लिए लोगों को किस प्रकार अधिक Gezi विरोध प्रदर्शन में भाग लेने के लिए और के नजरिए में बदलाव का अनुमान है की संभावना थी सक्षम थे: यह अन्य जानकारी के साथ विरोध प्रदर्शन से अधिक इस्तेमाल किया डेटा बढ़ाने के द्वारा, Budak और वत्स और अधिक जानने के लिए सक्षम थे प्रतिभागियों और गैर प्रतिभागियों, दोनों अल्पावधि में (पूर्व Gezi को Gezi दौरान तुलना) और लंबी अवधि में (पोस्ट-Gezi के लिए पूर्व Gezi तुलना)।

चित्रा 2.1: डिजाइन Budak और वाट्स (2015) द्वारा इस्तेमाल अध्ययन करने के लिए तुर्की में विरोध प्रदर्शन Gezi कब्जा 2013 की गर्मियों में ट्विटर का हमेशा पर प्रकृति का उपयोग करके, शोधकर्ताओं क्या वे एक पूर्व पोस्ट पैनल है कि के बारे में शामिल बुलाया बनाया दो वर्षों में 30,000 लोगों को। इसके विपरीत विशिष्ट अध्ययन है कि विरोध प्रदर्शन के दौरान प्रतिभागियों पर ध्यान केंद्रित, पूर्व पोस्ट पैनल से पहले और घटना के बाद और 2) से पहले गैर प्रतिभागियों से डेटा, दौरान और घटना के बाद 1) प्रतिभागियों से डेटा कहते हैं। इस समृद्ध डेटा संरचना Budak और वत्स सक्षम अनुमान लगाने के लिए लोगों को किस प्रकार और अधिक (के दौरान करने के लिए पूर्व की तुलना Gezi Gezi विरोध प्रदर्शन में भाग लेने के लिए और प्रतिभागियों और गैर प्रतिभागियों के नजरिए में बदलाव अनुमान लगाने के लिए, दोनों अल्पावधि में होने की संभावना थे Gezi) और लंबी अवधि में (की तुलना पूर्व Gezi करने के लिए पोस्ट-Gezi)।

चित्रा 2.1: डिजाइन द्वारा इस्तेमाल किया Budak and Watts (2015) का अध्ययन करने के लिए तुर्की में विरोध प्रदर्शन Gezi कब्जा 2013 की गर्मियों में ट्विटर का हमेशा पर प्रकृति का उपयोग करके, शोधकर्ताओं क्या वे एक पूर्व पोस्ट पैनल है कि के बारे में शामिल बुलाया बनाया दो वर्षों में 30,000 लोगों को। इसके विपरीत विशिष्ट अध्ययन है कि विरोध प्रदर्शन के दौरान प्रतिभागियों पर ध्यान केंद्रित, पूर्व पोस्ट पैनल से पहले और घटना के बाद और 2) से पहले गैर प्रतिभागियों से डेटा, दौरान और घटना के बाद 1) प्रतिभागियों से डेटा कहते हैं। इस समृद्ध डेटा संरचना Budak और वत्स सक्षम अनुमान लगाने के लिए लोगों को किस प्रकार और अधिक (के दौरान करने के लिए पूर्व की तुलना Gezi Gezi विरोध प्रदर्शन में भाग लेने के लिए और प्रतिभागियों और गैर प्रतिभागियों के नजरिए में बदलाव अनुमान लगाने के लिए, दोनों अल्पावधि में होने की संभावना थे Gezi) और लंबी अवधि में (की तुलना पूर्व Gezi करने के लिए पोस्ट-Gezi)।

यह सच है कि इनमें से कुछ अनुमान के बिना किया जा सकता था हमेशा पर डेटा संग्रह स्रोतों (जैसे, रवैया परिवर्तन की लंबी अवधि के अनुमानों), हालांकि 30,000 लोगों के लिए इस तरह के डेटा संग्रह काफी महंगा हो गया होता। और, यहां तक कि एक असीमित बजट दिया, मैं किसी भी अन्य तरीका है कि अनिवार्य रूप से शोधकर्ताओं समय में वापस यात्रा करने के लिए और सीधे अतीत में प्रतिभागियों व्यवहार का निरीक्षण की अनुमति देता है के बारे में सोच नहीं सकते हैं। निकटतम वैकल्पिक व्यवहार के पूर्वव्यापी रिपोर्ट एकत्रित करने की होगी, लेकिन इन रिपोर्टों को सीमित विघटन और संदिग्ध सटीकता के लिए किया जाएगा। तालिका 2.1 अध्ययन है कि एक हमेशा पर डेटा स्रोत एक अप्रत्याशित घटना का अध्ययन करने के लिए उपयोग के अन्य उदाहरण प्रदान करता है।

तालिका 2.1: हमेशा पर का उपयोग कर बड़ा डेटा स्रोतों अप्रत्याशित घटनाओं का अध्ययन।
अप्रत्याशित क्षण हमेशा पर डेटा स्रोत उद्धरण
तुर्की में Gezi आंदोलन पर कब्जा ट्विटर Budak and Watts (2015)
हांगकांग में छतरी विरोध प्रदर्शन Weibo Zhang (2016)
न्यूयॉर्क शहर में पुलिस की शूटिंग बंद और क्रीड़ा करना रिपोर्टों Legewie (2016)
व्यक्ति आईएसआईएस में शामिल होने ट्विटर Magdy, Darwish, and Weber (2016)
सितंबर 11, 2001 के हमले livejournal.com Cohn, Mehl, and Pennebaker (2004)
सितंबर 11, 2001 के हमले पेजर संदेश Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

दूसरा, हमेशा पर डेटा संग्रह शोधकर्ताओं वास्तविक समय माप, जो सेटिंग्स जहां नीति निर्माताओं सिर्फ मौजूदा व्यवहार से सबक नहीं करने पर भी यह जवाब चाहता हूँ में महत्वपूर्ण हो सकता है उत्पादन करने के लिए सक्षम बनाता है। उदाहरण के लिए, सामाजिक मीडिया डेटा प्राकृतिक आपदाओं के लिए प्रतिक्रियाओं का मार्गदर्शन करने के लिए इस्तेमाल किया जा सकता है (Castillo 2016)

अंत में, हमेशा पर डेटा सिस्टम अप्रत्याशित घटनाओं का अध्ययन करने और नीति निर्माताओं के लिए वास्तविक समय की जानकारी प्रदान करने के लिए सक्षम शोधकर्ताओं। मैं नहीं है, तथापि, का प्रस्ताव किया था कि हमेशा पर डेटा सिस्टम शोधकर्ताओं समय की लंबी अवधि में परिवर्तन ट्रैक करने के लिए सक्षम है। वजह यह है कि कई बड़े डेटा सिस्टम लगातार बदल-एक कर रहे हैं प्रक्रिया को कहा जाता बहाव (धारा 2.3.2.4) है।