हमेशा चालू बड़ा डेटा अप्रत्याशित घटनाओं और वास्तविक समय माप के अध्ययन के लिए सक्षम बनाता है।
कई बड़े डेटा सिस्टम हमेशा पर कर रहे हैं; वे लगातार डेटा एकत्रित कर रहे हैं। यह हमेशा पर विशेषता अनुदैर्ध्य डेटा के साथ शोधकर्ताओं प्रदान करता है (यानी, समय के साथ डेटा)। हमेशा पर होने के नाते अनुसंधान के लिए दो महत्वपूर्ण प्रभाव पड़ता है।
सबसे पहले, डेटा संग्रह पर हमेशा शोधकर्ताओं को अप्रत्याशित घटनाओं का अध्ययन करने में सक्षम बनाता है जो अन्यथा संभव नहीं होते हैं। उदाहरण के लिए, 2013 की गर्मियों में तुर्की में कब्जे वाले गीज़ी विरोधों का अध्ययन करने में रुचि रखने वाले शोधकर्ता आम तौर पर घटना के दौरान प्रदर्शनकारियों के व्यवहार पर ध्यान केंद्रित करेंगे। सेरेन बुडक और डंकन वाट्स (2015) प्रदर्शनकारियों का अध्ययन करने के लिए ट्विटर की हमेशा प्रकृति का उपयोग करके और अधिक करने में सक्षम थे जिन्होंने घटना के पहले, दौरान और बाद में ट्विटर का उपयोग किया था। और, वे घटना के पहले, दौरान, और उसके बाद गैर-प्रतिभागियों के तुलना समूह बनाने में सक्षम थे (आंकड़ा 2.2)। कुल मिलाकर, उनके पूर्व-पोस्ट पैनल में दो वर्षों में 30,000 लोगों की ट्वीट शामिल थीं। इस अन्य जानकारी के विरोध में आम तौर पर इस्तेमाल किए गए डेटा को बढ़ाकर, बुडक और वाट्स बहुत कुछ सीखने में सक्षम थे: वे अनुमान लगा सकते थे कि किस तरह के लोगों को गीज़ी विरोधों में भाग लेने की संभावना है और इसके दृष्टिकोण में परिवर्तन का अनुमान लगाया जा सकता है प्रतिभागियों और गैर-प्रतिभागियों, दोनों अल्प अवधि में (पूर्व-गीज़ी की तुलना गीज़ी के दौरान) और लंबी अवधि में (पूर्व-गीज़ी के साथ पूर्व-गीज़ी की तुलना में)।
एक संदिग्ध यह इंगित कर सकता है कि इनमें से कुछ अनुमान हमेशा डेटा संग्रह स्रोतों (उदाहरण के लिए, रवैया परिवर्तन के दीर्घकालिक अनुमान) के बिना किए जा सकते थे, और यह सही है, हालांकि 30,000 लोगों के लिए ऐसा डेटा संग्रह काफी होता महंगा। हालांकि, असीमित बजट भी दिया गया है, हालांकि, मैं किसी अन्य विधि के बारे में नहीं सोच सकता जो अनिवार्य रूप से शोधकर्ताओं को समय पर यात्रा करने की अनुमति देता है और अतीत में प्रतिभागियों के व्यवहार को सीधे देखता है। निकटतम विकल्प व्यवहार की पूर्वव्यापी रिपोर्ट एकत्र करना होगा, लेकिन ये रिपोर्ट सीमित ग्रैन्युलरिटी और संदिग्ध सटीकता से होगी। तालिका 2.1 अध्ययनों के अन्य उदाहरण प्रदान करता है जो एक अप्रत्याशित घटना का अध्ययन करने के लिए हमेशा डेटा स्रोत का उपयोग करते हैं।
अप्रत्याशित क्षण | हमेशा डेटा स्रोत पर | उद्धरण |
---|---|---|
तुर्की में गीज़ी आंदोलन पर कब्जा करो | ट्विटर | Budak and Watts (2015) |
हांगकांग में छतरी विरोध प्रदर्शन | Zhang (2016) | |
न्यूयॉर्क शहर में पुलिस की गोलीबारी | स्टॉप-एंड-फ्रिस्क रिपोर्ट्स | Legewie (2016) |
आईएसआईएस में शामिल व्यक्ति | ट्विटर | Magdy, Darwish, and Weber (2016) |
11 सितंबर 2001 हमले | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11 सितंबर 2001 हमले | पेजर संदेश | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
अप्रत्याशित घटनाओं का अध्ययन करने के अलावा, हमेशा बड़े डेटा सिस्टम शोधकर्ताओं को रीयल-टाइम अनुमान उत्पन्न करने में सक्षम करते हैं, जो नीतियों में महत्वपूर्ण हो सकते हैं जहां नीति निर्माताओं- सरकार या उद्योग में स्थितिगत जागरूकता के आधार पर प्रतिक्रिया देना चाहते हैं। उदाहरण के लिए, प्राकृतिक आपदाओं (Castillo 2016) आपातकालीन प्रतिक्रिया के मार्गदर्शन के लिए सोशल मीडिया डेटा का उपयोग किया जा सकता है और विभिन्न प्रकार के विभिन्न डेटा स्रोतों का उपयोग आर्थिक गतिविधि (Choi and Varian 2012) वास्तविक समय के अनुमानों का उत्पादन किया जा सकता है।
अंत में, हमेशा डेटा सिस्टम शोधकर्ताओं को अप्रत्याशित घटनाओं का अध्ययन करने और नीति निर्माताओं को वास्तविक समय की जानकारी प्रदान करने में सक्षम बनाता है। हालांकि, मुझे नहीं लगता कि हमेशा डेटा सिस्टम बहुत लंबे समय तक परिवर्तनों को ट्रैक करने के लिए उपयुक्त हैं। ऐसा इसलिए है क्योंकि कई बड़े डेटा सिस्टम लगातार बदल रहे हैं-एक प्रक्रिया जिसे मैं बाद में अध्याय (खंड 2.3.7) में बहाव कहूंगा।