2.3.1.2 सधैँ

सधैं-ठूलो डाटा अनपेक्षित घटनाहरू र वास्तविक-समय मापन अध्ययन गर्न सक्षम बनाउँछ।

धेरै ठूलो डाटा प्रणाली सधैं-हो; तिनीहरूले निरन्तर डाटा सङ्कलन छन्। यो सधैं-विशेषता अनुदैर्ध्य डाटा संग अनुसन्धानकर्ताहरूले प्रदान गर्दछ (अर्थात्, समय डाटा)। सधैं-हुँदा अनुसन्धान को लागि दुई महत्त्वपूर्ण निहितार्थ छ।

पहिलो, सधैं-डाटा संग्रह अनुसन्धानकर्ताहरूले छैन पहिले संभव थिए तरिकामा अनपेक्षित घटनाहरू अध्ययन गर्न सक्षम बनाउँछ। उदाहरणका लागि, 2013 को गर्मी मा टर्की Gezi विरोध कब्जा अध्ययन रुचि अनुसन्धानकर्ताहरूले सामान्यतया घटना समयमा protesters व्यवहारलाई ध्यान केन्द्रित हुनेछ। Ceren Budak र डंकन वत्स (2015) को समयमा, ट्विटर को सधैं-प्रकृति अघि protesters ट्विटर-प्रयोग अध्ययन गर्न प्रयोग गरेर थप के गर्न सके र घटना पछि। र, तिनीहरू (को विरोध बारे tweet नगर्ने वा सहभागीहरू) गैर-सहभागी एक तुलना समूह समयमा, पहिले सिर्जना गर्न सक्षम भए र घटना पछि (चित्रा 2.1)। कुल आफ्नो पूर्व-पोस्ट प्यानल दुई वर्ष 30,000 मान्छे को ट्विट समावेश। तिनीहरूले मानिसहरूलाई कुन प्रकार को Gezi विरोध भाग लिन र मनोवृत्ति परिवर्तनहरू अनुमान गर्न बढी सम्भावना थिए अनुमान गर्न सके: यो अन्य जानकारी संग विरोध देखि सामान्यतः प्रयोग डाटा बढएर गरेर, Budak र वत्स धेरै सिक्न सके सहभागीहरू र गैर-सहभागीहरू, दुवै अल्पकालीन मा (तुलना पूर्व-Gezi Gezi समयमा) र दीर्घकालीन मा (तुलना पूर्व-Gezi पोस्ट-Gezi गर्न)।

चित्रा 2.1: अध्ययन गर्न Budak र वत्स (2015) द्वारा प्रयोग डिजाइन को 2013. को गर्मी मा टर्की Gezi विरोध कब्जा ट्विटर को सधैं-प्रकृति प्रयोग गरेर, शोधकर्ताओं तिनीहरूले बारे समावेश एउटा पूर्व-पोस्ट प्यानल भनिन्छ के सिर्जना दुई वर्ष 30,000 मान्छे। यसको विपरीत मा विरोध समयमा सहभागीहरू केन्द्रित कि विशिष्ट अध्ययन, को पूर्व-पोस्ट प्यानल 1) सहभागीहरू डेटा पहिले र घटना पछि र 2) गैर-सहभागीहरू डेटा अघि, समयमा, र यो घटना पछि थप्छ। यो समृद्ध डाटा संरचना Budak र वत्स मान्छे को कुन प्रकार, छोटो-अवधि दुवै (समयमा तुलना गर्दा पूर्व-Gezi को Gezi विरोध भाग लिन र सहभागीहरू र गैर-सहभागी मनोवृत्ति परिवर्तनहरू अनुमान गर्न बढी सम्भावना थिए अनुमान गर्न सक्षम Gezi) र दीर्घकालीन मा (तुलना पूर्व-Gezi पोस्ट-Gezi)।

चित्रा 2.1: प्रयोग डिजाइन Budak and Watts (2015) अध्ययन गर्न 2013. को गर्मी मा टर्की Gezi विरोध कब्जा ट्विटर को सधैं-प्रकृति प्रयोग गरेर, शोधकर्ताओं तिनीहरूले बारे समावेश एउटा पूर्व-पोस्ट प्यानल भनिन्छ के सिर्जना दुई वर्ष 30,000 मान्छे। यसको विपरीत मा विरोध समयमा सहभागीहरू केन्द्रित कि विशिष्ट अध्ययन, को पूर्व-पोस्ट प्यानल 1) सहभागीहरू डेटा पहिले र घटना पछि र 2) गैर-सहभागीहरू डेटा अघि, समयमा, र यो घटना पछि थप्छ। यो समृद्ध डाटा संरचना Budak र वत्स मान्छे को कुन प्रकार, छोटो-अवधि दुवै (समयमा तुलना गर्दा पूर्व-Gezi को Gezi विरोध भाग लिन र सहभागीहरू र गैर-सहभागी मनोवृत्ति परिवर्तनहरू अनुमान गर्न बढी सम्भावना थिए अनुमान गर्न सक्षम Gezi) र दीर्घकालीन मा (तुलना पूर्व-Gezi पोस्ट-Gezi)।

यी अनुमान केही बिना गरेका छन् गरिएको सक्ने साँचो छ सधैं-डाटा संग्रह स्रोतहरू (जस्तै, मनोवृत्ति परिवर्तन को दीर्घकालीन अनुमान), हुनत 30,000 मान्छे को लागि यस्तो लगत सङ्कलन एकदम महंगा भएको थियो। र, पनि असीमित बजेट दिइएको, म अनिवार्य अनुसन्धानकर्ताहरूले समय फिर्ता यात्रा गर्न र सिधै विगतमा सहभागीहरू व्यवहार पालन गर्न अनुमति दिन्छ कुनै पनि अन्य विधि विचार गर्न सक्दैन। सबै भन्दा नजदीकी स्थान वैकल्पिक व्यवहार को पूर्वव्यापी रिपोर्टहरू सङ्कलन गर्न हुनेछ, तर यी रिपोर्टहरू सीमित विघटन र शङ्कास्पद शुद्धता को हुनेछ। तालिका 2.1 एउटा सधैं-डेटा स्रोत अनपेक्षित घटना अध्ययन गर्न प्रयोग अध्ययन को अन्य उदाहरण प्रदान गर्दछ।

तालिका 2.1: ठूलो डाटा स्रोतहरु सधैं-प्रयोग अनपेक्षित घटनाहरू अध्ययन।
अप्रत्याशित घटना सधैं-डेटा स्रोत उद्धरण
टर्की Gezi आन्दोलन कब्जा ट्विटर Budak and Watts (2015)
हङकङ छाता विरोध Weibo Zhang (2016)
न्यूयोर्क शहरका प्रहरी Shootings रिपोर्ट-र-frisk रोक्न Legewie (2016)
व्यक्ति आईएसआईएस सामेल हुने प्रक्रिया ट्विटर Magdy, Darwish, and Weber (2016)
सेप्टेम्बर 11, 2001 आक्रमण livejournal.com Cohn, Mehl, and Pennebaker (2004)
सेप्टेम्बर 11, 2001 आक्रमण पेजर सन्देशहरू Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

दोस्रो, सधैं-डाटा संग्रह अनुसन्धानकर्ताहरूले वास्तविक समय माप, जो सेटिङहरू जहाँ नीति निर्माता अवस्थित व्यवहार देखि बस सिक्न छैन तर पनि यो प्रतिक्रिया चाहनुहुन्छ मा महत्वपूर्ण हुन सक्छ उत्पादन गर्न सक्षम बनाउँछ। उदाहरणका लागि, सामाजिक मिडिया डाटा प्राकृतिक प्रकोप प्रतिक्रियाहरू मार्गदर्शन गर्न प्रयोग गर्न सकिन्छ (Castillo 2016)

निष्कर्ष मा, सधैं-डाटा प्रणाली अनपेक्षित घटनाहरू अध्ययन र नीति निर्माता वास्तविक-समय जानकारी प्रदान गर्न अनुसन्धानकर्ताहरूले सक्षम। म, तर, त्यो सधैं-डाटा प्रणाली अनुसन्धानकर्ताहरूले समय लामो अवधिमा परिवर्तन ट्रयाक गर्न सक्षम छ कि प्रस्तावित गर्नुभयो। किनभने धेरै ठूलो डाटा प्रणाली प्रक्रिया भनिन्छ बहाव (धारा 2.3.2.4) निरन्तर-एक परिवर्तन गर्दै छ।