2.3.2

सधैं-ठूलो डाटा अनपेक्षित घटनाहरू र वास्तविक-समय मापन अध्ययन गर्न सक्षम बनाउँछ।

धेरै ठूलो डाटा प्रणाली सधैं-हो; तिनीहरूले निरन्तर डाटा सङ्कलन छन्। यो सधैं-विशेषता अनुदैर्ध्य डाटा संग अनुसन्धानकर्ताहरूले प्रदान गर्दछ (अर्थात्, समय डाटा)। सधैं-हुँदा अनुसन्धान को लागि दुई महत्त्वपूर्ण निहितार्थ छ।

पहिलो, संधै डेटा संग्रहले शोधकर्ताहरूलाई अप्रत्याशित घटनाहरू अध्ययन गर्न सक्षम बनाउँछ जुन अन्यथा सम्भव हुँदैन। उदाहरणका लागि, 2013 को गर्मीमा टर्कीमा Occupy Gezi विरोधाभासहरू अध्ययन गर्न इच्छुक शोधकर्ताहरू प्रायः घटनाको समयमा प्रदर्शनकारकहरूको व्यवहारमा ध्यान केन्द्रित हुनेछन्। सेरेन बुडक र डनकन वाट्स (2015) ट्विटरमा पहिले, र पछि चहचहानाको प्रयोग गर्ने प्रदर्शनकारीहरूको अध्ययन गर्न ट्विटरको सट्टामा प्रयोग गरेर थप गर्न सक्षम थिए। र, तिनीहरूले घटना भन्दा पहिले, र पछि प्रतिभागीको तुलनात्मक समूह सिर्जना गर्न सक्षम भयो (चित्र 2.2)। कुलमा, उनीहरूको पूर्व-प्यानल प्यानलले दुई वर्षमा 30,000 मानिसहरूको ट्वीट्स समावेश गर्यो। यस अन्य जानकारीको साथमा प्रयोग गरिएको सामान्यतया प्रयोग डेटा बढाउने गरी बुडक र वाटहरू धेरै सिक्न सक्षम थिए: उनीहरूले गेजको विरोधमा कस्तो भाग लिने सम्भावना र अनुमानको परिवर्तनको अनुमान लगाउन सक्षम थिए सहभागिता र सहभागिता, दुवै छोटो अवधिमा (Gezi को अवधिमा Gezi को समयमा) र लामो अवधिमा (पछि Gezi पछि Gezi सँग तुलना)।

चित्रा 2.2: 2013 को गर्मीमा टेलिभिजनमा व्यवसायी गीडीको विरोधको अध्ययन गर्न बुडक र वट्स (2015) द्वारा प्रयोग गरिएको डिजाइन। ट्विटरको सधैँ स्वभाव प्रयोग गरेर, शोधकर्ताहरूले उनीहरूलाई पूर्व-प्यानल प्यानल भनिने कुरामा समावेश गरेका थिए जुन बारेमा समावेश गरिएको थियो। दुई वर्ष भन्दा बढी 30,000 मान्छे। एक ठेठ अध्ययनको विपरीत, जो प्रतिभागिहरु को प्रतिभागिहरु मा ध्यान केंद्रित गरेको छ, पूर्व-पैनल पैनल 1) घटना देखि पहिले र पछि को प्रतिभागिहरु को डेटा र 2) अप्रत्याशित को डेटा पहिले, दौरान र पछि। यस समृद्ध डेटा ढाँचाले बुबा र वाटहरूलाई अनुमानित गर्न सक्यो कि गजईको विरोधमा कस्तो प्रकारको मान्छे भाग लिन र सम्भावना र गैर-सहभागीहरुको व्यवहारमा परिवर्तन गर्ने अनुमान लगाउन सक्दछन। छोटो अवधिमा (गिजीको समयमा पूर्व-गेजको तुलना ) र लामो समय मा (पछि Gezi संग Gezi तुलना)।

चित्रा 2.2: 2013 को गर्मीमा टेलिभिजनमा व्यवसायी गीडीको विरोधको अध्ययन गर्न Budak and Watts (2015) द्वारा प्रयोग गरिएको डिजाइन। ट्विटरको सधैँ स्वभाव प्रयोग गरेर, शोधकर्ताहरूले उनीहरूलाई पूर्व-प्यानल प्यानल भनिने कुरामा समावेश गरेका थिए जुन बारेमा समावेश गरिएको थियो। दुई वर्ष भन्दा बढी 30,000 मान्छे। एक ठेठ अध्ययनको विपरीत, जो प्रतिभागिहरु को प्रतिभागिहरु मा ध्यान केंद्रित गरेको छ, पूर्व-पैनल पैनल 1) घटना देखि पहिले र पछि को प्रतिभागिहरु को डेटा र 2) अप्रत्याशित को डेटा पहिले, दौरान र पछि। यस समृद्ध डेटा ढाँचाले बुबा र वाटहरूलाई अनुमानित गर्न सक्यो कि गजईको विरोधमा कस्तो प्रकारको मान्छे भाग लिन र सम्भावना र गैर-सहभागीहरुको व्यवहारमा परिवर्तन गर्ने अनुमान लगाउन सक्दछन। छोटो अवधिमा (गिजीको समयमा पूर्व-गेजको तुलना ) र लामो समय मा (पछि Gezi संग Gezi तुलना)।

एक शंकास्पद हुन सक्छ कि यी अनुमानहरू मध्ये केही सँधै सँधै डेटा सङ्कलन स्रोतहरू (जस्तै, रवैया परिवर्तनको दीर्घकालीन अनुमानहरू) को बिना बनाइएको हुन सक्छ, र यो सही छ, यद्यपि 30,000 मानिसहरूको लागि यस्तो डेटा संग्रह हुनसक्छ महँगो। तथापि, असीमित बजेट पनि दिईयो, म कुनै पनि अन्य विधिको बारेमा सोच्न सक्दिन कि अनिवार्य रूपमा शोधकर्ताहरूलाई समयमा यात्रा गर्न र प्रत्यक्ष रूपमा विगतमा सहभागीहरूको व्यवहार देख्न अनुमति दिन्छ। निकटतम विकल्प व्यवहार को पुनरावृत्ति रिपोर्ट को एकत्र गर्न को लागी हुनेछ, तर यो रिपोर्ट सीमित granularity र संदिग्ध सटीकता को हुनेछ। तालिका 2.1 अप्रत्याशित कार्यक्रम अध्ययन गर्न सँधै डेटा स्रोत प्रयोग गर्ने अध्ययनहरूको अन्य उदाहरणहरू प्रदान गर्दछ।

तालिका 2.1: सँधै ठूलो डाटा स्रोतहरू प्रयोग गरी अप्रत्याशित घटनाहरूको अध्ययन।
अप्रत्याशित कार्यक्रम सँधै डाटा स्रोत उद्धरण
टेलिभिजनमा टेलिभिजनमा व्यस्त ट्विटर Budak and Watts (2015)
हांगकांगमा छाता प्रदर्शन Weibo Zhang (2016)
न्यूयर्क शहरमा प्रहरीको गोली रोक्नुहोस् र फ्र्यास रिपोर्टहरू Legewie (2016)
आईएसआईमा संलग्न व्यक्ति ट्विटर Magdy, Darwish, and Weber (2016)
सेप्टेम्बर 11, 2001 को हमला Livejournal.com Cohn, Mehl, and Pennebaker (2004)
सेप्टेम्बर 11, 2001 को हमला पेजर सन्देशहरू Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

अप्रत्याशित कार्यक्रमहरू अध्ययन गर्न थप रूपमा, सधैं-ठूलो डाटा प्रणालीले शोधकर्ताहरू वास्तविक-समय अनुमानहरू उत्पादन गर्न सक्षम गर्दछ, जुन सेटिङहरूमा जहाँ नीति निर्माताहरू-सरकार वा उद्योगमा-स्थितित्मक जागरूकताको आधारमा प्रतिक्रिया दिन चाहन्छन्, महत्त्वपूर्ण हुन सक्छ। उदाहरणका लागि, सामाजिक सञ्जाल डेटा प्राकृतिक आपदाहरू (Castillo 2016) लागि आकस्मिक प्रतिक्रिया मार्गदर्शन गर्न प्रयोग गर्न सकिन्छ र विभिन्न प्रकारका ठूला डेटा स्रोतहरू आर्थिक गतिविधि (Choi and Varian 2012) को वास्तविक-समय अनुमानहरू प्रयोग गर्न सकिन्छ।

अन्तमा, सधैँ डेटा प्रणालीले शोधकर्ताहरूले अप्रत्याशित कार्यक्रमहरू अध्ययन गर्न र नीति निर्माताहरूलाई वास्तविक-समय जानकारी प्रदान गर्न सक्षम पार्छन्। तथापि, मलाई लाग्छ कि सधैँ डेटा प्रणाली धेरै लामो अवधिमा परिवर्तनहरू ट्रयाकिङको लागि राम्रो उपयुक्त छ। यही कारणले गर्दा धेरै ठूला डेटा प्रणालीहरू लगातार परिवर्तन हुँदैछ - एक प्रक्रिया जुन म अध्याय (खण्ड 2.3.7) पछि बहावलाई कल गर्नेछु।