सधैं-ठूलो डाटा अनपेक्षित घटनाहरू र वास्तविक-समय मापन अध्ययन गर्न सक्षम बनाउँछ।
धेरै ठूलो डाटा प्रणाली सधैं-हो; तिनीहरूले निरन्तर डाटा सङ्कलन छन्। यो सधैं-विशेषता अनुदैर्ध्य डाटा संग अनुसन्धानकर्ताहरूले प्रदान गर्दछ (अर्थात्, समय डाटा)। सधैं-हुँदा अनुसन्धान को लागि दुई महत्त्वपूर्ण निहितार्थ छ।
पहिलो, संधै डेटा संग्रहले शोधकर्ताहरूलाई अप्रत्याशित घटनाहरू अध्ययन गर्न सक्षम बनाउँछ जुन अन्यथा सम्भव हुँदैन। उदाहरणका लागि, 2013 को गर्मीमा टर्कीमा Occupy Gezi विरोधाभासहरू अध्ययन गर्न इच्छुक शोधकर्ताहरू प्रायः घटनाको समयमा प्रदर्शनकारकहरूको व्यवहारमा ध्यान केन्द्रित हुनेछन्। सेरेन बुडक र डनकन वाट्स (2015) ट्विटरमा पहिले, र पछि चहचहानाको प्रयोग गर्ने प्रदर्शनकारीहरूको अध्ययन गर्न ट्विटरको सट्टामा प्रयोग गरेर थप गर्न सक्षम थिए। र, तिनीहरूले घटना भन्दा पहिले, र पछि प्रतिभागीको तुलनात्मक समूह सिर्जना गर्न सक्षम भयो (चित्र 2.2)। कुलमा, उनीहरूको पूर्व-प्यानल प्यानलले दुई वर्षमा 30,000 मानिसहरूको ट्वीट्स समावेश गर्यो। यस अन्य जानकारीको साथमा प्रयोग गरिएको सामान्यतया प्रयोग डेटा बढाउने गरी बुडक र वाटहरू धेरै सिक्न सक्षम थिए: उनीहरूले गेजको विरोधमा कस्तो भाग लिने सम्भावना र अनुमानको परिवर्तनको अनुमान लगाउन सक्षम थिए सहभागिता र सहभागिता, दुवै छोटो अवधिमा (Gezi को अवधिमा Gezi को समयमा) र लामो अवधिमा (पछि Gezi पछि Gezi सँग तुलना)।
एक शंकास्पद हुन सक्छ कि यी अनुमानहरू मध्ये केही सँधै सँधै डेटा सङ्कलन स्रोतहरू (जस्तै, रवैया परिवर्तनको दीर्घकालीन अनुमानहरू) को बिना बनाइएको हुन सक्छ, र यो सही छ, यद्यपि 30,000 मानिसहरूको लागि यस्तो डेटा संग्रह हुनसक्छ महँगो। तथापि, असीमित बजेट पनि दिईयो, म कुनै पनि अन्य विधिको बारेमा सोच्न सक्दिन कि अनिवार्य रूपमा शोधकर्ताहरूलाई समयमा यात्रा गर्न र प्रत्यक्ष रूपमा विगतमा सहभागीहरूको व्यवहार देख्न अनुमति दिन्छ। निकटतम विकल्प व्यवहार को पुनरावृत्ति रिपोर्ट को एकत्र गर्न को लागी हुनेछ, तर यो रिपोर्ट सीमित granularity र संदिग्ध सटीकता को हुनेछ। तालिका 2.1 अप्रत्याशित कार्यक्रम अध्ययन गर्न सँधै डेटा स्रोत प्रयोग गर्ने अध्ययनहरूको अन्य उदाहरणहरू प्रदान गर्दछ।
अप्रत्याशित कार्यक्रम | सँधै डाटा स्रोत | उद्धरण |
---|---|---|
टेलिभिजनमा टेलिभिजनमा व्यस्त | ट्विटर | Budak and Watts (2015) |
हांगकांगमा छाता प्रदर्शन | Zhang (2016) | |
न्यूयर्क शहरमा प्रहरीको गोली | रोक्नुहोस् र फ्र्यास रिपोर्टहरू | Legewie (2016) |
आईएसआईमा संलग्न व्यक्ति | ट्विटर | Magdy, Darwish, and Weber (2016) |
सेप्टेम्बर 11, 2001 को हमला | Livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
सेप्टेम्बर 11, 2001 को हमला | पेजर सन्देशहरू | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
अप्रत्याशित कार्यक्रमहरू अध्ययन गर्न थप रूपमा, सधैं-ठूलो डाटा प्रणालीले शोधकर्ताहरू वास्तविक-समय अनुमानहरू उत्पादन गर्न सक्षम गर्दछ, जुन सेटिङहरूमा जहाँ नीति निर्माताहरू-सरकार वा उद्योगमा-स्थितित्मक जागरूकताको आधारमा प्रतिक्रिया दिन चाहन्छन्, महत्त्वपूर्ण हुन सक्छ। उदाहरणका लागि, सामाजिक सञ्जाल डेटा प्राकृतिक आपदाहरू (Castillo 2016) लागि आकस्मिक प्रतिक्रिया मार्गदर्शन गर्न प्रयोग गर्न सकिन्छ र विभिन्न प्रकारका ठूला डेटा स्रोतहरू आर्थिक गतिविधि (Choi and Varian 2012) को वास्तविक-समय अनुमानहरू प्रयोग गर्न सकिन्छ।
अन्तमा, सधैँ डेटा प्रणालीले शोधकर्ताहरूले अप्रत्याशित कार्यक्रमहरू अध्ययन गर्न र नीति निर्माताहरूलाई वास्तविक-समय जानकारी प्रदान गर्न सक्षम पार्छन्। तथापि, मलाई लाग्छ कि सधैँ डेटा प्रणाली धेरै लामो अवधिमा परिवर्तनहरू ट्रयाकिङको लागि राम्रो उपयुक्त छ। यही कारणले गर्दा धेरै ठूला डेटा प्रणालीहरू लगातार परिवर्तन हुँदैछ - एक प्रक्रिया जुन म अध्याय (खण्ड 2.3.7) पछि बहावलाई कल गर्नेछु।