नेहमी-मोठ्या डेटा प्रसंग आणि रिअल-टाइम मापन अभ्यास सक्षम करते.
अनेक मोठे डेटा प्रणाली नेहमी आहेत; ते सतत माहिती गोळा आहेत. या नेहमी वैशिष्ट्यपूर्ण रेखांशाचा डेटा संशोधक उपलब्ध आहे (म्हणजेच, वेळ डेटा). नेहमी जात संशोधन दोन महत्त्वाचे मानले आहे.
प्रथम, नेहमीच्या डेटा संग्रहाने शोधकांना अनपेक्षित घटनांचे अभ्यासाचे मार्ग शोधण्यास सक्षम करते ज्या अन्यथा शक्य होणार नाहीत. उदाहरणार्थ, 2013 च्या उन्हाळ्यात तुर्कस्तानमध्ये गेओजी व्यापाराचे स्वामित्व अभ्यास करण्यात रस घेणाऱ्या संशोधक विशेषत: या कार्यक्रमादरम्यान निदर्शकांच्या वागणुकीवर लक्ष केंद्रित करतील. ट्विटर बॅनर आणि डंकन वॅट्स (2015) ट्विटरच्या नेहमीच्या प्रकृतिचा वापर करून ते स्पर्धेच्या आधी, दरम्यान आणि नंतर ट्विटरचा वापर करणार्या निदर्शकांचा अभ्यास करण्यासाठी अधिक सक्षम होते. आणि, इव्हेंटच्या आधी, दरम्यान आणि नंतर (आकृती 2.2) ते गैर-सहभागींच्या तुलना गटात तयार करण्यास सक्षम होते. एकूण, त्यांच्या माजी पॅनलमध्ये दोन वर्षांच्या कालावधीत 30,000 लोकांच्या ट्विट्सचा समावेश होता. या इतर माहितीसह सामान्यतः वापरल्या जाणार्या डेटाला वाढवून, बुडाक व वॉट्स हे अधिक जाणून घेण्यास सक्षम होते: ते अंदाज लावण्यात सक्षम होते की कोणत्या प्रकारच्या लोकांना लोकजगतातील निषेधार्थ होण्याची जास्त शक्यता असते आणि त्यांच्या वर्तणुकीत बदल करणे सहभागी आणि नॉनपेप्रिंटंट, दोन्ही अल्प मुदतीत (Gezi दरम्यान पूर्व Gezi तुलना) आणि दीर्घकालीन (पोस्ट Gezi सह पूर्व Gezi तुलना) दोन्ही.
एक संशयवादी असे सूचित करतात की यांपैकी काही अनुमान नेहमी नेहमीच डेटा संग्रह स्त्रोतांशिवाय (उदा. वृत्ती बदलाचे दीर्घकालीन अंदाज) केले जाऊ शकत नव्हते, आणि ते योग्य आहे, तरीही 30,000 लोकांसाठी असा डेटा संकलन टाळला असता. महाग जरी अमर्यादित अर्थसंकल्पास दिले असले तरीही, मी इतर कोणत्याही पद्धतीचा विचार करू शकत नाही ज्यामुळे संशोधक वेळेत मागे प्रवास करण्यास आणि भूतकाळात सहभागींच्या वर्तनाला प्रत्यक्षपणे नकार देतात. सर्वात जवळचा पर्याय वागणुकीच्या पूर्वव्यापी अहवाल एकत्रित करणे हे असेल, परंतु हे अहवाल मर्यादित ग्रॅन्युलॅरिटी आणि शंकास्पद अचूकतेचे असतील. टेबल 2.1 अभ्यासाची इतर उदाहरणे उपलब्ध करते जी अनपेक्षित घटनांचा अभ्यास करण्यासाठी नेहमीच्या डेटा स्रोताचा वापर करतात.
अनपेक्षित घटना | नेहमी-चालू असलेल्या डेटा स्त्रोत | उद्धरण |
---|---|---|
तुर्की मध्ये Gezi चळवळ व्यापारात | ट्विटर | Budak and Watts (2015) |
हाँगकाँगमधील छत्रछायेच्या निषेधार्थ | वेइबो | Zhang (2016) |
न्यू यॉर्क शहर पोलिसांची शूटिंग | थांबा आणि खिडकी अहवाल | Legewie (2016) |
ISIS मध्ये सामील होणारी व्यक्ती | ट्विटर | Magdy, Darwish, and Weber (2016) |
सप्टेंबर 11, 2001 हल्ला | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
सप्टेंबर 11, 2001 हल्ला | पेजर संदेश | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
अनपेक्षित घटनांचा अभ्यास करण्याव्यतिरिक्त, नेहमीच मोठ्या डेटा प्रणालीद्वारे संशोधकांना वास्तविक-वेळ अंदाज तयार करण्यास सक्षम केले जाते, जे धोरण किंवा धोरणांमध्ये नीति-निर्मात्यांमध्ये महत्त्वाचे असू शकतात- प्रसंगनिष्ठ जागरूकता आधारित आधारित प्रतिसाद देऊ इच्छितो. उदाहरणार्थ, नैसर्गिक आपत्ती (Castillo 2016) आपत्कालीन प्रतिसाद मार्गदर्शनासाठी सामाजिक मीडिया डेटाचा वापर केला जाऊ शकतो आणि विविध मोठ्या डेटा स्त्रोतांची विविधता वापरली जाऊ शकते आर्थिक गतिविधि (Choi and Varian 2012) वास्तविक-वेळ अंदाज तयार करण्यासाठी.
शेवटी, नेहमीच्या डेटा सिस्टम संशोधकांना अनपेक्षित घटनांचा अभ्यास करण्यास आणि धोरण निर्मात्यांना वास्तविक-वेळ माहिती प्रदान करण्यास सक्षम करतात. तथापि, असे नाही की मला नेहमी असे वाटते की नेहमीच्या काळात डेटा सिस्टम ही बर्याच काळातील बदलांवर मागोवा घेण्याकरिता अनुकूल असतात. अनेक मोठे डेटा प्रणाली सतत बदलत-एक आहेत कारण मी नंतर प्रकरण (विभाग 2.3.7) मध्ये पडणे कॉल करू की प्रक्रिया आहे.