2.3.2.4 बहती

जनसंख्या बहाव उपयोग बहाव, और सिस्टम बहाव यह मुश्किल बड़ा डेटा स्रोत का उपयोग करने के लिए लंबी अवधि के रुझान का अध्ययन करने के लिए बनाते हैं।

कई बड़े डेटा स्रोतों के महान लाभ में से एक यह है कि वे समय के साथ डेटा एकत्र कर रहे हैं। सामाजिक वैज्ञानिकों से अधिक समय डाटा, अनुदैर्ध्य डेटा के इस तरह कहते हैं। और, स्वाभाविक रूप से, अनुदैर्ध्य डेटा परिवर्तन का अध्ययन करने के लिए बहुत महत्वपूर्ण हैं। आदेश में मज़बूती से परिवर्तन को मापने के लिए, तथापि, माप सिस्टम ही स्थिर होना चाहिए। समाजशास्त्री ओटिस डुडले डंकन के शब्दों में, "आप परिवर्तन को मापने के लिए, माप बदल नहीं चाहते हैं तो" (Fischer 2011)

दुर्भाग्य से, कई बड़े डेटा सिस्टम, विशेष रूप से व्यापार प्रणाली है कि बनाने के लिए और कब्जा डिजिटल निशान-हर समय बदल रहा है, एक प्रक्रिया है कि मैं बहाव फोन करता हूँ। विशेष रूप से, इन पद्धतियों के तीन मुख्य तरीके में परिवर्तन: जनसंख्या बहाव व्यवहार बहाव (कैसे लोगों को उन का उपयोग कर रहे हैं में परिवर्तन) (जो उन्हें इस्तेमाल कर रहा है में परिवर्तन), और सिस्टम बहाव (सिस्टम अपने आप में परिवर्तन)। बहाव के तीन स्रोत का मतलब है कि डिजिटल ट्रेस डेटा में किसी भी स्वरूप दुनिया में एक महत्वपूर्ण परिवर्तन की वजह से हो सकता है, या यह बहाव के कुछ फार्म की वजह से हो सकता है।

बहाव-आबादी का पहला स्रोत बहाव-प्रणाली का उपयोग किया जाता है जो कर रहा है, और यह लंबे समय तराजू और कम समय तराजू पर बदल जाता है। उदाहरण के लिए, 2008 से पेश करने के लिए सोशल मीडिया पर लोगों की औसत उम्र बढ़ गई है। इन लंबी अवधि के रुझान के अलावा, किसी भी क्षण में एक प्रणाली का उपयोग कर लोगों से भिन्न होता है। उदाहरण के लिए, 2012 के अमेरिकी राष्ट्रपति चुनाव के दौरान राजनीति के बारे में ट्वीट के अनुपात में है कि महिलाओं द्वारा लिखे गए दिन से दिन में उतार-चढ़ाव (Diaz et al. 2016) । इस प्रकार, क्या ट्विटर-कविता के मूड में एक परिवर्तन किया जा करने के लिए वास्तव में बस जो किसी भी क्षण में बात कर रही है में परिवर्तन हो सकता है प्रकट हो सकता है।

जो एक प्रणाली का उपयोग किया जाता है में परिवर्तन के अलावा, वहाँ भी कैसे प्रणाली का इस्तेमाल किया जाता है में परिवर्तन होते हैं। उदाहरण के लिए, The दौरान इस्तांबुल में Gezi पार्क में विरोध प्रदर्शन, तुर्की कब्जा के रूप में विकसित किया विरोध में 2013 प्रदर्शनकारियों हैशटैग के अपने प्रयोग के लिए बदल दिया। यहाँ कैसे Zeynep Tufekci है (2014) बहाव है, जो वह पता लगाने के लिए है क्योंकि वह ट्विटर पर और जमीन पर व्यवहार को देख रहा था सक्षम था वर्णित है:

"क्या हुआ था कि जैसे ही विरोध के रूप में प्रमुख कहानी, लोगों की बड़ी संख्या बन गया था। । । सिवाय हैशटैग का उपयोग कर एक नई घटना की ओर ध्यान आकर्षित करने के लिए बंद कर दिया। । .. जबकि विरोध प्रदर्शन जारी रखा, और यहां तक ​​कि तेज, हैशटैग नीचे मर गया। साक्षात्कार इस के दो कारण का पता चला। सबसे पहले, एक बार हर किसी के विषय में पता था, हैशटैग एक बार में ज़रूरत से ज़्यादा और चरित्र सीमित ट्विटर मंच पर बेकार था। दूसरा, हैशटैग के रूप में ही एक विशेष विषय पर ध्यान आकर्षित करने, इसके बारे में बात करने के लिए के लिए उपयोगी देखा गया था। "

इस प्रकार, शोधकर्ताओं ने विरोध प्रदर्शन से संबंधित हैशटैग के साथ ट्वीट का विश्लेषण करके विरोध प्रदर्शन अध्ययन कर रहे थे कि क्या इस व्यवहार बहाव की वजह से हो रहा था की एक विकृत भावना होगा। उदाहरण के लिए, उनका मानना ​​है कि हो सकता है कि विरोध की चर्चा लंबे समय तक कमी आई है पहले यह वास्तव में कमी आई है।

बहाव के तीसरे तरह का सिस्टम बहाव है। इस मामले में, यह लोगों को बदलने या उनके व्यवहार नहीं बदल रहा है, लेकिन सिस्टम ही बदल रहा है। उदाहरण के लिए, समय के साथ फेसबुक स्टेटस अपडेट की लंबाई पर सीमा वृद्धि हुई है। इस प्रकार, स्थिति अद्यतन के किसी भी अनुदैर्ध्य अध्ययन इस बदलाव की वजह से कलाकृतियों के लिए असुरक्षित हो जाएगा। प्रणाली बहाव बारीकी एल्गोरिथम confounding बुलाया समस्या है जिसके लिए हम अब बारी से संबंधित है।