జనాభా ప్రవాహం, వాడుక ప్రవాహం, మరియు వ్యవస్థ చలనం దీర్ఘకాల ధోరణులను అధ్యయనం చేయడం కోసం పెద్ద డేటా మూలాలను ఉపయోగించడం కష్టతరం చేస్తుంది.
అనేక పెద్ద డేటా మూలాల యొక్క గొప్ప ప్రయోజనాల్లో ఒకటి, వారు కాలక్రమేణా డేటాను సేకరిస్తారు. సోషల్ శాస్త్రవేత్తలు ఈ రకమైన ఓవర్ టైం డేటా పొడవాటి డేటాను కాల్ చేస్తారు. సహజంగా, రేఖాంశ సమాచారం మార్పు అధ్యయనం కోసం చాలా ముఖ్యమైనవి. అయితే విశ్వసనీయంగా మార్పును అంచనా వేయడానికి, కొలత వ్యవస్థ కూడా స్థిరంగా ఉండాలి. సోషియాలజిస్ట్ ఓటిస్ డడ్లీ డన్కన్ యొక్క మాటల్లో, "మీరు మార్పును అంచనా వేయాలనుకుంటే, కొలతను మార్చవద్దు" (Fischer 2011) .
దురదృష్టవశాత్తు, అనేక పెద్ద డేటా వ్యవస్థలు-ముఖ్యంగా వ్యాపార వ్యవస్థలు- అన్ని సమయం మారుతున్నాయి, ఒక ప్రక్రియ నేను డ్రిఫ్ట్ అని పిలుస్తాను . ముఖ్యంగా, ఈ వ్యవస్థలు మూడు ప్రధాన మార్గాల్లో మార్పు చెందుతాయి: జనాభా ప్రవాహం (వాటిని ఉపయోగించేవారిలో మార్పు), ప్రవర్తనా ప్రవాహం (ప్రజలు వాటిని ఎలా ఉపయోగిస్తున్నారో మార్చడం), మరియు సిస్టమ్ డ్రిఫ్ట్ ( వ్యవస్థలో మార్పు). ప్రవాహం యొక్క మూడు మూలాలు అంటే పెద్ద డేటా మూలంలో ఏదైనా నమూనా ప్రపంచంలోని ఒక ముఖ్యమైన మార్పు కారణంగా సంభవించవచ్చు, లేదా ఏదో ఒక రకమైన డ్రిఫ్ట్ వల్ల ఇది సంభవించవచ్చు.
డ్రిఫ్ట్-పీపుల్ డ్రిఫ్ట్ యొక్క మొదటి మూలం వ్యవస్థను ఎవరు ఉపయోగిస్తుందో మార్పులకు కారణమవుతుంది మరియు ఈ మార్పులు చిన్న మరియు దీర్ఘ కాల వ్యవధుల్లో జరుగుతాయి. ఉదాహరణకు, 2012 ప్రెసిడెంట్ ఎన్నికల సమయంలో, రోజువారీ నుండి మహిళలు రాసిన రాజకీయాలు గురించి ట్వీట్లు నిష్పత్తి (Diaz et al. 2016) . అందువలన, ట్విట్టర్-వచనం యొక్క మూడ్లో మార్పు ఏమిటంటే, ఏ సమయంలోనైనా ఎవరు మాట్లాడుతున్నారో వాస్తవానికి కేవలం మార్పు కావచ్చు. ఈ స్వల్పకాలిక ఒడిదుడుకులతో పాటుగా, కొన్ని జనాభా సమూహాల దీర్ఘకాలిక ధోరణిని స్వీకరించడం మరియు విడిచిపెట్టడం కూడా ఉంది.
వ్యవస్థను ఎవరు ఉపయోగిస్తున్నారో కూడా మార్పులతో పాటు, వ్యవస్థ ఎలా ఉపయోగించాలో కూడా మారుతుంటుంది, నేను ప్రవర్తనా ప్రవాహం అని పిలుస్తాను. ఉదాహరణకు, 2013 లో టర్కీలో గీజీ నిరసనలు ఆక్రమించాయి, ఆందోళనకారులు ఉద్భవించిన నిరసనకారులు హ్యాష్ట్యాగ్ల వినియోగాన్ని మార్చుకున్నారు. జాయెప్ టుఫెక్కి (2014) ప్రవర్తనా ప్రవాహం గురించి వివరించారు, ఇది ఆమెను గుర్తించగలిగింది, ఎందుకంటే ఆమె ట్విట్టర్లో మరియు వ్యక్తిగతంగా ప్రవర్తనను గమనించింది:
"ఏమి జరుగుతుందో ఆందోళన ఆధిపత్య కథ అయింది, పెద్ద సంఖ్యలో ప్రజలు ... ఒక కొత్త దృగ్విషయానికి దృష్టిని ఆకర్షించే మినహా హ్యాష్ట్యాగ్లను ఉపయోగించడం ఆపివేశారు ... నిరసనలు కొనసాగాయి మరియు తీవ్రతరం అయినప్పటికీ, హ్యాష్ట్యాగ్లు మరణించాయి. ఇంటర్వ్యూ ఈ రెండు కారణాల వెల్లడించింది. మొదట, ఒకసారి ప్రతి ఒక్కరూ విషయం తెలుసు, హాష్ ట్యాగ్ పాత్ర-పరిమిత ట్విట్టర్ వేదికపై ఒకసారి నిరుపయోగంగా మరియు వ్యర్థమైంది. రెండవది, ఒక ప్రత్యేక అంశంపై దృష్టిని ఆకర్షించడానికి హాష్ ట్యాగ్లు ఉపయోగకరంగా ఉండేవి, దాని గురించి మాట్లాడటం లేదు. "
అందువలన, నిరసన సంబంధిత హ్యాష్ట్యాగ్లు ట్వీట్లు విశ్లేషించడం ద్వారా నిరసనలు చదువుతూ ఉండిన పరిశోధకులు ఎందుకంటే ఈ ప్రవర్తనా ఉరవడి ఏమి జరుగుతుందో యొక్క ఒక వక్రీకృత అర్ధంలో కలిగి ఉంటుంది. ఉదాహరణకు, వారు నిజానికి తగ్గింది ముందు నిరసన చర్చా దీర్ఘ తగ్గింది నమ్మకం ఉండవచ్చు.
మూడవ రకమైన డ్రిఫ్ట్ వ్యవస్థ డ్రిఫ్ట్. ఈ సందర్భంలో, ఇది మారుతున్న లేదా వారి ప్రవర్తన మారుతున్న కాదు, కానీ వ్యవస్థ మారుతుంది. ఉదాహరణకు, కాలక్రమేణా ఫేస్బుక్ స్థాయి నవీకరణల పొడవు పరిమితిని పెంచింది. అందువల్ల, ఈ మార్పు కారణంగా ఏర్పడిన కళాకృతులకి స్థిరమైన స్థితిగతుల గురించి దీర్ఘాయువు అధ్యయనం చేయబడుతుంది. సిస్టమ్ డ్రిఫ్ట్ అల్గోరిథమిక్ గందరగోళంగా పిలువబడే ఒక సమస్యకు దగ్గరి సంబంధాన్ని కలిగి ఉంది, నేను విభాగం 2.3.8 లో కవర్ చేస్తాను.
అంతిమంగా, అనేక పెద్ద డేటా మూలాల వారు వాడుతున్నారు ఎలా లో, వారు వాడుతున్నారు ఎలా లో, మరియు వ్యవస్థలు పని ఎలా మార్పులు కారణంగా డ్రిఫ్టింగ్ ఉంటాయి. ఈ మార్పు యొక్క మూలాలను కొన్నిసార్లు ఆసక్తికరమైన పరిశోధన ప్రశ్నలుగా చెప్పవచ్చు, కానీ ఈ మార్పులు కాలక్రమేణా దీర్ఘకాలిక మార్పులను గుర్తించడానికి పెద్ద డేటా మూలాల సామర్థ్యాన్ని క్లిష్టతరం చేస్తాయి.