ఎప్పుడూ పెద్ద డేటా అనూహ్య సంఘటనలు మరియు వాస్తవ కాల లెక్కింపు అధ్యయనం అనుమతిస్తుంది.
అనేక పెద్ద డేటా సిస్టమ్స్ ఎప్పుడూ ఉంటాయి; వారు నిరంతరం డేటా సేకరిస్తున్నారు. ఈ ఎప్పుడూ లక్షణం రేఖీయ డేటా తో పరిశోధకులు అందిస్తుంది (అంటే, కాలక్రమేణా డేటా). ఎప్పుడూ ఉండటం పరిశోధనకు రెండు ముఖ్యమైన చిక్కులను కలిగి ఉంది.
మొదట, డేటా సేకరణలో ఎల్లప్పుడూ పరిశోధకులు ఊహించని సంఘటనలను సాధ్యం కాని మార్గాల్లో అధ్యయనం చేయడాన్ని అనుమతిస్తుంది. ఉదాహరణకు, 2013 వేసవికాలంలో టర్కీలో ఆక్రమణ గీజీ నిరసనలు చదివే ఆసక్తి ఉన్న పరిశోధకులు ఈ కార్యక్రమంలో నిరసనకారుల ప్రవర్తనపై దృష్టి సారిస్తారు. Ceren Budad మరియు డంకన్ వాట్స్ (2015) ఈవెంట్ ముందు, సమయంలో, మరియు తరువాత Twitter ఉపయోగించిన నిరసనకారులు అధ్యయనం Twitter యొక్క స్వభావం ఎల్లప్పుడూ-ఉపయోగించి ఉపయోగించి చేయగలిగారు. మరియు, వారు సంఘటన ముందు, సమయంలో, మరియు సంఘటన తర్వాత (పోలిక 2.2) పోలిక సమూహాన్ని సృష్టించగలిగారు. మొత్తంగా, వారి మాజీ పోస్ట్ ప్యానెల్ రెండు సంవత్సరాల్లో 30,000 మంది ట్వీట్లను కలిగి ఉంది. ఈ ఇతర సమాచారంతో నిరసనల నుండి సాధారణంగా ఉపయోగించిన డేటాను పెంచడం ద్వారా, బుడాక్ మరియు వాట్స్ మరింత నేర్చుకోగలిగారు: వారు జీజీ నిరసనలు పాల్గొనడానికి ఎంత ఎక్కువ మంది ప్రజలు ఉంటారో మరియు వైఖరులలో మార్పులను స్వల్పకాలంలో (గీజికి పూర్వ గీజిని పోల్చడం) మరియు దీర్ఘకాలంలో (పోస్ట్-గీజీని పూర్వ-జిజితో పోల్చడం) పాల్గొనేవారు మరియు పాల్గొనేవారు.
సమాచార సేకరణ సేకరణల (ఉదా. దీర్ఘకాలిక అంచనా వైఖరి మార్పు) లేకుండా ఈ అంచనాలు కొన్ని చేయబడవచ్చని ఒక సంశయవాదం సూచించవచ్చు, మరియు ఇది సరైనదే అయినప్పటికీ 30,000 మంది ప్రజల కోసం సేకరించిన డేటా ఖరీదైన. కూడా, ఒక అపరిమిత బడ్జెట్ ఇచ్చిన అయితే, నేను తప్పనిసరిగా పరిశోధకులు సమయంలో తిరిగి ప్రయాణం మరియు నేరుగా గతంలో పాల్గొనే 'తీరును పరిశీలించడానికి అనుమతించే ఏ ఇతర పద్ధతి భావిస్తారు కాదు. దగ్గరగా ప్రత్యామ్నాయ ప్రవర్తన యొక్క పునర్విమర్శ నివేదికలను సేకరించడానికి ఉంటుంది, కానీ ఈ నివేదికలు పరిమిత గ్రాన్యులారిటీ మరియు ప్రశ్నార్థకమైన ఖచ్చితత్వం ఉంటుంది. పట్టిక 2.1 ఊహించని సంఘటనను అధ్యయనం చేయడానికి ఎల్లప్పుడూ ఆన్-సోర్స్ డేటాను ఉపయోగించే అధ్యయనాల యొక్క ఇతర ఉదాహరణలు అందిస్తుంది.
ఊహించని సంఘటన | ఎల్లప్పుడూ డేటా మూలం | citation |
---|---|---|
టర్కీలో గీజీ ఉద్యమాన్ని ఆక్రమిస్తాయి | ట్విట్టర్ | Budak and Watts (2015) |
హాంగ్ కాంగ్ లో గొడుగు నిరసనలు | Zhang (2016) | |
న్యూయార్క్ నగరంలోని పోలీసుల షూటింగ్ | స్టాప్-అండ్-ఫ్రిస్క్ నివేదికలు | Legewie (2016) |
వ్యక్తి ISIS లో చేరడం | ట్విట్టర్ | Magdy, Darwish, and Weber (2016) |
సెప్టెంబర్ 11, 2001 దాడి | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
సెప్టెంబర్ 11, 2001 దాడి | పేజర్ సందేశాలు | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
ఊహించని సంఘటనలను అధ్యయనం చేయడంతో పాటుగా, పెద్ద డేటా వ్యవస్థలలో ఎప్పుడూ పరిశోధకులు నిజమైన సమయం అంచనాలను ఉత్పత్తి చేయటానికి వీలు కల్పిస్తారు, ఇది పాలసీ మేకర్స్-ప్రభుత్వంలో లేదా పరిశ్రమలో-స్థాన అవగాహన ఆధారంగా స్పందిస్తారు. ఉదాహరణకు, ప్రకృతి వైపరీత్యాలకు (Castillo 2016) అత్యవసర ప్రతిస్పందనను మార్గనిర్దేశం చేసేందుకు సోషల్ మీడియా డేటాను ఉపయోగించుకోవచ్చు మరియు విభిన్న పెద్ద డేటా వనరులు ఆర్థిక కార్యకలాపాల యొక్క నిజ-సమయ అంచనాలను ఉత్పత్తి చేస్తాయి (Choi and Varian 2012) .
ముగింపులో, ఎప్పటికప్పుడు డేటా వ్యవస్థలు పరిశోధకులు ఊహించని సంఘటనలు అధ్యయనం మరియు విధాన నిర్ణేతలు నిజ సమయం సమాచారం అందించడానికి ఎనేబుల్. ఏమైనప్పటికీ, ఎప్పటికప్పుడు సమాచార వ్యవస్థలు చాలా కాలం పాటు ట్రాకింగ్ మార్పులకు బాగా సరిపోతున్నాయని నేను అనుకోను. ఎందుకంటే ఎన్నో పెద్ద సమాచార వ్యవస్థలు నిరంతరం మారుతున్నాయి-నేను ఆచరణలో తరువాత భాగంలో కాల్ చేస్తాను (సెక్షన్ 2.3.7).