Daonnan air mòr-dàta a 'toirt cothrom a' sgrùdadh ris nach robh dùil tachartasan agus fìor-ùine tomhas.
Tha mòran dàta mòr siostaman a tha daonnan-air; tha iad daonnan a 'tional dàta. Tha seo a 'còmhnaidh air a' toirt feart rannsachaidh le dhàta iar-astair (ie, dàta thar ùine). Tha a bhith an-còmhnaidh air Tha dà bhuaidh chudromach airson rannsachadh.
An toiseach, tha cruinneachadh dàta an-còmhnaidh a 'leigeil le luchd-rannsachaidh sgrùdadh a dhèanamh air tachartasan gun dùil ann an dòighean nach biodh comasach air a' chaochladh. Mar eisimpleir, bhiodh luchd-rannsachaidh aig a bheil ùidh ann a bhith a 'sgrùdadh gealladh Occupy Gezi anns an Tuirc ann an samhradh 2013 mar as trice ag amas air giùlan luchd-iomairt rè an tachartais. B 'urrainn do Cheren Budak agus Duncan Watts (2015) barrachd a dhèanamh le bhith a' cleachdadh nàdar an-còmhnaidh Twitter airson luchd-iomairt a sgrùdadh a chleachd iad Twitter ro, rè, agus an dèidh an tachartais. Agus, b 'urrainn dhaibh buidheann coimeas de luchd-neo-phàirteach a chruthachadh ron, rè, agus an dèidh an tachartais (figear 2.2). Gu h-iomlan, bha an tweets de 30,000 neach thairis air dà bhliadhna am pannal ex-post . Le bhith a 'cur ris an dàta a chaidh a chleachdadh gu tric bho na h-iomairtean leis an fhiosrachadh eile seo, b' urrainn do Budak agus Watts mòran a bharrachd ionnsachadh: bha e comasach dhaibh tuairmse a dhèanamh air dè na daoine a bu dualtach a bhith an sàs ann an gearan Gezi agus tuairmse a dhèanamh air na h-atharrachaidhean ann am beachdan com-pàirtichean agus neo-chompàirtichean, an dà chuid sa gheàrr-ùine (a 'dèanamh coimeas eadar ro-Gezi agus Gezi) agus san fhad-ùine (a' dèanamh coimeas eadar pre-Gezi agus Gezi às dèidh).
Dh'fhaodadh fios a bhith a 'toirt a-mach gum faodadh cuid de na tuairmsean sin a bhith air a dhèanamh gun a bhith a-riamh - air stòrasan cruinneachaidh dàta (me, tuairmsean fad-ùine de atharrachadh inntinn), agus tha sin ceart, ged a bhiodh cruinneachadh den leithid seo airson 30,000 neach air a bhith gu math daor. Eadhon air sgàth buidseat gun chrìoch, ge-tà, chan urrainn dhomh smaoineachadh air dòigh sam bith eile a tha a 'toirt cothrom dha luchd-rannsachaidh siubhal air ais ann an ùine agus gu dìreach a bhith a' cumail sùil air giùlan nan com-pàirtichean san àm a dh'fhalbh. B 'e an roghainn ab' fhaisge a bhith a 'cruinneachadh aithisgean giùlan ath-dhreuchdail, ach bhiodh na h-aithisgean sin glè chinnteach agus mionaideach. Tha clàr 2.1 a 'toirt eisimpleirean eile de sgrùdaidhean a bhios a' cleachdadh stòr dàta a-mhàin gus tachartas neo-dùil a sgrùdadh.
Tachartas neo-dùil | Daonnan-air stòr dàta | Luaidh |
---|---|---|
Gluasad gluasad Gezi anns an Tuirc | Budak and Watts (2015) | |
Tha Umbrella a 'gearan ann an Hong Kong | Zhang (2016) | |
Togalaichean de phoileas ann am Baile New York | Aithisgean stad-agus-frisk | Legewie (2016) |
Duine a 'ceangal ri ISIS | Magdy, Darwish, and Weber (2016) | |
11 Sultain 2001 ionnsaigh | beòjournal.com | Cohn, Mehl, and Pennebaker (2004) |
11 Sultain 2001 ionnsaigh | teachdaireachdan pagaidh | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
A bharrachd air a bhith a 'sgrùdadh thachartasan gun dùil, tha siostaman dàta daonnan-inntinneach cuideachd a' toirt cothrom do luchd-rannsachaidh tuairmsean fìor-ùine a dhèanamh, a dh'fhaodas a bhith cudromach ann an suidheachaidhean far a bheil poileasaidh ann an riaghaltas no gnìomhachas - ag iarraidh freagairt stèidhichte air mothachadh suidheachadh. Mar eisimpleir, faodar dàta meadhanan sòisealta a chleachdadh gus stiùireadh èiginn a stiùireadh gu mòr-thubaistean nàdarra (Castillo 2016) agus caochladh de stòran dàta mòr eadar-dhealaichte a bhith a 'toirt seachad tuairmsean fìor-ùine de ghnìomhachd eaconamach (Choi and Varian 2012) .
Ann an co-dhùnadh, tha siostaman dàta an-còmhnaidh a 'toirt comas do luchd-rannsachaidh tachartasan gun dùil a sgrùdadh agus fiosrachadh fìor-ùine a thoirt do luchd-dèanaidh phoileasaidhean. Chan eil mi a 'smaoineachadh, ge-tà, gu bheil siostaman dàta an-còmhnaidh freagarrach airson atharrachaidhean a tharraing thar ùineichean fada. Tha sin air sgàth gu bheil mòran de shiostaman dàta mòra ag atharrachadh a-riamh - pròiseas a dh 'iarr mi air drift nas fhaide air adhart sa chaibideil (earrann 2.3.7).