Kila mara data big itawezesha utafiti wa matukio zisizotarajiwa na halisi wakati kipimo.
Wengi mifumo kubwa data ni daima-on; wao ni daima kukusanya takwimu. Hii tabia ya daima-on hutoa watafiti na data longitudinal (yaani, data juu ya muda). Kuwa daima-on ina maana mbili muhimu kwa ajili ya utafiti.
Kwanza, daima kwenye ukusanyaji wa data huwezesha watafiti kujifunza matukio zisizotarajiwa kwa njia ambazo haingewezekana. Kwa mfano, watafiti wenye nia ya kusoma maandamano ya Occupy Gezi nchini Uturuki katika majira ya joto ya 2013 ingekuwa kawaida kuzingatia tabia ya waandamanaji wakati wa tukio. Ceren Budak na Duncan Watts (2015) waliweza kufanya zaidi kwa kutumia asili ya kila siku ya Twitter kujifunza waandamanaji ambao walitumia Twitter kabla, wakati, na baada ya tukio hilo. Na, walikuwa na uwezo wa kuunda kikundi cha kulinganisha cha wasio na sehemu kabla, wakati, na baada ya tukio (takwimu 2.2). Kwa jumla, jopo lao la zamani lilijumuisha tweets ya watu 30,000 zaidi ya miaka miwili. Kwa kuongezeka kwa data ya kawaida inayotumiwa kutoka kwa maandamano na maelezo mengine haya, Budak na Watts waliweza kujifunza mengi zaidi: waliweza kukadiria ni aina gani ya watu ambao walikuwa zaidi ya kushiriki katika maandamano ya Gezi na kukadiria mabadiliko katika mtazamo wa washiriki na wasiokuwa wahusika, kwa muda mfupi (kulinganisha kabla ya Gezi hadi wakati wa Gezi) na kwa muda mrefu (kulinganisha kabla ya Gezi na baada ya Gezi).
Skeptic inaweza kuonyesha kuwa baadhi ya makadirio hayo yanaweza kufanywa bila ya kila siku-kwenye vyanzo vya kukusanya data (kwa mfano, makadirio ya muda mrefu ya mabadiliko ya tabia), na hiyo ni sahihi, ingawa ukusanyaji wa data kama watu 30,000 ungekuwa kabisa ghali. Hata kupewa bajeti isiyo na ukomo, hata hivyo, siwezi kufikiria njia yoyote ambayo inaruhusu watafiti kurudi nyuma kwa muda na kuchunguza tabia ya washiriki katika siku za nyuma. Njia mbadala ya karibu itakuwa kukusanya ripoti ya retrospective ya tabia, lakini ripoti hizi zitakuwa na upepesi mdogo na usahihi. meza 2.1 hutoa mifano mingine ya tafiti ambazo hutumia chanzo cha data kila wakati ili kujifunza tukio lisilozotarajiwa.
Tukio zisizotarajiwa | Daima kwenye chanzo cha data | Citation |
---|---|---|
Kufanya kazi kwa Gezi harakati nchini Uturuki | Budak and Watts (2015) | |
Maandamano ya maandamano huko Hong Kong | Zhang (2016) | |
Kupigwa kwa polisi huko New York City | Ripoti za kuacha-na-frisk | Legewie (2016) |
Mtu kujiunga na ISIS | Magdy, Darwish, and Weber (2016) | |
Septemba 11, 2001 mashambulizi | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
Septemba 11, 2001 mashambulizi | ujumbe wa pager | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Mbali na kusoma matukio yasiyotarajiwa, daima kwenye mifumo ya data kubwa pia huwawezesha watafiti kuzalisha makadirio ya muda halisi, ambayo inaweza kuwa muhimu katika mipangilio ambapo watunga sera-katika serikali au sekta-wanataka kujibu kulingana na ufahamu wa hali. Kwa mfano, data za vyombo vya habari zinaweza kutumika kuongoza majibu ya dharura kwa majanga ya asili (Castillo 2016) na vyanzo mbalimbali vya data kubwa vinaweza kutumiwa kutoa makadirio ya muda halisi ya shughuli za kiuchumi (Choi and Varian 2012) .
Kwa kumalizia, daima-juu ya mifumo ya data huwezesha watafiti kujifunza matukio zisizotarajiwa na kutoa taarifa halisi ya muda kwa watunga sera. Hata hivyo, sifikiri kwamba daima-juu ya mifumo ya data inafaa kwa kufuatilia mabadiliko kwa muda mrefu sana. Hiyo ni kwa sababu mifumo mingi ya data inabadilika mara kwa mara-mchakato ambao nitaita simulizi baadaye katika sura (kifungu 2.3.7).