Kila mara data big itawezesha utafiti wa matukio zisizotarajiwa na halisi wakati kipimo.
Wengi mifumo kubwa data ni daima-on; wao ni daima kukusanya takwimu. Hii tabia ya daima-on hutoa watafiti na data longitudinal (yaani, data juu ya muda). Kuwa daima-on ina maana mbili muhimu kwa ajili ya utafiti.
Kwanza, daima-on ukusanyaji wa takwimu itawezesha watafiti kujifunza matukio yasiyotarajiwa kwa njia waliokuwa haiwezekani hapo awali. Kwa mfano, watafiti nia ya kusoma fanyeni biashara maandamano Gezi nchini Uturuki katika majira ya 2013 ingekuwa kawaida kuzingatia tabia ya waandamanaji wakati wa tukio hilo. Ceren Budak na Duncan Watts (2015) walikuwa na uwezo wa kufanya zaidi kwa kutumia asili daima-on wa Twitter kujifunza Twitter-kutumia waandamanaji kabla, wakati na baada ya tukio. Na, walikuwa na uwezo wa kujenga kulinganisha kundi la zisizo washiriki (au washiriki ambao hawakuwa tweet kuhusu maandamano) kabla, wakati na baada ya tukio (Kielelezo 2.1). Kwa jumla zamani baada yao jopo ni pamoja na tweets ya watu 30,000 katika kipindi cha miaka miwili. By augmenting data kawaida kutumika kutoka maandamano na habari hii mengine, Budak na Watts walikuwa na uwezo wa kujifunza mengi zaidi: waliweza kukadiria ni aina gani ya watu walikuwa zaidi uwezekano wa kushiriki katika maandamano Gezi na kukadiria mabadiliko katika mitizamo ya washiriki na mashirika yasiyo ya washiriki, katika muda mfupi (kulinganisha kabla ya Gezi kwa wakati Gezi) na katika muda mrefu (kulinganisha kabla ya Gezi baada-Gezi).
Ni kweli kwamba baadhi ya makadirio haya yangeweza kufanywa bila daima-on vyanzo ukusanyaji wa takwimu (mfano, makadirio ya muda mrefu ya mabadiliko ya tabia), ingawa ukusanyaji wa takwimu hizo kwa watu 30,000 ingekuwa ghali kabisa. Na, hata kupewa bajeti ukomo, siwezi kufikiria njia nyingine yoyote ambayo kimsingi inaruhusu watafiti kusafiri nyuma katika wakati na moja kwa moja kuchunguza washiriki tabia katika siku za nyuma. karibu mbadala itakuwa kukusanya taarifa retrospective ya tabia, lakini taarifa hizo itakuwa ya granularity mdogo na kuhojiwa usahihi. Jedwali 2.1 hutoa mifano mingine ya masomo ya kwamba matumizi ya daima-juu ya chanzo data kujifunza tukio zisizotarajiwa.
tukio isiyotarajiwa | Kila mara data chanzo | citation |
---|---|---|
Anashughulika Gezi harakati katika Uturuki | Budak and Watts (2015) | |
maandamano mwavuli katika Hong Kong | Zhang (2016) | |
Shootings wa polisi katika jiji la New York | Kuacha-na-frisk ripoti | Legewie (2016) |
Mtu kujiunga na ISIS | Magdy, Darwish, and Weber (2016) | |
Septemba 11, 2001 mashambulizi | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
Septemba 11, 2001 mashambulizi | ujumbe pager | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Pili, daima-on ukusanyaji wa takwimu itawezesha watafiti wa kuzalisha vipimo halisi wakati, ambayo inaweza kuwa muhimu katika mazingira ambapo watunga sera wanataka si tu kujifunza kutokana na tabia iliyopo lakini pia kujibu hilo. Kwa mfano, data kijamii vyombo vya habari inaweza kutumika kuongoza majibu ya majanga ya asili (Castillo 2016) .
Kwa kumalizia, daima-on data mifumo kuwawezesha watafiti kujifunza matukio yasiyotarajiwa na kutoa halisi wakati habari kwa watunga sera. Sikuwa, hata hivyo, kupendekeza kwamba kwamba daima-on data mifumo kuwawezesha watafiti kufuatilia mabadiliko juu ya muda mrefu. Hayo ni kwa sababu wengi mifumo kubwa data ni kubadilika-mchakato kuitwa drift (Sehemu ya 2.3.2.4).