Sok-on data gedé nyandak ulikan kajadian kaduga jeung ukuran real-time.
Loba sistem data gedé sok-on; aranjeunna terus ngumpulkeun data. ciri ieu sok di nyadiakeun panalungtik jeung data longitudinal (ie, data dumasar kana waktu). Keur sok-on ngabogaan dua implikasi penting pikeun panalungtikan.
Kahiji, salawasna-on data kempelan nyandak peneliti mun diajar acara terduga dina cara nu teu bakal disebutkeun tiasa. Contona, peneliti museurkeun diajar nu ngeusian protes Gezi di Turki dina usum panas 2013 ilaharna bakal difokuskeun paripolah démonstran nalika acara. Ceren Budak jeung Duncan Watts (2015) éta bisa ngalakukeun leuwih ku ngagunakeun alam salawasna-on of Twitter pikeun diajar démonstran anu dipaké Twitter sateuacan, salila, sarta sanggeus acara. Na, maranéhanana éta bisa nyieun grup ngabandingkeun tina nonparticipants sateuacan, salila, sarta sanggeus éta acara (inohong 2.2). Dina total, panel ex-pos maranéhna kaasup nu tweets tina 30.000 urang leuwih dua taun. Ku augmenting data ilahar dipaké ti protes kalayan informasi séjénna ieu, Budak jeung Watts éta bisa diajar leuwih: maranéhanana éta bisa estimasi naon jinis jalma éta leuwih gampang pikeun ilubiung dina protes Gezi jeung keur estimasi parobahan sikap tina pamilon na nonparticipants, duanana dina istilah pondok (ngabandingkeun pre-Gezi ka mangsa Gezi) jeung dina jangka panjang (ngabandingkeun pre-Gezi kalawan pos-Gezi).
A skeptic bisa nunjuk kaluar yén sababaraha perkiraan ieu bisa geus dilakukeun tanpa salawasna-on sumber pendataan (misalna perkiraan jangka panjang robah dangong), sarta nu bener, najan misalna kumpulan data pikeun 30.000 urang bakal geus rada mahal. Malah dibere hiji anggaran taya, kumaha oge, abdi teu tiasa mikir sagala metoda sejenna nu dasarna ngamungkinkeun peneliti diperlukeun keur indit deui dina waktos sareng langsung niténan kabiasaan pamilon 'nu geus kaliwat. Alternatif pangdeukeutna bakal ngumpulkeun laporan retrospective tina kabiasaan, tapi laporan ieu bakal jadi sahiji granularity kawates sarta akurasi questionable. tabél 2.1 nyadiakeun conto sejenna studi anu ngagunakeun hiji salawasna-on sumber data pikeun diajar hiji acara kaduga.
acara kaduga | Salawasna-on data sumber | nyalukan |
---|---|---|
Ngeusian gerakan Gezi di Turki | Budak and Watts (2015) | |
protes payung di Hong Kong | Zhang (2016) | |
Shootings sahiji pulisi di New York City | Ngeureunkeun-na-frisk laporan | Legewie (2016) |
Jalma gabung ISIS | Magdy, Darwish, and Weber (2016) | |
11 Séptémber 2001 serangan | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11 Séptémber 2001 serangan | seratan pager | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
Salian diajar acara terduga, salawasna-on sistem data badag ogé ngaktipkeun peneliti ngahasilkeun perkiraan real-time, nu tiasa penting dina setélan mana makers-di kawijakan pamaréntah atawa industri-kersa ngawaler dumasar kana kasadaran situasional. Contona, data média sosial bisa dipaké pikeun panduan tanggap darurat bencana alam (Castillo 2016) sarta rupa-rupa sumber data badag béda bisa dipaké ngahasilkeun perkiraan real-time dina aktivitas ekonomi (Choi and Varian 2012) .
Dina kacindekan, salawasna-on data sistem ngaktipkeun peneliti mun diajar acara kaduga jeung nyadiakeun informasi real-time mun makers kawijakan. Kuring mah henteu kitu, pikir nu salawasna-on data sistem anu ogé cocog pikeun parobahan tracking leuwih perioda pisan lila. Yén sabab loba sistem data badag terus ngarobah-prosés éta kuring gé nelepon kumalayang engké dina bab (bagian 2.3.7).