2.3.1.2 Selalu-on

Selalu-on data besar memungkinkan studi tentang kejadian tak terduga dan pengukuran real-time.

Banyak sistem data besar selalu-on; mereka terus-menerus mengumpulkan data. Karakteristik ini selalu-on menyediakan peneliti dengan data longitudinal (yaitu, data yang dari waktu ke waktu). Yang selalu-on memiliki dua implikasi penting untuk penelitian.

Pertama, selalu-on pengumpulan data memungkinkan peneliti untuk mempelajari kejadian tak terduga dengan cara yang tidak mungkin sebelumnya. Misalnya, peneliti tertarik untuk mempelajari Menempati protes Gezi di Turki pada musim panas 2013 biasanya akan fokus pada perilaku demonstran selama acara. Ceren Budak dan Duncan Watts (2015) mampu melakukan lebih dengan menggunakan sifat selalu-on Twitter untuk mempelajari Twitter-menggunakan demonstran sebelum, selama, dan setelah acara. Dan, mereka mampu membuat grup perbandingan non-peserta (atau peserta yang tidak tweet tentang protes) sebelum, selama, dan setelah acara (Gambar 2.1). Secara total panel ex-post mereka termasuk tweets dari 30.000 orang selama dua tahun. Dengan menambah data yang umum digunakan dari protes dengan informasi lainnya ini, Budak dan Watts mampu belajar lebih banyak: mereka mampu memperkirakan apa jenis orang lebih mungkin untuk berpartisipasi dalam protes Gezi dan untuk memperkirakan perubahan sikap dari peserta dan non-peserta, baik dalam jangka pendek (membandingkan pre-Gezi untuk selama Gezi) dan dalam jangka panjang (membandingkan pre-Gezi untuk memasukkan-Gezi).

Gambar 2.1: Desain yang digunakan oleh Budak dan Watts (2015) untuk mempelajari Menempati protes Gezi di Turki pada musim panas 2013. Dengan menggunakan sifat selalu-on dari Twitter, para peneliti menciptakan apa yang mereka sebut panel ex-post yang termasuk tentang 30.000 orang selama dua tahun. Sebaliknya studi khas yang berfokus pada peserta selama protes, panel ex-post menambahkan 1) data dari peserta sebelum dan setelah acara dan 2) data dari non-peserta sebelum, selama, dan setelah acara. struktur data yang diperkaya ini diaktifkan Budak dan Watts untuk memperkirakan apa jenis orang lebih mungkin untuk berpartisipasi dalam protes Gezi dan untuk memperkirakan perubahan sikap dari peserta dan non-peserta, baik dalam jangka pendek (membandingkan pre-Gezi untuk selama Gezi) dan dalam jangka panjang (membandingkan pre-Gezi untuk memasukkan-Gezi).

Gambar 2.1: Desain yang digunakan oleh Budak and Watts (2015) untuk mempelajari Menempati protes Gezi di Turki pada musim panas 2013. Dengan menggunakan sifat selalu-on dari Twitter, para peneliti menciptakan apa yang mereka sebut panel ex-post yang termasuk tentang 30.000 orang selama dua tahun. Sebaliknya studi khas yang berfokus pada peserta selama protes, panel ex-post menambahkan 1) data dari peserta sebelum dan setelah acara dan 2) data dari non-peserta sebelum, selama, dan setelah acara. struktur data yang diperkaya ini diaktifkan Budak dan Watts untuk memperkirakan apa jenis orang lebih mungkin untuk berpartisipasi dalam protes Gezi dan untuk memperkirakan perubahan sikap dari peserta dan non-peserta, baik dalam jangka pendek (membandingkan pre-Gezi untuk selama Gezi) dan dalam jangka panjang (membandingkan pre-Gezi untuk memasukkan-Gezi).

Memang benar bahwa beberapa perkiraan ini bisa saja dibuat tanpa selalu-on sumber pengumpulan data (misalnya, perkiraan jangka panjang perubahan sikap), meskipun pengumpulan data tersebut untuk 30.000 orang telah cukup mahal. Dan, bahkan diberi anggaran terbatas, saya tidak bisa memikirkan cara lain yang intinya memungkinkan peneliti untuk melakukan perjalanan kembali dalam waktu dan langsung mengamati peserta perilaku di masa lalu. Alternatif yang paling dekat akan mengumpulkan laporan retrospektif dari perilaku, tetapi laporan-laporan ini akan perincian terbatas dan akurasi dipertanyakan. Tabel 2.1 memberikan contoh-contoh lain dari penelitian yang menggunakan selalu-on sumber data untuk mempelajari suatu peristiwa yang tak terduga.

Tabel 2.1: Studi kejadian tak terduga menggunakan selalu-on sumber data yang besar.
kejadian tak terduga Selalu-data sumber Kutipan
Menempati gerakan Gezi di Turki Kericau Budak and Watts (2015)
protes payung di Hong Kong Weibo Zhang (2016)
Penembakan polisi di New York City Stop-dan-penggeledahan laporan Legewie (2016)
Orang bergabung ISIS Kericau Magdy, Darwish, and Weber (2016)
September 11, 2001 serangan livejournal.com Cohn, Mehl, and Pennebaker (2004)
September 11, 2001 serangan pesan pager Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Kedua, selalu-on pengumpulan data memungkinkan peneliti untuk menghasilkan pengukuran real-time, yang dapat menjadi penting dalam pengaturan di mana para pembuat kebijakan ingin tidak hanya belajar dari perilaku yang ada tetapi juga menanggapi itu. Misalnya, data media sosial dapat digunakan untuk memandu respon terhadap bencana alam (Castillo 2016) .

Kesimpulannya, selalu-data sistem memungkinkan peneliti untuk mempelajari kejadian tak terduga dan memberikan informasi real-time kepada para pembuat kebijakan. Aku tidak, bagaimanapun, mengusulkan bahwa yang selalu-data sistem memungkinkan para peneliti untuk melacak perubahan selama jangka waktu yang lama. Itu karena banyak sistem data besar yang terus berubah-proses yang disebut drift (Bagian 2.3.2.4).