Pengumpulan data terdistribusi adalah mungkin, dan di masa depan kemungkinan akan melibatkan teknologi dan partisipasi pasif.
Sebagai eBird menunjukkan, pengumpulan data terdistribusi dapat digunakan untuk penelitian ilmiah. Selanjutnya, PhotoCity menunjukkan bahwa masalah yang berkaitan dengan pengambilan sampel dan kualitas data yang berpotensi dipecahkan.
Bagaimana mungkin didistribusikan Data pekerjaan koleksi untuk penelitian sosial? Sebuah contoh yang indah berasal dari karya Susan Watkins dan rekan-rekannya di Jurnal Proyek Malawi (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . Dalam proyek ini, 22 penduduk lokal-yang disebut "wartawan" -kept "jurnal percakapan" yang direkam, secara detail, percakapan mereka mendengar tentang AIDS di kehidupan sehari-hari orang-orang biasa (pada saat proyek dimulai, sekitar 15% dari orang dewasa di Malawi terinfeksi HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Karena status insider mereka, wartawan ini mampu mendengar percakapan yang mungkin telah dapat diakses untuk Susan Watkins dan dia kolaborator penelitian Barat (saya akan membahas etika ini kemudian dalam bab ini ketika saya menawarkan saran tentang merancang proyek kolaborasi massa Anda sendiri ). Data dari Project Malawi Jurnal telah menyebabkan sejumlah temuan penting. Misalnya, sebelum proyek dimulai, banyak orang luar percaya bahwa ada keheningan tentang AIDS di sub-Sahara Afrika, namun jurnal menunjukkan bahwa ini adalah jelas tidak terjadi: wartawan mendengar ratusan percakapan pada topik, di lokasi yang beragam seperti pemakaman , bar, dan gereja-gereja. Selanjutnya, sifat percakapan ini membantu peneliti lebih memahami beberapa resistensi terhadap penggunaan kondom; cara penggunaan kondom dibingkai dalam pesan kesehatan masyarakat tidak konsisten dengan cara yang itu dibahas dalam kehidupan sehari-hari (Tavory and Swidler 2009) .
Tentu saja, seperti data dari eBird, data dari Jurnal Proyek Malawi tidak sempurna, masalah yang dibahas secara rinci oleh Watkins dan rekan. Misalnya, rekaman pembicaraan tidak sampel acak dari semua percakapan yang mungkin. Sebaliknya, mereka adalah sensus lengkap dari percakapan tentang AIDS. Dalam hal kualitas data, para peneliti percaya bahwa wartawan mereka berkualitas tinggi wartawan, sebagaimana dibuktikan oleh konsistensi dalam jurnal dan di jurnal. Selanjutnya, ketika cukup wartawan dikerahkan dalam pengaturan cukup kecil dan laporan terfokus pada topik tertentu, redundansi menjadi mungkin, yang meningkatkan kepercayaan diri dalam kualitas data. Misalnya, seorang pekerja seks bernama "Stella" muncul beberapa kali dalam jurnal dari empat wartawan yang berbeda (Watkins and Swidler 2009) . Seperti di PhotoCity, penggunaan redundansi merupakan prinsip penting untuk menilai dan memastikan kualitas data dalam proyek pengumpulan data terdistribusi. Dalam rangka untuk lebih membangun intuisi Anda, Tabel 5.3 menunjukkan contoh lain dari pengumpulan data didistribusikan untuk penelitian sosial.
Data yang dikumpulkan | Kutipan |
---|---|
Diskusi tentang HIV / AIDS di Malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Jalan mengemis di London | Purdam (2014) |
peristiwa konflik di Timur Kongo | Windt and Humphreys (2016) |
Kegiatan ekonomi di Nigeria dan Liberia | Blumenstock, Keleher, and Reisinger (2016) |
surveilans influenza | Noort et al. (2015) |
Semua contoh diuraikan dalam bagian ini telah melibatkan partisipasi aktif: wartawan ditranskrip percakapan bahwa mereka mendengar; birders upload daftar periksa birding mereka; atau pemain upload foto mereka. Tapi bagaimana jika partisipasi itu otomatis dan tidak memerlukan keahlian atau waktu tertentu untuk menyerahkan? Ini adalah janji yang ditawarkan oleh "penginderaan partisipatif" atau "orang-centric penginderaan." Sebagai contoh, Pothole Patrol, sebuah proyek oleh para ilmuwan di MIT, dipasang GPS accelerometers dilengkapi dalam tujuh taksi taksi di wilayah Boston (Eriksson et al. 2008) . Karena mengemudi lebih lubang daun sinyal accelerometer yang berbeda, perangkat ini, ketika ditempatkan di dalam taksi bergerak, dapat membuat peta lubang dari Boston. Tentu saja, taksi tidak secara acak sampel jalan, tetapi mengingat cukup taksi, mungkin ada cakupan cukup untuk memberikan informasi tentang bagian-bagian besar dari kota mereka. Manfaat kedua dari sistem pasif yang mengandalkan teknologi adalah bahwa mereka de-keterampilan proses kontribusi data: sementara itu membutuhkan keterampilan untuk berkontribusi eBird (karena Anda harus mampu untuk andal mengidentifikasi spesies burung), tidak memerlukan keahlian khusus untuk berkontribusi Pothole Patrol.
Ke depan, saya menduga bahwa proyek pengumpulan banyak data terdistribusi akan mulai memanfaatkan kemampuan ponsel yang sudah dilakukan oleh miliaran orang di seluruh dunia. Ponsel ini sudah memiliki sejumlah besar sensor penting untuk pengukuran, seperti mikrofon, kamera, perangkat GPS, dan jam. Selanjutnya, ponsel ini mendukung aplikasi pihak ketiga yang memungkinkan peneliti kontrol atas protokol pengumpulan data yang mendasari. Akhirnya, ponsel ini memiliki internet konektivitas, sehingga memungkinkan bagi mereka untuk off-load data yang mereka kumpulkan. Ada banyak tantangan teknis dari sensor akurat untuk hidup baterai yang terbatas, tetapi masalah ini kemungkinan akan berkurang seiring waktu sebagai teknologi berkembang. Isu yang terkait dengan privasi dan etika, di sisi lain, mungkin akan lebih rumit karena teknologi berkembang; Aku akan kembali ke pertanyaan etika ketika saya menawarkan saran tentang merancang kolaborasi massa sendiri.
Dalam proyek-proyek pengumpulan data terdistribusi, relawan berkontribusi data tentang dunia. Pendekatan ini telah berhasil digunakan, dan penggunaan di masa depan akan memiliki untuk mengatasi sampling dan kualitas data keprihatinan. Untungnya, proyek yang ada seperti PhotoCity dan Pothole Patrol menyarankan solusi untuk masalah ini. Karena lebih banyak proyek memanfaatkan teknologi yang memungkinkan partisipasi de-terampil dan pasif, didistribusikan proyek pengumpulan data harus secara dramatis meningkatkan dalam skala, memungkinkan peneliti untuk mengumpulkan data yang hanya terlarang di masa lalu.