2.3.2.4 drifting

Penduduk drift, penggunaan drift, dan sistem arus membuat sulit untuk menggunakan sumber data yang besar untuk mempelajari tren jangka panjang.

Salah satu keuntungan besar dari banyak sumber data besar adalah bahwa mereka mengumpulkan data dari waktu ke waktu. ilmuwan sosial menyebut jenis over-time data, data longitudinal. Dan, tentu saja, data longitudinal sangat penting untuk mempelajari perubahan. Dalam rangka untuk andal mengukur perubahan, namun, sistem pengukuran itu sendiri harus stabil. Dalam kata-kata sosiolog Otis Dudley Duncan, "jika Anda ingin mengukur perubahan, tidak berubah mengukur" (Fischer 2011) .

Sayangnya, banyak sistem-terutama data besar sistem bisnis yang menciptakan dan menangkap digital jejak-berubah sepanjang waktu, sebuah proses yang saya akan menelepon drift. Secara khusus, sistem ini berubah dalam tiga cara utama: hanyut penduduk (perubahan yang menggunakan mereka), hanyut perilaku (perubahan dalam cara orang menggunakan mereka), dan sistem drift (perubahan dalam sistem itu sendiri). Tiga sumber drift berarti bahwa setiap pola dalam data jejak digital dapat disebabkan oleh perubahan penting di dunia, atau bisa juga disebabkan oleh beberapa bentuk penyimpangan.

Sumber pertama drift-populasi melayang-adalah siapa yang menggunakan sistem, dan perubahan ini dalam skala waktu panjang dan skala waktu singkat. Misalnya, dari 2008 sampai sekarang usia rata-rata orang di media sosial telah meningkat. Selain tren jangka panjang ini, orang yang menggunakan sistem setiap saat bervariasi. Misalnya, dalam pemilihan Presiden AS tahun 2012 proporsi tweet tentang politik yang ditulis oleh perempuan berfluktuasi dari hari ke hari (Diaz et al. 2016) . Dengan demikian, apa yang mungkin tampak perubahan suasana hati para Twitter-ayat mungkin benar-benar hanya menjadi perubahan yang berbicara setiap saat.

Selain perubahan yang menggunakan sistem, ada juga perubahan dalam bagaimana sistem yang digunakan. Misalnya, selama Menempati protes Gezi Taman di Istanbul, Turki pada 2013 demonstran berubah penggunaan hashtags sebagai protes berkembang. Berikut adalah cara Zeynep Tufekci (2014) menggambarkan drift, yang ia mampu mendeteksi karena dia mengamati perilaku di Twitter dan di tanah:

"Apa yang terjadi adalah bahwa segera setelah protes menjadi cerita yang dominan, banyak orang. . . berhenti menggunakan hashtags kecuali untuk menarik perhatian fenomena baru. . .. Sementara protes terus, dan bahkan ditingkatkan, hashtags mereda. Wawancara mengungkapkan dua alasan untuk ini. Pertama, setelah semua orang tahu topik, hashtag itu sekaligus berlebihan dan boros pada platform Twitter karakter terbatas. Kedua, hashtags terlihat hanya sebagai berguna untuk menarik perhatian pada topik tertentu, bukan untuk berbicara tentang hal itu. "

Dengan demikian, para peneliti yang mempelajari protes dengan menganalisis tweet dengan hashtag terkait protes akan memiliki rasa terdistorsi apa yang terjadi karena pergeseran perilaku ini. Misalnya, mereka mungkin percaya bahwa pembahasan protes menurun jauh sebelum itu benar-benar menurun.

Jenis ketiga drift sistem drift. Dalam hal ini, itu bukan orang mengubah atau perubahan perilaku mereka, tetapi sistem itu sendiri berubah. Misalnya, dari waktu ke waktu Facebook telah meningkat batas pada panjang update status. Dengan demikian, setiap studi longitudinal update status akan rentan terhadap artefak yang disebabkan oleh perubahan ini. Sistem hanyut berkaitan erat dengan masalah yang disebut algoritmik pengganggu yang kita kini giliran.