2.3.2.4 Drifting

Penduduk drift, drift penggunaan, dan sistem drift membuat sukar untuk menggunakan sumber data yang besar untuk mengkaji trend jangka panjang.

Salah satu kelebihan yang besar daripada banyak sumber data yang besar adalah bahawa mereka mengumpul data dari masa ke masa. ahli sains sosial memanggil ini jenis data lebih masa, data membujur. Dan, secara semula jadi, data membujur adalah sangat penting untuk mengkaji perubahan. Dalam usaha untuk memberi ukuran perubahan, bagaimanapun, sistem pengukuran itu sendiri mestilah stabil. Dalam kata-kata ahli sosiologi Otis Dudley Duncan, "jika anda mahu untuk mengukur perubahan, tidak berubah langkah" (Fischer 2011) .

Malangnya, banyak sistem-terutama data yang besar sistem perniagaan yang mewujudkan dan menangkap digital kesan-berubah setiap masa, satu proses yang saya akan memanggil drift. Khususnya, sistem ini berubah dalam tiga cara utama: penduduk drift (perubahan yang menggunakan mereka), drift tingkah laku (perubahan dalam bagaimana orang menggunakan mereka), dan sistem drift (perubahan dalam sistem itu sendiri). Tiga sumber hanyut bermakna bahawa apa-apa corak dalam data surih digital boleh disebabkan oleh perubahan penting di dunia, atau ia boleh disebabkan oleh beberapa bentuk drift.

Sumber pertama drift-penduduk drift-adalah yang menggunakan sistem, dan perubahan ini pada skala yang lama dan skala masa yang singkat. Sebagai contoh, dari 2008 hingga sekarang umur purata orang di media sosial telah meningkat. Selain daripada trend jangka panjang, orang yang menggunakan sistem yang pada bila-bila berbeza. Sebagai contoh, semasa pilihan raya Presiden AS tahun 2012 bahagian tweet mengenai politik yang ditulis oleh wanita turun naik dari hari ke hari (Diaz et al. 2016) . Oleh itu, apa yang mungkin kelihatan perubahan dalam mood Twitter-ayat mungkin sebenarnya hanya menjadi perubahan yang bercakap pada bila-bila masa.

Selain perubahan yang menggunakan sistem, terdapat juga perubahan dalam bagaimana sistem ini digunakan. Sebagai contoh, semasa Menduduki protes Gezi Park dalam Istanbul, Turki pada 2013 penunjuk perasaan berubah mereka menggunakan hashtags kerana protes itu berkembang. Berikut adalah cara Zeynep Tufekci (2014) menyifatkan drift, yang dia dapat mengesan kerana dia memerhatikan tingkah laku di Twitter dan di atas tanah:

"Apa yang berlaku ialah sebaik sahaja bantahan yang menjadi cerita yang dominan, ramai orang. . . berhenti menggunakan hashtags kecuali untuk menarik perhatian kepada fenomena baru. . .. Walaupun protes berterusan, dan juga dipergiatkan, hashtags reda. Temubual mendedahkan dua sebab untuk ini. Pertama, apabila semua orang tahu topik, hashtag itu sekaligus berlebihan dan membazir di Twitter platform watak-terhad. Kedua, hashtags dilihat hanya sebagai berguna untuk menarik perhatian kepada topik tertentu, bukan untuk bercakap mengenainya. "

Oleh itu, penyelidik yang sedang menuntut protes dengan menganalisis tweet dengan hashtag yang berkaitan bantahan-akan mempunyai rasa yang menyimpang tentang apa yang berlaku kerana drift tingkah laku ini. Sebagai contoh, mereka mungkin percaya bahawa perbincangan mengenai bantahan menurun lama sebelum ia sebenarnya berkurangan.

Jenis yang ketiga drift adalah sistem drift. Dalam kes ini, ia bukan orang yang berubah-ubah atau menukar tingkah laku mereka, tetapi sistem itu sendiri berubah-ubah. Sebagai contoh, dari masa ke masa Facebook telah meningkat had kepada tempoh kemas kini status. Oleh itu, apa-apa kajian membujur kemas kini status akan terdedah kepada artifak yang disebabkan oleh perubahan ini. Sistem drift adalah berkait rapat dengan masalah dipanggil membaurkan algoritma yang kita beralih pula.