2.3.2.5 algoritma bingung

Perilaku dalam data yang ditemukan tidak alamiah, yang didorong oleh tujuan rekayasa sistem.

Meskipun banyak sumber data ditemukan adalah non-reaktif karena orang tidak menyadari data mereka sedang direkam (Bagian 2.3.1.3), peneliti tidak harus mempertimbangkan perilaku dalam sistem online untuk "alami" atau "murni." Pada kenyataannya, sistem digital yang perilaku record yang sangat direkayasa untuk menginduksi perilaku tertentu seperti mengklik iklan atau posting konten. Cara bahwa tujuan dari desainer sistem dapat memperkenalkan pola menjadi data disebut pengganggu algoritmik. pembaur algoritmik relatif tidak dikenal para ilmuwan sosial, tetapi merupakan perhatian utama di antara para ilmuwan data yang hati-hati. Dan, tidak seperti beberapa masalah lain dengan jejak digital, pembaur algoritmik sebagian besar tak terlihat.

Sebuah contoh yang relatif sederhana pembaur algoritmik adalah kenyataan bahwa di Facebook ada jumlah anomali tinggi pengguna dengan sekitar 20 teman (Ugander et al. 2011) . Para ilmuwan menganalisis data ini tanpa pemahaman tentang bagaimana Facebook bekerja diragukan bisa menghasilkan banyak cerita tentang bagaimana 20 adalah semacam nomor sosial magis. Namun, Ugander dan rekan-rekannya memiliki pemahaman substansial dari proses yang dihasilkan data, dan mereka tahu bahwa Facebook mendorong orang dengan beberapa koneksi di Facebook untuk membuat teman-teman lainnya sampai mereka mencapai 20 teman. Meskipun Ugander dan rekan tidak mengatakan ini di koran, kebijakan ini mungkin dibuat oleh Facebook untuk mendorong pengguna baru untuk menjadi lebih aktif. Tanpa mengetahui tentang adanya kebijakan ini, bagaimanapun, adalah mudah untuk menarik kesimpulan yang salah dari data. Dengan kata lain, jumlah sangat tinggi dari orang dengan sekitar 20 teman-teman memberitahu kita tentang Facebook dari perilaku manusia.

Lebih merusak daripada contoh sebelumnya di mana pengganggu algoritmik menghasilkan hasil unik bahwa peneliti-hati mungkin menyelidiki lebih lanjut, ada versi bahkan lebih sulit dari pengganggu algoritmik yang terjadi ketika desainer sistem online menyadari teori-teori sosial dan kemudian panggang teori-teori ini ke dalam kerja dari sistem mereka. Ilmuwan sosial menyebut performativitas ini: ketika teori mengubah dunia sedemikian rupa bahwa mereka membawa dunia lebih sejalan dengan teori. Dalam kasus pengganggu algoritmik performatif, sifat terkutuk data kemungkinan tak terlihat.

Salah satu contoh dari pola yang diciptakan oleh performativitas adalah transitivitas dalam jaringan sosial online. Pada 1970-an dan 1980-an, para peneliti berulang kali menemukan bahwa jika Anda berteman dengan Alice dan Anda berteman dengan Bob, maka Bob dan Alice lebih cenderung berteman dengan satu sama lain daripada dua orang yang dipilih secara acak. Dan, pola yang sama ini ditemukan dalam grafik sosial Facebook (Ugander et al. 2011) . Dengan demikian, orang bisa menyimpulkan bahwa pola persahabatan di Facebook meniru pola persahabatan offline, setidaknya dalam hal transitivitas. Namun, besarnya transitivitas dalam grafik sosial Facebook sebagian didorong oleh pengganggu algoritmik. Artinya, data yang para ilmuwan di Facebook tahu dari penelitian empiris dan teoritis tentang transitivitas dan kemudian dipanggang menjadi cara Facebook bekerja. Facebook memiliki "Orang yang Mungkin Anda Kenal" fitur yang menyarankan teman-teman baru, dan salah satu cara bahwa Facebook memutuskan siapa yang harus menyarankan kepada Anda adalah transitivitas. Artinya, Facebook lebih mungkin untuk menunjukkan bahwa Anda menjadi teman dengan teman-teman dari teman Anda. Fitur ini tentunya memiliki efek meningkatkan transitivitas dalam grafik sosial Facebook; dengan kata lain, teori transitivitas membawa dunia ke sejalan dengan prediksi dari teori (Healy 2015) . Jadi, ketika sumber data yang besar muncul untuk mereproduksi prediksi teori sosial, kita harus yakin bahwa teori itu sendiri tidak dimasukkan ke bagaimana sistem bekerja.

Daripada memikirkan sumber data besar seperti mengamati orang dalam lingkungan alam, metafora yang lebih tepat adalah mengamati orang di kasino. Kasino sangat direkayasa lingkungan yang dirancang untuk mendorong perilaku tertentu, dan peneliti tidak akan pernah berharap bahwa perilaku di kasino akan memberikan jendela terkekang dalam perilaku manusia. Tentu saja, kita bisa belajar sesuatu tentang perilaku belajar orang manusia di kasino-sebenarnya kasino mungkin pengaturan yang ideal untuk mempelajari hubungan antara konsumsi alkohol dan risiko preferensi-tetapi jika kita mengabaikan bahwa data sedang dibuat di kasino kami mungkin menarik beberapa kesimpulan yang buruk.

Sayangnya, berurusan dengan pengganggu algoritmik sangat sulit karena banyak fitur dari sistem online yang proprietary, kurang didokumentasikan, dan terus berubah. Misalnya, seperti yang saya akan jelaskan nanti dalam bab ini, pengganggu algoritmik adalah salah satu penjelasan yang mungkin untuk secara bertahap break-down dari Google Flu Trends (Bagian 2.4.2), tetapi klaim ini sulit untuk menilai karena inner pencarian Google algoritma adalah proprietary. Sifat dinamis pembaur algoritmik merupakan salah satu bentuk sistem drift. pembaur algoritmik berarti bahwa kita harus berhati-hati tentang klaim untuk perilaku manusia yang berasal dari sistem digital tunggal, tidak peduli seberapa besar.