Paripolah dina data kapanggih teu alami, eta disetir ku tujuan rékayasa sahiji sistem.
Sanajan loba sumber data kapanggih aya non-réaktif sabab jalma anu teu sadar data maranéhanana anu keur direkam (Bagéan 2.3.1.3), panalungtik teu kudu mertimbangkeun paripolah dina ieu sistem online jadi "alami kajadian" atawa "murni." Dina kanyataanana, nu sistem digital nu paripolah catetan nu kacida direkayasa ka dipicuna paripolah husus saperti ngaklik dina iklan atawa ngeposkeun eusi. Cara nu tujuan désainer sistim bisa ngawanohkeun pola kana data disebut confounding algorithmic. confounding Algorithmic relatif dipikanyaho ka élmuwan sosial, tapi perhatian utama antara élmuwan data ati. Jeung, kawas sababaraha masalah sejenna ngambah digital, confounding algorithmic nyaéta kalolobaan kawih.
A conto kawilang basajan tina confounding algorithmic nyaéta kanyataan yén on Facebook aya nomer anomalously luhur pamaké nu kira-kira 20 babaturan (Ugander et al. 2011) . Élmuwan analisa jeung data ieu tanpa pamahaman kumaha Facebook karya doubtlessly bisa ngahasilkeun loba carita ngeunaan kumaha 20 sababaraha jenis wilangan sosial gaib. Tapi, Ugander sareng kolega-Na kungsi pamahaman penting tina prosés nu dihasilkeun data, jeung maranehna terang yen Facebook wanti urang jeung sababaraha sambungan on Facebook nyieun babaturan leuwih nepi ka maranehna nepi ka 20 babaturan. Sanajan Ugander sareng kolega teu nyebutkeun ieu dina kertas, kawijakan ieu presumably dijieun ku Facebook dina raraga ajak pamaké anyar jadi leuwih aktip. Tanpa nyaho ngeunaan ayana kawijakan ieu, kumaha oge, nya éta gampang pikeun ngagambar kacindekan salah ti data. Dina basa sejen, jumlah heran luhur urang jeung kira 20 babaturan ngabejaan urang leuwih ngeunaan Facebook ti paripolah manusa.
More pernicious ti conto saméméhna ieu mana confounding algorithmic dihasilkeun hasil quirky nu panalungtik ati bisa nalungtik salajengna, aya pérsi komo trickier ti confounding algorithmic nu lumangsung nalika désainer sistem online sadar teori sosial terus Panggang téori ieu kana kerja nu sistem maranéhanana. Élmuwan Sosial nelepon performativity ieu: lamun téori ngarobah dunya dina cara saperti nu mawa dunya leuwih kana garis jeung teori. Dina kasus confounding algorithmic performative, alam ngabingungkeun data kamungkinan kawih.
Hiji conto pola dijieun ku performativity nyaéta transitivity dina jaringan sosial online. Dina 1970-an jeung 1980-an, panalungtik sababaraha kali manggihan yén lamun anjeun aya babaturan jeung Alice jeung anjeun babaturan jeung Bob, mangka Bob jeung Alice leuwih dipikaresep jadi babaturan jeung unggal lian ti dua urang dipilih sacara acak. Jeung, pola pisan sarua ieu kapanggih dina grafik sosial on Facebook (Ugander et al. 2011) . Ku kituna, hiji bisa dicindekkeun yen pola silaturahim on Facebook ngayakeun réplikasi pola friendships offline, sahenteuna dina watesan transitivity. Tapi, gedena transitivity dina grafik sosial Facebook anu sawaréh disetir ku confounding algorithmic. Hartina, data élmuwan di Facebook terang tina panalungtikan empiris jeung teoritis ngeunaan transitivity terus dipanggang kana kumaha Facebook hade. Facebook ngabogaan "Jalma Anjeun meureun Nyaho" ciri nu nunjukkeun babaturan anyar, jeung salah sahiji cara nu Facebook megatkeun anu ka nyarankeun ka anjeun téh transitivity. Nyéta, Facebook leuwih gampang nunjukkeun yén anjeun jadi babaturan jeung babaturan babaturan Anjeun. Fitur ieu sahingga boga pangaruh ngaronjatkeun transitivity dina grafik sosial Facebook; dina basa sejen, téori transitivity brings dunya kana garis jeung prediksi tina teori (Healy 2015) . Ku kituna, lamun sumber data gedé némbongan ka baranahan prediksi teori sosial, urang kudu yakin yén téori sorangan teu dipanggang kana kumaha sistem digawé.
Tinimbang mikir sumber data gedé salaku observasi jalma dina setting alam, hiji kiasan leuwih apt ieu observasi jalma di kasino a. Casinos anu kacida direkayasa lingkungan dirancang pikeun dipicuna paripolah nu tangtu, jeung panalungtik kungsi bakal nyangka yen paripolah dina kasino hiji bakal nyadiakeun jandela unfettered kana paripolah manusa. Tangtu, urang bisa diajar hiji hal ngeunaan paripolah nalungtik urang manusa dina casinos-di kanyataan kasino hiji bisa jadi hiji setting idéal pikeun nalungtik hubungan antara konsumsi alkohol jeung risiko kahoyong-tapi lamun urang teu dipalire data ieu keur dijieun dina kasino urang meureun ngagambar sababaraha conclusions goréng.
Hanjakalna, kaayaan confounding algorithmic sabagian hésé sabab loba fitur sistem online nu proprietary, kirang documented, sarta terus ngarobah. Contona, saperti Abdi gé ngajelaskeun saterusna dina ieu bab, confounding algorithmic salah katerangan mungkin pikeun bertahap break-turun tina Google Flu Tren (Bagéan 2.4.2), tapi ngaku ieu hésé assess sabab workings jero tina search Google algoritma nu proprietary. Alam dinamis tina confounding algorithmic mangrupa salah bentuk sistim drift. confounding Algorithmic hartina urang kudu cautious ngeunaan widang naon waé ngaku for kitu kalakuan manusa nu asalna ti sistem digital tunggal, euweuh urusan kumaha gedé.