Ponašanje u velikim sistemima podataka nije prirodno; pogonjen je inženjerskim ciljevima sistema.
Iako su mnogi veliki izvori podataka nereaktivni jer ljudi nisu svjesni da se njihovi podaci beleže (član 2.3.3), istraživači ne smiju uzeti u obzir da ponašanje u ovim onlajn sistemima bude "prirodno". U stvarnosti, visoko dizajniran da indukuje određena ponašanja kao što je klik na oglase ili objavljivanje sadržaja. Način na koji ciljevi dizajnera sistema mogu uvesti obrasce u podatke naziva se algoritamski zbunjujući . Algoritamski zbunjenost je sasvim nepoznato društvenim naučnicima, ali to je velika zabrinutost među pažljivim naučnicima podataka. I, za razliku od nekih drugih problema sa digitalnim tragovima, algoritamski zbunjenost je u velikoj meri nevidljiva.
Relativno jednostavan primer algoritamskog zbunjivanja je činjenica da na Facebooku postoji anomalozno veliki broj korisnika sa oko 20 prijatelja, što su otkrili Johan Ugander i kolege (2011) . Naučnici koji analiziraju ove podatke bez ikakvog razumevanja kako funkcioniše na Facebooku, nesumnjivo mogu generisati mnoge priče o tome kako je to neka vrsta magičnog društvenog broja. Srećom, Ugander i njegove kolege imali su značajno razumijevanje procesa koji su generisali podatke, a znali su da Facebook podstiče ljude sa nekoliko veza na Facebooku kako bi napravili više prijatelja dok ne stignu do 20 prijatelja. Iako Ugander i njegove kolege ovo ne govore u svom članku, Facebook je pretpostavio da je ovu politiku stvorila kako bi ohrabrila nove korisnike da postanu aktivniji. Međutim, bez poznavanja postojanja ove politike, lako je izvući pogrešan zaključak iz podataka. Drugim rečima, iznenađujuće veliki broj ljudi sa oko 20 prijatelja govori nam više o Facebook-u nego o ljudskom ponašanju.
U ovom prethodnom primjeru, algoritamski zbunjivanje proizvelo je izvanredan rezultat koji bi pažljivi istraživač mogao dalje otkriti i istražiti. Međutim, postoji čak i strožija verzija algoritamskog zbunjivanja koja se javlja kada su dizajneri online sistema svjesni društvenih teorija i potom te teorije ispeče u rad svojih sistema. Društveni naučnici nazivaju ovu performativnost : kada teorija menja svet na takav način da svet više uskladi sa teorijom. U slučaju performativnog algoritamskog zbivanja, zbunjena priroda podataka je veoma teško detektovati.
Jedan primjer uzorka koji stvara performativnost je tranzitnost u online društvenim mrežama. U sedamdesetim i osamdesetim godinama istraživači su u više navrata otkrili da ako ste prijatelji sa Alisom i Bobom, onda će Alice i Bob vjerovatno biti prijatelji jedni sa drugima nego ako su to slučajno izabrani ljudi. Ovaj isti obrazac je pronađen na društvenom grafiku na Facebooku (Ugander et al. 2011) . Tako bi se moglo zaključiti da obrasci prijateljstva na Facebook-u replikuju obrasce offline prijateljstva, bar u smislu tranzitnosti. Međutim, magnituda tranzitivnosti u društvenom grafikonu Facebook delimično je zahvaćena algoritmičkim zbunjenjem. To jest, naučnici na podacima na Facebooku znali su za empirijsko i teorijsko istraživanje tranzitnosti, a potom su ga pekli na način na koji funkcioniše Facebook. Facebook ima osobinu "Ljudi koje znate" koja predlaže nove prijatelje i jedan način na koji Facebook odlučuje ko će vam predložiti je tranzitnost. To jest, Facebook vjerovatnije će vam predložiti da postanete prijatelji sa prijateljima svojih prijatelja. Ova funkcija stoga ima efekat povećanja tranzitivnosti na socijalnom grafikonu Facebook-a; Drugim rečima, teorija tranzitivnosti dovodi svet u skladu sa predviđanjima teorije (Zignani et al. 2014; Healy 2015) . Dakle, kada veliki izvori podataka reprodukuju predviđanja društvene teorije, moramo biti sigurni da se sama teorija nije bacila na način na koji je sistem funkcionisao.
Umesto razmišljanja o velikim izvorima podataka kao posmatranje ljudi u prirodnom okruženju, metafora koja više apt posmatra ljude u kazinu. Kazina su visoko osmišljena okruženja dizajnirana da indukuju određena ponašanja, a istraživač nikada ne bi očekivao ponašanje u kazinu kako bi obezbedio neometan prozor u ljudskom ponašanju. Naravno, mogli biste naučiti nešto o ljudskom ponašanju proučavajući ljude u kazinu, ali ako ignorišete činjenicu da se podaci stvaraju u kazinu, mogli biste izvući neke loše zaključke.
Nažalost, bavljenje algoritmičkim zbunjenjem je naročito teško jer su mnoge karakteristike online sistema vlasničke, loše dokumentovane i stalno mijenjaju. Na primjer, kako ću vam objasniti kasnije u ovom poglavlju, algoritamsko zbunjenost je bilo jedno moguće objašnjenje postepenog sloma Google trendova gripa (poglavlje 2.4.2), ali je te tvrdnje teško procijeniti jer su unutarnji rad Google-ovog algoritma za pretraživanje vlasnički. Dinamička priroda algoritamskog zbližavanja je jedan oblik sistemskog drifta. Algoritamski zbunjujući znači da treba biti oprezan u pogledu bilo koje tvrdnje o ljudskom ponašanju koje potiče iz jednog digitalnog sistema, bez obzira na to koliko je veliki.