Ponašanje u velikim podatkovnim sustavima nije prirodno; upravljan je inženjerskim ciljevima sustava.
Iako mnogi veliki izvori podataka nisu reaktivni jer ljudi nisu svjesni da se njihovi podaci bilježe (odjeljak 2.3.3.), Istraživači ne bi smjeli uzeti u obzir ponašanje u tim mrežnim sustavima da budu "prirodno nastali". U stvarnosti, digitalni sustavi koji bilježe ponašanje visoko dizajniran da potakne određena ponašanja kao što su klikanje na oglase ili objavljivanje sadržaja. Načini na koje ciljevi dizajnerskih sustava mogu uvesti obrasce u podatke nazivaju se algoritamski zbunjujući . Algoritamsko zbunjivanje je relativno nepoznato društvenim znanstvenicima, ali je glavna briga među pažljivim znanstvenicima podataka. I, za razliku od nekih drugih problema s digitalnim tragovima, algoritamska konfuzija je uglavnom nevidljiva.
Relativno jednostavan primjer algoritamske konfuzije je činjenica da na Facebook-u postoji anomalijski veliki broj korisnika s približno 20 prijatelja, kao što su otkrili Johan Ugander i kolege (2011) . Znanstvenici koji analiziraju ove podatke bez ikakvog razumijevanja o tome kako Facebook funkcioniraju bez sumnje bi mogli generirati mnoge priče o tome kako je 20 neka vrsta čarobnog društvenog broja. Srećom, Ugander i njegovi kolege imali su znatno razumijevanje procesa koji je generirao podatke, a oni su znali da je Facebook potaknuo ljude s malim brojem veza na Facebook da bi ostvario više prijatelja sve dok ne dosegnu 20 prijatelja. Iako Ugander i njegovi kolege to ne govore u svom radu, Facebook je vjerojatno stvorio ovu politiku kako bi potaknula nove korisnike da postanu aktivniji. Međutim, bez poznavanja postojanja ove politike, lako je izvući pogrešan zaključak iz podataka. Drugim riječima, iznenađujuće visok broj ljudi s oko 20 prijatelja govori nam više o Facebooku nego o ljudskom ponašanju.
U ovom prethodnom primjeru, algoritamsko zbunjivanje proizvodi čudan rezultat koji pažljiv istraživač može otkriti i istražiti dalje. Međutim, postoji čak i trickier inačica algoritamske konfuzije koja se događa kada su dizajneri mrežnih sustava svjesni društvenih teorija, a zatim peče te teorije u rad njihovih sustava. Društveni znanstvenici zovu ovu izvedbenost : kada teorija mijenja svijet na takav način da dovede svijet u skladu s teorijom. U slučaju performativnog algoritamskog miješanja, zbunjena priroda podataka je vrlo teško detektirati.
Jedan primjer uzorka stvoren izvedbom je tranzitivnost u mrežnim društvenim mrežama. U sedamdesetim i osamdesetim godinama, istraživači su opetovano otkrili da, ako ste prijatelji s Alice i Bobom, onda su Alice i Bob veća vjerojatnost da budu prijateljski jedni s drugima nego da su dva slučajno odabrana čovjeka. Ovaj isti obrazac pronađen je u društvenom grafikonu na Facebooku (Ugander et al. 2011) . Stoga se može zaključiti da obrasci prijateljstva na Facebook repliciraju obrasce offline prijateljstva, barem u smislu tranzitivnosti. Međutim, veličina tranzitivnosti na socijalnom grafikonu Facebook djelomično je potaknuta algoritamskim zbunjenjem. Naime, znanstvenici na Facebooku znali su o empirijskim i teorijskim istraživanjima o tranziciji, a potom su pekli u tome kako funkcionira Facebook. Facebook ima "People You May Know" značajku koja predlaže nove prijatelje, a jedan od načina na koji Facebook odluči tko vam predložiti je tranzitivnost. To znači da će Facebook vjerojatno predložiti da postanete prijatelji prijateljima svojih prijatelja. Ova značajka tako utječe na povećanje tranzicije u društvenom grafikonu Facebooka; drugim riječima, teorija tranzitnosti dovodi svijet u skladu s predviđanjima teorije (Zignani et al. 2014; Healy 2015) . Stoga, kada se čini da veliki izvori podataka reproduciraju predviđanja društvene teorije, moramo biti sigurni da sama teorija nije bila ukopana u način funkcioniranja sustava.
Umjesto da razmišlja o velikim izvorima podataka kao promatranje ljudi u prirodnom okruženju, više prikladna metafora promatra ljude u kasinu. Casina su visoko projektirana okruženja dizajnirana da potiču određena ponašanja, a istraživač nikad ne bi očekivao ponašanje u kockarnici da osigura nesmetan prozor u ljudsko ponašanje. Naravno, možete naučiti nešto o ljudskom ponašanju tako što ćete proučavati ljude u kockarnicama, ali ako ste zanemarili činjenicu da se podaci stvaraju u kasinu, možete privući neke loše zaključke.
Nažalost, rješavanje algoritamskih konfuzija posebno je teško jer su mnoge značajke online sustava vlasnički, slabo dokumentirane i stalno se mijenjaju. Na primjer, kao što ću kasnije objasniti u ovom poglavlju, algoritamsko zbunjivanje bilo je jedno od mogućih objašnjenja postupnog sloma Google Raširenosti gripe (odjeljak 2.4.2), no ta je tvrdnja bila teško procijeniti jer je unutarnji rad Googleovog algoritma za pretraživanje vlasnički. Dinamična priroda algoritamske konfuzije je jedan oblik nestajanja sustava. Algoritamsko zbunjivanje znači da moramo biti oprezni u vezi s bilo kojim tvrdnjama u vezi s ljudskim ponašanjem koje proizlazi iz jednog digitalnog sustava, bez obzira koliko je velik.