Ponašanje u pronađen podataka nije prirodno, to je upravljan od strane tehničkih ciljeva sustava.
Iako su mnogi pronađeni izvori podataka nisu reaktivni, jer ljudi nisu svjesni svoje podatke snimaju (Odjeljak 2.3.1.3), istraživači ne bi trebalo uzeti u obzir ponašanje u tim online sustava da bi "prirodno" ili "čista". U stvarnosti, digitalni sustavi koji bilježe ponašanje vrlo su projektirana da se potakne specifična ponašanja kao što je klikom na oglase ili objavljivanje sadržaja. Načini da su ciljevi sustav dizajneri mogu uvesti obrasce u podacima zove algoritamski zbunjivanje. Algoritamski zbunjivanje je relativno nepoznata društvenih znanstvenika, ali to je glavna briga među oprezni znanstvenika podataka. I, za razliku od nekih drugih problema s digitalnim tragovima, algoritamski zbunjivanje je uglavnom nevidljiv.
Relativno jednostavan primjer algoritamske zbrka je činjenica da na Facebooku postoji jedan neuobičajeno visok broj korisnika s otprilike 20 prijatelja (Ugander et al. 2011) . Znanstvenici analiza s ovim podacima bez ikakvog razumijevanja o tome kako Facebook radi mogao nesumnjivo stvaraju mnoge priče o tome kako 20 je neka vrsta magičnog socijalne broj. Međutim, Ugander i njegovi kolege imali znatnu razumijevanje procesa koji generira podatke, a oni su znali da Facebook potiče ljude s brojem priključaka na Facebook da bi više prijatelja sve dok nisu stigli 20 prijatelja. Iako Ugander i kolege ne govore tome u novinama, to pravilo vjerojatno nastao je Facebook kako bi se potaklo nove korisnike da postanu aktivniji. Ne znajući o postojanju ove politike, međutim, to je lako izvući pogrešan zaključak iz podataka. Drugim riječima, iznenađujuće velik broj ljudi s oko 20 prijatelja govori nam više o Facebooku nego ljudskog ponašanja.
Pogubnija od ovog prethodnog primjera gdje algoritamski zbunjivanje proizvedene igra riječima rezultat koji je pažljiva znanstvenici mogli istražiti i dalje, tu je još zapletenije verzija algoritma zbrka koja nastaje kada dizajneri online sustava su svjesni socijalnih teorija, a zatim ispeći ove teorije u rad njihovih sustava. Socijalni znanstvenici nazivaju ovo performativnošću: kada se teorije promijeniti svijet na takav način da oni donose na svijet više u skladu s teorijom. U slučajevima izvedbene algoritamske zbrka je smeteno priroda podataka je vjerojatno nevidljiv.
Jedan primjer obrazac stvorio performativnosti je prijenosnost u online društvenim mrežama. U 1970-ih i 1980-ih, znanstvenici u više navrata utvrdio da, ako ste prijatelji s Alice i vi ste prijatelj s Bobom, a zatim Bob i Alice su više vjerojatno da će biti prijatelji jedni s drugima nego dva nasumično odabranih ljudi. A, ovaj isti uzorak pronađen je u društvenom grafu na Facebooku (Ugander et al. 2011) . Dakle, moglo bi se zaključiti da obrasci prijateljstva na Facebooku ponoviti uzorke offline prijateljstva, barem u smislu prijenosnost. Međutim, veličina prijenosnost u Facebook društvenog grafikona djelomično potaknut algoritamskog zbrka. To je, znanstvenici su podaci na Facebooku znao za empirijske i teorijske istraživanja o prijenosnost a zatim peče ga u tome Facebook radi. Facebook ima "osobe koje poznajete" značajka koja sugerira nove prijatelje, a jedan od načina da Facebook odlučuje tko sugerirati što je prijenosnost. To jest, Facebook je više vjerojatno da će predložiti da postanu prijatelji s prijateljima svojih prijatelja. Ova značajka je stoga za posljedicu povećanje tranzitivnost u Facebook društvenog grafikona; Drugim riječima, teorija prijenosnost donosi svijet u skladu s predviđanjima teorije (Healy 2015) . Tako, kad Veliki izvori podataka pojavljuje se reproducirati predviđanja teorije društva, moramo biti sigurni da je sama teorija nije bila pečena u tome kako sustav radi.
Umjesto da razmišljate o velikim izvora podataka kao što je promatranje ljudi u prirodnom okruženju, više sposoban metafora promatranje ljudi u kasinu. Kockarnice su visoko projektirana okruženja dizajniran da izazove određena ponašanja, a znanstvenici nikada ne bi očekivao da ponašanje u kasinu će osigurati nesmetan prozor u ljudskom ponašanju. Naravno, mogli smo saznati nešto o ponašanju proučavanje ljudi ljudskih u kasinima, zapravo casino može biti idealno mjesto za proučavanje odnosa između konzumacije alkohola i rizika preferencijama-ali ako ćemo zanemariti da su podaci koji se stvara u kasinu smo mogli izvući neke loše zaključke.
Nažalost, bavi algoritamske zbrka je posebno teško jer mnoge značajke online sustava su vlasništvo, slabo dokumentirana, i stalno se mijenja. Na primjer, kao što ću objasniti kasnije u ovom poglavlju, algoritamski zbunjivanje je bio jedan od mogućih objašnjenja za postupno slamanja Google Raširenost gripe (točka 2.4.2), ali ova tvrdnja je teško procijeniti, jer su unutarnji mehanizam Google pretraživanja algoritam su vlasništvo. Dinamična priroda algoritma zbrka je jedan oblik nanosa sustava. Algoritamski zbunjivanje znači da trebamo biti oprezne oko bilo zahtjeva za ljudsko ponašanje koje dolazi iz jednog digitalnog sustava, bez obzira na to koliko je velika.