Vedenje ugotovljeno podatkov ni naraven, poganja pa ga inženirskih cilji sistemov.
Čeprav so mnogi našli podatkovni viri nereaktiven, ker ljudje ne zavedajo, so njihovi podatki pa se zabeleži (oddelek 2.3.1.3), raziskovalci ne bi smelo upoštevati obnašanje na teh spletnih sistemov za "naravno" ali "čista". V resnici je digitalni sistemi, ki so zapis obnašanje zelo zasnovane za sprožanje specifične vedenje kot tako, da kliknete na oglase ali objavi vsebine. Načine, da lahko cilji oblikovalcem sistemov uvede vzorcev v podatkih se imenuje algoritmično zavajajoče. Algoritmična zavajajočih je relativno neznana družboslovci, vendar pa je glavna skrb med skrbni podatkov znanstveniki. In, za razliko od nekaterih drugih težav z digitalnimi sledi, algoritmično zavajajočih je večinoma neviden.
Relativno preprost primer algoritemskega zavajajočih je dejstvo, da so na Facebooku anomalously veliko število uporabnikov, s približno 20 prijatelji (Ugander et al. 2011) . Znanstveniki analiziranje s temi podatki, brez razumevanja, kako Facebook deluje bi nedvomno ustvarilo veliko zgodb o tem, kako 20 je nekakšen čarobni socialno številko. Vendar Ugander in njegovi kolegi so precej razumevanje procesa, ki generira podatke, in so vedeli, da Facebook spodbujati ljudi z nekaj povezav na Facebooku, da bi več prijateljev, dokler se ne doseže 20 prijateljev. Čeprav se Ugander in kolegi ne rečem v papir, je bila ta politika s Facebook predvidoma ustvaril, da bi spodbudili nove uporabnike, da postanejo bolj aktivni. Ne da bi vedel o obstoju te politike pa je težko pripraviti pravilno odločilo na podlagi podatkov. Z drugimi besedami, presenetljivo veliko število ljudi s približno 20 prijatelji nam pove več o Facebook kot človeškega vedenja.
Več škodljivi kot to prejšnjem primeru, kjer algoritmično zavajajočih proizvaja domiseln rezultat, ki bi skrbno raziskovalci nadaljnji preiskavi, pa je še težje različica algoritemskega zavajajočih, ki se pojavi, ko so oblikovalci spletnih sistemov zaveda socialnih teorij in nato pečemo te teorije v delovanje svojih sistemov. Družboslovci pravijo temu performativnost: ko teorije spremeniti svet na tak način, da jih prinesejo na svet bolj v skladu s teorijo. V primerih performativno algoritmično zavajajočih je zmeden narava podatkov je verjetno nevidna.
Eden od primerov iz vzorca, ki ga performativnosti ustvaril je prehodnost v spletnih socialnih omrežjih. Leta 1970 in 1980 so raziskovalci večkrat ugotovila, da so torej, če ste prijatelji z Alice in ste prijatelji z Bob Bob in Alice bolj verjetno, da bodo prijatelji s seboj od dveh naključno izbranih ljudi. In je bil prav ta isti vzorec najdemo v socialni graf na Facebooku (Ugander et al. 2011) . Tako bi lahko sklepali, da vzorci prijateljstvo na Facebooku posnemajo vzorce offline prijateljstva, vsaj v smislu prehodnosti. Vendar pa je velikost prehodnost v socialni graf Facebook delno poganja algoritmično zavajajočih. To pomeni, da podatki znanstveniki na Facebooku vedel empiričnih in teoretičnih raziskav o prehodnosti in nato pečen, kako Facebook deluje. Facebook ima "ljudi, ki jih morda poznate" funkcijo, ki predlaga nove prijatelje in en način, da je Facebook odločil, ki bi kazali, da si je prehodnost. To pomeni, Facebook je bolj verjetno, da predlagam, da postanejo prijatelji z prijateljem svojih prijateljev. Ta funkcija ima torej za posledico povečanje prehodnost v socialni graf Facebook; z drugimi besedami, teorija prehodnosti prinaša svet v skladu z napovedmi teorije (Healy 2015) . Tako je, ko se pojavi veliki podatkovni viri za reprodukcijo napovedi socialne teorije, moramo biti prepričani, da teorija sama ni bil pečen, kako sistem deluje.
Namesto da razmišljate o velikih podatkovnih virov, kot je opazovanje ljudi v naravnem okolju, je bolj primerna metafora opazovanje ljudi v igralnici. Igralnice so zelo inženirstva okolja izdelane za sprožanje določenih vedenj in raziskovalci ne bi nikoli pričakovali, da vedenje v igralnici bi zagotovila neoviran okno v človeško vedenje. Seveda lahko nekaj naučimo o vedenju ljudi študiju ljudi v igralnicah, v resnici casino lahko idealno okolje za preučevanje odnosa med porabo alkohola in tveganjem preferenc, če pa pozabiti, da so bili podatki, ki nastajajo v igralnici smo morda pripraviti nekaj slabih zaključkov.
Na žalost, ki se ukvarjajo z algoritmično zavajajočih je še posebej težko, ker so mnoge značilnosti spletnih sistemov zaščitene, slabo dokumentirane in se nenehno spreminja. Na primer, kot bom razložiti, kasneje v tem poglavju, je algoritmično zavajajočih ena možna razlaga za postopno razčlenitvijo Google Flu Trends (oddelek 2.4.2), vendar ta trditev je težko oceniti, saj notranje delovanje Googlovega iskanja algoritem so zaščitene. Dinamična narava algoritmično zavajajočih je ena od oblik sistema škropiva. Algoritmična zavajajočih pomeni, da moramo biti previdni pri vseh zahtevkih za človeškega obnašanja, ki prihaja iz ene same digitalni sistem, ne glede na to, kako velik.