Hegðun í stórum gagnakerfum er ekki eðlilegt; það er rekið af verkfræðilegum markmiðum kerfanna.
Þótt mörg stór gagnasöfn séu óvirk vegna þess að fólk er ekki meðvitað um að gögnin séu skráð (kafla 2.3.3), ættu vísindamenn ekki að íhuga hegðun í þessum netkerfum til að vera "náttúruleg." Í raun er stafræna kerfið sem skráir hegðun mjög verkfræðingur til að örva tiltekna hegðun eins og að smella á auglýsingar eða senda inn efni. Leiðirnar að markmiðum hönnuða kerfisins geti kynnt mynstur í gögn er kallað algrímfræðilegur confounding . Reiknirit er tiltölulega óþekkt fyrir félagsvísindamenn, en það er stórt áhyggjuefni gagnrýninna gagnafræðinga. Og ólíkt sumum öðrum vandamálum með stafrænum leifum er algrímsmiðið að mestu ósýnilegt.
A tiltölulega einfalt dæmi um algrímfræðilegur confounding er sú staðreynd að á Facebook eru óvenju margir notendur með um það bil 20 vinir, eins og uppgötvað var af Johan Ugander og samstarfsfólki (2011) . Vísindamenn sem greina þessar upplýsingar án þess að skilja hvernig Facebook virkar gæti án efa búið til margar sögur um hvernig 20 er einhverskonar töfrandi félagsleg tala. Sem betur fer höfðu Ugander og samstarfsmenn hans verulegan skilning á því ferli sem myndaði gögnin og þeir vissu að Facebook hvatti fólk með nokkrar tengingar á Facebook til að gera fleiri vini þangað til þeir náðu 20 vinum. Þrátt fyrir að Ugander og samstarfsmenn segja þetta ekki í blaðinu, var þessi stefna væntanlega búin til af Facebook til að hvetja nýja notendur til að verða virkari. Án þess að vita um tilvist þessa stefnu er þó auðvelt að draga röngan niðurstöðu úr gögnum. Með öðrum orðum, ótrúlega mikill fjöldi fólks með um 20 vini segir okkur meira um Facebook en um mannleg hegðun.
Í þessu fyrra dæmi skapaði algrímfræðilegur confounding einkennilegur árangur sem varlega rannsóknarmaður gæti greint og rannsakað frekar. Hins vegar er jafnvel enn erfiður útgáfa af algrímsmiðjum sem á sér stað þegar hönnuðir netkerfa eru meðvitaðir um félagslegar kenningar og síðan baka þessar kenningar inn í starfi kerfisins. Félagsvísindamenn kalla þetta afkastamikill : þegar kenning breytir heiminum á þann hátt að það leiði heiminn í takt við kenninguna. Þegar um er að ræða afkastamikil algrímsmiðlun, er hræðilegt eðli gagna mjög erfitt að greina.
Eitt dæmi um mynstur sem skapað er af performativity er flutningsgeta í samfélagsnetum á netinu. Á 1970- og 1980-talsins fundu vísindamenn ítrekað að ef þú ert vinur bæði Alice og Bob, þá eru líkurnar á að Alice og Bob séu vinir við hvert annað en ef þeir voru tveir af handahófi valin fólk. Þetta mjög sama mynstur var að finna í félagslegu myndinni á Facebook (Ugander et al. 2011) . Þannig gætirðu ályktað að mynstur vináttu á Facebook endurtaka mynstur offline vináttu, að minnsta kosti hvað varðar flutningsgetu. Hins vegar er umfang flutningsgetu í Facebook félagsfræðitöflinu að hluta til ekið af algrímfræðilegum confounding. Það er, gögn vísindamenn á Facebook vissi um empirical og fræðilega rannsóknir um flutningsgetu og síðan bakaði það í hvernig Facebook virkar. Facebook hefur "Fólk sem þú gætir að vita" sem bendir til nýrra vinna og ein leið til að Facebook ákveði hverjir að stinga upp á þig er yfirgang. Það er, Facebook er líklegri til að stinga upp á að þú sért vinur vini vina þinna. Þessi eiginleiki hefur þannig áhrif á að auka flutningsgetu í Facebook félagslega grafinu; Með öðrum orðum færir kenningin um flutning heiminn í samræmi við spár kenningarinnar (Zignani et al. 2014; Healy 2015) . Þannig að þegar stórar gagnamagnar virðast endurskapa spár félagslegrar kenningar, verðum við að vera viss um að kenningin sjálf hafi ekki verið bakuð í því hvernig kerfið virkaði.
Frekar en að hugsa um stóra gagnasöfn sem að fylgjast með fólki í náttúrulegu umhverfi, er líklegri til að meta að fylgjast með fólki í spilavíti. Spilavítum er mjög verkfræðilegt umhverfi sem ætlað er að örva ákveðna hegðun og rannsóknir myndu aldrei búast við hegðun í spilavíti til að veita óhindraðan glugga í mannlegri hegðun. Auðvitað gætirðu lært eitthvað um mannleg hegðun með því að læra fólk í spilavítum en ef þú hunsaðir því að gögnin voru búin til í spilavíti gætirðu dregið einhverjar slæmar ályktanir.
Því miður er það sérstaklega erfitt að takast á við algrímsmiðlun sem er mjög erfitt vegna þess að margir eiginleikar netkerfa eru einkamál, illa skjalfest og stöðugt að breytast. Til dæmis, eins og ég mun útskýra seinna í þessum kafla, var algrímfræðilegur grunur ein möguleg skýring á smám saman sundurliðun á grínastigi Google Fluens (kafla 2.4.2), en þessi krafa var erfitt að meta vegna þess að innri virkni leitaralgoritmið Google eru sér. The dynamic eðli algorithmic confounding er ein tegund af kerfi svíf. Algrímfræðilegur grunur þýðir að við ættum að vera varkár um kröfu um mannleg hegðun sem kemur frá einni stafrænu kerfi, sama hversu stórt.