Gedrag in groot datastelsels is nie natuurlik nie; Dit word gedryf deur die ingenieursdoelwitte van die stelsels.
Alhoewel baie groot databronne nie-reaktief is omdat mense nie bewus is dat hul data opgeneem word nie (afdeling 2.3.3), moet navorsers nie gedrag in hierdie aanlynstelsels beskou as "natuurlik voorkomend" nie. In werklikheid is die digitale stelsels wat rekordgedrag is, in ag geneem. hoogs gemanipuleer om spesifieke gedrag te veroorsaak, soos om op advertensies te kliek of om inhoud te plaas. Die maniere waarop die doelwitte van stelselontwerpers patrone in data kan voorstel, word algoritmiese verwarring genoem . Algoritmiese verwarring is relatief onbekend aan sosiale wetenskaplikes, maar dit is 'n groot bekommernis onder versigtige data wetenskaplikes. En in teenstelling met sommige van die ander probleme met digitale spore, is algoritmiese verwarring grootliks onsigbaar.
'N Relatief eenvoudige voorbeeld van algoritmiese verwarring is die feit dat daar op Facebook 'n anomalies hoë aantal gebruikers met ongeveer 20 vriende is, soos deur Johan Ugander en kollegas (2011) . Wetenskaplikes wat hierdie data ontleed sonder enige begrip van hoe Facebook werk kan ongetwyfeld baie stories opduik oor hoe 20 'n soort magiese sosiale nommer is. Gelukkig het Ugander en sy kollegas 'n wesenlike begrip gehad van die proses wat die data gegenereer het, en hulle het geweet dat Facebook mense met min verbindings op Facebook aangemoedig het om meer vriende te maak totdat hulle 20 vriende bereik het. Alhoewel Ugander en kollegas dit nie in hul koerant sê nie, is hierdie beleid vermoedelik deur Facebook geskep om nuwe gebruikers aan te moedig om meer aktief te word. Sonder om te weet oor die bestaan van hierdie beleid, is dit egter maklik om die verkeerde gevolgtrekking uit die data te trek. Met ander woorde, die verrassend hoë aantal mense met ongeveer 20 vriende vertel ons meer oor Facebook as oor menslike gedrag.
In hierdie vorige voorbeeld het algoritmiese verwarring 'n vreemde gevolg gelewer wat 'n versigtige navorser verder kan opspoor en ondersoek. Daar is egter 'n selfs moeiliker weergawe van algoritmiese verwarring wat plaasvind wanneer ontwerpers van aanlynstelsels bewus is van sosiale teorieë en dan hierdie teorieë in die werking van hul stelsels bak. Sosiale wetenskaplikes noem hierdie performativiteit : wanneer 'n teorie die wêreld so verander dat dit die wêreld meer in lyn bring met die teorie. In die geval van performative algoritmiese verwarring, is die beskaafde aard van die data baie moeilik om op te spoor.
Een voorbeeld van 'n patroon geskep deur performativiteit is transitivity in aanlyn sosiale netwerke. In die 1970's en 1980's het navorsers herhaaldelik bevind dat as jy albei met Alice en Bob is, is Alice en Bob meer geneig om met mekaar te wees as as hulle twee lukraak gekose mense was. Hierdie selfde patroon is in die sosiale grafiek op Facebook (Ugander et al. 2011) . So kan mens aflei dat patrone van vriendskap op Facebook patrone van aflyn vriendskappe herhaal, ten minste in terme van transitiviteit. Die grootte van die transitiviteit in die Facebook sosiale grafiek word egter gedeeltelik deur algoritmiese verwarring gedryf. Dit is, dat die data wetenskaplikes by Facebook het geweet van empiriese en teoretiese navorsing oor transitivity en dan gebak het in hoe Facebook werk. Facebook het 'n "People You May Know" -funksie wat nuwe vriende voorstel, en een manier waarop Facebook besluit wie om voor te stel, is transitivity. Dit is, Facebook is meer geneig om voor te stel dat jy vriende word met vriende van jou vriende. Hierdie kenmerk het dus die gevolg van toenemende transito-vermoë in die Facebook sosiale grafiek; Met ander woorde, die teorie van transitiviteit bring die wêreld in lyn met die voorspellings van die teorie (Zignani et al. 2014; Healy 2015) . Dus, wanneer groot databronne voorspellings van sosiale teorie voorkom, moet ons seker wees dat die teorie self nie gebak is in hoe die stelsel gewerk het nie.
Eerder as om te dink aan groot databronne om mense in 'n natuurlike omgewing waar te neem, is 'n meer gepaste metafoor die waarneming van mense in 'n casino. Casinos is hoogs gemanipuleerde omgewings wat ontwerp is om sekere gedrag te veroorsaak, en 'n navorser sal nooit gedrag in 'n casino verwag om 'n onversadigde venster in menslike gedrag te bied nie. Natuurlik kan jy iets leer oor menslike gedrag deur mense in casino's te bestudeer, maar as jy die feit ignoreer dat die data in 'n casino geskep word, kan jy dalk slegte gevolgtrekkings maak.
Ongelukkig is die hantering van algoritmiese verwarring besonder moeilik omdat baie eienskappe van aanlynstelsels besit, swak gedokumenteer is en voortdurend verander. Byvoorbeeld, soos ek later in hierdie hoofstuk sal verduidelik, was algoritmiese verwarring een moontlike verduideliking vir die geleidelike uiteensetting van Google Grense-tendense (afdeling 2.4.2), maar hierdie eis was moeilik om te assesseer omdat die innerlike werking van Google se soekalgoritme eiendom. Die dinamiese aard van algoritmiese verwarring is een vorm van stelseldrywing. Algoritmiese verwarring beteken dat ons versigtig moet wees oor enige eis rakende menslike gedrag wat uit 'n enkele digitale stelsel kom, maak nie saak hoe groot nie.