Käyttäytyminen suurissa tietojärjestelmissä ei ole luonnollinen; sitä ohjaavat järjestelmien tekniset tavoitteet.
Vaikka monet suuret tietolähteet eivät ole reagoivia, koska ihmiset eivät tiedä, että heidän tietojaan tallennetaan (2.3.3. Kohta), tutkijoiden ei pitäisi katsoa käyttäytymisensä näissä verkkojärjestelmissä olevan "luonnollisesti esiintyviä". Todellisuudessa digitaaliset järjestelmät, joka on suunniteltu erityisesti indusoimaan erityisiä käyttäytymismalleja, kuten napsauttamalla mainoksia tai lähettämällä sisältöä. Sellaisia tapoja, joilla järjestelmänsuunnittelijoiden tavoitteet voivat tuoda kuvioita tietoihin, kutsutaan algoritmiseksi sekaannukseksi . Algoritmiset häiriöt ovat suhteellisen tuntemattomia yhteiskuntatieteilijöille, mutta se on huolestuttavien tietojen tutkijoiden suuri huolenaihe. Ja toisin kuin jotkut muut digitaalisten jälkien ongelmat, algoritminen sekavuus on suurelta osin näkymätöntä.
Suhteellisen yksinkertainen esimerkki algoritmisesta häirinnästä on se, että Facebookissa on poikkeuksellisen suuri määrä käyttäjiä, joissa on noin 20 ystävää, kuten Johan Ugander ja hänen kollegat (2011) löysivät. Tutkijat, jotka analysoivat näitä tietoja ilman mitään ymmärrystä siitä, miten Facebook toimii, voisivat epäilemättä tuottaa monia tarinoita siitä, miten 20 on eräänlainen maaginen sosiaalinen numero. Onneksi Ugander ja hänen kollegansa tuntevat huomattavasti prosessin, joka tuotti tiedot, ja he tiesivät, että Facebook kannusti ihmisiä, joilla on vain vähän yhteyksiä Facebookissa, tekemään lisää ystäviä, kunnes he saavuttivat 20 ystävää. Vaikka Ugander ja kollegat eivät sano tämän paperissaan, Facebook luultavasti luonut tämän politiikan, jotta kannustettaisiin uusia käyttäjiä toimimaan aktiivisemmin. Tietämättä kuitenkaan tämän politiikan olemassaolosta on helppo tehdä virheellinen johtopäätös. Toisin sanoen yllättävän suuri määrä ihmisiä, joissa on noin 20 kaveria, kertoo enemmän Facebookista kuin ihmiskäyttäytymisestä.
Tässä edellisessä esimerkissä algoritminen sekoittuminen tuotti oudon tuloksen, jonka huolellinen tutkija voisi havaita ja tutkia edelleen. On kuitenkin olemassa entistä tuskempi versio algoritmisesta häirinnästä, joka ilmenee, kun verkko-ohjelmien suunnittelijat ovat tietoisia sosiaalisista teorioista ja sitten leipovat nämä teoriat järjestelmiensä työskentelyyn. Sosiaalitieteilijät kutsuvat tätä performatiivisuutta : kun teoria muuttaa maailmaa niin, että se tuo maailmaa paremmin yhteen teorian kanssa. Performatiivisen algoritmisen sekaannuksen tapauksessa dataa on sekava, joten sitä on hyvin vaikea havaita.
Yksi esimerkki suorituskyvyn luomasta kuviosta on siirtyvyys sosiaalisissa sosiaalisissa verkostoissa. 1970-luvulla ja 1980-luvulla tutkijat toistuvasti havaitsivat, että jos olet ystäviä sekä Alice ja Bob, niin Alice ja Bob ovat todennäköisesti ystäviä keskenään kuin jos he olivat kaksi satunnaisesti valittuja ihmisiä. Tämä sama kuvio löytyi Facebookin sosiaalisesta (Ugander et al. 2011) . Niinpä voisi päätellä, että Facebookin ystävyyssuhteet repliisivät offline-ystävyyssuhteita, ainakin läpinäkyvyyden osalta. Facebook-sosiaalisen kaavion läpinäkyvyyden suuruus kuitenkin osittain johtuu algoritmisesta häirinnästä. Eli tiedetieteilijät Facebookissa tunsivat kokeellisesta ja teoreettisesta tutkimuksesta läpikuluvuudesta ja söivät sitten sen, miten Facebook toimii. Facebookilla on "You Can Know Know" -ominaisuus, joka ehdottaa uusia ystäviä, ja yksi tapa, jolla Facebook päättää kuka ehdottaa sinulle, on siirtyvyys. Tämä tarkoittaa sitä, että Facebook suosittelee todennäköisemmin ystäväsi ystävien kanssa. Tämä ominaisuus täten lisää Facebook-sosiaalisen kaavion siirtyvyyttä. toisin sanoen siirtymätekniikka tuo maailmaan linjan teorian ennusteiden kanssa (Zignani et al. 2014; Healy 2015) . Näin ollen, kun suuret tietolähteet näyttävät toistuvan sosiaalisen teorian ennusteita, meidän on oltava varmoja siitä, että teoriaa ei ole kypsennetty siihen, miten järjestelmä toimi.
Sen sijaan, että ajattelisimme suuria tietolähteitä, kun havaitsimme luonnollisessa ympäristössä olevia ihmisiä, tarkempi metafora noudattaa kasinon ihmisiä. Kasinot ovat erittäin suunniteltuja ympäristöjä, joiden tarkoituksena on saada aikaan tiettyjä käyttäytymismalleja. Tutkija ei koskaan odota käyttäytymistä kasinolla tarjoten esteettömän ikkunan ihmisen käyttäytymiseen. Tietenkin voit oppia jotain ihmiskäyttäytymistä tutkimalla ihmisiä kasinoissa, mutta jos jätit huomiotta sen, että tietoja luotiin kasinossa, voit tehdä huonoja johtopäätöksiä.
Valitettavasti algoritmisen häirinnän käsitteleminen on erityisen hankalaa, koska verkkopalvelujen monet ominaisuudet ovat omaperäisiä, huonosti dokumentoituja ja jatkuvasti muuttuvia. Esimerkiksi, kuten myöhemmin selitän tässä luvussa, algoritminen sekaannus oli yksi mahdollinen selitys Google Influenz Trendsin asteittaisesta hajoamisesta (2.4.2 kohta), mutta tätä väitettä oli vaikea arvioida, koska Googlen hakualgoritmin sisäinen toiminta on oma. Algoritmisen sekaannuksen dynaaminen luonne on yksi systeemin ajovirta. Algoritmisen sekaannus tarkoittaa, että meidän on oltava varovaisia kaikista ihmisen käyttäytymisestä, joka on peräisin yhdestä digitaalisesta järjestelmästä riippumatta siitä, kuinka suuri.