Gedrag gevonden gegevens niet natuurlijk, wordt aangedreven door de technische doelen van de systemen.
Hoewel veel gevonden gegevensbronnen niet-reactief omdat men zich niet bewust van hun gegevens worden opgeslagen (Sectie 2.3.1.3) Onderzoekers moeten niet als gedrag van deze online systemen om "natuurlijk voorkomend" of "zuiver". In werkelijkheid, de digitale systemen dat record gedrag sterk zijn ontworpen om specifiek gedrag te induceren zoals het klikken op advertenties of het plaatsen van content. De manieren waarop de doelstellingen van systeemontwerpers patronen kunnen introduceren in data heet algoritmische verstorende. Algoritmische verwarrende is relatief onbekend bij sociale wetenschappers, maar het is een grote zorg onder voorzichtig data wetenschappers. En, in tegenstelling tot andere problemen met digitale sporen, algoritmische verstorende grotendeels onzichtbaar.
Een relatief eenvoudig voorbeeld van algoritmische storende is dat Facebook er een abnormaal hoge aantal gebruikers met ongeveer 20 vrienden (Ugander et al. 2011) . Wetenschappers analyseren van deze gegevens zonder enig begrip van hoe Facebook werkt kon ongetwijfeld het genereren van veel verhalen over hoe 20 is een soort van magische sofi-nummer. Echter, Ugander en zijn collega's hadden een substantieel inzicht in het proces dat de gegevens die zijn gegenereerd, en ze wisten dat Facebook aangemoedigd mensen met weinig aansluitingen op Facebook om meer vrienden te maken, totdat ze bereikt 20 vrienden. Hoewel Ugander en collega's dit niet in de krant zeggen, werd dit beleid vermoedelijk gemaakt door Facebook om nieuwe gebruikers aan te moedigen om actiever te worden. Zonder op de hoogte van het bestaan van dit beleid is het echter gemakkelijk om de verkeerde conclusie trekken uit de gegevens. Met andere woorden, het verrassend hoge aantal mensen met ongeveer 20 vrienden vertelt ons meer over Facebook dan menselijk gedrag.
Schadelijker dan het voorgaande voorbeeld waarbij algoritmische verstorende produceerde een origineel zodat een zorgvuldige onderzoekers verder kunnen onderzoeken, er een nog lastiger versie van algoritmische verstorende die optreedt wanneer ontwerpers van online systemen zijn bekend maatschappijtheorieën en bak deze theorieën in werkstand van hun systemen. Sociale wetenschappers noemen dit performativity: wanneer theorieën de wereld te veranderen in een zodanige wijze dat zij de wereld te brengen meer in overeenstemming met de theorie. In het geval van performatieve algoritmische verwarrende, het schaamrood aard van de gegevens is waarschijnlijk onzichtbaar.
Een voorbeeld van een patroon gemaakt door performativiteit is transitiviteit in online sociale netwerken. In de jaren 1970 en 1980, de onderzoekers herhaaldelijk vastgesteld dat als je vrienden met Alice en je bent bevriend met Bob, dan Bob en Alice hebben meer kans om vrienden met elkaar dan twee willekeurig gekozen mensen. En, was deze zelfde patroon gevonden in de sociale grafiek op Facebook (Ugander et al. 2011) . Zo zou men kunnen concluderen dat de patronen van de vriendschap op Facebook repliceren patronen van offline vriendschappen, althans in termen van transitiviteit. Echter de omvang van transitiviteit in het bij sociale grafiek gedeeltelijk aangedreven door algoritmische verwarren. Dat wil zeggen dat data wetenschappers van Facebook kende van de empirische en theoretische onderzoek naar transitiviteit en vervolgens gebakken het in hoe Facebook werkt. Facebook heeft een "People You May Know" functie die nieuwe vrienden suggereert, en een manier dat Facebook beslist wie voor te stellen aan u is transitiviteit. Dat wil zeggen, Facebook is meer kans om te suggereren dat je vrienden worden met de vrienden van je vrienden. Deze functie heeft dus het effect van het verhogen transitiviteit in de Facebook sociale grafiek; met andere woorden, de theorie van transitiviteit brengt de wereld in overeenstemming met de voorspellingen van de theorie (Healy 2015) . Dus, als big data bronnen blijkt voorspellingen van sociale theorie te reproduceren, moeten we er zeker van zijn dat de theorie zelf niet werd gebakken in hoe het systeem werkte.
In plaats van te denken van big data bronnen zoals observeren van mensen in een natuurlijke omgeving, is een treffende metafoor observeren van mensen in een casino. Casino's zijn zeer ontworpen omgevingen ontworpen om bepaalde gedragingen te induceren, en de onderzoekers zou nooit verwachten dat gedrag in een casino zou een onbelemmerde venster te geven in het menselijk gedrag. Natuurlijk, kunnen we iets over menselijk gedrag bestuderen van mensen in leren casino's in feite een casino zou een ideale setting voor het bestuderen van de relatie tussen alcoholconsumptie en het risico voorkeuren, maar als we negeerden dat de gegevens werd gemaakt in een casino we misschien trekken een aantal slechte conclusies.
Helaas, het omgaan met algoritmische verstorende is bijzonder moeilijk omdat veel kenmerken van online systemen zijn eigendom, slecht gedocumenteerd, en veranderen voortdurend. Bijvoorbeeld, zoals ik later zal uitleggen in dit hoofdstuk, algoritmische verstorende was een mogelijke verklaring voor de geleidelijke afbraak van Google Grieptrends (paragraaf 2.4.2), maar deze claim is moeilijk in te schatten, omdat de innerlijke werking van de zoekresultaten van Google algoritme zijn eigendom. Het dynamische karakter van algoritmische verstorende is één vorm van systeem drift. Algoritmische verwarrende betekent dat we geen kwestie voorzichtig over een vordering voor het menselijk gedrag dat afkomstig is van één digitaal systeem, moet worden hoe groot.