Uzvedība atrasts dati nav dabiski, tas virza inženierzinātņu mērķiem sistēmu.
Lai gan daudzi atrasti datu avoti ir nereaģē, jo cilvēki nav informēti viņu dati tiek ierakstīti (2.3.1.3 iedaļu), pētnieki nevajadzētu apsvērt rīcību šo tiešsaistes sistēmu, lai būtu "dabīgi" vai "tīrs." Patiesībā, ciparu sistēmas, ka ieraksts uzvedība ir ļoti izstrādāti, lai rosinātu konkrētas uzvedību, piemēram, noklikšķinot uz reklāmām vai norīkošanu saturu. Veidi, ka mērķi sistēmas dizaineri var ieviest trafaretus datu sauc algoritmiskās sajaukšanas. Algoritmiskās sajaukšanas ir salīdzinoši nezināms sociālajiem zinātniekiem, bet tā ir liela problēma starp rūpīgu datu zinātniekiem. Un, atšķirībā no dažām citām problēmām ar ciparu pēdas, algoritmiskās sajaukšanas lielākoties neredzams.
Salīdzinoši vienkāršs piemērs algoritmiskās sajauktiem ir tas, ka par Facebook tur ir anomalously liels skaits lietotāju ar aptuveni 20 draugiem (Ugander et al. 2011) . Zinātnieki analizējot šos datus bez izpratnes par to, kā Facebook darbu varētu neapšaubāmi radīt daudz stāstu par to, kā 20 ir sava veida burvju sociālās numuru. Tomēr Ugander un viņa kolēģi bija ievērojams izpratni par procesu, kas iegūti dati, un viņi zināja, ka Facebook mudināja cilvēkus ar dažiem savienojumiem Facebook padarīt vairāk draugu, līdz tie sasniedza 20 draugiem. Kaut Ugander un kolēģi to nesaku papīra, šī politika tika domājams izveidots ar Facebook, lai veicinātu jaunus lietotājus aktīvāk. Nezinot par to, ka pastāv šo politiku, tomēr, tas ir viegli izdarīt nepareizu secinājumu datiem. Citiem vārdiem sakot, pārsteidzoši liels cilvēku skaits ar aptuveni 20 draugiem stāsta mums vairāk par Facebook kā cilvēka uzvedību.
Vairāk bīstams nekā iepriekšējais piemēram, ja algoritmiskās sajaukšanas ražota quirky rezultātu rūpīgas pētnieki varētu izmeklēt tālāk, ir vēl sarežģītāk versija algoritmiskās sajauktiem kas rodas, kad dizaineri tiešsaistes sistēmām ir informēti par sociālo teoriju un tad cep šīs teorijas uz darba savu sistēmu. Sociālie zinātnieki sauc šo performativity: kad teorijas mainīt pasauli tādā veidā, ka tie rada pasauli vairāk saskaņotu ar teoriju. Gadījumos performatīvās algoritmiskā sajauktiem, tad sagruvušas datu veidu visticamāk neredzams.
Viens piemērs modelis, ko rada performativity ir transitivitātes tiešsaistes sociālajos tīklos. In 1970 un 1980, pētnieki vairākkārt konstatēja, ka, ja jums ir draugi, ar Alice un esat draugi ar Bob, tad Bobs un Alise, visticamāk, būt draugos ar otru nekā diviem brīvi izvēlētiem cilvēkiem. Un tas ir ļoti pats modelis tika atrasts sociālajā grafikā Facebook (Ugander et al. 2011) . Tādējādi varētu secināt, ka modeļi draudzības Facebook atkārtot modeļus nesaistes draudzību, vismaz ziņā transitivitātes. Tomēr lielums transitivitātes ar Facebook sociālajā diagrammas ir daļēji virza algoritmiskās sajauktiem. Tas nozīmē, ka datu zinātnieki Facebook zināja empīrisku un teorētisku pētījumu par transitivitātes un tad cep to kā Facebook darbojas. Facebook ir "Cilvēki jūs zināt" funkciju, kas piedāvā jaunus draugus, un viens no veidiem, ka Facebook nolemj kurš ieteikt jums ir transitivitātes. Tas ir, Facebook ir vairāk iespējams, liecina, ka jums kļūt par draugiem ar draugiem no jūsu draugiem. Tādējādi šī funkcija ir sekas palielināt transitivitātes ar Facebook sociālajā grafika; citiem vārdiem sakot, teoriju transitivitātes nes pasauli atbilstoši prognozēm teorijas (Healy 2015) . Tātad, kad lielie datu avotiem, šķiet, reproducēt prognozes sociālās teorijas, mums ir jābūt pārliecinātiem, ka teorija pati netika cep par to, kā sistēma strādā.
Nevis domāt par lielo datu avotu, kā vērojot cilvēku dabiskā vidē, vairāk apt metafora vēro cilvēkus kazino. Kazino ir ļoti inženierijas vidē, kuru mērķis ir izraisīt noteiktu uzvedību, un pētnieki nekad varētu sagaidīt, ka uzvedība kazino nodrošinātu neierobežotas logu cilvēka uzvedību. Protams, mēs varētu uzzināt kaut ko par cilvēka uzvedības pētot cilvēku kazino-patiesībā kazino varētu būt ideāls iestatījumu pētot saistību starp alkohola patēriņu un riska vēlmēm, bet, ja mēs ignorēt, ka dati tika izveidota kazino mēs varētu izdarīt dažus slikti secinājumus.
Diemžēl, kas nodarbojas ar algoritmiskās sajauktiem ir īpaši grūti, jo daudzi iezīmes tiešsaistes sistēmām ir patentēta, slikti dokumentēti, un pastāvīgi mainās. Piemēram, kā es paskaidrošu vēlāk šajā nodaļā, algoritmiskās sajaukšanas bija viens iespējams izskaidrojums pakāpenisku sadalījumu Google gripas izplatība (2.4.2 nodaļa), taču šis apgalvojums bija grūti novērtēt, jo iekšējo darbību Google meklēšanā algoritms ir patentēta. Dinamisko raksturu algoritmiskās sajauktiem ir viena veida sistēmas drift. Algoritmiskās sajaukšanas nozīmē, ka mums ir jābūt piesardzīgiem par jebkuru prasību par cilvēka uzvedību, kas nāk no vienas digitālo sistēmu, neatkarīgi no tā, cik liels.