Понашање у великим системима података није природно; то је подстакнуто инжењерским циљевима система.
Иако многи велики извори података нису активни, јер људи нису свјесни да се њихови подаци снимају (дио 2.3.3), истраживачи не требају сматрати да се понашање у овим онлајн системима "природно одвија". У стварности, високо дизајниран да индукује одређена понашања као што је клик на огласе или објављивање садржаја. Начин на који циљеви дизајнера система могу увести обрасце у податке назива се алгоритамски збуњујући . Алгоритамски збуњеност је сасвим непознато за друштвене науке, али то је велика забринутост међу пажљивим научницима података. И, за разлику од неких других проблема са дигиталним траговима, алгоритамски збуњеност је у великој мери невидљива.
Релативно једноставан пример алгоритамског збуњивања је чињеница да на Фацебооку постоји аномалозно велики број корисника са око 20 пријатеља, што су открили Јохан Угандер и колеге (2011) . Научници који анализирају ове податке, без икаквог разумевања како функционише Фацебоок, несумњиво могу генерисати многе приче о томе како је то нека врста магичног друштвеног броја. Срећом, Угандер и његове колеге имали су значајно разумевање процеса који је генерисао податке и знали су да је Фацебоок подстакао људе са неколико веза на Фацебоок-у да направе више пријатеља док не дођу до 20 пријатеља. Иако Угандер и колеге то не говоре у свом чланку, Фацебоок је вероватно створила ову политику како би охрабрила нове кориснике да постану активнији. Међутим, без познавања постојања ове политике, лако је извући погрешан закључак из података. Другим речима, изненађујуће велики број људи са око 20 пријатеља говори нам више о Фацебоок-у него о људском понашању.
У овом претходном примјеру, алгоритамски збуњивање произвело је изванредан резултат који пажљиви истраживач може додатно открити и истражити. Међутим, постоји чак и строжија верзија алгоритамског збуњивања која се јавља када су дизајнери онлине система свјесни друштвених теорија и потом те теорије испече у рад својих система. Социјалисти називају ову перформативност : када теорија мења свет тако да свет више усклади са теоријом. У случају перформативног алгоритамског збивања, збуњена природа података је веома тешко открити.
Један примјер узорка који ствара перформативност је транзитност у онлине друштвеним мрежама. У седамдесетим и осамдесетим годинама истраживачи су у више наврата открили да ако сте пријатељи са Алисом и Бобом, онда ће Алице и Боб вероватно бити пријатељи једни с другима него ако су то случајно изабрани људи. Овај исти образац је пронађен у друштвеном графику на Фацебооку (Ugander et al. 2011) . Тако би се могло закључити да обрасци пријатељства на Фацебоок-у репликују обрасце оффлине веза, барем у смислу транзитности. Међутим, магнитуда транзитивности у Фацебоок друштвеном графу делимично је захваћена алгоритамским збуњењем. То јест, научници на Фацебооку су знали за емпиријска и теоријска истраживања о транзитивности, а потом их пекли на начин на који функционише Фацебоок. Фацебоок има особину "Људи које знате" која предлаже нове пријатеље и један начин на који ће Фацебоок одлучити ко ће вам предложити транситивност. То јест, Фацебоок вероватније ће вам предложити да постанете пријатељи са пријатељима својих пријатеља. Ова функција стога има ефекат повећања транзитивности на социјалном графикону Фацебоок-а; Другим речима, теорија транзитивности доводи свет у складу са предвиђањима теорије (Zignani et al. 2014; Healy 2015) . Стога, када велики извори података репродукују предвиђања друштвене теорије, морамо бити сигурни да се сама теорија није бацила у то како је систем функционисао.
Уместо да размишљате о великим изворима података као посматрање људи у природном окружењу, метафора која више апт посматра људе у казину. Казина су високо конструисана окружења дизајнирана да индукују одређена понашања, а истраживач никада не би очекивао понашање у казину како би обезбедио неометан прозор у људском понашању. Наравно, могли бисте научити нешто о људском понашању проучавајући људе у казину, али ако сте игнорисали чињеницу да се подаци стварају у казину, могли бисте извући неке лоше закључке.
Нажалост, бављење алгоритмичким збуњењем је нарочито тешко јер су многобројне карактеристике онлине система власничке, лоше документоване и стално мијењају. На примјер, како ћу вам објаснити касније у овом поглављу, алгоритамско збуњујући начин је био једно могуће објашњење постепеног слома Гоогле трендова грипа (поглавље 2.4.2), али је те тврдње тешко процијенити јер су унутарњи рад Гоогле алгоритма за претрагу власнички. Динамичка природа алгоритамског збуњивања је један облик системског дрифта. Алгоритамски збуњујући значи да треба бити опрезан у погледу било које тврдње о људском понашању које потиче из једног дигиталног система, без обзира колико је велика.