Понашање у пронађено података није природно, то је вођен инжењерских циљева система.
Иако многи сматрају да су извори података не реагује, јер људи нису свесни њихови подаци се снимају (Одељак 2.3.1.3), истраживачи не би требало да размотри понашање у овим онлајн система како би "природно" или "чист". У стварности, дигитални системи који запис понашање су веома конструисане да изазову специфично понашање као што кликну на огласе или постављање садржаја. Начини да су циљеви система дизајнера могу увести обрасце у подацима се зове Алгоритамски збуњујући. Алгоритама збуњујући је релативно непознат друштвених наука, али то је за велику забринутост међу пажљивим научника података. И, за разлику од неких других проблема са дигиталним траговима, Алгоритхмиц збуњујући је углавном невидљив.
Релативно једноставан пример алгоритма збуњујући је чињеница да на Фацебооку има су аномалоусли велики број корисника са око 20 пријатеља (Ugander et al. 2011) . Научници испитују са овим подацима без икаквог разумевања како Фацебоок функционише могао несумњиво генерисати многе приче о томе како 20 је нека врста магичне социјалне броја. Међутим, Угандер и његове колеге су имали значајно разумевање процеса који генерише податке, а они су знали да Фацебоок подстицала људе са неколико конекција на Фацебоок-да више пријатеља док нису стигли 20 пријатели. Иако Угандер и колеге не кажем у новинама, ова политика је вероватно створио Фацебоок у циљу подстицања нових корисника да постану активнији. Без знања о постојању ове политике, међутим, лако је извући погрешан закључак из података. Другим речима, изненађујуће велики број људи са око 20 пријатеља нам говори више о Фацебооку него људског понашања.
Још више штетну од овог претходног примера где алгоритама збуњујући произвела провокативни резултат који би пажљива истраживачи истражују даље, постоји још тежи верзија алгоритма мешовити који се јавља када дизајнери Онлине-система свесни друштвених теорија, а затим пећи ове теорије у рад њихових система. Социолози зову перформативност: када теорије променити свет на такав начин да они доносе свет више у складу са теоријом. У случајевима извођачких алгоритмическој збуњујући је проклета природа података је вероватно невидљив.
Један пример обрасца створили перформативности је Транзитивност у интернет друштвеним мрежама. Током 1970-их и 1980-их, истраживачи су у више наврата открили да ако сте пријатељ са Алице и ви сте пријатељи са Бобом, онда је Боб и Алице су веће шансе да буду пријатељи са једни другима него два насумично одабраних људи. И, тај исти образац је пронађен у социјалном графу на Фацебоок-у (Ugander et al. 2011) . Тако, могло би се закључити да обрасци пријатељства на Фацебооку понови обрасце офлајн пријатељства, барем у погледу транзитивности. Међутим, магнитуда транзитивности у Фацебоок друштвеној графикона је делимично покреће алгоритмическој збуњујући. То је, научници података на Фацебоок знао емпиријског и теоријског истраживања о транзитивности и онда пече га у како Фацебоок ради. Фацебоок има "људи које можда знате" функција која сугерише нове пријатеље, а један начин да Фацебоок одлучује ко да тврдим да је Транзитивност. То јест, Фацебоок је већа вероватноћа да предлажемо да постану пријатељи са пријатељима ваших пријатеља. Ова функција тако има ефекат повећања транзитивност у Фацебоок друштвеној графикона; Другим речима, теорија транзитивности доводи свет у складу са предвиђањима теорије (Healy 2015) . Тако, када велики извори података изгледа да репродукује предвиђања друштвене теорије, морамо бити сигурни да сама теорија није печен у како тај систем функционише.
Уместо да размишљате о великим извора података као посматра људе у природном окружењу, а склонији метафора посматра људе у казину. Казина су веома пројектована окружења дизајнирано да подстакне одређена понашања, и још истраживачи никада не би очекивао да понашање у казину би обезбедити несметан прозор у људском понашању. Наравно, можемо научити нешто о људском понашању проучавањем људи у казину-у заправо казино може бити идеално за проучавање односа између конзумирања алкохола и ризика склоности-а ако се игнорише да су подаци се ствара у казину бисмо могли извући неке лоше закључке.
На жалост, која се бави алгоритмическој збуњујући је посебно тешко, јер многе карактеристике онлајн система су власничке, слабо документоване, и стално мења. На пример, као што ћу касније објаснити у овом поглављу, Алгоритхмиц збуњујући је био један од могућих објашњења за постепену слома Гоогле грипа (члан 2.4.2), али ова тврдња је тешко проценити јер унутрасњим пословима Гоогле претрагом алгоритам су власништво. Динамичка природа алгоритмическој збуњујући је један облик система дрифт. Алгоритама збуњујући значи да треба да будемо опрезни у вези са било ког захтева за људско понашање које долази из једног дигиталног система, без обзира колики.