2.3.2.5 hutonte algorithmically

Sjellja në të dhënat e gjetur nuk është e natyrshme, ajo është e shtyrë nga qëllimet inxhinierike të sistemeve.

Edhe pse shumë burime gjenden të dhëna janë jo-reaktive për shkak se njerëzit nuk janë të vetëdijshëm të dhënat e tyre janë duke u regjistruar (Seksioni 2.3.1.3), studiuesit nuk duhet të marrë parasysh sjelljen në këto sisteme në internet të jetë "natyrale" ose "të pastër." Në të vërtetë, sistemet dixhitale që sjellja dhënat janë shumë të engineered për të nxitur sjellje të veçanta të tilla si klikuar mbi reklama ose postimi përmbajtje. Mënyrat se qëllimet e designers sistemit të prezantuar modele në të dhëna quhet ngatërruar algorithmic. ngatërruar algorithmic është relativisht e panjohur për shkencëtarët socialë, por është një shqetësim i madh në mesin e shkencëtarëve të kujdesshëm të të dhënave. Dhe, ndryshe nga disa nga problemet e tjera me gjurmë dixhitale, ngatërruar algorithmic është kryesisht i padukshëm.

Një shembull relativisht e thjeshtë e ngatërruar algorithmic është fakti se në Facebook ka një numër të anomalously të lartë të përdoruesve me afërsisht 20 shokët (Ugander et al. 2011) . Shkencëtarët analizuar me këto të dhëna pa asnjë të kuptuarit se si funksionon Facebook pa dyshim mund të gjenerojë shumë histori se si 20 është një lloj numri magjik social. Megjithatë, Ugander dhe kolegët e tij kishin një kuptim të konsiderueshme të procesit që gjeneruar të dhëna, dhe e panë që Facebook të inkurajuar njerëzit me disa lidhje në Facebook për të bërë me shume miq derisa arritën 20 shokët. Edhe pse Ugander dhe kolegët nuk e them këtë në letër, kjo politikë u krijua me sa duket nga Facebook për të inkurajuar përdoruesit e rinj të bëhen më aktive. Pa e ditur për ekzistencën e kësaj politike, megjithatë, ajo është e lehtë për të nxjerrë konkluzion të gabuar nga të dhënat. Me fjalë të tjera, numri çuditërisht i lartë i njerëzve me rreth 20 miq na tregon më shumë rreth Facebook se sjelljen e njeriut.

Më i dëmshëm se këtë shembull të mëparshëm, ku ngatërruar algorithmic prodhuar një rezultat quirky që një studiues i kujdesshëm mund të hetojë më tej, ka një version edhe më e komplikuar e ngatërruar algorithmic që ndodh kur designers e sistemeve online janë në dijeni të teorive sociale dhe pastaj piqem këto teori në punën e sistemeve të tyre. Sociologët e quajnë këtë performativity: kur teoritë ndryshuar botën në mënyrë të tillë që ata të sjellin botën më shumë në përputhje me teorinë. Në rastet e ngatërruar performative algorithmic, natyra turpërohet e të dhënave është e mundshme të padukshme.

Një shembull i një modeli të krijuar nga performativity është transitivity në rrjetet sociale në internet. Në vitet 1970 dhe 1980, hulumtuesit në mënyrë të përsëritur ka gjetur se në qoftë se ju jeni miq me Alice dhe ju jeni miq me Bob, pastaj Bob dhe Alice kanë më shumë gjasa të jenë miq me njëri-tjetrin se dy persona të zgjedhur rastësisht. Dhe, ky model i njëjti u gjet në grafikun shoqëror në Facebook (Ugander et al. 2011) . Kështu, mund të konkludojmë se modelet e miqësisë në Facebook përsëris modelet e miqësive offline, të paktën në aspektin e Transitivity. Megjithatë, madhësia e Transitivity në grafikun social Facebook është nxitur pjesërisht nga ngatërruar algorithmic. Kjo është, të dhënat shkencëtarët në Facebook dinte të hulumtimeve empirike dhe teorike rreth Transitivity dhe pastaj e pjekur e saj në Facebook se si punon. Facebook ka një "Njerëzit mund ta dini" tipar që sugjeron miq të rinj, dhe në një mënyrë që Facebook vendos që të sugjerojë për ju është transitivity. Që është, Facebook ka më shumë gjasa për të sugjeruar që të bëheni miq me miqtë e miqve tuaj. Ky funksion kështu ka efektin e rritjes transitivity në grafikun social Facebook; me fjalë të tjera, teoria e Transitivity sjell botën në përputhje me parashikimet e teorisë (Healy 2015) . Kështu, kur burime të mëdha të të dhënave duket të riprodhuar parashikimet e teorisë sociale, ne duhet të jetë i sigurt se teoria vetë nuk ishte pjekur ne se si sistemi ka punuar.

Në vend se të menduarit e burimeve të mëdha të të dhënave, si vëzhgimin e njerëzve në një mjedis natyror, një metaforë më të prirur është respektuar njerëzit në një kazino. Casinos janë engineered shumë mjedise të dizajnuara për të nxitur sjellje të caktuara, dhe një studiues kurrë nuk do të presim që sjellja në një kazino do të sigurojë një dritare të papenguar në sjelljen e njeriut. Sigurisht, ne mund të mësojmë diçka rreth sjelljes studiuar njerëzit e njeriut në kazinove, në fakt një kazino mund të jetë një ideal për të studiuar marrëdhëniet në mes të konsumit të alkoolit dhe rrezikut preferencat, por në qoftë se ne injorohet se të dhënat janë duke u krijuar në një kazino ne fuqi nxjerrë disa përfundime të këqija.

Për fat të keq, që kanë të bëjnë me ngatërruar algorithmic është veçanërisht e vështirë për shkak se shumë karakteristika të sistemeve online janë të pronarit, të dokumentuara dobët, dhe vazhdimisht në ndryshim. Për shembull, pasi unë do të shpjegoj më vonë në këtë kapitull, ngatërruar algorithmic ishte një shpjegim i mundshëm për gradual shpërbërjes poshtë e Google gripit Tendencat (Seksioni 2.4.2), por kjo kërkesë ishte e vështirë të vlerësohet, sepse punët e brendshme të kërkimit të Google algorithm janë të pronarit. Natyra dinamike e ngatërruar algorithmic është një formë e sistemit domethënie. ngatërruar algorithmic do të thotë se ne duhet të jetë i kujdesshëm në lidhje me ndonjë kërkesë për sjelljen njerëzore që vjen nga një sistem të vetëm dixhital, pa marrë parasysh sa e madhe.