2.3.2.5 algorithmically mħawwda

Komportament fid-data misjuba mhux naturali, huwa mmexxi mill-għanijiet ta 'inġinerija tas-sistemi.

Għalkemm ħafna sorsi tad-dejta misjuba huma mhux reattiv għaliex in-nies mhumiex konxji tad-data tagħhom qed jiġu rreġistrati (Sezzjoni 2.3.1.3), ir-riċerkaturi ma għandhomx jikkunsidraw l-imġiba fl dawn is-sistemi fuq l-internet li jkunu "b'mod naturali" jew "pur." Fir-realtà, il- sistemi diġitali li l-imġiba ta 'reġistri huma ħafna inġinerija li jinduċi imgieba speċifiċi bħal tikklikkja fuq ads jew kollokament kontenut. Il-modi li l-għanijiet ta 'disinjaturi tas-sistemi jistgħu jintroduċu mudelli f'data tissejjaħ joħloq konfużjoni algorithmic. jistgħu jfixklu algorithmic huwa relattivament mhux magħruf li xjentisti soċjali, iżda huwa ta 'tħassib kbir fost ix-xjenzati data bir-reqqa. U, kuntrarjament għal uħud mill-problemi l-oħra bil-traċċi diġitali, li jistgħu jfixklu algorithmic huwa l-aktar inviżibbli.

Eżempju relattivament sempliċi ta 'li joħloq konfużjoni algorithmic huwa l-fatt li fuq Facebook hemm numru anomalously għoli ta' utenti b'madwar 20-ħbieb (Ugander et al. 2011) . Xjentisti analiżi ma din id-dejta mingħajr l-ebda fehim ta 'kif Facebook xogħlijiet setgħux mingħajr dubju jiġġeneraw ħafna stejjer dwar kif 20 huwa xi tip ta' numru soċjali maġika. Madankollu, Ugander u l-kollegi tiegħu kellhom fehim sostanzjali tal-proċess li ġġenerat id-data, u dawn kienu jafu li Facebook jitħeġġu n-nies bi ftit konnessjonijiet fuq Facebook biex jagħmlu ħbieb aktar sakemm dawn laħqu 20 ħbieb. Għalkemm Ugander u l-kollegi ma ngħid dan fil-karta, din il-politika kienet preżumibbilment maħluqa minn Facebook sabiex jinkoraġġixxu l-utenti ġodda biex isiru aktar attivi. Mingħajr ma jkunu jafu dwar l-eżistenza ta 'din il-politika, madankollu, huwa faċli li jaslu għall-konklużjoni żbaljata mid-dejta. Fi kliem ieħor, in-numru sorprendentement għoli ta 'nies ma' madwar 20-ħbieb jgħidilna aktar dwar Facebook minn imġiba tal-bniedem.

Aktar distruttiva minn dan l-eżempju preċedenti fejn jistgħu jfixklu algoritmiku pproduċew riżultat quirky li riċerkaturi attent tista tkompli tinvestiga, hemm verżjoni saħansitra delikati ta konfondenti algoritmiku li sseħħ meta disinjaturi tas-sistemi onlajn huma konxji ta 'teoriji soċjali u mbagħad bake dawn it-teoriji fil-ħidma tas-sistemi tagħhom. Xjentisti soċjali sejħa dan performativity: meta teoriji tbiddel id-dinja b'tali mod li dawn iġibu d-dinja aktar konformi mal-teorija. Fil-każijiet ta 'li jistgħu jfixklu algorithmic performattic, in-natura mħawwda tad-data hija probabbli inviżibbli.

Eżempju wieħed ta 'mudell maħluqa minn performativity huwa Transitivity fin-netwerks soċjali online. Fl-1970 u l-1980, ir-riċerkaturi ripetutament sabet li jekk inti ħbieb ma Alice u inti ħbieb ma Bob, allura Bob u Alice huma aktar probabbli li jkunu ħbieb ma 'xulxin minn żewġ persuni magħżula b'mod każwali. U, dan ħafna istess mudell nstabet fil-graff soċjali fuq Facebook (Ugander et al. 2011) . Għalhekk, wieħed jista 'jikkonkludi li l-mudelli ta' ħbiberija fuq Facebook replikata mudelli ta 'ħbiberiji offline, għall-inqas f'termini ta Transitivity. Madankollu, il-kobor tal Transitivity fil-graff soċjali Facebook hija parzjalment immexxija mill joħloq konfużjoni algorithmic. Dan huwa, ix-xjentisti data fil Facebook jafu bl-riċerka empirika u teoretika dwar Transitivity u mbagħad moħmija huwa dwar kif taħdem Facebook. Facebook tkun a "Nies Inti tista 'taf" karatteristika li jissuġġerixxi ħbieb ġodda, u mod wieħed li Facebook jiddeċiedi li jissuġġerixxu li inti huwa Transitivity. Jiġifieri, Facebook huwa aktar probabbli li jissuġġerixxu li inti ssir ħbieb ma l-ħbieb tal-ħbieb tiegħek. Din il-karatteristika għalhekk għandha l-effett li żżid Transitivity fil-graff soċjali Facebook; fi kliem ieħor, il-teorija ta 'Transitivity ġġib id-dinja konformi mal-previżjonijiet tat-teorija (Healy 2015) . Għalhekk, meta s-sorsi tad-dejta kbar jidher li tirriproduċi previżjonijiet tat-teorija soċjali, irridu nkunu żgur li t-teorija innifsu ma kienx moħmija dwar kif is-sistema ħadmet.

Pjuttost milli taħseb sorsi ta 'data kbar kif osservazzjoni nies fl-iffissar naturali, metafora iktar xieraq qiegħed josserva n-nies fil-każinò. Casinos huma ferm ambjenti mfassla biex jinduċi ċerti imgieba inġinerija, u riċerkaturi qatt jistenna li l-imġieba fil-każinò se tipprovdi tieqa sovrana fis imġiba tal-bniedem. Naturalment, nistgħu jitgħallmu xi ħaġa dwar in-nies imġiba jistudjaw bniedem fil-casinos fil-fatt każinò jista 'jkun f'ambjent ideali għall-istudju tar-relazzjoni bejn il-konsum ta' alkoħol u riskju preferenzi-imma jekk irridu injorat li d-data kienet qed jinħolqu fil-każinò nistgħu jiġbed xi konklużjonijiet ħżiena.

Sfortunatament, jittrattaw jistgħu jfixklu algoritmiku huwa partikolarment diffiċli minħabba li ħafna karatteristiċi ta 'sistemi onlajn huma proprjetarji, dokumentati ħażin, u li jinbidlu kontinwament. Per eżempju, kif jien ser jispjegaw aktar tard f'dan il-kapitolu, li joħloq konfużjoni algorithmic kienet waħda spjegazzjoni possibbli għall-gradwali tqassim ta 'Google Flu Tendenzi (Sezzjoni 2.4.2), iżda din it-talba kienet diffiċli li tevalwa għaliex il-ħidma interna ta' tfittxija ta 'Google algoritmu huma proprjetarji. In-natura dinamika tas jistgħu jfixklu algoritmiku huwa forma waħda ta 'drift sistema. jistgħu jfixklu algorithmic ifisser li għandna nkunu kawti dwar kwalunkwe pretensjoni għall-imġieba tal-bniedem li tkun ġejja minn sistema diġitali uniku, l-ebda kwistjoni kemm hu kbir.