2.3.2.4 Drifting

Drift stanovništva, drift korištenje, i sistem drift čine ga teško koristiti veliki izvor podataka za proučavanje dugoročnih trendova.

Jedna od velikih prednosti mnogih velikih izvora podataka su da prikupljaju podatke tokom vremena. Sociolozi zovu ove vrste više-time podataka, longitudinalnih podataka. I, naravno, longitudinalnih podaci su vrlo važni za proučavanje promjena. Kako bi se pouzdano izmjeriti promjene, međutim, sama mjerenja sistem mora biti stabilan. Prema riječima sociologa Otis Dudley Duncan, "ako želite mjeriti promjene, ne mijenjaju mjeru" (Fischer 2011) .

Na žalost, mnogi Big Data Systems-a posebno poslovni sistem koji stvaraju i snimanje digitalnih tragova-mijenjaju cijelo vrijeme, što je proces koji ću nazvati drift. Konkretno, ovi sistemi promijeniti u tri glavna načina: Drift stanovništva (promjena koji ih koristi), drift ponašanja (promjena u načinu na koji ih ljudi koriste), i sistem drift (promjena u samom sistemu). Tri izvora drift znači da svaki obrazac u podacima digitalni trag može biti uzrokovana važna promjena u svijetu, ili može biti uzrokovana nekim oblikom drift.

Prvi izvor drift-stanovništva drift-je koji se koristi sistem, i to mijenja na dugoročne vremenske skale i kratko-vremenske skale. Na primjer, od 2008. do danas povećao je prosječna starost ljudi na društvenim mrežama. Pored ovih dugoročnih trendova, ljudi koriste sistem u svakom trenutku varira. Na primjer, u predsjedničkim izborima u SAD 2012. godine udio tvitova o politici koje su napisali žene oscilirala iz dana u dan (Diaz et al. 2016) . Dakle, ono što bi moglo izgledati da su promjene u raspoloženju Twitter-stih može zapravo biti samo promjena u koji se govori u svakom trenutku.

Osim promjene u koji koristi sistem, tu su i promjene u načinu na koji se sistem koristi. Na primjer, za vrijeme Occupy protesta Gezi park u Istanbulu, Turska u 2013. godini demonstranti su promijenili svoju upotrebu hashtags kao protest evoluirao. Evo kako Zeynep Tufekci (2014) opisao je drift, koja je bila u stanju da otkrije jer je posmatrao ponašanje na Twitter-u i na terenu:

"Ono što se dogodilo je da čim je protest postala dominantna priča, veliki broj ljudi. . . zaustavljen koristeći hashtags osim da bi privukli pažnju na novi fenomen. . .. Dok protesti nastavili, pa čak i intenzivirana, hashtags zamro. Intervjui otkrila dva razloga za to. Prvo, kada su svi znali temu, hashtag je odjednom suvišno i rasipnički na karakter ograničene Twitter platformi. Drugo, hashtags su viđeni samo kao koristan za privlačenje pažnje na određenu temu, a ne za razgovor o tome. "

Stoga, istraživači koji su studirali protesta analizirajući tweetove sa hashtags protesta vezanih imati iskrivljenu osjećaj onoga što se događa zbog toga drift ponašanja. Na primjer, mogli bi smatraju da je rasprava o protesta smanjen dugo prije nego što je zapravo smanjena.

Treća vrsta drift je sistem drift. U ovom slučaju, to nije narod mijenja ili njihovo mijenjanje ponašanja, ali sam sistem mijenja. Na primjer, tokom vremena Facebook je povećao limit dužine ažuriranja statusa. Stoga, bilo longitudinalna studija o promjenama statusa će biti ranjiva na artefakte uzrokovane ove promjene. Sistem drift je usko vezan za problem zove algoritamske zbunjujući za koje smo sada okrenuti.