2.3.2.4 Drifting

Befolking drift, usage drift, en systeem drift meitsje it dreech te brûken grutte gegevens boarne te studearjen lange-termyn trends.

Ien fan 'e grutte foardielen fan in protte grutte gegevens boarnen binne dat se sammelje gegevens oer tiid. Sosjale wittenskippers neame dit soarte fan over-tiid gegevens, longitudinaal gegevens. En, fansels, longitudinaal gegevens binne tige wichtich foar stúdzje feroaring. Om betrouber mjitten feroaring, lykwols, de mjitting systeem sels moat stabyl. Yn 'e wurden fan sosjolooch Otis Dudley Duncan, "as jo wolle mjitten feroarje, net feroarje de maatregel" (Fischer 2011) .

Spitigernôch, in protte grutte gegevens systemen-benammen saaklike systeem dat meitsje en fêstlizze digitale spoaren-binne feroarjende al de tiid, in proses dat ik neame drift. Yn it bysûnder, dy systemen feroarje yn trije wichtichste wizen: befolking drift (wiziging yn dy't mei help fan harren), gedrachsproblemen drift (feroaring yn hoe't minsken binne mei help fan har), en systeem drift (wiziging yn it systeem sels). De trije boarnen fan drift betsjutte dat in patroan yn digitale spoare gegevens koe wurde feroarsake troch in wichtige feroaring yn 'e wrâld, of it koe wurde feroarsake troch guon foarm fan drift.

De earste boarne fan drift-befolking drift-is dy't mei help fan it systeem, en dat feroaret op lange-tiid weachskeal en koarte-tiid skobben. Bygelyks, fan 2008 te presintearjen de gemiddelde leeftiid fan de minsken op sosjale media is tanommen. Neist dizze lange-termyn trends, de minsken mei help fan in systeem op elts momint fariearret. Bygelyks, yn 'e Amerikaanske presidintsferkiezings fan 2012 it oanpart fan de tweets oer de polityk dy't waarden skreaun troch froulju skommele fan dei ta dei (Diaz et al. 2016) . Sa, wat kin ferskine te wêzen in feroaring yn 'e stimming fan' e Twitter-fers miskien eins krekt wêze feroarings yn dy't praten op elk momint.

Neist feroarings yn dy't mei help fan in systeem, binne der ek feroaret yn hoe't it systeem wurdt brûkt. Bygelyks, yn it Occupy Gezi Park protest yn Istanboel, Turkije yn 2013 demonstranten feroare harren gebrûk fan Hashtags as it protest evoluearre. Hjir is hoe't Zeynep Tufekci (2014) beskreau de drift, dat hja koe detect want se wie observearjen gedrach op Twitter en op 'e grûn:

"Wat hie der bard wie dat sa gau as it protest waard de dominante ferhaal, grutte oantallen fan minsken. . . stoppe mei help fan de Hashtags útsein om omtinken te freegjen foar in nije fenomeen. . .. Wylst de protesten fierder, en sels yntinsiver, de Hashtags stoar del. Ynterviews bliken twa redenen foar dit. Earste, ien kear elkenien wist it ûnderwerp, de hashtag wie tagelyk oerstallich en wasteful op it karakter-beheind Twitter platfoarm. Twadde, Hashtags waarden sjoen allinne as nuttich foar it oanlûken omtinken oan in bepaald ûnderwerp, net foar it oer it. "

Sa, ûndersikers dy't stúdzje de protesten troch analysearjen tweets mei protest-relatearre Hashtags soe hawwe in ambivalinte gefoel fan wat wie bart omdat fan dizze gedrachsproblemen drift. Bygelyks, se soe leauwe dat de diskusje fan it protest ôfnommen lang foardat it eins ôfnommen.

De tredde soarte fan drift is systeem drift. Yn dit gefal, it is net de minsken feroarjen of harren gedrach dochter, mar it systeem sels feroaret. Bygelyks, oer tiid Facebook tanommen de limyt op de lingte fan de status updates. Sa, in longitudinale stúdzje fan status updates sille wêze kwetsber foar keunstfoarwerpen feroarsake troch dizze feroaring. Systeem drift is nau besibbe oan probleem neamd algorithmic confounding dêr't wy no keare.