2.3.2.4 Drifting

Bevolking drif, gebruik drif, en stelsel drif maak dit moeilik om groot databron gebruik om tendense langtermyn bestudeer.

Een van die groot voordele van baie groot databronne dat hulle data met verloop van tyd in te samel. Sosiale wetenskaplikes noem hierdie soort van oor-time data, longitudinale data. En, natuurlik, longitudinale data is baie belangrik vir die bestudering van verandering. Ten einde betroubaar te meet verandering egter die meting stelsel self moet stabiel wees. In die woorde van sosioloog Otis Dudley Duncan, "as jy wil verandering te meet, moet die maat nie verander nie" (Fischer 2011) .

Ongelukkig het baie groot data stelsels-veral besigheid stelsel wat skep en vang digitale spore-verander al die tyd, 'n proses wat ek drif sal noem. In die besonder, hierdie stelsels verander in drie hoof maniere: bevolking drif (verandering in wat hulle gebruik), gedrags- drif (verandering in die manier waarop mense hulle met behulp van), en stelsel drif (verandering in die stelsel self). Die drie bronne van drif beteken dat 'n patroon in digitale spoor data kan veroorsaak word deur 'n belangrike verandering in die wêreld, of dit kan veroorsaak word deur een of ander vorm van drif.

Die eerste bron van drif-bevolking drif-is wat die gebruik van die stelsel, en dit verander op lang tydskale en kort tydskale. Byvoorbeeld, vanaf 2008 tot die hede die gemiddelde ouderdom van mense op sosiale media het toegeneem. Behalwe vir hierdie langtermyn tendense, die mense met behulp van 'n stelsel op enige oomblik wissel. Byvoorbeeld, tydens die Amerikaanse presidensiële verkiesing van 2012 het die verhouding van tweets oor die politiek wat geskryf is deur vroue gewissel van dag tot dag (Diaz et al. 2016) . So, wat mag voorkom na 'n verandering in die gemoed van die Twitter-vers wees kan eintlik net veranderinge in wat praat op enige oomblik.

Benewens veranderinge in wat met behulp van 'n stelsel, is daar ook veranderinge in hoe die stelsel gebruik word. Byvoorbeeld, tydens die Occupy Gezi Park protes in Istanbul, Turkye in 2013 betogers hul gebruik van hashtags verander as die protes ontwikkel. Hier is hoe Zeynep Tufekci (2014) beskryf die drif, wat sy in staat is om op te spoor omdat sy gedrag waarneem op Twitter en op die grond was:

"Wat gebeur het, was dat sodra die protes het die dominante verhaal, 'n groot aantal mense. . . gestop met behulp van die hashtags behalwe om aandag te vestig op 'n nuwe verskynsel. . .. Terwyl die protes voortgegaan en selfs versterk, die hashtags bedaar. Onderhoude geopenbaar twee redes hiervoor. Eerstens, wanneer almal die onderwerp geweet, die hashtag was in 'n keer oorbodig en verkwistende op die karakter beperk Twitter platform. In die tweede plek was hashtags gesien net so nuttig vir om aandag te trek om 'n spesifieke onderwerp, nie vir om daaroor te praat. "

So, navorsers wat die protes was studeer deur die ontleding van tweets met protes-verwante hashtags sou 'n verwronge sin van wat daar gebeur het as gevolg van hierdie gedragspatrone drif het. Byvoorbeeld, kan hulle glo dat die bespreking van die protes afgeneem lank voordat dit eintlik afgeneem.

Die derde soort drif is stelsel drif. In hierdie geval, is dit nie die mense te verander of hul gedrag verander, maar die stelsel self verander. Byvoorbeeld, met verloop van tyd Facebook het die limiet verhoog op die lengte van status updates. Dus, sal enige longitudinale studie van status updates kwesbaar vir artefakte wat veroorsaak word deur hierdie verandering wees. Stelsel drif is nou verwant aan die probleem genoem algoritmiese confounding waaraan ons nou draai.