2.3.2.4 Drifting

Iedzīvotāju drift, izmantošana drift, un sistēma dreifs padara to grūti izmantot lielu datu avotu, lai pētītu ilgtermiņa tendences.

Viena no lielas priekšrocības daudziem lieliem datu avotiem, ir, ka viņi vāc datus laika gaitā. Sociālie zinātnieki sauc šāda veida pār laiku datiem garenām dati. Un, protams, gareniskā dati ir ļoti svarīgi, lai mācās izmaiņas. Lai droši novērtētu pārmaiņas, tomēr mērījums sistēma pati par sevi ir jābūt stabilai. Vārdiem sociologs Otis Dudley Duncan ", ja jūs vēlaties, lai izmērītu izmaiņas, nemaina pasākumu" (Fischer 2011) .

Diemžēl, daudzi lielie dati sistēmas-it īpaši biznesa sistēma, kas rada un uztveršanas digitālās pēdas-mainās visu laiku, process, es saukšu drift. Jo īpaši šīs sistēmas nomainīt trīs galvenajos veidos: iedzīvotāju drifta (izmaiņas, kas tos izmanto), uzvedības novirzes (izmaiņas, kā cilvēki tos izmanto), un sistēmu drift (pārmaiņas pašā sistēmā). Trīs avoti drifta nozīmē, ka jebkurš modelis digitālās izsekot datiem varētu radīt nozīmīgu izmaiņas pasaulē, vai tas varētu būt izraisījusi kāda veida drift.

Pirmais avots drifta iedzīvotāju drift-ir, kas izmanto šo sistēmu, un tas mainās uz ilgu laiku svari un īsā laika skalas. Piemēram, no 2008. līdz klāt vidējais vecums cilvēku sociālajos medijos ir palielinājies. Papildus šiem ilgtermiņa tendencēm, cilvēki, kas izmanto sistēmu, jebkurā brīdī mainās. Piemēram, ASV prezidenta vēlēšanām 2012. gadā īpatsvars tweets par politiku, kas tika rakstīti sievietes svārstījās no dienas dienā (Diaz et al. 2016) . Tātad, kas varētu izrādīties izmaiņas noskaņojumu no Twitter-dzejolis tiešām var vienkārši būt izmaiņas, kas runā jebkurā brīdī.

Papildus pārmaiņām, kas izmanto sistēmu, ir arī izmaiņas, kā tiek izmantota sistēma. Piemēram, laikā Aizņem Gezi parks protestus Istanbul, Turcija 2013 protestētāji mainījušas savu izmantošanu hashtags kā protests attīstījusies. Lūk, kā Zeynep Tufekci (2014) aprakstīja drift, kas viņai varēja atklāt, jo viņa bija novērot uzvedību par čivināt, un uz zemes:

"Kas bija noticis, bija, ka, tiklīdz protesta kļuva par dominējošo stāsts, liels skaits cilvēku. . . pārtrauca izmantojot atsauču izņemot vērst uzmanību uz jaunu parādību. . .. Kamēr protesti turpinājās, un pat pastiprinājās, tad Atsauces, miris uz leju. Intervijas atklāja divus iemeslus. Pirmkārt, pēc tam, kad visi zināja tēmu, hashtag bija uzreiz lieks un izšķērdīgi uz rakstzīmju ierobežotu Twitter platformu. Otrkārt, Atsauces, tika uzskatīta tikai par noderīgu, lai piesaistītu uzmanību uz konkrētu tēmu, nevis runāt par to. "

Tātad, zinātnieki, kuri mācās protestus, analizējot tweets ar protesta saistīto hashtags būtu izkropļotu sajūtu par to, kas notiek, jo šo uzvedības drift. Piemēram, viņi varētu domāt, ka diskusija par protesta ilgi samazinājās, pirms tā faktiski samazinājās.

Trešā veida drifta ir sistēma drift. Šajā gadījumā tas nav cilvēki, mainot vai viņu uzvedība mainās, bet sistēma pati mainās. Piemēram, laika gaitā Facebook ir palielinājusi limitu par garumu statusa atjauninājumus. Tādējādi jebkura garenvirzienā pētījums statusa atjauninājumus būs neaizsargāti pret artefaktu, ko izraisa šīs izmaiņas. Sistēmas drift ir cieši saistīta ar problēmu, ko sauc par algoritmiskās sajaukšanas ar kuru mēs tagad savukārt.