2.3.2.4 Driftingo

Gyventojų dreifas, naudojimo dreifas ir sistema dreifas yra sunku naudoti didelį duomenų šaltinį studijuoti ilgalaikes tendencijas.

Vienas iš didžiausių privalumų daugelio didelių duomenų šaltinių yra tai, kad jie renka duomenis per tam tikrą laiką. Socialiniai mokslininkai vadina šį daugiau laiko duomenimis, išilginio pjūvio duomenų natūra. Ir, žinoma, išilginio pjūvio duomenys yra labai svarbūs tiriant pokyčius. Tam, kad patikimai įvertinti pokyčius, tačiau, pati matavimo sistema turi būti stabili. Siekiant sociologas Otis Dudley Duncan tariant, "jei norite išmatuoti pokyčius, nekeičia priemonę" (Fischer 2011) .

Deja, daugelis didelis duomenų sistemas-ypač verslo sistema, kuri sukuria ir fiksuoti skaitmeniniai pėdsakai-keičiasi visą laiką, procesas, kad aš kviesiu dreifo. Visų pirma, šios sistemos keisti trimis pagrindiniais būdais: gyventojų drift (pokytį, kuris juos naudojant), elgesio dreifo (pokytį, kaip žmonės juos naudojant), ir sistemos dreifo (pokytis pati sistema). Trys šaltiniai dreifo reiškia, kad bet koks skaitmeninių pėdsakų duomenų modelis gali būti sukeltas svarbiu pokyčių pasaulyje, arba ji gali būti dėl kai kurių tėkmės forma.

Pirmasis šaltinis dreifo populiacijos dreifo-yra kas naudoja sistemą, ir tai keičia ant LONG-TIME svarstyklės ir trumpas laiko skales. Pavyzdžiui, nuo 2008 iki pristatys vidutinis amžius žmonėms, socialinės žiniasklaidos išaugo. Be šių ilgalaikes tendencijas, žmonės naudoja sistemą, bet kuriuo metu skiriasi. Pavyzdžiui, per JAV prezidento rinkimus 2012 m tweets dalis apie politiką, kad buvo parašyta moterų svyravo diena iš dienos (Diaz et al. 2016) . Taigi, kas gali atrodyti kaip Atsižvelgiant į Twitter eilėraščio nuotaikos kaita iš tiesų gali būti tik pokyčiai, kuris kalba, bet kuriuo metu.

Be to į pokyčius, kurie naudoja sistemą, yra taip pat keičia į tai, kaip sistema yra naudojamas. Pavyzdžiui, per Occupy Gezi parkas protestus, esantys Stambulas, Turkija 2013 protestuotojai pakeitė savo išnaudoti hashtags kaip protestas pasikeitė. Štai kaip Zeynep Tufekci (2014) apibūdino dreifo, kurią ji galėjo aptikti, nes ji stebėjo elgesį Twitter ir ant žemės:

"Kas nutiko buvo, kad kuo greičiau protesto tapo dominuojančia istorija, daug žmonių. , , sustojo naudojant Žymas išskyrus atkreipti dėmesį į naują reiškinį. , .. Nors ir toliau protestai, ir net sustiprėjo, kad žymos su grotelėmis nurimo. Interviu atskleidė dvi priežastis. Pirma, kai visi žinojo temą, hashtag buvo vienu metu nereikalinga ir išlaidavimas ant simbolių ribotos Twitter platformoje. Antra, žymos su grotelėmis buvo žiūrima tik kaip naudinga pritraukti dėmesį į tam tikrą temą, o ne kalbėti apie tai. "

Taigi, mokslininkai, kurie mokeisi protestus analizuojant tweets su protesto susijusių hashtags darytų iškreiptą prasmę, kas vyksta, nes šios elgsenos dreifo. Pavyzdžiui, jie gali manyti, kad protesto aptarimas ilgai sumažėjo, kol ji faktiškai sumažėjo.

Trečiasis rūšies dreifo yra sistema dreifo. Šiuo atveju, ji yra ne žmonės keisti ar jų elgsenos keitimo, bet pati sistema keičiasi. Pavyzdžiui, laikui bėgant "Facebook" padidino ribą dėl statuso atnaujinimus ilgio. Taigi, nors išilginis tyrimas būsenos atnaujinimus bus pažeidžiami artefaktų sukelia šio pakeitimo. Sistemos dreifas yra glaudžiai susijęs su liga, vadinama algoritminės kebli, į kuriuos mes dabar kreiptis.