2.3.2.4 Drifting

Drift Popullsia, përdorimi drift, dhe sistemi drift bëjnë të vështirë të përdorin burime të mëdha të të dhënave për të studiuar prirjet afatgjata.

Një nga avantazhet e madhe e shumë burime të mëdha të të dhënave janë që ata të mbledhur të dhëna me kalimin e kohës. Sociologët e quajnë këtë lloj të gjatë-kohë dhënave, të dhënat e gjatësisë. Dhe, natyrisht, të dhënat e gjatësisë janë shumë të rëndësishme për të studiuar ndryshimin. Në mënyrë të besueshme të matur ndryshimet, megjithatë, sistemi i matjes në vetvete duhet të jetë e qëndrueshme. Në fjalët e sociologut Otis Dudley Duncan, "në qoftë se ju doni për të matur ndryshimin, nuk do të ndryshojë masën" (Fischer 2011) .

Për fat të keq, shumë të dhënave e madhe sisteme-sidomos të sistemit të biznesit që krijojnë dhe të kapur gjurmët-po dixhitale ndryshon gjatë gjithë kohës, një proces që unë do të thërrasë drift. Në veçanti, këto sisteme të ndryshojë në tre mënyra kryesore: drift popullsisë (ndryshim në të cilët është duke i përdorur ato), domethënie të sjelljes (ndryshim në mënyrën se si njerëzit janë duke përdorur ato), dhe e sistemit drift (ndryshimi në vetë sistemit). Tre burimet e domethënie të thotë se çdo model në të dhënat gjurmë dixhitale mund të jetë shkaktuar nga një ndryshim të rëndësishëm në botë, ose ajo mund të jetë shkaktuar nga një formë e domethënie.

Burimi i parë i drift-popullatës drift-i i cili është duke përdorur sistemin, dhe kjo ndryshon në peshore të gjata në kohë dhe peshore në kohë të shkurtër. Për shembull, nga viti 2008 për të paraqitur mosha mesatare e njerëzve në mediat sociale është rritur. Përveç këtyre tendencave afatgjata, njerëzit duke përdorur një sistem në çdo moment ndryshon. Për shembull, gjatë zgjedhjeve presidenciale amerikane të vitit 2012 përqindja e tweets për politikë që janë shkruar nga gratë luhatur nga dita në ditë (Diaz et al. 2016) . Kështu, ajo që mund të duket të jetë një ndryshim në disponimin e Twitter-varg mund të vërtetë vetëm të ketë ndryshime në të cilët është folur në çdo moment.

Përveç ndryshimeve në i cili është duke përdorur një sistem, ka edhe ndryshime në mënyrën se si përdoret sistemi. Për shembull, gjatë pushtojnë protesta Gezi Park në Stamboll, Turqi në 2013 Protestuesit ndryshuar përdorimin e hashtags si protesta evoluar. Ja se si Zeynep Tufekci (2014) e përshkroi domethënie, të cilën ajo ishte në gjendje për të zbuluar për shkak se ajo ishte duke vëzhguar sjelljen në Twitter dhe në terren:

"Ajo që kishte ndodhur ishte se sa më shpejt që të protestës u bë historia dominant, numër i madh njerëzish. . . u ndal duke përdorur hashtags, përveç për të tërhequr vëmendjen për një fenomen të ri. . .. Ndërsa protestat e vazhdueshme, dhe madje intensifikuar, të hashtags vdekur poshtë. Intervistat zbuloi dy arsye për këtë. Së pari, pasi të gjithë e dinin temën, hashtag ishte në të njëjtën kohë e tepërt dhe të kota në karakter të kufizuar platformën Twitter. Së dyti, hashtags janë parë vetëm si të dobishme për të tërhequr vëmendjen për një temë të veçantë, jo për të folur në lidhje me të. "

Kështu, studiuesit të cilët janë duke studiuar protestat duke analizuar tweets me hashtags protestës të lidhura do të ketë një kuptim të shtrembëruar të asaj që po ndodhte për shkak të kësaj domethënie të sjelljes. Për shembull, ata mund të besojnë se diskutimi i protestës ka rënë shumë kohë para se ai në fakt është ulur.

Lloji i tretë i drift është sistemi domethënie. Në këtë rast, nuk është populli ndryshuar ose ndryshimin e tyre sjellje, por vetë sistemi i ndryshuar. Për shembull, me kalimin e kohës Facebook ka rritur kufirin nga gjatësia e të rejat e statusit. Kështu, çdo studim gjatësore të rejat e statusit do të jenë të prekshme për objekte të shkaktuara nga ky ndryshim. drift sistem është i lidhur ngushtë me problemin e quajtur ngatërruar algorithmic për të cilën ne tani kthehet.