2.3.2.4 Дрифтинг

Становништво Дрифт, употреба Дрифт, а систем Дрифт отежавају користити велики извор података за проучавање дугорочних трендова.

Једна од великих предности многих великих извора података су да прикупљају податке током времена. Социолози зову ову врсту претерано времена подацима, лонгитудиналних података. И, наравно, уздужни подаци су веома важни за проучавање промена. У циљу поуздано мерење промене, међутим, систем мерење сама мора бити стабилан. По речима социолога Отис Дудлеи Дунцан, "ако желите да мерити промену, не мењају ту меру" (Fischer 2011) .

На жалост, многи велики Дата Системс-посебно пословни систем који стварају и ухвати дигитални трагови-мењају све време, процес који ћу звати дрифт. Посебно, ови системи мењају на три главна начина: становништво Дрифт (промена у који их користи), понашању Дрифт (промену у томе како се људи их користе), и система дрифт (промена у самом систему). У три извора нанос значи да би сваки образац у дигиталним подацима траговима бити изазван важној промени у свету, или би могао бити изазван неким обликом дрифт.

Први извор дрифт-популације Дрифт-е који користи систем, а то мења на дугогодишњи скале и кратког времена скале. На пример, од 2008. да представи просечна старост људи на друштвеним медијима је повећана. Поред ових дугорочних трендова, људи користе систем у сваком тренутку варира. На пример, током САД председничким изборима 2012. године проценат твеет о политици који су написали жена варирао из дана у дан (Diaz et al. 2016) . Тако, шта могу изгледати промене у расположењу Твиттер-стиха може заправо бити само промена у који се говоре у сваком тренутку.

Поред промјена у који се користи систем, ту су и промене начина на који се користи систем. На пример, током Оццупи Гези Парк протесте у Истанбулу, Турска у 2013 демонстранти су променили употребу Ознаке хеша као протест развијала. Ево како Зеинеп Туфекци (2014) дрифт, који је био у стању да открије јер је посматрањем понашања на Твиттер и на терену:

"Оно што се десило је да чим протеста постала доминантна прича, велики број људи. . . престао користећи ознака хеша осим да скрене пажњу на нове појаве. . .. Док су протести наставили, па чак и интензивира, да хасхтагс смирује. Интервјуи открио два разлога за то. Прво, кад сви знају тему, хештегом је одједном сувишна и расипање на Твиттер платформи карактера ограничен. Друго, хасхтагс су виђени само као користан за привлачење пажње на одређену тему, а не за говоримо о томе. "

Тако, истраживачи који су проучавали протесте анализом твеетс са Хеш-ознаке протеста у вези ће имати искривљену осећај шта се дешава због овог понашања дрифт. На пример, они могу да верујем да је расправа протеста смањио много пре него што заправо смањио.

Трећа врста дрифт је систем дрифт. У овом случају, то нису људи мењају или њихово понашање мења, али сам систем мења. На пример, током времена Фацебоок је повећао лимит на дужини од ажурирања статуса. Стога, свака лонгитудинална студија о новостима о статусу ће бити подложни артефаката изазваних овим променама. Систем дрифт је уско повезан са проблемом који се зове алгоритама збуњујући на које смо сада претворити.