2.3.2.4 Drifting

Drift populácie, drift využitie a systém drift, aby bolo ťažké používať veľký zdroj dát pre štúdium dlhodobých trendov.

Jednou z veľkých výhod mnohých veľkých zdrojov dát je, že zber údajov v priebehu času. Sociálna vedci nazývajú tento druh nad aktuálnymi dátami, pozdĺžnych dát. A, samozrejme, pozdĺžne údaje sú pre štúdium zmien veľmi dôležité. Aby bolo možné spoľahlivo merať zmeny však merací systém sám o sebe musí byť stabilná. Slovami sociológa Otis Dudley Duncan, "Ak chcete merať zmeny, nemeňte opatrenia" (Fischer 2011) .

Bohužiaľ, mnoho veľké dátové systémy-najmä obchodný systém, ktorý vytvára a zachytiť digitálne stopy-mení po celú dobu, čo je proces, ktorý Zavolám drift. Najmä tieto systémy zmeniť tromi hlavnými spôsobmi: populácia drift (zmena kto je ich použitie), správanie drift (zmena v spôsobe, akým ľudia ich používajú) a systém drift (zmena v samotnom systéme). Tieto tri zdroje unášanie znamená, že akýkoľvek vzor digitálne dáta trasovanie môže byť spôsobené významnú zmenu vo svete, alebo to môže byť spôsobené nejakou formou postrekov.

Prvým zdrojom drift populáciu drift-sa, kto používa systém, a to sa zmení na dlhoročný váhy a krátkodobé váhy. Napríklad od roku 2008 prezentovať sa priemerný vek ľudí na sociálnych médií sa zvýšila. Okrem týchto dlhodobých trendov, ľudia používajúci systém v každom okamihu mení. Napríklad v amerických prezidentských voľbách roku 2012 bol podiel tweetov o politike, ktorá bola napísaná ženy kolísal zo dňa na deň (Diaz et al. 2016) . To, čo sa môže zdať byť zmenu v nálade na Twitter verši v skutočnosti môže byť len zmeny, ktorá sa hovorí v každom okamihu.

Okrem zmien vo ktorý používa systém, tam sú tiež zmeny v tom, ako je systém používaný. Napríklad počas Occupy gezi Park protesty v Istanbule v Turecku v roku 2013 demonštrantov zmenil ich použitie hashtags ako protest vyvinul. Tu je návod, ako Zeynep Tufekci (2014) opísal drift, ktorý ona bola schopná rozpoznať, pretože ona bola pozorovanie správania na Twitteri a na zemi:

"To, čo sa stalo, bolo, že akonáhle protest sa stal dominantnou príbeh, veľké množstvo ľudí. , , prestala používať hashtag s výnimkou upozorniť na nový fenomén. , .. Kým protesty pokračovali, a dokonca zosilnel, že hashtag utíchol. Rozhovory odhalili dva dôvody. Po prvé, akonáhle všetci vedeli téma sa hashtag bol zrazu zbytočné a nehospodárne na charaktere obmedzené Twitter platformu. Po druhé, hashtag sa pozorovali iba ako užitočný pre prilákanie pozornosti na konkrétnu tému, nie o tom hovoriť. "

Preto vedci, ktorí študovali protesty analýzou tweety protest v súvislosti s hashtags bude mať skreslené zmysel toho, čo sa deje, pretože toto správanie driftu. Napríklad verí, že diskusia o proteste dlho znížil pred tým, než v skutočnosti znížil.

Tretí druh driftu je systém drift. V tomto prípade to nie sú ľudia meniace alebo ich zmenu správania, ale samotný systém mení. Napríklad, v priebehu času Facebook zvýšila limit dĺžky aktualizácie stavu. Preto každá dlhodobá štúdia o zmenách stavu bude náchylné k artefaktov spôsobených touto zmenou. Systém drift úzko súvisí s problémom s názvom algoritmické mätúce, ku ktorému sa teraz zameriame.