2.3.2.4 reki

Mannfjöldi svíf, notkun svíf, og kerfið svíf gera það erfitt að nota stór gögn fengið að læra langtíma þróun.

Einn af the mikill kostur af mörgum stórum heimildum gögn eru þeir að safna gögnum með tímanum. Félagsleg vísindamenn kalla þessa tegund af yfir-tími gögn, langsniðsgögnum. Og, að sjálfsögðu, eru langsniðsgögn mjög mikilvæg fyrir nám breytingu. Til þess að áreiðanlegum mæla breytingar, Hins vegar getur mæling kerfið sjálft verður að vera stöðug. Í orðum félagsfræðingur Otis Dudley Duncan, "ef þú vilt mæla breytingar, ekki breyta ráðstöfun" (Fischer 2011) .

Því miður, margir stór gögn kerfi, sérstaklega viðskipti kerfi sem skapa og fanga stafrænar ummerki-eru að breytast allan tímann, en það ferli sem ég kalla svíf. Einkum þessi kerfi breytast á þrjá mismunandi vegu: Íbúum Drift (breyting á hver er að nota þær), hegðunar Drift (breyting á því hvernig fólk er að nota þær), og kerfið svíf (breyting á kerfinu sjálfu). Þrír uppsprettur svíf meina að allir mynstur í stafrænum gögnum snefilefni gæti stafað af mikilvæga breytingu í heiminum, eða það gæti stafað af einhvers konar svíf.

Fyrsti uppspretta svíf-íbúa svíf-er hver er að nota kerfið, og þetta breytist á lengri tíma baðvogir og skemmri tíma baðvogir. Til dæmis, frá 2008 til kynna að meðalaldur fólks á félagslega fjölmiðla hefur aukist. Í viðbót við þessar langtímastefnu, fólk með því að nota kerfið hvenær breytilegt. Til dæmis, á meðan US Forsetakosningar 2012 var hlutfall kvak um stjórnmál sem voru skrifaðar af konum sveiflast frá degi til dags (Diaz et al. 2016) . Svona, það gæti virst vera breyting á skapi Twitter-vers gæti reyndar bara verið breytingar í sem er að tala á hvaða augnabliki.

Auk breytinga á hver er að nota kerfi, það eru líka breytingar á því hvernig kerfið er notað. Til dæmis, á Hernema Gezi Park mótmæli í Istanbul, Tyrkland í 2013 mótmælendur breytt notkun þeirra hashtags sem mótmæli þróast. Hér er hvernig Zeynep Tufekci (2014) lýsti svíf, sem hún var fær til uppgötva vegna þess að hún var að fylgjast með hegðun á Twitter og á jörðu:

"Hvað hefði gerst var að um leið og mótmæli urðu ríkjandi sagan, mikill fjöldi fólks. . . hætt að nota hashtags nema til að vekja athygli á nýju fyrirbæri. . .. Þó mótmæli áfram, og jafnvel magnast, Myllumerki dó niður. Viðtöl ljós tvær ástæður fyrir þessu. Fyrst, þegar allir vissu efni, hashtag var í einu óþarfur og eyðslusamur á eðli-takmarkaður Twitter vettvang. Í öðru lagi, Myllumerki sáust aðeins eins gagnlegt að laða athygli á ákveðnu efni, ekki til að tala um það. "

Þannig vísindamenn sem voru að læra mótmæli því að greina kvak með mótmælum tengdum hashtags hefði brenglast tilfinningu fyrir því hvað var að gerast vegna þessa hegðunarvanda svíf. Til dæmis, gætu þeir telja að umfjöllun um mótmæli minnkaði löngu áður en það minnkaði í raun.

Þriðja konar svíf er kerfi svíf. Í þessu tilfelli, er það ekki fólk að breyta eða hegðun breytast þeirra, en kerfið sjálft breytast. Til dæmis, með tímanum Facebook hefur aukið takmörk á lengd endurnýja stöðu. Þannig, allir langtímarannsókn af stöðu uppfærslur verða viðkvæmt artifacts völdum þessa breytingu. System svíf er nátengd sem nefnist lausnarleiðar truflandi sem við snúum.