2.3.2.4 дрэйфуючых

Дрэйф насельніцтва, дрэйф выкарыстання і дрэйфу сістэма робіць яго цяжка выкарыстоўваць вялікі крыніца дадзеных для вывучэння доўгатэрміновых тэндэнцый.

Адным з вялікіх пераваг многіх буйных крыніц дадзеных, якія яны збіраюць дадзеныя на працягу доўгага часу. Сацыёлагі называюць гэты выгляд больш часу дадзеных, падоўжных дадзеных. І, натуральна, падоўжныя дадзеныя вельмі важныя для вывучэння змен. Для таго, каб надзейна вымяраць змены, тым не менш, сама сістэма вымярэння павінна быць стабільнай. Па словах сацыёлага Otis Дадлі Дункан, "калі вы хочаце вымераць змены, не змяняюць меру" (Fischer 2011) .

На жаль, ва многіх сістэмах, асабліва вялікіх аб'ёмаў дадзеных бізнес - сістэмы , якія ствараюць і захопліваць лічбавыя сляды-мяняюцца ўвесь час, працэс , які я буду называць дрэйфам. У прыватнасці, гэтыя сістэмы змяняюцца па трох асноўных напрамках: дрэйф насельніцтва (змяненне хто іх выкарыстоўвае), паводніцкія дрэйф (змяненне ў тым , як людзі выкарыстоўваюць іх), і дрэйф сістэмы (змяненне самой сістэмы). Тры крыніцы дрэйфу азначае, што любы шаблон ў лічбавых дадзеных трасіроўкі можа быць выклікана важным змяненнем у свеце, ці гэта можа быць выклікана той ці іншай форме дрэйфу.

Першая крыніца дрейфовой насельніцтва дрэйфу ў тым, хто выкарыстоўвае сістэму, і гэта змяняе на доўгатэрміновых часовых маштабах і кароткіх часовых маштабах. Напрыклад, з 2008 па цяперашні час сярэдні ўзрост людзей у сацыяльных медыя павялічыўся. У дадатак да гэтых доўгатэрміновых тэндэнцый, людзі, якія выкарыстоўваюць сістэму ў любы момант часу мяняецца. Напрыклад, падчас выбараў прэзідэнта ЗША 2012 гады дзель твітаў пра палітыку , якія былі напісаныя жанчынамі вагаліся з дня ў дзень (Diaz et al. 2016) і (Diaz et al. 2016) . Такім чынам, тое, што можа здацца, што змяненне ў настроі Twitter-верш фактычна можа быць проста змены, якія кажуць у любы момант.

У дадатак да зменаў у тым, хто выкарыстоўвае сістэму, ёсць таксама змены ў тым, як выкарыстоўваецца сістэма. Напрыклад, падчас Займайце Gezi Парк пратэсты ў Стамбуле, Турцыя ў 2013 годзе дэманстранты змянілі сваё выкарыстанне хэштэг, як пратэст эвалюцыянаваў. Вось як Зейнеп Tufekci (2014) апісаў дрэйф, які яна ў стане выявіць , таму што яна назірала за паводзінамі на Twitter і на зямлі:

"Тое, што здарылася, што як толькі акцыі стала дамінуючай гісторыя, вялікая колькасць людзей. , , спынілі выкарыстанне хештегов за выключэннем таго, каб прыцягнуць увагу да новага з'яве. , .. У той час як пратэсты працягваліся, і нават ўзмацніліся, што Hashtags аціхлі. Інтэрв'ю выявілі дзве прычыны для гэтага. Па-першае, калісьці ўсё ведалі па гэтай тэме, хэштэгу быў адразу ж залішнім і марнатраўна на персанажа абмежаванай платформе Twitter. Па-другое, Hashtags былі заўважаныя толькі карысныя для прыцягнення ўвагі да той ці іншай тэме, а не казаць пра гэта ".

Такім чынам, даследчыкі, якія вывучалі пратэсты, аналізуючы твіты з пратэсту, звязаных з Хештеги будзе мець скажонае адчуванне таго, што адбываецца з-за гэтага паводніцкага дрэйфу. Напрыклад, яны могуць паверыць, што абмеркаванне пратэсту зменшылася задоўга да таго, як на самой справе зменшылася.

Трэці від дрэйфу дрэйф сістэмы. У гэтым выпадку, гэта не людзі, змяненне або іх змяненне паводзін, але сама сістэма змяняецца. Напрыклад, на працягу доўгага часу або Facebook павялічыў ліміт на даўжыні абнаўлення статусу. Такім чынам, любое падоўжнае даследаванне абнаўленняў статусу будуць ўразлівыя для артэфактаў, выкліканых гэтым змяненнем. Дрэйф сістэма цесна звязана з праблемай пад назвай алгарытмічная ўмешваецца, да якога мы зараз пераходзім.