2.3.1.2 Заўсёды-на

Заўсёды-на вялікіх дадзеных дазваляе вывучаць нечаканых падзей і вымярэнняў ў рэжыме рэальнага часу.

Многія буйныя інфармацыйныя сістэмы заўсёды-на; яны ўвесь час збірае дадзеныя. Гэта заўсёды на характарыстыка забяспечвае даследчыкам падоўжных дадзеных (г.зн. дадзеных з цягам часу). Які заўсёды на два важных наступствы для даследаванняў.

Па-першае, заўсёды на зборы дадзеных дазваляе даследчыкам вывучаць нечаканыя падзеі спосабамі, якія не былі магчымыя раней. Напрыклад, даследчыкі, зацікаўленыя ў вывучэнні Займайце Gezi пратэсты ў Турцыі летам 2013 года, як правіла, сканцэнтраваны на паводзінах пратэстуючых падчас мерапрыемства. Серэну Будак і Дункан Ўотс (2015) былі ў стане зрабіць больш, выкарыстоўваючы заўсёды на прыроду Twitter , каб , перш чым вывучаць Twitter-выкарыстоўваючы пратэстуючых, падчас і пасля мерапрыемства. І яны былі ў стане стварыць групу параўнання асоб, якія не з'яўляюцца ўдзельнікамі (або удзельнікаў, якія не цвіркалі пра пратэст) да, падчас і пасля мерапрыемства (Малюнак 2.1). У агульнай складанасці іх постфактум групы ўваходзілі твіты 30000 чалавек у працягу двух гадоў. Шляхам павелічэння часта выкарыстоўваюцца дадзеныя ад пратэстаў з гэтай іншай інфармацыі, Будак і Ўотс змаглі даведацца значна больш: яны былі ў стане ацаніць, якія людзі былі больш схільныя да ўдзелу ў Gezi пратэстаў і ацаніць змены ў адносінах ўдзельнікі і якія не з'яўляюцца ўдзельнікамі, як у кароткатэрміновай перспектыве (параўноўваючы папярэдне Gezi на працягу Gezi) і ў доўгатэрміновай перспектыве (параўноўваючы пре-Gezi пост-Gezi).

Малюнак 2.1: Канструкцыя выкарыстоўваецца Будак і Ўотс (2015) для вывучэння Займайце Gezi пратэсты ў Турцыі улетку 2013 г. Выкарыстоўваючы заўсёды на прыроду Twitter, даследчыкі стварылі тое, што яны называюць постфактум панэль, якая ўключала каля 30000 чалавек на працягу двух гадоў. У адрозненне ад тыповага даследаванні, якое засяроджана на ўдзельнікаў падчас пратэстаў, экс-пост панэль дадае 1) дадзеныя ад удзельнікаў да і пасля падзеі і 2) дадзеныя, якія не з'яўляюцца ўдзельнікамі да, падчас і пасля мерапрыемства. Гэтая узбагачаная структура дадзеных дазволіла Будак і ват, каб ацаніць, якія людзі былі больш схільныя да ўдзелу ў Gezi пратэстаў і ацаніць змены ў дачыненні да ўдзельнікаў і няўдзельнікам, як у кароткатэрміновай перспектыве (параўноўваючы папярэдне Gezi на працягу Gezi) і ў доўгатэрміновай перспектыве (параўноўваючы папярэдне Gezi пост-Gezi).

Малюнак 2.1: Канструкцыя выкарыстоўваецца Budak and Watts (2015) для вывучэння Займайце Gezi пратэсты ў Турцыі улетку 2013 г. Выкарыстоўваючы заўсёды на прыроду Twitter, даследчыкі стварылі тое , што яны называюць постфактум панэль , якая ўключала каля 30000 чалавек на працягу двух гадоў. У адрозненне ад тыповага даследаванні, якое засяроджана на ўдзельнікаў падчас пратэстаў, экс-пост панэль дадае 1) дадзеныя ад удзельнікаў да і пасля падзеі і 2) дадзеныя, якія не з'яўляюцца ўдзельнікамі да, падчас і пасля мерапрыемства. Гэтая узбагачаная структура дадзеных дазволіла Будак і ват, каб ацаніць, якія людзі былі больш схільныя да ўдзелу ў Gezi пратэстаў і ацаніць змены ў дачыненні да ўдзельнікаў і няўдзельнікам, як у кароткатэрміновай перспектыве (параўноўваючы папярэдне Gezi на працягу Gezi) і ў доўгатэрміновай перспектыве (параўноўваючы папярэдне Gezi пост-Gezi).

Гэта праўда, што некаторыя з гэтых ацэнак маглі б быць зробленыя без заўсёды на крыніцы збору дадзеных (напрыклад, доўгатэрміновыя ацэнкі змены адносіны), хоць збор такіх дадзеных для 30000 чалавек былі б даволі дорага. І, нават улічваючы неабмежаваны бюджэт, я не магу думаць аб якой - небудзь іншы метад , які па сутнасці дазваляе даследчыкам падарожнічаць назад у часе і непасрэдна назіраць за паводзінамі удзельнікаў у мінулым. Бліжэйшай альтэрнатывай будзе збіраць рэтраспектыўныя справаздачы аб паводзінах, аднак гэтыя справаздачы будуць мець абмежаваную зярністасці і сумнеўнай дакладнасці. У табліцы 2.1 прадстаўлены іншыя прыклады даследаванняў, якія выкарыстоўваюць заўсёды на крыніцы дадзеных для вывучэння нечаканае падзея.

Табліца 2.1: Даследаванні з выкарыстаннем нечаканых падзей заўсёды на вялікіх крыніц дадзеных.
нечаканае падзея Заўсёды-на зыходных дадзеных цытаванне
Займайце рух Gezi ў Турцыі шчабятаць Budak and Watts (2015)
Парасон пратэсты ў Ганконгу Weibo Zhang (2016)
Здымкі паліцыі ў Нью-Ёрку Стоп-і-FRISK справаздачы Legewie (2016)
які ўступае ISIS шчабятаць Magdy, Darwish, and Weber (2016)
11 верасня 2001 напад livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 верасня 2001 напад пэйджара паведамлення Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

Па-другое, заўсёды на зборы дадзеных дазваляе даследчыкам вырабляць вымярэння ў рэальным часе, што можа быць важна ва ўмовах, калі палітыкі хочуць не толькі вучыцца ў існуючага паводзінаў, але і адкажа на яго. Напрыклад, дадзеныя сацыяльныя медыя могуць быць выкарыстаны для накіравання рэагавання на стыхійныя бедствы (Castillo 2016) .

У заключэнне, заўсёды на дадзеныя сістэмы дазваляюць даследчыкам вывучаць нечаканыя падзеі і прадастаўляць інфармацыю ў рэальным часе для асоб, якія вызначаюць палітыку. Я, аднак, не мяркуюць, што, што заўсёды на дадзеныя сістэмы дазваляюць даследчыкам адсочваць змены на працягу працяглых перыядаў часу. Гэта адбываецца таму , што многія буйныя інфармацыйныя сістэмы пастаянна мяняюцца-працэсу , званага дрэйфам (раздел 2.3.2.4).