Размеркаваны збор дадзеных магчымы, і ў будучыні, хутчэй за ўсё , звязаныя з тэхналогіяй і пасіўны ўдзел.
Як паказвае eBird, размеркаваных па зборы дадзеных могуць быць выкарыстаны для навуковых даследаванняў. Акрамя таго, PhotoCity паказвае, што праблемы, звязаныя з адборам спроб і якасці дадзеных з'яўляюцца патэнцыйна вырашальныя.
Як можа размяркоўвацца па зборы дадзеных для працы сацыяльных даследаванняў? Выдатны прыклад з працы Сьюзан Уоткінс і яе калегі па праекце Малаві Журналы (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . У гэтым праекце, 22 мясцовыя жыхары званыя "журналісты" -kept "гутарковых часопісаў", якія запісаныя, у дэталях, размовы яны падслуханыя пра СНІД у паўсядзённым жыцці простых людзей (у момант пачатку праекта, каля 15% дарослага насельніцтва ў Малаві былі інфіцыраваны ВІЧ (Bello, Chipeta, and Aberle-Grasse 2006) ). З-за іх статусу інсайдэрскай, гэтыя журналісты змаглі падслухаць размовы, якія, магчыма, былі недаступныя для Сьюзан Уоткінс і яе заходніх навуковых супрацоўнікаў (я буду абмяркоўваць этыку пазней у гэтым раздзеле, калі я прапаную парады аб распрацоўцы ўласнага праекта масавага супрацоўніцтва ). Дадзеныя з праекту Малаві Журналы прывяло да шэрагу важных высноў. Напрыклад, да пачатку праекта, многія аўтсайдэры лічылі, што там было маўчанне пра СНІД у Афрыцы на поўдзень ад Сахары, але часопісы паказалі, што гэта відавочна не той выпадак: журналісты падслухалі сотні размоў на гэтую тэму, у тых месцах, гэтак жа разнастайныя, як пахаванне , бараў і цэркваў. Акрамя таго, характар гэтых гутарак дапамаглі даследчыкам лепш зразумець некаторыя з ўстойлівасці да выкарыстання прэзерватываў; так што выкарыстанне прэзерватываў падставілі ў паведамленнях грамадскага аховы здароўя не ўзгадняецца з тым, як гэта абмяркоўвалася ў паўсядзённым жыцці (Tavory and Swidler 2009) .
Вядома, як і дадзеныя з eBird, дадзеныя з праекту Малаві Журналы не з'яўляецца дасканалым, пытанне падрабязна абмяркоўваецца ў Watkins і яго калегі. Так, напрыклад, запісаныя гутаркі не з'яўляюцца выпадковай выбаркай з усіх магчымых размоў. Хутчэй за ўсё, яны з'яўляюцца няпоўнымі перапіс размоў пра СНІД. З пункту гледжання якасці дадзеных, даследчыкі лічаць, што іх журналісты былі высакаякасныя журналісты, пра што сведчыць ўзгодненасць у часопісах і па часопісах. Акрамя таго, калі дастатковую колькасць журналістаў размешчаны ў досыць малой налады і справаздачы сканцэнтраваны на канкрэтнай тэме, надмернасць стала магчымым, што павышае давер да якасці дадзеных. Напрыклад, работнік сэкс - бізнэсу пад назвай "Stella" паказаў некалькі разоў у часопісах чатырох розных журналістаў (Watkins and Swidler 2009) . Як гэта было ў PhotoCity, выкарыстанне надмернасці з'яўляецца важным прынцыпам для ацэнкі і забеспячэння якасці дадзеных у размеркаваных праектах па зборы дадзеных. Для таго, каб у далейшым будаваць сваю інтуіцыю, Табліца 5.3 паказвае іншыя прыклады размеркаванай збору дадзеных для сацыяльных даследаванняў.
Дадзеныя, сабраныя | цытаванне |
---|---|
Дыскусіі аб ВІЧ / СНІД у Малаві | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Кленчанне ў Лондане | Purdam (2014) |
Падзеі Канфлікт ва Усходнім Конга | Windt and Humphreys (2016) |
Эканамічная актыўнасць у Нігерыі і Лібэрыі | Blumenstock, Keleher, and Reisinger (2016) |
эпіднагляду за грыпам | Noort et al. (2015) |
Усе прыклады, апісаныя ў гэтым раздзеле прыцягнулі актыўны ўдзел: журналісты расшыфраваныя размовы, што яны пачутыя; лаўцы птушак загрузіў свае бирдинг кантрольныя спісы; ці гульцы могуць загружаць свае фатаграфіі. Але што, калі ўдзел было аўтаматычным і не патрабуе якіх-небудзь канкрэтных навыкаў або часу, каб прадставіць? Гэта абяцанне , прапанаваных " з удзелам зандзіравання" ці "чалавек-арыентаваных зандзіравання." Напрыклад, выбоіна Patrol, праект навукоўцамі ў MIT, устаноўлены GPS - абсталяваныя акселерометры ўнутры сямі таксі ў раёне Бостана (Eriksson et al. 2008) і (Eriksson et al. 2008) . З-за ваджэння над выбоіны пакідае выразны сігнал акселерометра, гэтыя прылады, пры размяшчэнні ўнутры рухаюцца таксі, могуць ствараць выбоіну карты Бостана. Вядома, таксі не выпадкова выбаркі дарогі, але, улічваючы дастатковую колькасць таксі, можа быць дастаткова пакрыцця, каб даць інфармацыю аб вялікіх участках яны горада. Другое перавага пасіўных сістэм, якія належаць на тэхналогіі заключаецца ў тым, што яны дэ-уменне працэс ўнесці свой уклад дадзеных: у той час як яна патрабуе навыку ўнесці свой уклад у eBird (таму што вам трэба, каб мець магчымасць надзейна ідэнтыфікаваць віды птушак), ён не патрабуе ніякіх спецыяльных навыкаў для ўнесці свой уклад у выбоіну Patrol.
Забягаючы наперад, я падазраю, што многія калекцыі размеркаваных дадзеных праектаў пачнуць выкарыстоўваць магчымасці мабільных тэлефонаў, якія ўжо вядуцца мільярды людзей па ўсім свеце. Гэтыя тэлефоны ўжо маюць вялікую колькасць датчыкаў, важных для вымярэння, такіх як мікрафоны, камеры, GPS-прылады, і гадзіны. Акрамя таго, гэтыя мабільныя тэлефоны падтрымліваюць іншыя прыкладанні, якія дазваляюць даследчыкам некаторы кантроль над базавымі пратаколамі збору дадзеных. Нарэшце, гэтыя тэлефоны маюць Інтэрнэт-злучэнні, што робіць магчымым для іх, каб разгрузіць дадзеныя, якія яны збіраюць. Існуюць шматлікія тэхнічныя праблемы ад недакладных датчыкаў да абмежаванага часу аўтаномнай працы, але гэтыя праблемы, хутчэй за ўсё, памяншацца з цягам часу па меры развіцця тэхналогіі. Пытанні, звязаныя з асабістым жыцці і этыкі, з другога боку, маглі б атрымаць больш складаным па меры развіцця тэхналогіі; Я вярнуся да пытанняў этыкі, калі я прапаную парады аб распрацоўцы ўласных супрацоўніцтва мас.
У размеркаваных праектах па зборы дадзеных, валанцёры прадастаўляюць дадзеныя аб свеце. Такі падыход ужо паспяхова выкарыстоўваецца, і будучага выкарыстання, верагодна, прыйдзецца звярнуцца выбаркі і якасці дадзеных праблем. На шчасце, існуючыя праекты, такія як PhotoCity і выбоіну Patrol прапанаваць шляхі вырашэння гэтых праблем. Паколькі ўсё больш праектаў скарыстацца перавагамі тэхналогіі, якая дазваляе дэ-кваліфікаваных і пасіўны ўдзел, размеркаваных па зборы дадзеных праектаў павінны рэзка павялічыць у маштабе, што дазваляе даследчыкам збіраць дадзеныя, якія былі проста пакінуць межы ў мінулым.