Размеркаваны збор дадзеных можна, і ў будучыні, хутчэй за ўсё , звязаныя з тэхналогіяй і пасіўны ўдзел.
Як паказвае eBird, размеркаваны па зборы дадзеных можа быць выкарыстаны для навуковых даследаванняў. Акрамя таго, PhotoCity паказвае, што праблемы, звязаныя з адборам спроб і якасці дадзеных, з'яўляюцца патэнцыйна адрозныя. Як можа размяркоўвацца праца па зборы дадзеных для сацыяльных даследаванняў? Адным з прыкладаў работы Сьюзан Уоткінс і яе калегі па праекце Малаві Журналы (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . У гэтым праекце, 22 мясцовыя жыхары званыя «журналісты» -kept «гутарковых часопісаў», якія запісаныя, у дэталях, размовы яны пачутыя пра СНІД у паўсядзённым жыцці простых людзей (у момант пачатку праекта, каля 15% дарослых у Малаві былі інфіцыраваны ВІЧ (Bello, Chipeta, and Aberle-Grasse 2006) ). З-за іх інсайдэрскай статус, гэтыя журналісты мелі магчымасць падслухоўваць размовы, якія, магчыма, былі недаступныя для Watkins і яе заходніх навуковых супрацоўнікаў (я буду абмяркоўваць этыку пазней у гэтым раздзеле, калі я прапаную парады аб распрацоўцы ўласнага праекта масавага супрацоўніцтва) , Дадзеныя з праекту Малаві часопісе прывялі да шэрагу важных высноў. Напрыклад, да пачатку праекта, многія аўтсайдэры лічылі, што было маўчанне пра СНІД у Афрыцы на поўдзень ад Сахары, але гутарковыя часопісы паказалі, што гэта відавочна не той выпадак: журналісты падслухалі сотні абмеркаванняў гэтай тэмы, у месцах, гэтак жа разнастайныя, як пахаванне, бары і царквы. Акрамя таго, характар гэтых гутарак дапамог даследчыкам лепш зразумець некаторыя супраціву выкарыстання прэзерватываў; так што выкарыстанне прэзерватываў падставілі ў паведамленнях грамадскага аховы здароўя не ўзгадняецца з тым, як гэта абмяркоўвалася ў паўсядзённым жыцці (Tavory and Swidler 2009) .
Вядома, як і дадзеныя з eBird, дадзеныя з праекту Малаві Журналы не дасканалыя, пытанне падрабязна абмяркоўваецца ў Уоткінс і яго калегамі. Так, напрыклад, запісаныя гутаркі не з'яўляюцца выпадковай выбаркай з усіх магчымых размоў. Хутчэй, яны з'яўляюцца няпоўнымі перапіс размоў пра СНІД. З пункту гледжання якасці дадзеных, даследчыкі мяркуюць, што журналісты, якія іх былі высокай якасці рэпарцёры, пра што сведчыць ўзгодненасць у часопісах і па часопісах. Гэта значыць, таму што дастаткова журналістаў былі размешчаны ў досыць невялікі наладзе і сканцэнтраваны на канкрэтную тэму, можна было выкарыстоўваць надмернасць для ацэнкі і забеспячэння якасці дадзеных. Напрыклад, сэкс - работнік назвалі «Stella» паказаў некалькі раз у часопісах чатырох журналістаў (Watkins and Swidler 2009) . Для таго, каб у далейшым будаваць сваю інтуіцыю, табліца 5.3 паказвае іншыя прыклады размеркаванага збору дадзеных для сацыяльных даследаванняў.
збор дадзеных | спасылка |
---|---|
Дыскусіі аб ВІЧ / СНІД у Малаві | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Кленчанне ў Лондане | Purdam (2014) |
Падзеі Канфлікт ва Усходнім Конга | Windt and Humphreys (2016) |
Эканамічная актыўнасць у Нігерыі і Лібэрыі | Blumenstock, Keleher, and Reisinger (2016) |
нагляд за грыпам | Noort et al. (2015) |
Усе прыклады, апісаныя ў гэтым раздзеле, удзельнічаюць актыўны ўдзел: журналісты расшыфраваныя размовы, што яны чулі; арнітолагаў загрузіў свае бирдинг кантрольныя спісы; ці гульцы могуць загружаць свае фатаграфіі. Але што, калі ўдзел было аўтаматычным і не патрабуе якіх-небудзь канкрэтных навыкаў або часу, каб прадставіць? Гэта абяцанне , прапанаванае « з удзелам зандзіраванні» або «людзі-арыентаванага зандзіраваннем». Напрыклад, выбоіна Patrol, праект навукоўцамі ў MIT, змантаваны GPS-абсталяваныя акселерометры ўнутры сем таксі ў раёне Бостана (Eriksson et al. 2008) і (Eriksson et al. 2008) . Таму што калі прыязджаюць выбоіны пакідае выразны сігнал акселерометра, гэтыя прылады, пры размяшчэнні ўнутры рухаюцца таксі, можна стварыць выбоіну карты Бостана. Вядома, таксі не выпадкова ўзору дарогі, але, улічваючы дастатковую колькасць таксі, могуць быць дастаткова пакрыццём, каб даць інфармацыю аб вялікіх участках яны горад. Другое перавага пасіўных сістэм, якія належаць на тэхналогіі з'яўляецца тое, што яны дэ-уменне працэсу пацверджання дадзеных: у той час як яна патрабуе уменняў спрыяць eBird (таму што вы павінны быць у стане надзейна ідэнтыфікаваць віды птушак), ён не патрабуе ніякіх спецыяльных навыкаў для ўнесці свой уклад у выбоіну Patrol.
Забягаючы наперад, я падазраю, што многія калекцыі размеркаваных дадзеных праектаў будзе пачаць выкарыстоўваць магчымасці мабільных тэлефонаў, якія ўжо перавезеных мільярды людзей па ўсім свеце. Гэтыя тэлефоны ўжо маюць вялікую колькасць датчыкаў, важныя для вымярэння, такіх як мікрафоны, камеры, GPS-прылада, і гадзіны. Акрамя таго, яны падтрымліваюць іншыя прыкладанні, якія дазваляюць даследчыкам некаторы кантроль над ніжэйлеглую пратаколамі збору дадзеных. Нарэшце, у іх ёсць інтэрнэт-злучэнне, што дазваляе ім разгрузіць дадзеныя, якія яны збіраюць. Існуюць шматлікія тэхнічныя праблемы, пачынаючы ад недакладных датчыкаў да абмежаваны тэрмін службы батарэі, але гэтыя праблемы, хутчэй за ўсё, памяншацца з цягам часу па меры развіцця тэхналогіі. Пытанні, якія тычацца прыватнасці і этыкі, з другога боку, маглі б атрымаць больш складаным; Я вярнуся да пытанняў этыкі, калі я прапаную парады аб распрацоўцы ўласнага супрацоўніцтва мас.
У размеркаваных праектах па зборы дадзеных, добраахвотнікі прадастаўляюць дадзеныя аб свеце. Такі падыход ужо паспяхова выкарыстоўваецца, і будучага выкарыстання, верагодна, прыйдзецца звярнуцца выбаркі і якасці дадзеных праблем. На шчасце, існуючыя праекты, такія як PhotoCity і выбоіна Patrol прапанаваць шляхі вырашэння гэтых праблем. Чым больш праектаў скарыстацца перавагамі тэхналогіі, што дазваляе дэ-кваліфікаваных і пасіўны ўдзел, размеркаваных па зборы дадзеных праектаў павінны рэзка павялічыць у маштабе, што дазваляе даследчыкам збіраць дадзеныя, якія былі проста зачыненыя ў мінулым.