Дистрибутед прикупљање података је могуће, а у будућности ће вероватно укључити технологију и пасивно учешће.
Као еБирд показује, дистрибуирано прикупљање података могу се користити за научна истраживања. Даље, ПхотоЦити показује да проблеми везани за узорковање и квалитет података су потенцијално решиви.
Како би дистрибуиран наплате рад података за социјална истраживања? Диван пример долази из рада Сузан Ваткинс и њених колега на Малави часописима пројекта (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . У оквиру овог пројекта, 22 локални становници тзв "новинаре" -кепт "конверзацијских часописа" да снима, у детаљима, разговори су чули о АИДС-у свакодневном животу обичних људи (у време када је пројекат почео, око 15% одраслих у Малави инфицирано ХИВ-ом (Bello, Chipeta, and Aberle-Grasse 2006) ). Због инсајдерске статуса, ти новинари су били у стању да чули разговоре које су могле бити недоступне Сузан Ваткинс и њених западних истраживања сарадника (Ја ћу разговарати етике касније у поглављу када сам дају савете о дизајнирати своју пројекта маса сарадњу ). Подаци из Малави часописима пројекта је довело до великог броја значајних налаза. На пример, пре почетка пројекта, многи странци верује да је ћутање о АИДС-у подсахарској Африци, али су часописи су показали да то очигледно није случај: новинари чули стотине разговора на тему, на локацијама као разнолик као сахранама , барови, и цркве. Даље, природа тих разговора помогло истраживачима боље разумеју неке од отпора употребе кондома; начин на који је кондом употреба урамљена у јавним здравственим порукама је у супротности са начин на који је било речи у свакодневном животу (Tavory and Swidler 2009) .
Наравно, као и података из еБирд, подаци из Малави часописима пројекта није савршен, проблем расправља детаљно Ваткинс и колеге. На пример, снимљени разговори нису случајни узорак од свих могућих разговора. Уместо тога, они су непотпуни попис из разговора о АИДС-а. У погледу квалитета података, истраживачи верују да су њихови новинари су квалитетни новинари, као што се види на доследност у часописима и преко часописима. Даље, када се довољно новинари распоређени у малом довољно подешавања и извештаји су фокусиране на одређену тему, вишак запослених постало је могуће, што повећава поверење у квалитет података. На пример, сексуална радница под називом "Стела" неколико пута појавио у часописима четири различита новинара (Watkins and Swidler 2009) . Као што је у ПхотоЦити, употреба вишка запослених је важан принцип за процену и осигурање квалитета података у дистрибуираних пројеката прикупљања података. У циљу даље изградње своју интуицију, Табела 5.3 показује друге примјере дистрибуираних прикупљања података за друштвена истраживања.
prikupljeni подаци | цитат |
---|---|
Дискусије о ХИВ / АИДС-а у Малави | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Улица просјачење у Лондону | Purdam (2014) |
Цонфлицт догађаји у источном Конгу | Windt and Humphreys (2016) |
Економска активност у Нигерији и Либерији | Blumenstock, Keleher, and Reisinger (2016) |
грип надзор | Noort et al. (2015) |
Сви примери су описани у овом одељку су укључени активно учешће: новинари преписао разговоре који су чули; Бирдерс уплоадед своје Посматрање птица контролне листе; или играчи уплоадед њихове фотографије. Али шта ако је учешће је аутоматска и не захтева никакву посебну вештину или времена да поднесе? Ово је обећање нуди "партиципативне очитавање" или "Људи оријентисане детекције." На пример, Рупа патрола, пројекат научници на МИТ, монтира ГПС опремљеним убрзања у седам таксија у области Бостона (Eriksson et al. 2008) . Јер вожње преко рупе оставља посебан акцелерометар сигнал, ове уређаје, када је постављен унутар покретних таксија, могу створити рупу мапе Бостона. Наравно, таксисти не случајно узорак путеве, али с обзиром довољно таксија, могу постојати довољно покриће да пружи информације о великим деловима они граду. Друга корист од пасивних система који се ослањају на технологије је да они де-вештина процес доприноси податке: а то захтева вештину да допринесу еБирд (јер треба бити у могућности да поуздано идентификује врста птица), она не захтева посебне вештине у доприносе рупа патролу.
Убудуће, претпостављам да ће пројекти прикупљање многи дистрибуирани подаци почињу да користе могућности мобилних телефона који су већ које милијарде људи широм света. Ови телефони већ имају велики број сензора важних за мерење, као што су микрофони, камере, ГПС уређаје и сатове. Даље, ови мобилни телефони подржавају апликација независних омогућавају истраживачима неку контролу над основних протокола прикупљања података. Коначно, ови телефони имају интернет-везу, омогућавајући им да ван учита податке које прикупљају. Постоје бројни технички проблеми са нетачним сензора ограниченог трајања батерије, али ови проблеми ће вероватно смањити током времена како се технологија развија. Питања која се односе на приватност и етику, с друге стране, може се компликованија развојем технологије; Вратићу се питањима етике када сам дају савете о дизајнирати своју масовну сарадњу.
Дистрибуираних пројеката прикупљања података, волонтери доприносе податке о свету. Овај приступ је већ успешно коришћен, а будући користи ће вероватно морати да се бави узорковања и квалитета података забринутост. Срећом, постоје пројекти као што су ПхотоЦити и рупа Патрол предложе решења за ове проблеме. Што више пројеката искористи технологију која омогућава де-обучених и пасивно учешће, дистрибуира пројекти за прикупљање података би требало да драматично повећати у скали, што омогућава истраживачима за прикупљање података који је једноставно ван граница у прошлости.