Дистрибуирани собирање на податоци е можно, а во иднина најверојатно ќе вклучува технологија и пасивно учество.
Како што покажува eBird, дистрибуирани собирање на податоци може да се користи за научни истражувања. Понатаму, PhotoCity покажува дека проблемите поврзани со земање примероци и квалитетот на податоците се потенцијално решливи.
Како може да дистрибуира работа за собирање на податоци за социјални истражувања? Прекрасно пример доаѓа од работата на Сузан Воткинс и нејзините колеги во списанија проектот Малави (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . Во овој проект, 22 локални жители се нарекува "новинари" -kept "разговорно списанијата" кои забележале, во детали, на разговори што тие го слушнал за СИДА во секојдневниот живот на обичните луѓе (во времето на проектот започна, околу 15% од возрасните во Малави биле заразени со ХИВ (Bello, Chipeta, and Aberle-Grasse 2006) ). Поради нивната инсајдерски статус, овие новинари беа во можност да слушнеме и разговори кои би можеле да се недостапни за Сузан Воткинс и нејзините западни истражување соработници (јас ќе разговараат за етиката на ова подоцна во глава кога ќе нудат совети за дизајнирање свој проект маса соработка ). Податоците од проектот Малави списанија доведе до голем број на важни наоди. На пример, пред проектот започна, многу аутсајдери верува дека имаше молк за СИДА во суб-сахарска Африка, но списанија покажа дека ова беше јасно не е случај: новинарите слушнал стотици разговор на оваа тема, во локации како што се различни како погреби , барови и цркви. Понатаму, природата на овие разговори помогна истражувачи подобро да се разбере некои од отпорот на употребата на кондоми; начинот на кој кондом употреба е врамена со пораки за јавно здравје е во спротивност со начинот на кој се дискутираше во секојдневниот живот (Tavory and Swidler 2009) .
Се разбира, како и податоците од eBird, податоците од Списанија проектот Малави не е совршен, на прашањето кое се дискутира во детали од Воткинс и колеги. На пример, снимените разговори не се на случаен примерок од сите можни разговори. Напротив, тие се нецелосен попис на разговори во врска со СИДА. Во однос на квалитетот на податоците, истражувачите веруваат дека нивните новинари беа со висок квалитет за новинарите, како што беше потврдено од страна на конзистентност во рамките на списанија и во списанија. Понатаму, кога доволно новинари се распоредени во доволно мал за поставување и извештаи се фокусира на одредена тема, технолошки вишок, стана можно, со што се зголемува довербата во квалитетот на податоците. На пример, сексуалните работници наречен "Стела" се појави неколку пати во списанија на четири различни новинари (Watkins and Swidler 2009) . Како што беше во PhotoCity, употребата на вишок е важен принцип за оценување и да се обезбеди квалитетот на податоците во дистрибуирани проекти за собирање на податоци. Со цел дополнително да се изгради на вашата интуиција, Табела 5.3 покажува други примери на дистрибуирани собирање на податоци за социјални истражувања.
собраните податоци | цитат |
---|---|
Дискусии за ХИВ / СИДА во Малави | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Улица молат во Лондон | Purdam (2014) |
Конфликт настани во источниот дел на Конго | Windt and Humphreys (2016) |
Економската активност во Нигерија и Либерија | Blumenstock, Keleher, and Reisinger (2016) |
надзор грип | Noort et al. (2015) |
Сите примери опишани во овој дел се вклучени активно учество: новинарите се транскрибира разговори, кои го чуја; birders поставени нивните birding листи; или играчи поставени нивните фотографии. Но, што ако учеството е автоматски и не бара никакви посебни вештини или време да ги достават? Ова е ветувањето понудени од страна на "набљудување со учество" или "луѓе се оддалечиме од сензори." На пример, на дупка патрола, проект од страна на научниците на МИТ, монтирани GPS опремени accelerometers во седум такси такси во областа на Бостон (Eriksson et al. 2008) . Поради возење во текот на дупка остава посебен акцелерометар сигнал, овие уреди, кога се наоѓа во внатрешноста на движење на такси-возила, може да се создаде дупка карти на Бостон. Се разбира, такси не случајно ги тестираат патишта, но со оглед на доволно такси-возила, може да има доволно покриеност да обезбеди информации за голем дел од тие градот. Вториот корист на пасивните системи кои се потпираат на оваа технологија е тоа што де-вештина на процесот на придонесува податоци: а тоа бара вештина за да се придонесе за eBird (затоа што треба да биде во можност да со сигурност да се идентификуваат видови на птици), таа не бара посебни вештини за да придонесе за дупка патрола.
Оди напред, се сомневам дека многу проекти за собирање на дистрибуирани податоци ќе почнат да се направи употреба на можностите на мобилни телефони кои се веќе извршени од страна на милијарди луѓе од целиот свет. Овие телефони веќе имаат голем број на сензори важно за мерење, како што микрофони, камери, ГПС уреди, и часовници. Понатаму, овие мобилни телефони поддршка на трети лица апликации овозможуваат на истражувачите некои контрола врз основните протоколи за собирање податоци. Конечно, овие телефони имаат интернет конекција, со што е можно за нив да се off-вчитување на податоци што ги собираат. Постојат бројни технички предизвици од неточна сензори за ограничен век на батеријата, но овие проблеми, најверојатно, ќе се намали со текот на времето како што се развива технологијата. Прашања поврзани со приватноста и етика, од друга страна, може да добиете повеќе комплицирано како што се развива технологијата; Ќе се вратам на прашањата на етиката кога ќе нудат совети за дизајнирање на вашата маса соработка.
Во дистрибуирани проекти за собирање на податоци, волонтери придонесе податоци за светот. Овој пристап е веќе успешно се користи, и идните цели, најверојатно, ќе мора да одговори на загриженоста на земање мостри и квалитет на податоците. За среќа, на постојните проекти, како што PhotoCity и дупка патрола предлага решавање на овие проблеми. Како што се повеќе проекти да ги искористат предностите на технологијата која им овозможува на де-квалификувани и пасивно учество, дистрибуирани проекти за собирање на податоци треба драстично да се зголеми во обем, овозможувајќи им на истражувачите да се соберат податоци кои, едноставно, беше надвор од дозволените граници во минатото.