Дистрибуираното собирање на податоци е можно, а во иднина, најверојатно, ќе вклучува и технологија и пасивно учество.
Како што покажува eBird, дистрибуираното собирање на податоци може да се користи за научни истражувања. Понатаму, PhotoCity покажува дека проблемите поврзани со примерокот и квалитетот на податоците се потенцијално решливи. Како може да се дистрибуира собирање на податоци за социјални истражувања? Еден пример произлегува од работата на Сузан Воткинс и нејзините колеги за проектот Малави Џурнали (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . Во овој проект, 22 локални жители - наречени "новинари" - "разговорни списанија", кои детално ги евидентираа разговорите што ги слушнаа за СИДА во секојдневниот живот на обичните луѓе (во моментот кога започна проектот, околу 15% од возрасните во Малави биле инфицирани со ХИВ (Bello, Chipeta, and Aberle-Grasse 2006) ). Поради нивниот инсајдерски статус, овие новинари успеаја да ги слушнат разговорите што можеби не беа достапни за Воткинс и нејзините западни истражувачки соработници (ќе разговарам за етиката на ова подоцна во поглавјето кога ќе ви понудам совети за дизајнирање на вашиот сопствен проект за масовна соработка) . Податоците од проектот Малави списанија доведоа до бројни важни наоди. На пример, пред почетокот на проектот, многу аутсајдери веруваа дека има молк за СИДА во субсахарска Африка, но разговорните списанија покажаа дека ова очигледно не е случај: новинарите чукнаа стотици дискусии на темата, на различни локации погреби, барови и цркви. Понатаму, природата на овие разговори им помогна на истражувачите подобро да разберат некои од отпорот кон употребата на кондоми; начинот на кој користењето на кондомот беше врамено во пораките за јавно здравје не беше во согласност со начинот на кој се дискутираше во секојдневниот живот (Tavory and Swidler 2009) .
Се разбира, како и податоците од eBird, податоците од проектот Малави списанија не се совршени, прашање кое во детали ги дискутира Watkins и неговите колеги. На пример, снимените разговори не се случаен примерок од сите можни разговори. Наместо тоа, тие се нецелосен попис на разговорите за СИДА. Во однос на квалитетот на податоците, истражувачите веруваа дека нивните новинари се новинари со висок квалитет, како што беше потврдено од конзистентноста во списанијата и низ списанијата. Тоа е затоа што, поради тоа што доволно новинари беа распоредени во доволно мал амбиент и фокусирани на одредена тема, беше можно да се користи вишок за да се процени и да се обезбеди квалитетот на податоците. На пример, еден сексуален работник именуван "Стела" се појавува неколку пати во списанијата на четири различни новинари (Watkins and Swidler 2009) . Со цел понатаму да ја градите својата интуиција, во табелата 5.3 се прикажани и други примери за дистрибуирано собирање на податоци за социјални истражувања.
Собраните податоци | Референца |
---|---|
Разговори за ХИВ / СИДА во Малави | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Улична молитва во Лондон | Purdam (2014) |
Конфликт настани во Источна Конго | Windt and Humphreys (2016) |
Економска активност во Нигерија и Либерија | Blumenstock, Keleher, and Reisinger (2016) |
Набљудување на грип | Noort et al. (2015) |
Сите примери опишани во овој дел вклучуваа активно учество: новинарите ги транскрибираа разговорите што ги слушнаа; птиците ги подигнале контролните списоци за птици; или играчите ги подигнаа своите фотографии. Но, што ако учеството е автоматско и не бараше одредена вештина или време да ги доставите? На пример, Pothole Patrol, проект на научници во MIT, ги монтирал акселерометрите опремени со GPS во седум такси-кабини во областа Бостон (Eriksson et al. 2008) . Поради тоа што возењето низ дупка остава посебен сигнал за акцелерометар, овие уреди, кога се ставаат во внатрешноста на движечките такси, можат да создадат мапи од Бостон. Се разбира, таксите не случајно ги земаат патиштата, но, со оглед на доволно такси, може да има доволно покриеност за да обезбеди информации за големи делови од градот. Втора корист од пасивните системи кои се потпираат на технологијата е дека тие го деконструираат процесот на доделување на податоци: додека бара вештина да придонесе за eBird (затоа што треба да бидете во можност сигурно да ги идентификувате птичји видови), тоа не бара посебни вештини за придонесе за Pothole патрола.
Продолжувам, се сомневам дека многу дистрибуирани проекти за собирање податоци ќе почнат да ги користат можностите на мобилните телефони кои веќе ги носат милијарди луѓе ширум светот. Овие телефони веќе имаат голем број сензори важни за мерење, како што се микрофони, камери, GPS уреди и часовници. Понатаму, тие ги поддржуваат апликациите од трети лица кои им овозможуваат на истражувачите да имаат контрола врз основните протоколи за собирање на податоци. Конечно, тие имаат интернет-поврзување, овозможувајќи им да ги исклучат податоците што ги собираат. Постојат бројни технички предизвици, кои се движат од неточни сензори до ограничен век на батеријата, но овие проблеми најверојатно ќе се намалат со текот на времето како што се развива технологијата. Прашањата поврзани со приватноста и етиката, од друга страна, би можеле да бидат покомплицирани; Ќе се вратам на етичките прашања кога ќе понудам совети за дизајнирање на вашата масовна соработка.
Во дистрибуираните проекти за собирање на податоци, волонтерите придонесуваат за светот. Овој пристап веќе е успешно користен, а идните потреби најверојатно ќе треба да ги опфатат проблемите со земање мостри и квалитетот на податоците. За среќа, постоечките проекти како што се PhotoCity и Pothole Patrol сугерираат решенија на овие проблеми. Бидејќи повеќе проекти ја искористуваат технологијата што овозможува декриптичко и пасивно учество, дистрибуираните проекти за собирање на податоци треба драматично да се зголемат во обем, овозможувајќи им на истражувачите да собираат податоци кои едноставно беа надвор од границите во минатото.