Colectarea de date distribuite este posibil, iar în viitor se va implica probabil tehnologia și participarea pasivă.
După cum demonstrează eBird, colectarea de date distribuite pot fi folosite pentru cercetare științifică. În plus, PhotoCity arată că problemele legate de eșantionare și calitatea datelor sunt potențial rezolvabile.
Modul în care s-ar putea rețelelor distribuite de colectare a datelor pentru cercetarea socială? Un exemplu minunat vine din munca lui Susan Watkins si colegii ei de pe fusurile Proiectului Malawi (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . În cadrul acestui proiect, 22 de rezidenti locale numite "jurnaliști" -kept "jurnale de conversație", care au înregistrat, în detaliu, convorbirile ei auzite despre SIDA în viața de zi cu zi a oamenilor obișnuiți (în momentul în care proiectul a început, aproximativ 15% dintre adulți in Malawi au fost infectate cu HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Din cauza statutului lor din interior, acești jurnaliști au fost capabili să conversații care s-ar putea auzi au fost inaccesibile pentru Susan Watkins si colaboratorii sai occidentali de cercetare (voi discuta despre etica acest lucru mai târziu, în capitolul când am oferit sfaturi despre proiectarea propriul proiect de colaborare în masă ). Datele din proiect Malawi reviste, a condus la o serie de concluzii importante. De exemplu, înainte de începerea proiectului, mulți din afară au crezut că a fost tăcere despre SIDA în Africa sub-sahariană, dar jurnalele au demonstrat că acest lucru a fost în mod evident nu este cazul: jurnaliștii auzit sute de conversație pe acest subiect, în locații diverse, precum funeralii , baruri și biserici. În plus, natura acestor conversații au ajutat cercetatorii sa inteleaga mai bine unele dintre rezistenta la folosirea prezervativului; modul în care folosirea prezervativului a fost încadrat în mesajele de sănătate publică a fost în contradicție cu modul în care a fost discutată în viața de zi cu zi (Tavory and Swidler 2009) .
Desigur, ca datele din eBird, datele din revistele Proiectul Malawi nu este perfectă, o problemă discutată în detaliu de Watkins si colegii. De exemplu, conversațiile înregistrate nu sunt un eșantion aleatoriu de toate conversațiile posibile. Mai degrabă, ele sunt un recensământ incomplet al convorbirilor despre SIDA. În ceea ce privește calitatea datelor, cercetătorii cred că jurnaliștii lor au fost reporteri de înaltă calitate, după cum reiese din coerența în reviste și jurnale peste. Mai mult, când destui jurnaliști sunt desfășurate într-un cadru suficient de mici și rapoartele sunt concentrate pe un anumit subiect, redundanță a devenit posibilă, ceea ce sporește încrederea în calitatea datelor. De exemplu, un lucrător de sex numit "Stella" a apărut de mai multe ori în jurnalele de patru jurnaliști diferite (Watkins and Swidler 2009) . Așa cum a fost în PhotoCity, utilizarea redundanței este un principiu important pentru evaluarea și asigurarea calității datelor în cadrul proiectelor de colectare a datelor distribuite. În scopul de a construi în continuare intuiția, tabelul 5.3 prezintă alte exemple de colectare a datelor distribuite pentru cercetarea socială.
datele colectate | Citare |
---|---|
Discuții despre HIV / SIDA in Malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Stradă cerșind în Londra | Purdam (2014) |
Evenimente de conflict din estul Congo | Windt and Humphreys (2016) |
Activitatea economică în Nigeria și Liberia | Blumenstock, Keleher, and Reisinger (2016) |
supravegherea gripei | Noort et al. (2015) |
Toate exemplele descrise în această secțiune au implicat participarea activă: jurnaliștii transcris conversații pe care le-au auzit; birders a încărcat listele de verificare birding; sau jucătorii încărcat fotografiile lor. Dar dacă participarea a fost realizată automat și nu au nevoie de nici o abilitate sau de timp să se supună? Aceasta este promisiunea oferită de "detectare participativă" sau "oameni-centric de detectare." De exemplu, Avenul Patrol, un proiect de oamenii de stiinta de la MIT, montate prin GPS accelerometrele echipate în șapte cabine de taxi din zona Boston (Eriksson et al. 2008) . Pentru că de conducere de peste un aven lasa un semnal accelerometru distinct, aceste dispozitive, atunci când sunt plasate în interiorul taxiuri în mișcare, se pot crea hărți Avenul din Boston. Desigur, taxiuri nu eșantion la întâmplare drumuri, dar având în vedere suficiente taxiuri, pot exista suficiente pentru o acoperire pentru a furniza informații cu privire la porțiuni mari din ele oraș. Un al doilea avantaj al sistemelor pasive care se bazează pe tehnologia este că ei de-abilitate procesul de a contribui date: în timp ce necesită îndemânare pentru a contribui la eBird (pentru că trebuie să fie în măsură să identifice în mod credibil specii de păsări), ea nu necesită abilități speciale contribuie la Avenul de patrulare.
Mergând mai departe, cred că proiectele de colectare in mai multe date distribuite vor începe să facă uz de capacitățile telefoanelor mobile, care sunt deja transportate de miliarde de oameni din întreaga lume. Aceste telefoane au deja un număr mare de senzori importanți pentru măsurarea, cum ar fi microfoane, camere video, dispozitive GPS și ceasuri. În plus, aceste telefoane mobile acceptă aplicații terță parte care să permită cercetătorilor un anumit control asupra protocoalelor de colectare a datelor care stau la baza. În cele din urmă, aceste telefoane au Internet-conectivitate, ceea ce face posibil ca acestea să off-încărca datele pe care le colectează. Există numeroase provocări tehnice de la senzori la viață limitată incorecte a bateriei, dar aceste probleme se vor diminua probabil în timp, pe măsură ce tehnologia se dezvoltă. Probleme legate de viața privată și de etică, pe de altă parte, s-ar putea obține mai complicate pe măsură ce tehnologia se dezvoltă; Voi reveni la întrebări de etică atunci când am oferi sfaturi cu privire la proiectarea propria colaborare în masă.
În cazul proiectelor de colectare a datelor distribuite, voluntarii contribuie date despre lume. Această abordare a fost deja utilizată cu succes, iar utilizările viitoare vor trebui probabil să se adreseze de eșantionare și de calitate a datelor se referă. Din fericire, proiectele existente, cum ar fi PhotoCity și Avenul Patrol sugerează soluții la aceste probleme. Ca mai multe proiecte să profite de tehnologie care permite participarea de calificare și pasivă, distribuite proiecte de colectare a datelor ar trebui să crească în mod dramatic la scara, care sa permita cercetatorilor sa colecteze date, care a fost pur și simplu în afara limitelor în trecut.