Distribuirea datelor colectate este posibilă, iar în viitor va implica probabil tehnologia și participarea pasivă.
După cum demonstrează eBird, colectarea distribuită a datelor poate fi utilizată pentru cercetarea științifică. În plus, PhotoCity arată că problemele legate de eșantionare și de calitatea datelor sunt potențial rezolvate. Cum ar putea fi distribuită colectarea de date pentru cercetarea socială? Un exemplu vine din opera lui Susan Watkins și colegilor ei despre Proiectul (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) Malawi (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . În acest proiect, 22 de rezidenți locali - numiți "jurnaliști" - au ținut "jurnale conversaționale" care au înregistrat, în detaliu, conversațiile pe care le-au auzit despre SIDA în viața de zi cu zi a oamenilor obișnuiți (la momentul inițierii proiectului, aproximativ 15% în Malawi au fost infectați cu HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Din cauza statutului lor insider, acești jurnaliști au fost capabili să audă conversații care ar fi putut fi inaccesibile Watkins și colaboratorilor occidentali de cercetare (vom discuta etica acestui lucru mai târziu în capitol atunci când vă ofer sfatul despre proiectarea propriului proiect de colaborare în masă) . Datele din Proiectul Jurnalului din Malawi au condus la o serie de constatări importante. De exemplu, înainte de începerea proiectului, mulți străini credeau că există o tăcere despre SIDA în Africa Subsahariană, dar jurnalele de conversație au demonstrat că acest lucru nu era evident: jurnaliști au auzit sute de discuții despre subiect, în locuri atât de diverse funeralii, baruri și biserici. În plus, natura acestor conversații a ajutat cercetătorii să înțeleagă mai bine o parte din rezistența la utilizarea prezervativului; modul în care utilizarea prezervativului a fost încadrată în mesajele de sănătate publică nu era în concordanță cu modul în care a fost discutată în viața de zi cu zi (Tavory and Swidler 2009) .
Desigur, la fel ca datele de la eBird, datele din Proiectul Magazinelor Malawi nu sunt perfecte, o problemă discutată în detaliu de Watkins și colegi. De exemplu, conversațiile înregistrate nu reprezintă un eșantion aleatoriu al tuturor conversațiilor posibile. Mai degrabă, acestea sunt un recensământ incomplet al conversațiilor despre SIDA. În ceea ce privește calitatea datelor, cercetătorii au crezut că jurnaliștii lor au fost reporteri de înaltă calitate, după cum reiese din coerența în jurnale și în jurnale. Adică, deoarece suficient jurnaliști au fost dispuși într-un cadru suficient de mic și s-au axat pe un anumit subiect, a fost posibilă utilizarea redundanței pentru a evalua și a asigura calitatea datelor. De exemplu, un lucrător de sex numit "Stella" a apărut de mai multe ori în revistele a patru jurnaliști diferiți (Watkins and Swidler 2009) . Pentru a vă construi mai mult intuiția, în tabelul 5.3 sunt prezentate alte exemple de colectare a datelor distribuite pentru cercetarea socială.
Datele colectate | Referinţă |
---|---|
Discuții despre HIV / SIDA în Malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Street cerșind în Londra | Purdam (2014) |
Evenimente conflictuale din estul Congo | Windt and Humphreys (2016) |
Activitatea economică în Nigeria și Liberia | Blumenstock, Keleher, and Reisinger (2016) |
Supravegherea gripei | Noort et al. (2015) |
Toate exemplele descrise în această secțiune au implicat participarea activă: jurnaliștii au transcris conversațiile pe care le au auzit; birders au încărcat listele de verificare a animalelor; sau jucătorii au încărcat fotografiile. Dar dacă participarea a fost automată și nu necesită o anumită abilitate sau un timp pentru depunerea acesteia? Aceasta este promisiunea oferită de "sensibilizarea participativă" sau de "percepția centrică a oamenilor". De exemplu, Pothole Patrol, proiect de oameni de știință de la MIT, a montat accelerometre echipate cu GPS în șapte cabine de taxi din zona Boston (Eriksson et al. 2008) . Deoarece conducerea deasupra unei gropi lasa un semnal distinct al accelerometrului, aceste dispozitive, atunci cand sunt plasate in interiorul taxiurilor in miscare, pot crea harti de gropi din Boston. Bineînțeles, taxiurile nu eșantionează aleatoriu drumurile, dar, având în vedere taxiurile suficiente, ar putea exista o acoperire suficientă pentru a furniza informații despre porțiuni mari ale orașului. Un al doilea beneficiu al sistemelor pasive care se bazează pe tehnologie este că aceștia de-abilitatea procesului de a contribui la date: deși necesită o abilitate de a contribui la eBird (pentru că trebuie să puteți identifica în mod fiabil speciile de păsări), nu necesită abilități speciale contribuie la Patrolul Pothole.
În continuare, bănuiesc că multe proiecte de colectare a datelor distribuite vor începe să utilizeze capabilitățile telefoanelor mobile care sunt deja transportate de miliarde de oameni din întreaga lume. Aceste telefoane au deja un număr mare de senzori importanți pentru măsurare, cum ar fi microfoanele, camerele, dispozitivele GPS și ceasurile. În plus, ele suportă aplicații terțe care permit cercetătorilor un anumit control asupra protocoalelor de colectare a datelor. În cele din urmă, aceștia au conectivitate la Internet, ceea ce face posibilă descărcarea datelor pe care le colectează. Există numeroase provocări tehnice, de la senzorii inexacți la durata de viață limitată a bateriei, dar aceste probleme se vor diminua probabil în timp, pe măsura dezvoltării tehnologiei. Aspectele legate de intimitate și etică, pe de altă parte, s-ar putea complica; Mă voi întoarce la întrebări de etică când vă ofer sfaturi despre proiectarea propriei colaborări în masă.
În cadrul proiectelor de colectare a datelor distribuite, voluntarii contribuie cu date despre lume. Această abordare a fost deja utilizată cu succes, iar utilizările viitoare vor trebui probabil să abordeze preocupările privind prelevarea de probe și calitatea datelor. Din fericire, proiectele existente, cum ar fi PhotoCity și Pothole Patrol, sugerează soluții la aceste probleme. Dat fiind că mai multe proiecte profită de tehnologia care permite participarea calificată și pasivă, proiectele de colectare a datelor distribuite ar trebui să crească în mod dramatic, permițând cercetătorilor să colecteze date care în trecut au fost doar limitate.