La raccolta di dati distribuiti è possibile e in futuro probabilmente coinvolgerà la tecnologia e la partecipazione passiva.
Come dimostra eBird, la raccolta di dati distribuiti può essere utilizzata per la ricerca scientifica. Inoltre, PhotoCity mostra che i problemi relativi al campionamento e alla qualità dei dati sono potenzialmente risolvibili. In che modo la raccolta di dati distribuiti può funzionare per la ricerca sociale? Un esempio viene dal lavoro di Susan Watkins e dei suoi colleghi sul Malawi Journals Project (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . In questo progetto, 22 residenti locali, chiamati "journalists" -kept "diari di conversazione" che hanno registrato, in dettaglio, le conversazioni che hanno ascoltato sull'AIDS nella vita quotidiana della gente comune (al momento del progetto, circa il 15% degli adulti in Malawi sono stati contagiati dall'HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). A causa del loro status di insider, questi giornalisti sono stati in grado di ascoltare conversazioni che potrebbero essere state inaccessibili a Watkins e ai suoi collaboratori di ricerca occidentali (discuterò dell'etica di questo più avanti nel capitolo quando offro consigli su come progettare il proprio progetto di collaborazione di massa) . I dati del progetto delle pubblicazioni del Malawi hanno portato a una serie di risultati importanti. Ad esempio, prima che il progetto iniziasse, molti estranei credevano che ci fosse silenzio sull'AIDS nell'Africa sub-sahariana, ma i diari conversazionali hanno dimostrato che non era così: i giornalisti hanno sentito centinaia di discussioni sull'argomento, in luoghi diversi come funerali, bar e chiese. Inoltre, la natura di queste conversazioni ha aiutato i ricercatori a comprendere meglio parte della resistenza all'uso del preservativo; il modo in cui l'uso del preservativo è stato inquadrato nei messaggi sulla salute pubblica è stato incoerente con il modo in cui è stato discusso nella vita di tutti i giorni (Tavory and Swidler 2009) .
Certamente, come i dati di eBird, i dati del Malawi Journals Project non sono perfetti, un problema discusso in dettaglio da Watkins e colleghi. Ad esempio, le conversazioni registrate non sono un campione casuale di tutte le conversazioni possibili. Piuttosto, sono un censimento incompleto delle conversazioni sull'AIDS. In termini di qualità dei dati, i ricercatori ritenevano che i loro giornalisti fossero reporter di alta qualità, come dimostra la coerenza tra le riviste e le riviste. Cioè, dal momento che un numero sufficiente di giornalisti è stato distribuito in un ambiente abbastanza piccolo e focalizzato su un argomento specifico, è stato possibile utilizzare la ridondanza per valutare e garantire la qualità dei dati. Ad esempio, una prostituta di nome "Stella" si è presentata diverse volte nei diari di quattro giornalisti diversi (Watkins and Swidler 2009) . Per sviluppare ulteriormente la tua intuizione, la tabella 5.3 mostra altri esempi di raccolta di dati distribuiti per la ricerca sociale.
Dati raccolti | Riferimento |
---|---|
Discussioni sull'HIV / AIDS in Malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Via a mendicare a Londra | Purdam (2014) |
Eventi di conflitto nel Congo orientale | Windt and Humphreys (2016) |
Attività economica in Nigeria e Liberia | Blumenstock, Keleher, and Reisinger (2016) |
Sorveglianza dell'influenza | Noort et al. (2015) |
Tutti gli esempi descritti in questa sezione hanno coinvolto la partecipazione attiva: i giornalisti hanno trascritto conversazioni che hanno ascoltato; gli uccellini hanno caricato le loro liste di controllo degli uccelli; o i giocatori hanno caricato le loro foto. Ma cosa accadrebbe se la partecipazione fosse automatica e non richiedesse abilità o tempo specifici per l'invio? Questa è la promessa offerta dal "sensing partecipativo" o dal "sensing centrato sulla gente". Ad esempio, la Pothole Patrol, un progetto degli scienziati del MIT, montò accelerometri GPS dotati di sette taxi nella zona di Boston (Eriksson et al. 2008) . Poiché guidare su una buca lascia un segnale accelerometro distinto, questi dispositivi, quando posizionati all'interno di taxi in movimento, possono creare mappe di buche di Boston. Naturalmente, i taxi non campionano a caso le strade, ma, dato un numero sufficiente di taxi, potrebbe esserci una copertura sufficiente per fornire informazioni su grandi porzioni di città. Un secondo vantaggio dei sistemi passivi che si basano sulla tecnologia è che essi rendono obsoleto il processo di contributo dei dati: mentre richiede abilità per contribuire a eBird (perché è necessario essere in grado di identificare in modo affidabile le specie di uccelli), non richiede abilità particolari per contribuire a Pothole Patrol.
Andando avanti, sospetto che molti progetti di raccolta dati distribuiti inizieranno a sfruttare le capacità dei telefoni cellulari che sono già state portate da miliardi di persone in tutto il mondo. Questi telefoni hanno già un numero elevato di sensori importanti per la misurazione, come microfoni, fotocamere, dispositivi GPS e orologi. Inoltre, supportano app di terze parti che consentono ai ricercatori un certo controllo sui protocolli di raccolta dati sottostanti. Infine, hanno la connettività Internet, che consente loro di scaricare i dati che raccolgono. Ci sono numerose sfide tecniche, che vanno dai sensori inaccurati alla durata limitata della batteria, ma questi problemi probabilmente diminuiranno nel tempo man mano che la tecnologia si sviluppa. I problemi legati alla privacy e all'etica, d'altra parte, potrebbero essere più complicati; Tornerò alle domande di etica quando offro consigli sulla progettazione della tua collaborazione di massa.
Nei progetti di raccolta dati distribuiti, i volontari forniscono dati sul mondo. Questo approccio è già stato utilizzato con successo e gli usi futuri dovranno probabilmente affrontare problemi di campionamento e di qualità dei dati. Fortunatamente, progetti esistenti come PhotoCity e Pothole Patrol suggeriscono soluzioni a questi problemi. Dato che più progetti traggono vantaggio dalla tecnologia che consente la partecipazione passiva e passiva, i progetti di raccolta dati distribuiti dovrebbero aumentare drasticamente di scala, consentendo ai ricercatori di raccogliere dati che erano semplicemente off limits in passato.