Insamling Distribuerad uppgifter är möjlig, och i framtiden kommer sannolikt att innebära teknik och passivt deltagande.
Som eBird visar, kan insamling distribuerad data användas för vetenskaplig forskning. Vidare visar PhotoCity att problem i samband med provtagning och datakvalitet är potentiellt lösas.
Hur kan distribueras datainsamling arbete för social forskning? Ett underbart exempel kommer från arbete Susan Watkins och hennes kollegor på Malawi Journals Project (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . I detta projekt, 22 lokalbefolkningen kallade "journalister" -kept "konversera tidskrifter" som spelats in i detalj, de samtal de Uppsnappat om aids i det dagliga livet för vanliga människor (vid den tidpunkt då projektet startade, ungefär 15% av vuxna i Malawi infekterades med HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). På grund av sin insynsställning, dessa journalister kunde höra samtal som skulle ha varit otillgängliga för Susan Watkins och hennes västerländska forsknings medarbetare (jag ska diskutera etiken i detta senare i kapitlet när jag ge råd om att designa din egen massa samarbetsprojekt ). Data från Malawi Journals projektet har lett till ett antal viktiga slutsatser. Till exempel, innan projektet startade, trodde många utomstående som var det tyst om AIDS i Afrika söder om Sahara, men tidskrifter visade att detta var uppenbarligen inte fallet: journalister hörde hundratals samtal i ämnet, på platser så olika som begravningar , barer och kyrkor. Vidare arten av dessa samtal hjälpt forskare bättre förstå en del av motståndet mot att använda kondom, det sätt som kondomanvändning inramades i offentliga meddelanden hälso var oförenligt med det sätt som det diskuterades i vardagen (Tavory and Swidler 2009) .
Naturligtvis, liksom data från eBird, är inte perfekt data från Malawi Journals Project, en fråga som diskuteras i detalj av Watkins och kollegor. Till exempel, de inspelade samtalen är inte ett slumpmässigt urval av alla möjliga samtal. Snarare är de en ofullständig inventering av samtal om aids. När det gäller datakvalitet, forskarna tror att deras journalister var hög kvalitet reportrar, vilket framgår av enhetlighet inom tidskrifter och över tidskrifter. Vidare, när tillräckligt journalister är utplacerade i en tillräckligt liten miljö och rapporter är inriktade på ett specifikt ämne, blev redundans möjligt, vilket ökar förtroendet för datakvalitet. Till exempel, en sexarbetare som heter "Stella" visade upp flera gånger i tidskrifter av fyra olika journalister (Watkins and Swidler 2009) . Som det var i PhotoCity, är användningen av redundans en viktig princip för att bedöma och garantera kvaliteten på uppgifterna i distribuerade datainsamlingsprojekt. För att ytterligare bygga din intuition, Tabell 5.3 visar andra exempel på insamling distribuerad data för social forskning.
Data samlas in | Citat |
---|---|
Diskussioner om HIV / AIDS i Malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Gata tiggeri i London | Purdam (2014) |
Konflikt händelserna i östra Kongo | Windt and Humphreys (2016) |
Den ekonomiska aktiviteten i Nigeria och Liberia | Blumenstock, Keleher, and Reisinger (2016) |
influensa övervakning | Noort et al. (2015) |
Alla exempel som beskrivs i detta avsnitt har involverat aktivt deltagande: journalister transkriberade samtal som de hörde; birders uppladdade deras birding checklistor; eller spelare laddat sina bilder. Men vad händer om deltagandet var automatiska och inte kräver någon särskild skicklighet eller tid att lämna? Detta är ett löfte som erbjuds av "deltagande avkänning" eller "folk-centrerad avkänning." Till exempel Pothole Patrol, ett projekt av forskare vid MIT, monterade GPS utrustade accelerometrar i sju taxibilar i Boston (Eriksson et al. 2008) . Eftersom kör över en grop lämnar en tydlig accelerometer signal, dessa enheter, när den placeras inne i rörliga taxibilar kan skapa tipp kartor över Boston. Naturligtvis behöver taxibilar inte slumpmässigt prov vägar, men med tanke på tillräckligt taxi, kan det finnas tillräcklig täckning för att ge information om stora delar av de stad. En andra fördel med passiva system som förlitar sig på tekniken är att de avkvalificera processen att bidra data: medan det kräver skicklighet för att bidra till eBird (eftersom du måste kunna tillförlitligt identifiera fågelarter) krävs det inga speciella kunskaper till bidra till Pothole Patrol.
Framöver, jag misstänker att insamling många distribuerade data projekt kommer att börja utnyttja funktionerna i mobiltelefoner som redan bärs av miljarder människor runt om i världen. Dessa telefoner har redan ett stort antal sensorer som är viktiga för mätning, såsom mikrofoner, kameror, GPS-enheter och klockor. Vidare, dessa mobiltelefoner stöder appar från tredje part som gör det möjligt forskare viss kontroll över de underliggande datainsamlingsprotokoll. Slutligen, dessa telefoner har Internet-anslutning, vilket gör det möjligt för dem att avlasta de uppgifter som de samlar in. Det finns många tekniska utmaningar från felaktiga sensorerna till begränsad batteritid, men dessa problem kommer sannolikt att minska med tiden som tekniken utvecklas. Frågor som rör integritet och etik, å andra sidan, kan få mer komplicerat eftersom tekniken utvecklas; Jag ska återkomma till frågor om etik när jag ge råd om att designa din egen massa samarbete.
I distribuerade datainsamlingsprojekt, volontärer bidrar uppgifter om världen. Detta tillvägagångssätt har redan använts med framgång, och framtida användning kommer troligen att ha att ta itu med provtagning och datakvalitetsproblem. Lyckligtvis befintliga projekt som PhotoCity och Grop Patrol föreslå lösningar på dessa problem. När fler projekt dra nytta av teknik som gör det möjligt för de kvalificerade och passivt deltagande, distribuerad datainsamlings projekt bör öka dramatiskt i omfattning, vilket gör att forskare att samla in data som var helt enkelt utanför gränserna i det förflutna.