Distribuerad datainsamling är möjlig, och i framtiden kommer det sannolikt att innebära teknik och passivt deltagande.
Som eBird demonstrerar kan distribuerad datainsamling användas för vetenskaplig forskning. Vidare visar PhotoCity att problem som rör provtagning och datakvalitet är potentiellt lösliga. Hur kan distribuerad datainsamling jobba för social forskning? Ett exempel kommer från Susan Watkins arbete och hennes kollegor på Malawi Journal Project (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . I det här projektet har 22 lokalbefolkningar, som kallas "journalister", upptagna "konversationstidningar" som i detalj uppdagade de samtal som de hörde om aids i vanliga människors dagliga liv (vid det att projektet började, cirka 15% av de vuxna i Malawi smittades med HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). På grund av sin insiderstatus kunde dessa journalister överhöra konversationer som kunde ha varit otillgängliga för Watkins och hennes västerländska forskningssamarbetare (jag kommer att diskutera etiken i detta senare i kapitlet när jag erbjuder råd om att designa ditt eget masssamarbetesprojekt) . Uppgifterna från Malawi Journals Project har lett till ett antal viktiga resultat. Till exempel, innan projektet startade, trodde många outsidare att det var tyst om aids i Afrika söder om Sahara, men konversationstidningarna visade att det inte var klart så här: journalister hörde hundratals diskussioner om ämnet på platser som är så olika som begravningar, barer och kyrkor. Vidare bidrog arten av dessa konversationer till att forskare bättre förstod något av motståndet mot kondomanvändning; Det sätt på vilket kondomanvändning var inramat i folkhälsobeskrivningen var inkonsekvent med det sätt som det diskuterades i vardagen (Tavory and Swidler 2009) .
Naturligtvis, som data från eBird, är data från Malawi Journal Project inte perfekta, en fråga som diskuteras i detalj av Watkins och kollegor. De inspelade konversationerna är till exempel inte ett slumpmässigt urval av alla möjliga konversationer. Snarere är de en ofullständig folkräkning av konversationer om aids. När det gäller datakvalitet trodde forskarna att deras journalister var högkvalitativa reportrar, vilket framgår av konsistensen inom tidskrifter och över tidskrifter. Det är därför att det var möjligt att använda redundans för att bedöma och säkerställa datakvaliteten för att tillräckligt många journalister användes i en tillräckligt liten miljö och fokuserade på ett specifikt ämne. Till exempel visade en sexarbetare som heter "Stella" flera gånger i tidningar av fyra olika journalister (Watkins and Swidler 2009) . För att ytterligare bygga din intuition visar tabell 5.3 andra exempel på distribuerad datainsamling för social forskning.
Uppgifter som samlats in | Referens |
---|---|
Diskussioner om hiv / aids i malawi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Gata tigger i London | Purdam (2014) |
Konflikthändelser i östra Kongo | Windt and Humphreys (2016) |
Ekonomisk aktivitet i Nigeria och Liberia | Blumenstock, Keleher, and Reisinger (2016) |
Influensaövervakning | Noort et al. (2015) |
Alla exemplen som beskrivs i detta avsnitt har medverkat aktivt deltagande: journalister transkriberade konversationer som de hörde; birders laddade upp sina fågelskådningslistor; eller spelare laddade upp sina foton. Men vad händer om deltagandet var automatiskt och inte krävde någon särskild färdighet eller tid att skicka in? Detta är det löfte som erbjuds av "participatory sensing" eller "people-centric sensing". Till exempel, Pothole Patrol, ett projekt av forskare vid MIT, monterade GPS-utrustade accelerometrar inom sju taxibilar i Boston-området (Eriksson et al. 2008) . Eftersom körning över en pothole lämnar en tydlig accelerometer signal, kan dessa enheter, när de placeras inuti rörliga taxibilar, skapa pothole-kartor över Boston. Självklart prövar taxibilar inte slumpmässigt vägar, men med tanke på tillräckligt med taxibilar kan det finnas tillräcklig täckning för att ge information om stora delar av staden. En andra fördel med passiva system som bygger på tekniken är att de avlägsnar processen med att bidra med data: medan det krävs färdighet för att bidra till eBird (eftersom du behöver kunna identifiera fågelarter på ett tillförlitligt sätt) behöver det inga speciella färdigheter att bidra till Pothole Patrol.
Jag går framåt, jag misstänker att många distribuerade datainsamlingsprojekt kommer att börja utnyttja förmågan hos de mobiltelefoner som redan bärs av miljarder människor runt om i världen. Dessa telefoner har redan ett stort antal sensorer som är viktiga för mätning, såsom mikrofoner, kameror, GPS-enheter och klockor. Vidare stöder de tredje part apps som gör det möjligt för forskare att få kontroll över de underliggande datainsamlingsprotokollen. Slutligen har de internetanslutning, vilket gör det möjligt för dem att ladda ner de data de samlar in. Det finns många tekniska utmaningar, allt från felaktiga sensorer till begränsad batterilivslängd, men dessa problem kommer sannolikt att minska med tiden då tekniken utvecklas. Problem som är relaterade till integritet och etik, å andra sidan, kan bli mer komplicerade. Jag återkommer till etiska frågeställningar när jag erbjuder råd om att designa ditt eget masssamarbete.
I distribuerade datainsamlingsprojekt bidrar volontärer med data om världen. Detta tillvägagångssätt har redan använts framgångsrikt, och framtida användningar kommer sannolikt att behöva ta itu med provtagning och datakvalitetshänsyn. Lyckligtvis föreslår befintliga projekt som PhotoCity och Pothole Patrol lösningar på dessa problem. Eftersom fler projekt utnyttjar tekniken som möjliggör defagliga och passiva deltagandet, bör distribuerade datainsamlingsprojekt öka dramatiskt, så att forskare kan samla in data som helt enkelt saknar gränser i det förflutna.