Mbledhja e të dhënave të shpërndara është e mundur, dhe në të ardhmen do të ngjarë të përfshijë teknologjinë dhe pjesëmarrjen pasive.
Si eBird tregon, mbledhja e të dhënave të shpërndara mund të përdoret për kërkime shkencore. Më tej, PhotoCity tregon se problemet që lidhen me marrjen e mostrave dhe cilësisë së të dhënave janë potencialisht të zgjidhshme.
Si mund të shpërndahen e të dhënave mbledhjes punën për kërkime sociale? Një shembull i mrekullueshëm vjen nga puna e Susan Watkins dhe kolegët e saj në Projektin e Journals Malavi (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . Në këtë projekt, 22 lokale banorët-quajtur "gazetarë" -kept "revista bisedor" që të regjistruara, në mënyrë të detajuar, bisedat që overheard për AIDS në jetën e përditshme të njerëzve të zakonshëm (në atë kohë projekti ka filluar, rreth 15% e të rriturve në Malavi janë të infektuar me HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Për shkak të statusit të tyre të brendshëm, këto gazetarë ishin në gjendje të dëgjojnë biseda që mund të kenë qenë të paarritshme për Susan Watkins dhe saj bashkëpunëtorë Perëndimor (unë do të diskutuar etikën e këtë më vonë në kapitullin, kur unë të ofrojë këshilla për dizajnimin e projektit tuaj bashkëpunimi në masë ). Të dhënat nga Projekti i Malawi Journals ka çuar në një numër të gjetjeve të rëndësishme. Për shembull, para se projekti ka filluar, shumë jashtmit besonin se kishte heshtje në lidhje me AIDS në Afrikën sub-Sahariane, por revista treguar se kjo ishte e qartë nuk është rasti: gazetarët përgjuara qindra e bisedës në temë, në vende të ndryshme si funerale , bare, dhe kishat. Për më tepër, natyra e këtyre bisedave ka ndihmuar studiuesit të kuptojnë më mirë një pjesë e rezistencës ndaj përdorimin e kondomit; mënyra se përdorimi i kondomit është përshtatur në mesazhet e shëndetit publik ishte në përputhje me mënyrën se si është diskutuar në jetën e përditshme (Tavory and Swidler 2009) .
Sigurisht, si të dhënave nga eBird, të dhënat nga Projekti revista Malavi nuk është i përsosur, një çështje është diskutuar në detaje nga Watkins dhe kolegët. Për shembull, bisedat e regjistruara nuk janë një mostër të rastit të të gjitha bisedave të mundshme. Përkundrazi, ata janë një regjistrim i plotë i bisedave rreth AIDS. Në aspektin e cilësisë së të dhënave, hulumtuesit besojnë se gazetarët e tyre ishin reporterë me cilësi të lartë, siç dëshmohet nga konsistencës në revista dhe nëpër revista. Më tej, kur gazetarët mjaftueshme janë të vendosura në një mjedis të vogël të mjaftueshme dhe raportet janë të përqendruar në një temë të veçantë, tepricë u bë e mundur, e cila e rrit besimin në cilësinë e të dhënave. Për shembull, një punëtor seksi me emrin "Stella" ka treguar disa herë në revista e katër gazetarëve të ndryshme (Watkins and Swidler 2009) . Siç ishte në PhotoCity, përdorimi i tepricë është një parim i rëndësishëm për vlerësimin dhe sigurimin e cilësisë së të dhënave në projekte të shpërndara mbledhjen e të dhënave. Për të ndërtuar më tej intuitës tuaj, Tabela 5.3 tregon shembuj të tjerë të mbledhjes së të dhënave të shpërndara për kërkime sociale.
Të dhënat e mbledhura | Citim |
---|---|
Diskutimet rreth HIV / AIDS në Malavi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Rruga lypur në Londër | Purdam (2014) |
ngjarjet e konfliktit në Kongo Lindore | Windt and Humphreys (2016) |
Aktiviteti ekonomik në Nigeri dhe Liberi | Blumenstock, Keleher, and Reisinger (2016) |
mbikqyrjes influenza | Noort et al. (2015) |
Të gjithë shembujt e përshkruara në këtë seksion janë përfshirë pjesëmarrjen aktive: gazetarët transkriptuar bisedat që kanë dëgjuar; birders ngarkuar listat kontrolluese e tyre birding; ose lojtarët ngarkuar fotot e tyre. Por, çfarë nëse pjesëmarrja është automatik dhe nuk kërkojnë ndonjë aftësi të veçantë apo kohë për të paraqitur? Ky është premtimi i ofruar nga "ndjerë pjesëmarrëse" ose "njerëzve-centric ndjerë." Për shembull, Pothole Patrol, një projekt nga shkencëtarët në MIT, montuar garave nxitim pajisura brenda shtatë taksi në zonën e Bostonit (Eriksson et al. 2008) . Sepse ngarje mbi një pothole lë një sinjal të veçantë Accelerometer, këto pajisje, kur vendoset brenda taksi lëviz, mund të krijojnë hartat pothole e Bostonit. Natyrisht, taksitë mos rastësisht mostrës rrugë, por duke pasur parasysh taksi mjaftueshme, mund të ketë mbulim të mjaftueshme për të siguruar informacion në lidhje me pjesë të mëdha të qytetit ata. Një përfitim i dytë i sistemeve pasive që mbështeten në teknologji është se ata de-aftësi procesi i kontribuar dhënat: ndërsa ajo kërkon aftësi për të kontribuar në eBird (për shkak se ju duhet të jetë në gjendje për të identifikuar në mënyrë të besueshme specie zogjsh), ajo nuk kërkon aftësi të veçanta për kontribuojnë në pothole Patrol.
Duke shkuar përpara, unë dyshoj se projektet e grumbullimit të të dhënave shumë të shpërndara do të fillojë për të bërë përdorimin e aftësive të telefonave mobil që janë kryer tashmë nga miliarda njerëz në mbarë botën. Këto faqe tashmë kanë një numër të madh të sensorë të rëndësishme për matjen, të tilla si mikrofona, kamera, pajisje GPS, dhe orë. Për më tepër, këto telefona celularë të mbështetur aplikacionet e palës së tretë mundësuar kërkuesve një kontroll mbi protokollet themelore mbledhjes së të dhënave. Së fundi, këto faqe kanë internet-lidhje, duke e bërë të mundur që ata të off-ngarkuar të dhënat që ata mbledhin. Ka sfida të shumta teknike nga sensorë të pasakta për jetën e baterisë të kufizuar, por këto probleme ka gjasa të zvogëlohet me kalimin e kohës si teknologji zhvillohet. Çështjet që lidhen me jetën private dhe etikës, nga ana tjetër, mund të merrni më të komplikuara si teknologji zhvillohet; Unë do të kthehet në çështjet e etikës, kur unë të ofrojë këshilla në lidhje me dizajnimin bashkëpunimin tuaj në masë.
Në projektet shpërndarë mbledhjes së të dhënave, vullnetarë kontribuojnë të dhënat në lidhje me botën. Kjo qasje tashmë është përdorur me sukses, dhe përdor të ardhmen do të ngjarë të duhet të adresojë të mostrave dhe të cilësisë së të dhënave shqetësime. Për fat të mirë, projektet ekzistuese si dhe PhotoCity pothole Patrol sugjerojnë zgjidhje për këto probleme. Sa më shumë projekte të përfituar nga teknologjia që mundëson pjesëmarrjen de-kualifikuar dhe pasiv, të shpërndara projekte mbledhjes së të dhënave duhet të rrisë ndjeshëm në shkallë, duke mundësuar kërkuesit për të mbledhur të dhëna që ishte thjesht të kufizuara në të kaluarën.