Distribuita datenkolektado eblas, kaj en la estonteco probable impliki teknologio kaj pasiva partopreno.
Kiel eBird pruvas, distribuita datenkolektado povas esti uzata por sciencaj esploroj. Plui, PhotoCity montras ke problemoj rilataj al muestreo kaj datumoj kvalito estas potenciale solvebla.
Kiel eblas distribuita datenkolektado laboro por sociaj esploroj? Mirinda ekzemplo venas de la laboro de Susan Watkins kaj ŝiaj kolegoj sur la Malavio Journals Project (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . En tiu projekto, 22 lokaj loĝantoj nomita "ĵurnalistoj" -kept "konversacia revuoj" kiu gravuris, en detalo, la konversaciojn oni aŭdis pri aidoso en la ĉiutagaj vivoj de ordinaraj homoj (tiutempe la projekto komenciĝis, proksimume 15% de plenkreskuloj en Malavio estis infektitaj kun HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Pro iliaj insider statuso, tiuj ĵurnalistoj povis aŭdi konversaciojn kiuj eble estus nealireblaj al Susan Watkins kaj ŝia okcidentaj esploroj kunlaborantoj (mi diskutos la etiko de ĉi poste en la ĉapitro kiam Mi proponas konsilojn pri desegnanta vian propran mason kunlaboro projekto ). La datumoj de la Malavia Journals Projekto gvidis al kelkaj gravaj trovoj. Ekzemple, antaŭ la projekto komenciĝis, multaj eksteruloj kredis ke estis silento pri aidoso en subsahara Afriko, sed la revuoj pruvis ke tio klare ne estas la kazo: ĵurnalistoj aŭdis centojn da konversacio pri la temo, en lokoj tiel diversaj kiel funerales , trinkejoj, kaj preĝejojn. Plui, la naturo de tiuj konversacioj helpis esploristoj pli bone kompreni kelkajn el la rezisto al kondomo uzo; la vojo ke kondomo uzo estis enkadrigita en publika sano mesaĝojn estis malkonsekvencaj kun la maniero ke ĝi estis diskutita en la ĉiutaga vivo (Tavory and Swidler 2009) .
Kompreneble, kiel la datumoj de eBird, la datumoj de la Malavia Journals Project estas ne perfekta, temo diskutita en detalo fare Watkins kaj kolegoj. Ekzemple, la registritaj konversacioj estas ne hazarda specimeno de ĉiuj eblaj konversacioj. Prefere, ili estas nekompleta censo de konversacioj pri aidoso. Laŭ datumoj kvalito, la investigadores kredas ke ilia ĵurnalistoj estis altkvalita raportistoj, kiel pruvas la konsistenco ene revuoj kaj trans revuoj. Plui, kiam sufiĉa ĵurnalistoj estas deplojitaj en malgranda sufiĉa fikso kaj raportoj estas temigis specifan temon, redundo iĝis ebla, kiu pliigas fidon datumoj kvalito. Ekzemple, sekso laboristo nomita "Stella" aperis plurajn fojojn en la revuoj de kvar malsamaj ĵurnalistoj (Watkins and Swidler 2009) . Kiel estis en PhotoCity, la uzo de redundo estas grava principo por taksi kaj certigi datumoj kvalito en distribuita datenkolektado projektoj. Por pliaj konstrui vian intuicion, Tabelo 5.3 montras aliajn ekzemplojn de distribuita datenkolektado por sociaj esploroj.
datumoj kolektitaj | citaĵo |
---|---|
Diskutoj pri HIV / aidoso en Malavio | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Strato petegante en Londono | Purdam (2014) |
Konflikto okazaĵoj en orienta Kongo | Windt and Humphreys (2016) |
Ekonomia aktiveco en Niĝerio kaj Liberio | Blumenstock, Keleher, and Reisinger (2016) |
gripo viglado | Noort et al. (2015) |
Ĉiuj ekzemploj priskribita en tiu sekcio implikis aktiva partopreno: ĵurnalistoj transskribis konversacioj kiujn ili aŭdis; birdumantoj alŝutis iliajn Birdumo checklists; aŭ ludantoj alŝutis iliajn fotojn. Sed kion se la tantiemo estis aŭtomata kaj ne postulas ajnan specifan kapablon aŭ tempon por prezenti? Jen estas la promeso proponita de "partoprena sensing" aŭ "homoj centrita sensing." Ekzemple, la Pothole Patrolo, projekto de sciencistoj ĉe MIT, muntita GPS ekipita acelerómetros ene sep taksio taksioj en la areo de Boston (Eriksson et al. 2008) . Ĉar veturanta super Pothole lasas klaran acelerómetro signalo, tiuj aparatoj, kiam metita ene de movanta taksioj, povas krei Pothole mapoj de Boston. Kompreneble, taksioj ne hazarde specimeno vojoj, sed donita sufiĉa taksioj, povas esti sufiĉa priraportado provizi informojn pri grandaj partoj de tiuj urbo. Dua avantaĝo de pasivaj sistemoj kiuj dependas de la teknologio kiun ili de-lerteco la procezo de kontribuante datumoj: dum ĝi postulas lertecon kontribui al eBird (ĉar vi bezonas por povi fidinde identigi birdospecioj), ĝi ne postulas specialajn kapablojn kontribui al Pothole Patrolo.
Irante antaŭen, mi suspektas ke multaj distribuita datenkolektado projektoj komencos uzi kapablojn de poŝtelefonoj kiuj jam portis de miliardoj de homoj ĉirkaŭ la mondo. Tiuj telefonoj jam havas grandan numeron de sensores grava por mezurado, ekzemple mikrofonoj, fotiloj, GPS aparatoj kaj horloĝoj. Plui, tiuj poŝtelefonoj subtenas triaj apps ebligante esploristoj iun kontrolon super la suba datenkolektado protokoloj. Fine, tiuj telefonoj havas Interreto-konekteblecon, ebligante al ili ekster-ŝarĝas la datumojn ili kolekti. Ekzistas multnombraj teknikaj defioj de malpreciza sensores por limigita pilvivo, sed tiuj problemoj probable malpliigi la tempo kiel teknologio evoluas. Temoj rilataj al privateco kaj etiko, aliflanke, povus akiri pli komplika kiel teknologio evoluas; Mi revenos al demandoj de etiko kiam Mi proponas konsilojn pri desegnanta vian propran mason kunlaborado.
En distribuita datenkolektado projektoj, volontuloj kontribui datumoj pri la mondo. Tiu aliro estas jam uzata sukcese, kaj estontaj uzoj probable devas trakti muestreo kaj datumoj kvalito zorgojn. Feliĉe, ekzistas projektoj kiel PhotoCity kaj Pothole Patrolo sugesti solvojn al tiuj problemoj. Kiel pli projektoj utiligi teknologio kiu ebligas de kvalifikitaj kaj pasiva partopreno, distribuita datenkolektado projektoj devus draste pliigi en skalo, ebligante esploristoj kolekti datumojn kiuj estis simple for limoj en la pasinteco.