Distribuita datumkolekto eblas, kaj en la estonteco verŝajne implikos teknologion kaj pasivan partoprenon.
Kiel eBird pruvas, distribuita datumkolekto povas esti uzata por scienca esplorado. Plue, PhotoCity montras, ke problemoj rilate al samplado kaj datuma kvalito estas ebla solveblaj. Kiel povus distribui la kolektadon de datumoj por socia esplorado? Unu ekzemplo venas de la laboro de Susan Watkins kaj ŝiaj kolegoj en la Malavia Revuiga Projekto (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . En ĉi tiu projekto, 22 lokaj loĝantoj, nomitaj "ĵurnalistoj" -kaptis "konversaciaj revuoj", registris, detale, la konversaciojn, kiujn ili aŭdis pri AIDOSO en la ĉiutaga vivo de ordinaraj homoj (kiam la projekto komencis, ĉirkaŭ 15% de plenkreskuloj En Malavio estis infektita de HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Pro ilia intensa statuso, ĉi tiuj ĵurnalistoj povis aŭskulti konversaciojn, kiuj povus esti nealireblaj por Watkins kaj ŝiaj okcidentaj esploraj kunlaborantoj (mi diskutos la etikon de ĉi tio poste en la ĉapitro kiam mi proponas konsilojn pri desegnado de via propra masa kunlaboro) . La datumoj de la Malavia Revizia Projekto kaŭzis multajn gravajn rezultojn. Ekzemple, antaŭ ol la projekto komencis, multaj eksterlandanoj kredis, ke silento okazis pri AIDOS en Afriko subsahariana, sed la konversaciaj ĵurnaloj pruvis, ke tio klare ne estis: la ĵurnalistoj aŭskultis centojn da diskutoj pri la temo, en lokoj tiel diversaj kiel funerales, trinkejoj kaj preĝejoj. Plie, la naturo de ĉi tiuj konversacioj helpis al esploristoj pli bone kompreni iom da rezisto al la uzo de kondomoj; la maniero, en kiu la uzo de kondomoj estis enkadrigita en publikaj sanaj mesaĝoj, estis nekongrua kun la maniero, kiel ĝi diskutis en la ĉiutaga vivo (Tavory and Swidler 2009) .
Kompreneble, kiel la datumoj de eBird, la datumoj de la Malavia Revuiga Projekto ne estas perfekta, temo diskutata de Watkins kaj kolegoj. Ekzemple, la registritaj konversacioj ne estas hazarda specimeno de ĉiuj eblaj konversacioj. Prefere ili estas nekompleta censo de konversacioj pri AIDOSO. Koncerne al la kvalito de la datumoj, la esploristoj kredis, ke iliaj ĵurnalistoj estis altkvalitaj raportistoj, kiel evidentigas la konsistado en revuoj kaj trans revuoj. Tio estas, ĉar sufiĉe da ĵurnalistoj estis deplojitaj en sufiĉe malgranda fikso kaj koncentritaj al specifa temo, estis eble uzi redundon por taksi kaj certigi la kvaliton de datumoj. Ekzemple, seksa laboristo nomata "Stella" montris plurajn fojojn en la revuoj de kvar malsamaj ĵurnalistoj (Watkins and Swidler 2009) . Por pliigi vian intuicion, tablo 5.3 montras aliajn ekzemplojn de distribuitaj datumoj-kolekto por socia esplorado.
Datumoj kolektitaj | Referenco |
---|---|
Diskutoj pri HIV / AIDOSO en Malavio | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Strato petegante en Londono | Purdam (2014) |
Konfliktoj en Orienta Kongo | Windt and Humphreys (2016) |
Ekonomia aktiveco en Niĝerio kaj Liberio | Blumenstock, Keleher, and Reisinger (2016) |
Gvatado | Noort et al. (2015) |
Ĉiuj ekzemploj priskribitaj en ĉi tiu sekcio implikis aktivan partoprenon: ĵurnalistoj transskribis konversaciojn, kiujn ili aŭdis; birdistoj alŝutis siajn birdajn ĉeklistojn; aŭ ludantoj alŝutis siajn fotojn. Sed kio se la partopreno estis aŭtomata kaj ne postulis iun specifan kapablon aŭ tempon por submetiĝi? Ĉi tiu estas la promeso proponita de "partoprenaj sentoj" aŭ "homoj-centraj sentoj". Ekzemple, la Pothole Patrol, projekto de sciencistoj ĉe MIT, muntis GPS-ekipitajn akcelometrojn ene de sep taksioj en la areo de Boston (Eriksson et al. 2008) . Pro tio, ke veturi super pothole eliras klaran signalon de acelerómetro, ĉi tiuj aparatoj, kiam ili lokas ene de moviĝantaj taksioj, povas krei popolajn mapojn de Boston. Kompreneble, taksioj ne hazarde montras vojojn, sed, donitaj sufiĉaj taksioj, povas esti sufiĉa priraportado por provizi informojn pri grandaj partoj de ili grandurbo. Dua avantaĝo de pasivaj sistemoj, kiuj dependas de la teknologio, estas, ke ili malhelpas la procezon de kontribuado de datumoj: dum ĝi bezonas lertecon por kontribui al eBird (ĉar vi bezonas fidinde identigi birdajn speciojn), ĝi ne bezonas specialajn kapablojn al kontribui al Pothole Patrol.
Antaŭenirinte, mi suspektas, ke multaj distribuataj datumoj-kolektadoproj komencos uzi kapablojn de la poŝtelefonoj, kiuj jam portas milionojn da homoj de la mondo. Ĉi tiuj telefonoj jam havas grandan nombron da sensiloj gravaj por mezurado, kiel ekzemple mikrofonoj, ĉambroj, aparatoj GPS kaj horloĝoj. Plue, ili subtenas partiajn programojn, kiuj ebligas al esploristoj iom da kontrolo pri la subaĵaj kolektoj de protokoloj. Fine, ili havas interreligecon, ebligante al ili malŝarĝi la datumojn, kiujn ili kolektas. Ekzistas multaj teknikaj defioj, kiuj iras de malĝustaj sensiloj ĝis limigita kuirilaro, sed ĉi tiuj problemoj malpliiĝos laŭ la tempo, kiam la teknologio disvolvas. Temoj rilatigitaj al privateco kaj etiko, aliflanke, povus esti pli komplikaj; Mi revenos al demandoj pri etiko kiam mi proponas konsilojn pri desegnado de via propra masa kunlaboro.
En distribuitaj datumoj kolektoj, volontuloj kontribuas pri la mondo. Ĉi tiu alproksimiĝo jam estis sukcese uzata, kaj estontaj uzoj verŝajne devos trakti la specimenojn pri specimeno kaj pri kvalito de datumoj. Feliĉe, ekzistantaj projektoj kiel PhotoCity kaj Pothole Patrol sugestas solvojn al ĉi tiuj problemoj. Ĉar pli da projektoj utiligas teknologion, kiu ebligas nekredeblan kaj pasivan partoprenon, distribuitajn datumajn projektojn devus drame pliigi skalon, ebligante al esploristoj kolekti datumojn, kiuj estis simple limigitaj en la pasinteco.