Mbledhja e të dhënave të shpërndara është e mundur dhe në të ardhmen ka gjasa të përfshijë teknologjinë dhe pjesëmarrjen pasive.
Siç tregon eBird, mbledhja e të dhënave të shpërndara mund të përdoret për kërkime shkencore. Për më tepër, PhotoCity tregon se problemet që lidhen me marrjen e mostrave dhe cilësinë e të dhënave janë potencialisht të zgjidhshme. Si mund të shpërndahet puna për grumbullimin e të dhënave për hulumtime sociale? Një shembull vjen nga puna e Susan Watkins dhe kolegët e saj në Projektin e (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) Malavi (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . Në këtë projekt, 22 banorë lokalë - të quajtura "gazetarë" -shkruan "revistat biseduese" që regjistronin në detaje bisedat që dëgjonin për AIDS në jetën e përditshme të njerëzve të zakonshëm (në kohën kur filloi projekti, rreth 15% e të rriturve në Malavi ishin të infektuar me HIV (Bello, Chipeta, and Aberle-Grasse 2006) ). Për shkak të statusit të tyre të brendshëm, këta gazetarë ishin në gjendje t'i dëgjonin bisedat që mund të kishin qenë të paarritshme për Watkins dhe bashkëpunëtorët e saj të hulumtimit perëndimor (unë do të diskutoj etikën e kësaj më vonë në kapitullin kur ofroj këshilla për hartimin e projektit tuaj të bashkëpunimit në masë) . Të dhënat nga Projekti i Revistës Malavi kanë çuar në një numër gjetjesh të rëndësishme. Për shembull, para se të fillonte projekti, shumë të huaj besonin se kishte heshtje rreth AIDS-it në Afrikën Sub-Sahariane, por revistat biseduese treguan se kjo nuk ishte e qartë: gazetarët dëgjonin qindra diskutime të temës, në vende sa të ndryshme funerale, bare dhe kisha. Më tej, natyra e këtyre bisedave ndihmoi studiuesit të kuptojnë më mirë disa nga rezistenca ndaj përdorimit të kondomit; mënyra se si përdorimi i kondomit ishte i përshtatur në mesazhet e shëndetit publik ishte në kundërshtim me mënyrën se si u diskutua në jetën e përditshme (Tavory and Swidler 2009) .
Natyrisht, si të dhënat nga eBird, të dhënat nga Projekti i Revistës Malavi nuk janë të përsosura, një çështje e diskutuar në detaje nga Watkins dhe kolegët. Për shembull, bisedat e regjistruara nuk janë një mostër e rastësishme e të gjitha bisedave të mundshme. Përkundrazi, ato janë një regjistrim jo i plotë i bisedimeve rreth AIDS-it. Sa i përket cilësisë së të dhënave, studiuesit besonin se gazetarët e tyre ishin reporterë të kualitetit të lartë, siç dëshmohet nga qëndrueshmëria brenda revistave dhe nëpër revista. Kjo është, sepse gazetarët e mjaftueshëm u vendosën në një mjedis të vogël dhe u përqëndruan në një temë specifike, ishte e mundur të përdoret tepricë për të vlerësuar dhe siguruar cilësinë e të dhënave. Për shembull, një punonjës i seksit me emrin "Stella" u shfaq disa herë në revistat e katër gazetarëve të ndryshëm (Watkins and Swidler 2009) . Për të ndërtuar më tej intuitën tuaj, tabela 5.3 tregon shembuj të tjerë të mbledhjes së të dhënave të shpërndara për hulumtime sociale.
Të dhënat e mbledhura | referim |
---|---|
Diskutime rreth HIV / AIDS në Malavi | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Rruga që lyp në Londër | Purdam (2014) |
Ngjarjet e konfliktit në Kongo Lindore | Windt and Humphreys (2016) |
Aktiviteti ekonomik në Nigeri dhe Liberi | Blumenstock, Keleher, and Reisinger (2016) |
Vëzhgimi i influencës | Noort et al. (2015) |
Të gjithë shembujt e përshkruar në këtë pjesë kanë përfshirë pjesëmarrjen aktive: gazetarët i kanë transkripuar bisedat që dëgjuan; birders ngarkuar listat e kontrollit të tyre birding; ose lojtarët ngarkuan fotot e tyre. Por, çka nëse pjesëmarrja ishte automatike dhe nuk kërkonte ndonjë aftësi specifike apo kohë për t'u paraqitur? Për shembull, Patrol Pothole, një projekt nga shkencëtarët në MIT, montuan accelerometers të pajisur me GPS brenda shtatë kabina taksie në zonën e Bostonit (Eriksson et al. 2008) . Sepse ngasja mbi një lende lë një sinjal të dallueshëm të akseleratorit, këto pajisje, kur vendosen brenda lëvizjes së taksive, mund të krijojnë harta të buta të Bostonit. Natyrisht, taksi nuk përzgjedhin rrugët rastësisht, por, duke pasur parasysh taksitë e mjaftueshme, mund të ketë mbulim të mjaftueshëm për të siguruar informacion rreth pjesëve të mëdha të qytetit. Një përfitim i dytë i sistemeve pasive që mbështetet në teknologji është që ata të aftësojnë procesin e dhënies së të dhënave: ndërsa kërkon aftësi për të kontribuar në eBird (sepse ju duhet të jeni në gjendje të identifikoni me saktësi llojet e zogjve), nuk kërkon aftësi të veçanta kontribuojnë në Patologjinë e Pothole.
Duke shkuar përpara, dyshoj se shumë projekte të shpërndara të mbledhjes së të dhënave do të fillojnë të përdorin aftësitë e telefonave celularë që tashmë janë kryer nga miliarda njerëz në mbarë botën. Këto telefona tashmë kanë një numër të madh të sensorëve të rëndësishëm për matjen, të tilla si mikrofona, kamera, pajisje GPS dhe orë. Për më tepër, ato mbështesin aplikacionet e palëve të treta, duke u mundësuar hulumtuesve disa kontroll mbi protokollet e mbledhjes së të dhënave. Së fundi, ata kanë lidhje me internetin, duke u mundësuar atyre që të shkarkojnë të dhënat që mbledhin. Ekzistojnë sfida të shumta teknike, që shkojnë nga sensorë të pasakta në jetën e baterisë të kufizuar, por këto probleme do të zvogëlohen me kalimin e kohës, ndërsa zhvillohet teknologjia. Çështjet që lidhen me privatësinë dhe etikën, nga ana tjetër, mund të bëhen më të komplikuara; Do të kthehem në çështjet e etikës kur të ofroj këshilla rreth dizajnimit të bashkëpunimit tuaj në masë.
Në projektet e shpërndarjes së të dhënave, vullnetarët kontribuojnë me të dhëna për botën. Kjo qasje tashmë është përdorur me sukses dhe përdorimet e ardhshme do të kenë të ngjarë të adresojnë marrjen e mostrave dhe shqetësimet e cilësisë së të dhënave. Për fat të mirë, projektet ekzistuese si PhotoCity dhe Pothole Patrol sugjerojnë zgjidhje për këto probleme. Ndërsa projekte të tjera përfitojnë nga teknologjia që mundëson pjesëmarrjen e de-kualifikuar dhe pasive, projektet e shpërndarjes së të dhënave duhet të rriten në mënyrë dramatike në shkallë, duke u mundësuar hulumtuesve të mbledhin të dhëna që ishin thjesht jashtë kufijve në të kaluarën.