Разпространено събиране на данни е възможно и в бъдеще вероятно ще включва технологично и пасивно участие.
Както демонстрира eBird, събирането на разпределени данни може да се използва за научни изследвания. Освен това PhotoCity показва, че проблемите, свързани с вземането на проби и качеството на данните, са потенциално разрешими. Как може да се разпредели събирането на данни за социални изследвания? Един пример идва от работата на Сюзън Уоткинс и нейните колеги по проекта за журналисти в Малави (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . В този проект 22 местни жители, наречени "журналисти", разговаряха с "разговорни списания", които записваха подробно разговорите, които са чували за СПИН в ежедневието на обикновените хора (по времето, когато проектът започна, около 15% в Малави са заразени с ХИВ (Bello, Chipeta, and Aberle-Grasse 2006) ). Поради инвалидния си статус тези журналисти успяха да чуят разговорите, които можеха да бъдат недостъпни за Уоткинс и нейните западни изследователи (ще обсъдя етиката на това по-късно в главата, когато ви предлагам съвети за проектирането на вашия собствен проект за масова съвместна работа) , Данните от Проекта на журналистите в Малави доведоха до редица важни констатации. Например преди началото на проекта много аутсайдери вярваха, че има мълчание за СПИН в Африка на юг от Сахара, но разговорите в списанията показват, че това несъмнено е било така: журналистите чуват стотици дискусии по темата, погребения, барове и църкви. Освен това естеството на тези разговори помогна на изследователите да разберат по-добре някои от съпротивата срещу употребата на презервативи; начинът, по който употребата на презервативи е била оформена в съобщенията за общественото здраве, не съответства на начина, по който се дискутира в ежедневието (Tavory and Swidler 2009) .
Разбира се, подобно на данните от eBird, данните от проекта за журналисти в Малави не са съвършени, въпрос, обсъден подробно от Уоткинс и колегите. Например, записаните разговори не са случайна извадка от всички възможни разговори. По-скоро те са непълна преброяване на разговорите за СПИН. По отношение на качеството на данните, изследователите смятат, че техните журналисти са висококачествени репортери, както се вижда от последователността в списанията и в списанията. Това означава, че тъй като достатъчно журналисти бяха разгърнати в достатъчно малка обстановка и се съсредоточиха върху определена тема, беше възможно да се използва съкращаване, за да се оцени и гарантира качеството на данните. Например, сексуален работник на име "Stella" се появява няколко пъти в списанията на четирима различни журналисти (Watkins and Swidler 2009) . С цел по-нататъшно изграждане на вашата интуиция, таблица 5.3 показва други примери за събиране на разпределени данни за социални изследвания.
Събрани данни | препратка |
---|---|
Дискусии за ХИВ / СПИН в Малави | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Улицата проси в Лондон | Purdam (2014) |
Конфликтни събития в Източно Конго | Windt and Humphreys (2016) |
Икономическа дейност в Нигерия и Либерия | Blumenstock, Keleher, and Reisinger (2016) |
Наблюдение на грипа | Noort et al. (2015) |
Всички примери, описани в този раздел, включват активно участие: журналистите преписват разговорите, които са чували; birders качи своите списъци за проверка на птици; или играчите са качили снимките си. Но какво би станало, ако участието беше автоматизирано и не изискваше никакво конкретно умение или време за подаване? Това е обещанието, предлагано от "усещането на участието" или "разпознаването на хора". Например "Потхол Патрул", проект на учените от MIT, монтира акселерометри, оборудвани с GPS, в седем таксита в района на Бостън (Eriksson et al. 2008) . Тъй като шофирането над дупката дава очевиден сигнал за акселерометър, тези устройства, когато се намират в движещи се таксита, могат да създават карти на Бостон. Разбира се, такситата не избират случайно пътища, но при достатъчно таксита може да има достатъчно покритие, за да предоставят информация за големи части от града. Второто предимство на пасивните системи, които разчитат на технологията, е, че те не познават процеса на предоставяне на данни: въпреки че изисква умение да допринася за eBird (защото трябва да сте в състояние надеждно да идентифицирате видовете птици), не изисква специални умения допринасят за Потхол Патрул.
Придвижвайки се напред, подозирам, че много разпространени проекти за събиране на данни ще започнат да използват възможностите на мобилните телефони, които вече се пренасят от милиарди хора по целия свят. Тези телефони вече имат голям брой сензори, важни за измерването, като например микрофони, камери, GPS устройства и часовници. Освен това те поддържат приложения на трети страни, които дават възможност на изследователите да контролират основните протоколи за събиране на данни. И накрая, те имат интернет свързаност, което им дава възможност да разтоварват данните, които събират. Съществуват множество технически предизвикателства, вариращи от неточни сензори до ограничен живот на батерията, но тези проблеми вероятно ще намалеят с течение на времето, докато технологията се развива. Въпросите, свързани с неприкосновеността на личния живот и етиката, от друга страна, може да станат по-сложни; Ще се върна към етичните въпроси, когато ви предлагам съвети за разработването на вашето масово сътрудничество.
В проектите за събиране на разпределени данни доброволците дават данни за света. Този подход вече е използван успешно и евентуалните бъдещи употреби вероятно ще трябва да обхванат проблемите с вземането на проби и качеството на данните. За щастие съществуващи проекти като PhotoCity и Pothole Patrol предлагат решения на тези проблеми. Тъй като повече проекти се възползват от технологията, която позволява неквалифицирано и пасивно участие, проектите за разпределено събиране на данни трябва драматично да се увеличават в мащаб, което позволява на изследователите да събират данни, които просто са били извън границите в миналото.