Розподілений збір даних можливий, і в майбутньому, швидше за все , пов'язані з технологією і пасивну участь.
Як показує eBird, розподілених по збору даних можуть бути використані для наукових досліджень. Крім того, PhotoCity показує, що проблеми, пов'язані з відбором проб та якості даних є потенційно можна розв'язати.
Як може розподілятися по збору даних для роботи соціальних досліджень? Прекрасний приклад з роботи Сьюзан Уоткінс і її колеги по проекту Малаві Журнали (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . У цьому проекті, 22 місцеві жителі звані "журналісти" -kept "розмовних журналів", які записані, в деталях, розмови вони підслухані про СНІД в повсякденному житті простих людей (в момент початку проекту, близько 15% дорослого населення в Малаві були інфіковані ВІЛ (Bello, Chipeta, and Aberle-Grasse 2006) ). Через їх статусу інсайдерської, ці журналісти змогли підслухати розмови, які, можливо, були недоступні для Сьюзан Уоткінс і її західних наукових співробітників (я буду обговорювати етику пізніше в цій главі, коли я пропоную поради про розробку власного проекту масового співробітництва ). Дані з проекту Малаві Журнали призвело до ряду важливих висновків. Наприклад, до початку проекту, багато аутсайдери вважали, що там було мовчання про СНІД в Африці на південь від Сахари, але журнали показали, що це явно не той випадок: журналісти підслухали сотні розмов на цю тему, в тих місцях, настільки ж різноманітні, як похорон , барів і церков. Крім того, характер цих бесід допомогли дослідникам краще зрозуміти деякі з стійкості до використання презервативів; так що використання презервативів підставили в повідомленнях громадської охорони здоров'я не узгоджується з тим, як це обговорювалося в повсякденному житті (Tavory and Swidler 2009) .
Звичайно, як і дані з eBird, дані з проекту Малаві Журнали не є досконалим, питання детально обговорюється в Watkins і його колеги. Так, наприклад, записані розмови не є випадковою вибіркою з усіх можливих розмов. Швидше за все, вони є неповними перепис розмов про СНІД. З точки зору якості даних, дослідники вважають, що їх журналісти були високоякісні журналісти, про що свідчить узгодженість в журналах і по журналам. Крім того, коли достатня кількість журналістів розміщені в досить малій настройки і звіти зосереджені на конкретній темі, надмірність стало можливим, що підвищує довіру до якості даних. Наприклад, працівник секс - бізнесу під назвою "Stella" показав кілька разів в журналах чотирьох різних журналістів (Watkins and Swidler 2009) . Як це було в PhotoCity, використання надмірності є важливим принципом для оцінки та забезпечення якості даних в розподілених проектах по збору даних. Для того, щоб в подальшому будувати свою інтуїцію, Таблиця 5.3 показує інші приклади розподіленої збору даних для соціальних досліджень.
Дані, зібрані | цитування |
---|---|
Дискусії про ВІЛ / СНІД в Малаві | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
Жебрацтво в Лондоні | Purdam (2014) |
Події Конфлікт в Східному Конго | Windt and Humphreys (2016) |
Економічна активність в Нігерії та Ліберії | Blumenstock, Keleher, and Reisinger (2016) |
епіднагляду за грипом | Noort et al. (2015) |
Всі приклади, описані в цьому розділі залучили активну участь: журналісти розшифровані розмови, що вони почуті; птахоловів завантажив свої бірдінг контрольні списки; або гравці можуть завантажувати свої фотографії. Але що, якщо участь було автоматичним і не потребує будь-яких конкретних навичок або часу, щоб представити? Ця обіцянка , пропонованих " з участю зондування" або "людина-орієнтованих зондування." Наприклад, вибоїна Patrol, проект вченими в MIT, встановлені GPS - обладнані акселерометри всередині семи таксі в районі Бостона (Eriksson et al. 2008) і (Eriksson et al. 2008) . Через водіння над вибоїни залишає чіткий сигнал акселерометра, ці пристрої, при розміщенні всередині рухомих таксі, можуть створювати вибоїну карти Бостона. Звичайно, таксі не випадково вибірки дороги, але, з огляду на достатню кількість таксі, може бути досить покриття, щоб надати інформацію про великих ділянках вони міста. Друга перевага пасивних систем, які покладаються на технології полягає в тому, що вони де-вміння процес внести свій вклад даних: в той час як вона вимагає навику внести свій вклад в eBird (бо вам потрібно, щоб мати можливість надійно ідентифікувати види птахів), він не вимагає ніяких спеціальних навичок для внести свій внесок у вибоїну Patrol.
Забігаючи вперед, я підозрюю, що багато колекцій розподілених даних проектів почнуть використовувати можливості мобільних телефонів, які вже ведуться мільярди людей по всьому світу. Ці телефони вже мають велику кількість датчиків, важливих для вимірювання, таких як мікрофони, камери, GPS-пристрої, і годинник. Крім того, ці мобільні телефони підтримують сторонні додатки, що дозволяють дослідникам деякий контроль над базовими протоколами збору даних. Нарешті, ці телефони мають Інтернет-з'єднання, що робить можливим для них, щоб розвантажити дані, які вони збирають. Існують численні технічні проблеми від неточних датчиків до обмеженого часу автономної роботи, але ці проблеми, швидше за все, зменшуватися з плином часу у міру розвитку технології. Питання, пов'язані з особистого життя і етики, з іншого боку, могли б отримати більш складним у міру розвитку технології; Я повернуся до питань етики, коли я пропоную поради про розробку власних співпраці мас.
У розподілених проектах зі збору даних, волонтери надають дані про світ. Такий підхід вже успішно використовується, і майбутнього використання, ймовірно, доведеться звернутися вибірки і якості даних проблем. На щастя, існують проекти, такі як PhotoCity і вибоїну Patrol запропонувати шляхи вирішення цих проблем. Оскільки все більше проектів скористатися перевагами технології, яка дозволяє де-кваліфікованих і пасивну участь, розподілених по збору даних проектів повинні різко збільшити в масштабі, що дозволяє дослідникам збирати дані, які були просто виїхати за межі минулого.