После того, как вы побудили многих людей работать над реальной научной проблемой, вы обнаружите, что ваши участники будут гетерогенными по двум основным направлениям: они будут варьироваться как по своему мастерству, так и по уровню их усилий. Первой реакцией многих социальных исследователей является борьба с этой неоднородностью, пытаясь исключить некачественных участников, а затем попытаться собрать фиксированный объем информации у всех. Это неправильный способ разработки проекта массового сотрудничества. Вместо борьбы с гетерогенностью вы должны использовать ее.
Во-первых, нет причин исключать низкоквалифицированных участников. При открытых вызовах участники с низкой квалификацией не вызывают проблем; их вклад никому не мешает, и они не требуют времени для оценки. Более того, в проектах человеческих вычислений и распределенных проектов по сбору данных лучшая форма контроля качества осуществляется за счет избыточности, а не через высокий бар для участия. Фактически, вместо исключения участников с низким уровнем квалификации лучший подход заключается в том, чтобы помочь им внести больший вклад, как это сделали исследователи из eBird.
Во-вторых, нет причин собирать фиксированный объем информации от каждого участника. Участие во многих проектах массового сотрудничества невероятно неравномерно (Sauermann and Franzoni 2015) , при этом небольшое количество людей вносит свой вклад в многое, иногда называемое толстой головой, и многие люди мало что дают, иногда называемый длинным хвостом . Если вы не собираете информацию с толстой головы и длинного хвоста, вы оставляете массы информации без внимания. Например, если Википедия приняла 10 и только 10 исправлений для каждого редактора, она потеряет около 95% изменений (Salganik and Levy 2015) . Таким образом, при массовых проектах сотрудничества лучше всего использовать гетерогенность, а не пытаться ее устранить.