Une fois que vous avez motivé beaucoup de gens à travailler sur un vrai problème scientifique, vous découvrirez que vos participants seront hétérogènes de deux façons principales: ils varieront à la fois dans leur compétence et leur niveau d'effort. La première réaction de nombreux chercheurs en sciences sociales est de lutter contre cette hétérogénéité en essayant d'exclure les participants de faible qualité et en tentant ensuite de collecter une quantité d'informations fixe auprès de tous ceux qui restent. C'est la mauvaise façon de concevoir un projet de collaboration de masse. Au lieu de lutter contre l'hétérogénéité, vous devriez en tirer parti.
Premièrement, il n'y a aucune raison d'exclure les participants peu qualifiés. Dans les appels ouverts, les participants peu qualifiés ne causent pas de problèmes; leurs contributions ne font de mal à personne et ils n'ont pas besoin de temps pour évaluer. En outre, dans les projets de calcul humain et de collecte de données distribuées, la meilleure forme de contrôle de la qualité passe par la redondance, et non par une barre trop élevée pour la participation. En fait, plutôt que d'exclure les participants peu qualifiés, une meilleure approche consiste à les aider à faire de meilleures contributions, comme l'ont fait les chercheurs d'eBird.
Deuxièmement, il n'y a aucune raison de collecter une quantité fixe d'informations de chaque participant. La participation à de nombreux projets de collaboration de masse est incroyablement inégale (Sauermann and Franzoni 2015) , avec un petit nombre de personnes qui contribuent beaucoup - parfois appelé la grosse tête - et beaucoup de gens qui contribuent un peu - parfois appelé la longue traîne . Si vous ne collectez pas d'informations sur la grosse tête et la longue queue, vous laissez des masses d'informations non collectées. Par exemple, si Wikipédia acceptait 10 et seulement 10 modifications par éditeur, elle perdrait environ 95% des modifications (Salganik and Levy 2015) . Ainsi, avec des projets de collaboration de masse, il est préférable de tirer parti de l'hétérogénéité plutôt que d'essayer de l'éliminer.