După ce au motivat o mulțime de oameni pentru a lucra la o problemă științifică reală, veți descoperi că participanții vor fi eterogene în două moduri principale: acestea vor varia în abilitățile lor și ei vor varia în nivelul lor de efort. Prima reacție a multor cercetători sociali este de a exclude participanților de calitate scăzută și apoi să încerce să colecteze o sumă fixă de informații din toată lumea a plecat. Acesta este un mod greșit de a proiecta un proiect de colaborare în masă.
În primul rând, nu există nici un motiv pentru a exclude participanții necalificați. În cadrul unor apeluri deschise, participanții necalificați nu cauzează probleme; contribuțiile lor nu rănesc pe nimeni și nu necesită nici un moment pentru a evalua. În cazul proiectelor de colectare a datelor distribuite de calcul uman și, pe de altă parte, cea mai bună formă de control al calității vine prin redundanță, nu un bar mare pentru participare. De fapt, mai degrabă decât excluderea participanților scăzut de calificare, o abordare mai bună este de a le ajuta să facă contribuții mai bune, la fel ca cercetatorii de la eBird au făcut.
În al doilea rând, nu există nici un motiv pentru a colecta o cantitate fixă de informații de la fiecare participant. Participarea la mai multe proiecte de colaborare în masă este extrem de inegală (Sauermann and Franzoni 2015) , cu un număr mic de persoane care contribuie foarte mult-numit uneori capul de grăsime -și o mulțime de oameni care contribuie un pic-numit uneori coada lunga. În cazul în care nu colectează informații de cap de grăsime și coada lungă, sunteți lăsând tone de informații necolectate. De exemplu, în cazul în care Wikipedia a acceptat 10 și doar 10 modificări per editor, ar pierde aproximativ 95% din modificările (Salganik and Levy 2015) . Astfel, cu proiecte de colaborare în masă, cel mai bine este să pârghie eterogenitate, mai degrabă decât să încerce să-l elimine.