I progetti di computazione umana hanno un grosso problema, dividerlo in parti semplici, inviarlo a molti lavoratori e quindi aggregare i risultati.
I progetti di computazione umana combinano gli sforzi di molte persone che lavorano su semplici microtasks per risolvere problemi che sono impossibilmente grandi per una persona. Potresti avere un problema di ricerca adatto al calcolo umano se hai mai pensato: "Potrei risolvere questo problema se avessi un migliaio di assistenti di ricerca".
L'esempio prototipo di un progetto di calcolo umano è Galaxy Zoo. In questo progetto, più di centomila volontari hanno classificato le immagini di circa un milione di galassie con un'accuratezza simile a precedenti - e sostanzialmente minori - sforzi da parte di astronomi professionisti. Questa maggiore scala fornita dalla collaborazione di massa ha portato a nuove scoperte sul modo in cui le galassie si formano, e ha scoperto una classe di galassie completamente nuova chiamata "piselli verdi".
Sebbene Galaxy Zoo possa sembrare lontano dalla ricerca sociale, in realtà ci sono molte situazioni in cui i ricercatori sociali vogliono codificare, classificare o etichettare immagini o testi. In alcuni casi, questa analisi può essere eseguita dai computer, ma ci sono ancora alcune forme di analisi difficili per i computer, ma facili per le persone. Sono queste microtasche facili da usare per la gente e difficili da computer che possiamo trasformare in progetti di calcolo umani.
Non solo la microtask in Galaxy Zoo è abbastanza generale, ma anche la struttura del progetto è generale. Galaxy Zoo e altri progetti di computazione umana utilizzano in genere una strategia di combinazione di split-apply-combination (Wickham 2011) e, una volta compresa questa strategia, sarai in grado di utilizzarla per risolvere molti problemi. Innanzitutto, un grosso problema è suddiviso in tanti piccoli problemi. Quindi, il lavoro umano viene applicato a ogni piccolo problema, indipendentemente dagli altri blocchi. Infine, i risultati di questo lavoro sono combinati per produrre una soluzione di consenso. Considerando questo background, vediamo come è stata utilizzata la strategia split-apply-combine in Galaxy Zoo.