Fonti di dati Big tendini à me dece caratteristiche; certi sò boni per a ricerca è suciale, certi sò mali.
S'è circadori jemu à amparà da grandi data, ch'elli ùn crià o raccoglia, po si deve capisce a so caratteristiche ginirali. Chiu tostu di ripiglià un rimpianu da accustà u rimpianu (per esempiu, quì, hè ciò chì ci vole à sapè su Twitter, quì, hè ciò chì ci vole à cunnosce circa di dati di ricerca Google, eccetra), aghju decisu chè vocu à discriva i dece caratteristiche ginirali di grandi li dati, e caratteristiche chì a mio zitella picchì i dati nun fu criatu di lu ntentu di a ricerca suciali. Par Stepping torna da i ditagli di ogni sistema di particulare, è fighjulendu ssi pruprità ginirali, circadori pò amparà aghjustà di più nantu fonti di dati esistenti e hannu nu nsemi offiziu di idee di dumandà a fonti di dati avvene.
Aghju trova Corsets à u gruppu di lu tipu 'n dui categorie:
Largu di parlà, di guvernu amministrativi sò menu non-riprisentante, menu algorithmically cunfusi, è menu varca. Nantu à u cuntrariu, i cartulari amministrativi los tendini à essa più grande è più sempri-on.