Dui funti di non-representativeness sunnu diffirenti pupulazzioni e sfarente essayer utilizzu.
Big dati tendini à be biased ripetuta in dui modi principali. Chistu nun basta causari un prublema di tuttu tipu di analisi, ma per certi analisi si pò esse un scar critica.
A prima surghjenti di lu priggiudizziu omicidiu è chì u populu catturata sunnu tipicamenti nè un universu cumpleta di tutti i populi o un campionu incerta da ogni pupulazzioni specifichi. Per esempiu, amiricani on Twitter ùn sò micca un campionu incerta di Miricani (Hargittai 2015) . A seconda surgenti di lu priggiudizziu omicidiu è chì parechji sistemi di dati grande catturà azzione, e certi genti cuntribuisce assai più numerose chè l 'altri. Per esempiu, certi pirsuni on Twitter cuntribuisce à centinaie di volte di più Dating chè l 'altri. Ghjè per quessa, u evenimenti nantu à una spianiccia spécifique, pò esse mai più pisi riflessivo di certi subgroups cà u rimpianu iddu stissu.
Nurmalamenti circadori vogghiu sapiri assai supra li dati ca iddi hannu. Ma, datu la natura non-riprisentante di grande data, hè Corsets à valencià puru u vostru pensamentu. Sì ancu bisognu di cunnosce assai supra li dati ca tu nun hannu. Chistu è in particulare veru, quannu li dati ca vo ùn avete sò chjamate sfarenti da i dati chì vo ùn avemu. Per esempiu, sè vo avete i ricordi d da un impresa telefuninu in un paesi sviluppati, tenite vi pari micca prontu à u pòpulu in u vostru dataset, ma ancu di circa lu pòpulu ca si putissi essiri troppu poviru à pusseda un telefuninu. In seguita, in Chapter 3, avemu Mulateri Di L'mparari cumu chila pò attivà i circadori à fà estimates megliu da données non-ripresenta.