Olmayan Temsil İki kaynağı farklı nüfus ve farklı kullanım şekilleri vardır.
Büyük veriler sistematik başlıca iki şekilde önyargılı olma eğilimindedir. Bu analiz için her türlü sorun yol gerekmez, ancak bazı analizler için bir kritik yarık olabilir.
sistematik önyargı bir ilk kaynak yakalanan insanlar genellikle tüm insanların tam bir evren ya da herhangi bir spesifik nüfus rastgele örneklem ne olduğudur. Örneğin, Twitter'da Amerikalılar Amerikalılar rastgele örneklem değildir (Hargittai 2015) . sistematik önyargı ikinci kaynağı çok büyük veri sistemleri eylemleri yakalamak olduğunu ve bazı insanlar diğerlerine göre çok daha fazla eylem katkıda bulunur. Örneğin, Twitter'da bazı insanlar diğerlerinden daha kat daha fazla tweets yüzlerce katkıda bulunur. Bu nedenle, belirli bir platform üzerinde olaylar platforma kendisinden daha belli alt grupların her zamankinden daha ağır yansıtıcı olabilir.
Normalde araştırmacılar sahip oldukları verileri hakkında çok şey bilmek istiyorum. Ama, büyük verinin temsili olmayan doğası göz önüne alındığında, aynı zamanda düşünme çevirmek için yararlıdır. Ayrıca yok veriler hakkında bir şey bilmek gerekir. Eğer yoksa veri var mı verilerden sistematik farklı olduğunda bu özellikle doğrudur. Bir gelişmekte olan ülkelerde bir cep telefonu şirketi çağrı kayıtları varsa Örneğin, size veri kümesi içinde insanlar hakkında değil, aynı zamanda bir cep telefonu sahibi olmak çok fakir olabilir insanlar hakkında değil, sadece düşünmek gerekir. Dahası, Bölüm 3, biz ağırlık olmayan temsilcisi verilerden daha iyi tahminler yapmak için araştırmacılar etkinleştirebilirsiniz nasıl öğreneceksiniz.