2.3.2.3 Non-wakilin

Biyu samo ba representativeness ne daban-daban alƙarya da daban-daban amfani alamu.

Big data ayan a tsare son zuciya a manyan hanyoyi biyu. Wannan bukata ba sa da matsala ga dukan irin bincike, amma ga wasu analysis zai iya zama m aibi.

A farko tushen din nuna bambanci shi ne, mutane da kama ne yawanci ba a gama duniya da dukan mutane, ko da wani bazuwar samfurin daga wani takamaiman yawan. Alal misali, {asar Amirka a kan Twitter ba a bazuwar samfurin Amirkawa (Hargittai 2015) . A karo na biyu tushen din nuna bambanci shi ne, mutane da yawa babban data tsarin kama aiki, da kuma wasu mutane da yawa da taimako mafi ayyuka fiye da wasu. Alal misali, wasu mutane a kan Twitter taimaka daruruwan sau more tweets fiye da wasu. Saboda haka, abubuwan da suka faru a kan wani takamaiman dandamali iya zama taba more dauke da nuna wasu subgroups fiye da dandamali kanta.

A yadda aka saba masu bincike so su san da yawa game da bayanai da suke da shi. Amma, ba da ba-wakilin yanayin babban data, shi ne m ga ma jefa your tunani. Kana bukatar kuma ka san da yawa game da bayanai da ba ka da. Gaskiya ne, a lõkacin da bayanai da ba ka da su tsare daban-daban daga data cewa ba ka da shi. Alal misali, idan kana da kira records daga wayar hannu kamfanin a kasashe masu tasowa, ya kamata ka yi tunani ba kawai game da mutãne, a cikin your dataset, amma kuma a game da mutanen da suka iya zama ma talakawa ya mallaki wayar hannu. Bugu da ari, a Babi na 3, za mu koyi game da yadda weighting iya taimaka masu bincike don yin m kimomi daga wadanda ba wakilin data.