2.3.2.3 Non-mwakilishi

Vyanzo viwili vya yasiyo ya representativeness ni watu mbalimbali na mifumo tofauti ya matumizi.

data Big huwa na kuwa utaratibu upendeleo kwa njia mbili kuu. Hii haihitaji kusababisha tatizo kwa kila aina ya uchambuzi, lakini kwa baadhi ya uchambuzi inaweza kuwa flaw muhimu.

chanzo cha kwanza upendeleo utaratibu ni kwamba watu alitekwa ni kawaida wala ulimwengu kamili ya watu wote au sampuli random kutoka idadi ya watu maalum. Kwa mfano, Wamarekani juu ya Twitter si sampuli ya majaribio ya Wamarekani (Hargittai 2015) . Chanzo cha pili cha upendeleo utaratibu ni kwamba wengi mifumo kubwa data kukamata matendo, na baadhi ya watu kuchangia hatua nyingi zaidi kuliko wengine. Kwa mfano, baadhi ya watu juu ya Twitter kuchangia mamia ya tweets zaidi ya mara wengine. Kwa hiyo, matukio kwenye jukwaa maalum inaweza kuwa milele zaidi sana kutafakari ya subgroups baadhi ya jukwaa yenyewe.

Kwa kawaida watafiti wanataka kujua mengi kuhusu data kwamba wana. Lakini, kutokana na yasiyo ya mwakilishi asili ya data kubwa, ni muhimu pia flip mawazo yako. Wewe pia haja ya kujua mengi kuhusu data kwamba huna. Hii ni kweli hasa wakati data kwamba huna ni utaratibu tofauti na data kwamba huna kuwa nayo. Kwa mfano, kama una rekodi wito kutoka kampuni ya simu za mkononi katika nchi zinazoendelea, unapaswa kufikiria siyo tu kuhusu watu katika CCD wako, lakini pia kuhusu watu ambao wanaweza kuwa na maskini mno wanamiliki simu za mkononi. Zaidi ya hayo, katika Sura ya 3, tutaweza kujifunza kuhusu jinsi Viktning inaweza kuwawezesha watafiti kufanya makadirio bora kutoka data zisizo mwakilishi.