2.3.2.3 Ոչ ներկայացուցիչը

Երկու աղբյուրները ոչ-ներկայացուցչականություն են բնակչության տարբեր խմբերի եւ տարբեր օգտագործման հրահանգների.

Մեծ տվյալները հակված է համակարգված կողմնակալ է երկու հիմնական ձեւերով: Այս կարիք չի հանգեցնում խնդիր է բոլոր տեսակի վերլուծության, սակայն ինչ-ինչ վերլուծության, այն կարող է լինել կրիտիկական սխալ.

Առաջին աղբյուր համակարգված կողմնակալության այն է, որ նրանք գրավել են, որպես կանոն, ոչ մի ամբողջական տիեզերքի բոլոր մարդկանց կամ պատահական նմուշ որեւէ կոնկրետ բնակչության համար: Օրինակ, ամերիկացիները Twitter- ում չեն պատահական նմուշ ամերիկացիների (Hargittai 2015) : Երկրորդ աղբյուրը համակարգված կողմնակալության, որ շատ մեծ տվյալների համակարգեր գրավել գործողություններ, եւ որոշ մարդիկ նպաստել է ավելի շատ գործողություններ, քան մյուսները: Օրինակ, որոշ մարդիկ Twitter- ում նպաստում է հարյուրավոր անգամներ ավելի Թվիթեր, քան մյուսները: Հետեւաբար, միջոցառումներ է կոնկրետ հարթակ կարող է լինել շատ ավելի ծանր ռեֆլեկտիվ որոշ ենթախմբերի, քան հարթակը:

Սովորաբար, հետազոտողները ուզում են իմանալ, թե շատ բան մասին տվյալները, որոնք նրանք ունեն: Սակայն, հաշվի առնելով ոչ ներկայացուցիչ բնույթը մեծ տվյալների, դա օգտակար է նաեւ մատով խփել ձեր մտածողությունը: Դուք նաեւ պետք է իմանալ, մի բան մասին տվյալները, որ դուք չեք ունենա: Սա հատկապես ճիշտ է, երբ տվյալները, որ դուք չունեք պարբերաբար տարբերվում են տվյալները, որ դուք պետք. Օրինակ, եթե դուք ունեք Զանգեր մի բջջային հեռախոսի ընկերության զարգացող երկրներում, դուք պետք է մտածել ոչ թե պարզապես ժողովրդի մասին ձեր dataset, այլեւ այն մարդկանց, ովքեր կարող են շատ աղքատ է սեփական բջջային հեռախոսը: Բացի այդ, 3-րդ գլխում, մենք սովորում, թե այն մասին, թե ինչպես է կշռման կարող է հնարավորություն տալ հետազոտողներին, որպեսզի ավելի լավ նախահաշիվները ոչ ներկայացուցչական տվյալները.