Մեծ տվյալների աղբյուրները հակված են տասը բնութագրեր. ոմանք լավ են սոցիալական հետազոտությունների եւ ոմանք վատ են:
Եթե հետազոտողները մտադիր են դասեր քաղել մեծ տվյալների, որ նրանք չեն ստեղծելու կամ հավաքելու, ապա նրանք պետք է հասկանալ իր ընդհանուր բնութագիրը: Ավելի շուտ, քան հաշվի հարթակ է հարթակ մոտեցմամբ (օրինակ, ահա թե ինչ Ձեզ անհրաժեշտ է իմանալ մասին Twitter, ահա թե ինչ Ձեզ անհրաժեշտ է իմանալ մասին Google որոնողական տվյալներով եւ այլն), ես պատրաստվում եմ նկարագրել, տասը ընդհանուր բնութագիրը մեծ տվյալների, հատկանիշներ, որոնք առաջանում քանի որ տվյալները չեն ստեղծվել նպատակով սոցիալական հետազոտությունների: Ըստ ընդլայնելով ետ մանրամասներին յուրաքանչյուր կոնկրետ համակարգի եւ նայում այդ ընդհանուր հատկություններով, հետազոտողները կարող եք արագ սովորել ավելի մոտ առկա տվյալների աղբյուրների եւ ունեն ամուր շարք գաղափարների կիրառվում ապագա տվյալների աղբյուրների:
Ես գտնում եմ, որ դա օգտակար է խմբի հատկանիշների երկու կատեգորիաների:
Ընդհանուր առմամբ, կառավարության վարչական արձանագրություններ են ավելի քիչ, ոչ ներկայացուցիչ, ավելի քիչ ալգորիթմիկ շփոթեցաւ, եւ ավելի քիչ կուտակումներ: Բայց, մյուս կողմից, գործարար վարչական արձանագրություններ հակված լինել ավելի մեծ եւ ավելի մշտապես: