Големи извори на податоци имаат тенденција да имаат десет карактеристики; некои се добри за социјални истражувања, а некои се лоши.
Ако истражувачите се случува да научат од големите податоци дека тие не се создаваат или собираат, тогаш тие мора да разберат неговите општи карактеристики. Наместо со земање на платформа со пристап платформа (на пример, тука е она што треба да знаете за Твитер, тука е она што треба да знаете за податоци на Google за пребарување, итн), јас ќе одам да се опише десет општите карактеристики на големи податоци, карактеристики кои се јавуваат затоа што податоците не е создаден заради социјални истражувања. Со Отстапувајќи од деталите на секој конкретен систем и да гледа во овие општи карактеристики, истражувачите можат брзо да научат повеќе за постојните извори на податоци и да имаат цврста сет на идеи да се однесуваат на иднината на извори на податоци.
Сметам дека е корисно да се група на карактеристики во две категории:
Генерално, државни административни записи се помалку нерепрезентативен, помалку алгоритамски збунет, а помалку лебдат. Од друга страна, бизнис административни евиденции имаат тенденција да бидат поголеми и секогаш-на.