Burimet e të dhënave të mëdha priren të kenë dhjetë karakteristika; disa janë të mira për hulumtime sociale dhe disa janë të këqija.
Nëse studiuesit do të mësoni nga të dhënat e madhe që ata nuk kanë krijuar ose mbledhur, atëherë ata duhet të kuptojnë karakteristikat e saj të përgjithshme. Në vend se të marrë një platformë nga qasja platformë (p.sh., këtu është ajo që ju duhet të dini në lidhje me Twitter, këtu është ajo që ju duhet të dini në lidhje me të dhënat e kërkimit të Google, etj), unë jam duke shkuar për të përshkruar dhjetë karakteristikat e përgjithshme të të dhënave të mëdha, karakteristikat që dalin për shkak se të dhënat nuk është krijuar për qëllime të hulumtimeve sociale. Duke shkëputur nga detajet e çdo sistemi të caktuar dhe duke kërkuar në këto prona të përgjithshme, studiuesit mund të shpejt të mësuar më shumë për burimet ekzistuese të të dhënave dhe të ketë një grup të fortë të ideve për të aplikuar për të burimeve të ardhshme të të dhënave.
I gjejnë të dobishme për grupin e karakteristikave në dy kategori:
Përgjithësisht, të dhënat administrative qeveritare janë më pak jo-përfaqësuese, të hutuar pak algorithmically, dhe më pak shkon. Nga ana tjetër, të dhënat administrative të biznesit priren të jenë më të mëdha dhe më të gjithmonë-në.