تميل مصادر البيانات الكبيرة لديها عشرة الخصائص. بعضها جيد للبحوث الاجتماعية وبعضها سيئة.
إذا الباحثين يذهبون للتعلم من البيانات الكبيرة أنها لم تخلق أو جمع، ثم عليهم أن يفهموا الخصائص العامة. بدلا من أخذ المنصة نهج منصة (على سبيل المثال، وهنا ما تحتاج إلى معرفته عن التغريد، وهنا ما تحتاج إلى معرفته حول بيانات البحث جوجل وغيرها)، وانا ذاهب لوصف عشرة الخصائص العامة من بيانات كبيرة، والخصائص التي تنشأ لأنه لم يتم إنشاء البيانات لغرض البحث الاجتماعي. من خلال التراجع عن تفاصيل كل نظام معين وتبحث في هذه الخصائص العامة، يمكن للباحثين يتعلم بسرعة أكبر حول مصادر البيانات الموجودة ولها مجموعة حازما من الأفكار لتطبيقها على مصادر البيانات في المستقبل.
أجد أنه من المفيد أن مجموعة الخصائص إلى فئتين:
بصفة عامة، والسجلات الإدارية الحكومية هي أقل غير ممثلة، مرتبك أقل حسابيا، وأقل الانجراف. من ناحية أخرى، والسجلات الإدارية الأعمال تميل إلى أن تكون أكبر وأكثر دائما على.