מקורות נתונים גדולים נוטים להיות מספר מאפיינים משותפים; חלקם טובים בדרך כלל למחקר חברתי וחלקם בדרך כלל רע.
למרות כל מקור נתונים גדול הוא מובחן, זה מועיל לשים לב כי ישנם מאפיינים מסוימים נוטים להתרחש שוב ושוב. לכן, במקום לנקוט בגישה לפלטפורמת פלטפורמה (לדוגמה, הנה מה שאתה צריך לדעת על טוויטר, הנה מה שאתה צריך לדעת על נתוני חיפוש של Google, וכו '), אני הולך לתאר עשר תכונות כלליות של גדול מקורות מידע. צעד לאחור מן הפרטים של כל מערכת מסוימת, מסתכל על המאפיינים הכלליים האלה מאפשר לחוקרים ללמוד במהירות על מקורות נתונים קיימים יש קבוצה של רעיונות מוצקים ליישם את מקורות הנתונים שייווצרו בעתיד.
אף על פי שהמאפיינים הרצויים של מקור נתונים תלויים במטרה המחקרית, אני מוצא את זה מועיל לקבץ את המאפיינים של עשר קטגוריות לשתי קטגוריות רחבות:
כפי שאני מתאר את המאפיינים האלה תוכל להבחין כי הם נוטים לעתים קרובות כי מקורות נתונים גדולים לא נוצרו לצורך המחקר.