מקורות נתונים גדולים נוטים להיות בעלי עשר תכונות; חלקם טובים למחקר חברתי וחלקם רעים.
אם חוקרים הולכים ללמוד מנתונים גדולים כי הם לא ליצור או לאסוף, אז הם חייבים להבין את המאפיינים הכלליים שלה. במקום לקחת פלטפורמה ידי גישת פלטפורמה (למשל, הנה מה שאתם צריכים לדעת על טוויטר, הנה מה שאתה צריך לדעת בנוגע לנתוני חיפוש Google, וכו '), אני הולך לתאר עשרה מאפיינים כלליים של נתונים גדולים, מאפיינים המתעוררים כיוון שהנתונים לא נברא לצורך המחקר החברתי. על ידי צעידה לאחור מן הפרטים של כל מערכת מסוימת ומביטים מאפיינים הכלליים אלה, חוקרים יכולים לקבל מידע נוסף לגבי מקורות נתונים קיימים ויש לי במבנה איתן של רעיונות לחול על מקורות נתונים עתידיים.
אני מוצא את זה מועיל לקבוצה המאפיינים לשתי קטגוריות:
באופן כללי, רשומות שלטון ומנהל הן פחות ולא מייצגים, פחות מבולבלים אלגוריתמי, ופחות נסחף. מצד השני, רשומים מנהלי עסקים נוטים להיות גדול יותר ויותר תמיד על.