Big πηγές δεδομένων τείνουν να έχουν δέκα χαρακτηριστικά? μερικά είναι καλό για την κοινωνική έρευνα και μερικά είναι κακό.
Εάν οι ερευνητές πρόκειται να μάθουμε από τα μεγάλα στοιχεία ότι δεν δημιουργούν ή να συλλέγουν, τότε θα πρέπει να κατανοήσουν τα γενικά χαρακτηριστικά του. Αντί να λάβει μια πλατφόρμα από την προσέγγιση πλατφόρμας (π.χ., εδώ είναι ό, τι πρέπει να ξέρετε για το Twitter, εδώ είναι ό, τι πρέπει να ξέρετε για τα δεδομένα αναζήτησης Google, κλπ), Πάω να περιγράψει δέκα γενικά χαρακτηριστικά των μεγάλων δεδομένων, τα χαρακτηριστικά που προκύπτουν επειδή τα δεδομένα δεν δημιουργήθηκε για τους σκοπούς της κοινωνικής έρευνας. Με την ενίσχυση πίσω από τις λεπτομέρειες του κάθε συγκεκριμένο σύστημα και κοιτάζοντας αυτές τις γενικές ιδιότητες, οι ερευνητές μπορούν να μάθουν γρήγορα περισσότερα σχετικά με τις υπάρχουσες πηγές δεδομένων και να έχουν μια σταθερή σειρά από ιδέες για να εφαρμόζονται σε μελλοντικές πηγές δεδομένων.
Θεωρώ ότι είναι χρήσιμο να ομαδοποιήσετε τα χαρακτηριστικά σε δύο κατηγορίες:
Σε γενικές γραμμές, η κυβέρνηση διοικητικά αρχεία είναι λιγότερο μη-αντιπροσωπευτική, λιγότερο αλγοριθμικά συγχέονται, και λιγότερο παρασύρεται. Από την άλλη πλευρά, οι επιχειρήσεις διοικητικά αρχεία τείνουν να είναι μεγαλύτερα και πιο always-on.