Στην αναλογική εποχή, η συλλογή δεδομένων σχετικά με τη συμπεριφορά-ποιος κάνει τι, όταν, ήταν ακριβό, και, ως εκ τούτου, είναι σχετικά σπάνιες. Τώρα, στην ψηφιακή εποχή, οι συμπεριφορές των δισεκατομμυρίων ανθρώπων που καταγράφονται, αποθηκεύονται και να αναλυθούν. Για παράδειγμα, κάθε φορά που κάνετε κλικ σε ένα δικτυακό τόπο, να κάνει μια κλήση στο κινητό σας, ή να πληρώσει για κάτι με την πιστωτική σας κάρτα, ένα ψηφιακό αρχείο της συμπεριφοράς σας δημιουργείται και αποθηκεύεται από μια επιχείρηση. Επειδή αυτά τα δεδομένα είναι ένα υποπροϊόν της κάθε δράσεις μέρα των ανθρώπων, που συχνά ονομάζονται ψηφιακά ίχνη. Εκτός από αυτά τα ίχνη που κατέχουν οι επιχειρήσεις, οι κυβερνήσεις έχουν επίσης απίστευτα πλούσια δεδομένα σχετικά τόσο τους ανθρώπους και τις επιχειρήσεις, τα στοιχεία τα οποία είναι συχνά ψηφιοποιηθεί και να αναλυθούν. Μαζί αυτά τα επιχειρηματικά και κυβερνητικά αρχεία καλούνται συχνά μεγάλα δεδομένα.
Η συνεχώς αυξανόμενη πλημμύρα των μεγάλων δεδομένων σημαίνει ότι έχουμε μετακινηθεί από έναν κόσμο όπου τα δεδομένα συμπεριφοράς ήταν σπάνιο σε έναν κόσμο όπου συμπεριφοράς των δεδομένων είναι άφθονα. Αλλά, επειδή αυτοί οι τύποι δεδομένων που είναι σχετικά νέο, ένα ατυχές το ποσό της έρευνας με τη χρήση τους μοιάζει με τους επιστήμονες τυφλά κυνηγούν τα διαθέσιμα δεδομένα. Το κεφάλαιο αυτό, αντ 'αυτού, προσφέρει σε αρχές προσέγγιση για την κατανόηση των διαφορετικών πηγών δεδομένων και πώς μπορούν να χρησιμοποιηθούν. Αυτή η βαθύτερη κατανόηση θα σας βοηθήσει να ταιριάζει καλύτερα ερευνητικά ερωτήματα σας με τις κατάλληλες πηγές δεδομένων. Ή, αν αυτές οι υπάρχουσες πηγές λείπει, σας πείσει να συλλέξετε τα δικά σας δεδομένα χρησιμοποιώντας τις ιδέες στο μέλλον κεφάλαια.
Ένα πρώτο βήμα για την εκμάθηση από τα μεγάλα στοιχεία είναι να συνειδητοποιήσουμε ότι είναι μέρος μιας ευρύτερης κατηγορίας των στοιχείων που έχει χρησιμοποιηθεί για την κοινωνική έρευνα για πολλά χρόνια: παρατηρησιακά δεδομένα. Χονδρικά, παρατηρησιακά δεδομένα είναι οποιαδήποτε στοιχεία που προκύπτει από την παρατήρηση ενός κοινωνικού συστήματος, χωρίς να παρεμβαίνει με κάποιο τρόπο. Ένα αργό τρόπο να το σκεφτώ είναι ότι παρατηρησιακά δεδομένα είναι κάθε τι που δεν περιλαμβάνει μιλώντας με τους ανθρώπους (π.χ., έρευνες, το θέμα του Κεφαλαίου 3) ή μεταβαλλόμενο περιβάλλον των ανθρώπων (π.χ., πειράματα, το θέμα του Κεφαλαίου 4). Έτσι, εκτός από τις επιχειρήσεις και κυβερνητικά αρχεία, δεδομένα παρατήρησης περιλαμβάνει επίσης τα πράγματα όπως το κείμενο των άρθρων εφημερίδων και δορυφορικές φωτογραφίες.
Αυτό το κεφάλαιο έχει τρία μέρη. Πρώτον, στο τμήμα 2.2, έχω περιγράψει μεγάλο δεδομένων με περισσότερες λεπτομέρειες και να αποσαφηνίσει μια θεμελιώδη διαφορά μεταξύ αυτού και των δεδομένων που έχουν γενικά χρησιμοποιηθεί για την κοινωνική έρευνα στο παρελθόν. Στη συνέχεια, στο τμήμα 2.3, έχω περιγράψει δέκα κοινά χαρακτηριστικά των μεγάλων πηγών δεδομένων. Η κατανόηση αυτών των χαρακτηριστικών μας δίνει τη δυνατότητα να αναγνωρίζουν γρήγορα τα πλεονεκτήματα και τις αδυναμίες των υφιστάμενων πηγών και θα μας βοηθήσει να αξιοποιήσουμε τις νέες πηγές που θα δημιουργηθούν στο μέλλον. Τέλος, στην ενότητα 2.4, περιγράφω τρεις κύριες ερευνητικές στρατηγικές που μπορείτε να χρησιμοποιήσετε για να μάθουν από παρατηρησιακά δεδομένα: μετρώντας τα πράγματα, πρόβλεψη πράγματα, και προσεγγίζει ένα πείραμα.