Η μέτρηση είναι πολύ λιγότερο πιθανό να αλλάξει συμπεριφορά σε μεγάλες πηγές δεδομένων.
Μία πρόκληση της κοινωνικής έρευνας είναι ότι οι άνθρωποι μπορούν να αλλάξουν τη συμπεριφορά τους όταν ξέρουν ότι θα τηρούνται από τους ερευνητές. Οι κοινωνικοί επιστήμονες αποκαλούν γενικά αυτήν την αλλαγή συμπεριφοράς ως απάντηση στην αντιδραστικότητα μέτρηση ερευνητή (Webb et al. 1966) . Μια πτυχή των μεγάλων δεδομένων που πολλοί ερευνητής βρείτε πολλά υποσχόμενη είναι ότι οι συμμετέχοντες δεν είναι γενικά γνωρίζουν ότι τα δεδομένα τους να συλληφθεί ή έχουν γίνει τόσο εξοικειωμένοι με αυτή τη συλλογή στοιχείων που πλέον αλλάζει τη συμπεριφορά τους. Επειδή είναι μη αντιδραστικά, ως εκ τούτου, πολλές πηγές των μεγάλων δεδομένων μπορεί να χρησιμοποιηθεί για τη μελέτη της συμπεριφοράς που δεν έχει τροποποιήσιμα για ακριβή μέτρηση προηγουμένως. Για παράδειγμα, Stephens-Davidowitz (2014) χρησιμοποιείται για τον επιπολασμό των ρατσιστικών όρων σε ερωτήματα μηχανή αναζήτησης για να μετρήσει τη φυλετική animus σε διάφορες περιοχές των Ηνωμένων Πολιτειών. Η μη αντιδραστική και μεγάλα (βλέπε προηγούμενη παράγραφο) τη φύση των δεδομένων αναζήτησης ενεργοποιήσετε μετρήσεις που θα ήταν δύσκολο χρησιμοποιώντας άλλες μεθόδους, όπως οι έρευνες.
Μη-αντιδραστικότητα, ωστόσο, δεν εξασφαλίζει ότι τα στοιχεία αυτά είναι κατά κάποιο τρόπο μια άμεση αντανακλούν τη συμπεριφορά ή τις στάσεις των ανθρώπων. Για παράδειγμα, ως ένας ερωτώμενος είπε Newman et al. (2011) , "Δεν είναι ότι δεν έχω προβλήματα, είμαι απλά δεν τις βάζετε στο Facebook." Με άλλα λόγια, ακόμα και αν κάποιες μεγάλες πηγές δεδομένων είναι μη ενεργά, δεν είναι πάντα απαλλαγμένα από προκαταλήψεις κοινωνική σκοπιμότητα , η τάση για τους ανθρώπους να θέλουν να παρουσιάσουν τον εαυτό τους με τον καλύτερο δυνατό τρόπο. Περαιτέρω, όπως θα περιγράψω πιο κάτω, αυτές οι πηγές δεδομένων είναι μερικές φορές επηρεάζονται από τους στόχους των ιδιοκτητών πλατφόρμα, ένα πρόβλημα που ονομάζεται αλγοριθμική σύγχυση (περιγράφονται πιο κάτω).
Αν και μη-αντιδραστικότητα είναι συμφέρουσα για την έρευνα, την παρακολούθηση της συμπεριφοράς των ανθρώπων χωρίς τη συγκατάθεση και την ευαισθητοποίηση τους εγείρει ηθικά προβλήματα που συζητούνται παρακάτω και λεπτομερώς στο Κεφάλαιο 6. Μια δημόσια αντίδραση εναντίον αυξημένη ψηφιακής επιτήρησης θα μπορούσε να οδηγήσει μεγάλα συστήματα δεδομένων για να γίνει πιο αντιδραστική την πάροδο του χρόνου, και ισχυρή ανησυχία για την ψηφιακή επιτήρηση θα μπορούσε ακόμη και να οδηγήσει μερικούς ανθρώπους να προσπαθήσουν να opt-out από τα μεγάλα συστήματα δεδομένων εντελώς, αυξάνοντας τις ανησυχίες σχετικά με τη μη αντιπροσωπευτικότητα (περιγράφονται πιο κάτω).
Αυτές οι τρεις καλές ιδιότητες των μεγάλων δεδομένων κοινωνικής έρευνας-μεγάλες, πάντα-on, και μη-αντιδραστική-γενικά οφείλονται στο γεγονός ότι αυτές οι πηγές δεδομένων δεν δημιουργήθηκαν από τους ερευνητές για την έρευνα. Τώρα, εγώ θα στραφούν σε επτά ιδιότητες των μεγάλων πηγών δεδομένων που είναι κακό για την έρευνα. Τα χαρακτηριστικά αυτά τείνουν επίσης να προκύψει, επειδή τα στοιχεία αυτά δεν δημιουργήθηκε από τους ερευνητές για την έρευνα.