Η μέτρηση σε μεγάλες πηγές δεδομένων είναι πολύ λιγότερο πιθανό να αλλάξει τη συμπεριφορά.
Μια πρόκληση της κοινωνικής έρευνας είναι ότι οι άνθρωποι μπορούν να αλλάξουν τη συμπεριφορά τους όταν γνωρίζουν ότι παρακολουθούνται από ερευνητές. Οι κοινωνικοί επιστήμονες ονομάζουν γενικά αυτή την αντιδραστικότητα (Webb et al. 1966) . Για παράδειγμα, οι άνθρωποι μπορούν να είναι πιο γενναιόδωροι σε εργαστηριακές μελέτες από τις μελέτες πεδίου, επειδή στην πρώτη γνωρίζουν καλά ότι παρακολουθούνται (Levitt and List 2007a) . Μια πτυχή των μεγάλων δεδομένων που πολλοί ερευνητές βρίσκουν πολλά υποσχόμενες είναι ότι οι συμμετέχοντες γενικά δεν γνωρίζουν ότι τα δεδομένα τους συλλαμβάνονται ή έχουν γίνει τόσο συνηθισμένα σε αυτή τη συλλογή δεδομένων που δεν αλλάζει πλέον τη συμπεριφορά τους. Επειδή οι συμμετέχοντες είναι μη αντιδραστικές , επομένως, πολλές πηγές μεγάλων δεδομένων μπορούν να χρησιμοποιηθούν για να μελετήσουν συμπεριφορές που δεν είχαν προηγουμένως υποστεί ακριβείς μετρήσεις. Για παράδειγμα, ο Stephens-Davidowitz (2014) χρησιμοποίησε τον επιπολασμό των ρατσιστικών όρων στα ερωτήματα μηχανών αναζήτησης για τη μέτρηση του φυλετικού animus σε διάφορες περιοχές των Ηνωμένων Πολιτειών. Η μη αντιδραστική και η μεγάλη (βλ. Σημείο 2.3.1) φύση των δεδομένων αναζήτησης επιτρέπουν τις μετρήσεις που θα ήταν δύσκολο να χρησιμοποιηθούν με άλλες μεθόδους, όπως έρευνες.
Η μη αντιδραστικότητα, ωστόσο, δεν εξασφαλίζει ότι αυτά τα δεδομένα είναι κατά κάποιο τρόπο άμεση αντανάκλαση της συμπεριφοράς ή της στάσης των ανθρώπων. Για παράδειγμα, όπως δήλωσε ένας ερωτώμενος σε μια μελέτη που βασίζεται σε συνεντεύξεις, "Δεν είναι ότι δεν έχω προβλήματα, απλά δεν τα βάζω στο Facebook" (Newman et al. 2011) . Με άλλα λόγια, αν και μερικές μεγάλες πηγές δεδομένων είναι μη αντιδραστικές, δεν είναι πάντα απαλλαγμένες από κοινωνική επιθυμία, η τάση να θέλουν οι άνθρωποι να παρουσιάζονται με τον καλύτερο δυνατό τρόπο. Επιπλέον, όπως θα περιγράψω αργότερα στο κεφάλαιο, η συμπεριφορά που έχει καταγραφεί σε μεγάλες πηγές δεδομένων επηρεάζεται μερικές φορές από τους στόχους των ιδιοκτητών πλατφορμών, ένα ζήτημα που θα ονομάσω αλγοριθμική σύγχυση . Τέλος, αν και η μη αντιδραστικότητα είναι επωφελής για την έρευνα, η παρακολούθηση της συμπεριφοράς των ανθρώπων χωρίς τη συγκατάθεσή τους και η συνειδητοποίηση δημιουργούν ηθικές ανησυχίες που θα περιγράψω λεπτομερώς στο κεφάλαιο 6.
Οι τρεις ιδιότητες που μόλις περιέγραψα - μεγάλες, πάντοτε και μη αντιδραστικές - είναι γενικά, αλλά όχι πάντα, επωφελείς για την κοινωνική έρευνα. Στη συνέχεια, θα στραφώ στις επτά ιδιότητες των μεγάλων πηγών δεδομένων - ελλιπείς, απρόσιτες, μη αντιπροσωπευτικές, παρασυρόμενες, αλγοριθμικά συγκεχυμένες, βρώμικες και ευαίσθητες - που γενικά, αλλά όχι πάντα, δημιουργούν προβλήματα στην έρευνα.