Μετατόπιση του πληθυσμού, παρασυρόμενα χρήσης, και της μετατόπισης του συστήματος να είναι δύσκολο να χρησιμοποιήσετε μεγάλη πηγή δεδομένων για τη μελέτη των μακροπρόθεσμων τάσεων.
Ένα από τα μεγάλα πλεονεκτήματα της πολλές μεγάλες πηγές δεδομένων είναι ότι συλλέγουν δεδομένα την πάροδο του χρόνου. Οι κοινωνικοί επιστήμονες αποκαλούν αυτό το είδος υπερ-χρόνου των δεδομένων, διαχρονικά δεδομένα. Και, φυσικά, διαχρονικά δεδομένα είναι πολύ σημαντικά για τη μελέτη της αλλαγής. Για να μετρηθεί αξιόπιστα αλλαγή, όμως, το ίδιο το σύστημα μέτρησης πρέπει να είναι σταθερή. Σύμφωνα με τα λόγια του κοινωνιολόγου Otis Dudley Duncan, "αν θέλετε να μετρήσει την αλλαγή, δεν αλλάζουν το μέτρο" (Fischer 2011) .
Δυστυχώς, πολλά συστήματα-ειδικά μεγάλων δεδομένων του συστήματος των επιχειρήσεων που δημιουργούν και να συλλάβει τα ίχνη ψηφιακό αλλάζει όλη την ώρα, μια διαδικασία που θα καλέσω drift. Ειδικότερα, τα συστήματα αυτά αλλάζουν με τρεις κυρίως τρόπους: πληθυσμός μετατόπιση (αλλαγή στο ποιος τη χρήση τους), τη συμπεριφορά drift (αλλαγή στον τρόπο με τον οποίο οι άνθρωποι χρησιμοποιούν τους), και της μετατόπισης του συστήματος (αλλαγή στο ίδιο το σύστημα). Οι τρεις πηγές των παρασυρόμενων σημαίνει ότι κάθε μοτίβο σε ψηφιακά δεδομένα ίχνος θα μπορούσε να προκληθεί από μια σημαντική αλλαγή στον κόσμο, ή θα μπορούσε να προκληθεί από κάποια μορφή μετακίνησης.
Η πρώτη πηγή των παρασυρόμενων πληθυσμού παρασυρόμενα είναι ποιος χρησιμοποιεί το σύστημα, και αυτό αλλάζει σε κλίμακες πολύ καιρό και κλίμακες σύντομο χρόνο. Για παράδειγμα, από το 2008 να παρουσιάσει ο μέσος όρος ηλικίας των ανθρώπων για την κοινωνική μέσων μαζικής ενημέρωσης έχει αυξηθεί. Εκτός από αυτές τις μακροπρόθεσμες τάσεις, οι άνθρωποι χρησιμοποιούν ένα σύστημα ανά πάσα στιγμή ποικίλλει. Για παράδειγμα, κατά τη διάρκεια της ΗΠΑ προεδρικών εκλογών του 2012, το ποσοστό των tweets για την πολιτική που γράφτηκαν από γυναίκες κυμάνθηκε από μέρα σε μέρα (Diaz et al. 2016) . Έτσι, ό, τι μπορεί να φαίνεται να είναι μια αλλαγή στη διάθεση του Twitter-στίχο θα μπορούσε στην πραγματικότητα να είναι μόνο οι αλλαγές στο ποιος μιλάει σε κάθε στιγμή.
Εκτός από τις αλλαγές στη οποίος χρησιμοποιεί ένα σύστημα, υπάρχουν επίσης αλλαγές στον τρόπο που χρησιμοποιείται το σύστημα. Για παράδειγμα, κατά τη διάρκεια του Occupy Gezi Πάρκο διαδηλώσεις στην Κωνσταντινούπολη, Τουρκία το 2013 διαδηλωτές αλλάξει η χρήση τους διέσεις όπως η διαμαρτυρία εξελίχθηκε. Εδώ είναι πώς Zeynep Τουφεκτσί (2014) περιέγραψε την εκτροπή, η οποία ήταν σε θέση να ανιχνεύσει επειδή είχε την παρατήρηση της συμπεριφοράς στο Twitter και στο έδαφος:
"Αυτό που είχε συμβεί ήταν ότι μόλις η διαμαρτυρία έγινε η κυρίαρχη ιστορία, μεγάλο αριθμό ανθρώπων. . . σταμάτησε χρησιμοποιώντας τις διέσεις εκτός από το να επιστήσω την προσοχή σε ένα νέο φαινόμενο. . .. Αν και οι διαδηλώσεις συνεχίστηκαν, και μάλιστα ενταθεί, τα hashtags πέθανε κάτω. Συνεντεύξεις αποκάλυψε δύο λόγοι γι 'αυτό. Κατ 'αρχάς, όταν όλοι γνώριζαν το θέμα, το hashtag ήταν ταυτόχρονα περιττό και σπάταλο στο χαρακτήρα περιορισμένη Twitter πλατφόρμα. Δεύτερον, hashtags είχαν δει μόνο ως χρήσιμο για να προσελκύσουν την προσοχή σε ένα συγκεκριμένο θέμα, δεν είναι για να μιλάμε γι 'αυτό. "
Έτσι, ερευνητές που μελετούσαν τις διαμαρτυρίες από την ανάλυση των tweets με διέσεις διαμαρτυρίας που σχετίζονται θα έχουν μια διαστρεβλωμένη αίσθηση του τι συνέβαινε εξαιτίας αυτής της συμπεριφοράς drift. Για παράδειγμα, μπορεί να πιστεύουν ότι η συζήτηση της διαμαρτυρίας μειώθηκε πολύ πριν στην πραγματικότητα μειώθηκε.
Το τρίτο είδος της μετακίνησης είναι drift συστήματος. Σε αυτή την περίπτωση, δεν είναι οι άνθρωποι αλλάζουν ή η συμπεριφορά αλλαγή τους, αλλά το ίδιο το σύστημα αλλάζει. Για παράδειγμα, με την πάροδο του χρόνου το Facebook έχει αυξηθεί το όριο για το μήκος των ενημερώσεις κατάστασης. Έτσι, κάθε διαχρονική μελέτη των ενημερώσεις κατάστασης θα είναι ευάλωτα σε αντικείμενα που προκαλείται από την αλλαγή αυτή. μετατόπιση του συστήματος είναι στενά συνδεδεμένη με το πρόβλημα που ονομάζεται αλγοριθμική σύγχυση στην οποία έχουμε τώρα.