الانجراف السكان، والانحراف الاستخدام، والانجراف نظام يجعل من الصعب استخدام مصدر بيانات كبيرة لدراسة الاتجاهات الطويلة الأجل.
واحدة من مزايا كبيرة من العديد من مصادر البيانات الكبيرة هي أنها جمع البيانات على مر الزمن. علماء الاجتماع نسمي هذا النوع من الإفراط في وقت البيانات والبيانات الطولية. وبطبيعة الحال، البيانات الطولية مهمة جدا لدراسة التغيير. من أجل قياس موثوق التغيير، ومع ذلك، يجب أن يكون نظام القياس نفسها مستقرة. على حد تعبير عالم الاجتماع أوتيس دادلي دنكان، "إذا كنت ترغب في قياس التغير، لا تتغير التدبير" (Fischer 2011) .
لسوء الحظ، العديد من الأنظمة وخاصة البيانات الكبيرة نظام العمل التي تخلق والتقاط آثار، والرقمية تتغير في كل وقت، وهي العملية التي سأتصل الانجراف. على وجه الخصوص، تتغير هذه الأنظمة في ثلاث طرق رئيسية: الانجراف السكان (التغيير في الذي يستخدم منهم)، والانحراف السلوكي (التغيير في كيفية استخدام الناس لهم)، والانجراف نظام (تغيير في النظام نفسه). المصادر الثلاثة من الانجراف يعني أن أي نمط في بيانات التتبع الرقمية يمكن أن تكون ناجمة عن تغيير مهم في العالم، أو يمكن أن يكون سببه شكل من أشكال الانحراف.
المصدر الأول للالعائمة السكان العائمة هو الذي يستخدم نظام، وهذه التغيرات على فترات زمنية طويلة والمقاييس لوقت قصير. على سبيل المثال، من 2008 وحتى الآن زاد متوسط عمر الناس على وسائل الاعلام الاجتماعية. وبالإضافة إلى هذه الاتجاهات الطويلة الأجل، والأشخاص الذين يستخدمون نظام في أي لحظة يختلف. على سبيل المثال، خلال الانتخابات الرئاسية الأمريكية عام 2012 تراوحت نسبة التغريدات عن السياسة التي كانت مكتوبة من قبل النساء من يوم لآخر (Diaz et al. 2016) . وبالتالي، ما قد يبدو أن هناك تغييرا في مزاج تويتر الآية قد الواقع يكون مجرد تغييرات في الذي يتحدث في أي لحظة.
بالإضافة إلى التغيرات في الذي يستخدم نظام، وهناك أيضا تغييرات في كيفية استخدام النظام. على سبيل المثال، أثناء احتلال الاحتجاجات Gezi بارك في اسطنبول، تركيا في عام 2013 المتظاهرين تغير استخدامها من الهاش كما تطورت المظاهرة. وهنا كيف زينب Tufekci (2014) وصف الانحراف، والتي كانت قادرة على كشف لأنها كانت مراقبة سلوك على تويتر وعلى الأرض:
"ما حدث هو أنه بمجرد الاحتجاج أصبحت القصة المهيمنة، فإن أعدادا كبيرة من الناس. . . توقف باستخدام الهاش إلا للفت الانتباه إلى ظاهرة جديدة. . .. على الرغم من أن الاحتجاجات استمرت، بل وتكثيف، توفي الهاش أسفل. كشفت مقابلات سببان لذلك. أولا، مرة واحدة كل شخص يعرف هذا الموضوع، كان الهاشتاج لزوم لها في آن واحد والإسراف على تويتر منصة محدودة شخصية. ثانيا، كان ينظر الهاش فقط كما مفيدة لجذب الانتباه إلى موضوع معين، وليس للحديث حول هذا الموضوع ".
وبالتالي فإن الباحثين الذين يدرسون الاحتجاجات من خلال تحليل التغريدات مع الهاش المتعلقة الاحتجاج لديهم شعور مشوهه لما كان يحدث بسبب هذا الانحراف السلوكي. على سبيل المثال، لأنها قد نعتقد أن مناقشة احتجاج انخفضت وقت طويل قبل أن انخفضت فعلا.
النوع الثالث من الانجراف هو نظام الانجراف. في هذه الحالة، فإنه ليس من الناس تغيير أو تغيير سلوكهم، ولكن النظام نفسه يتغير. على سبيل المثال، مع مرور الوقت زادت الفيسبوك الحد الأقصى لطول تحديثات الحالة. وبالتالي، فإن أي دراسة طولية من تحديثات الحالة تكون عرضة للالتحف الناجمة عن هذا التغيير. يرتبط الانجراف نظام ارتباطا وثيقا مشكلة اسمها الخلط حسابي التي سنتناولها الآن.