2.3.2.4 נסחף

להיסחף האוכלוסין, להיסחף השימוש, וסחיפה מערכת להקשות להשתמש במקור נתונים גדול ללמוד על מגמות ארוכות טווח.

אחד היתרונות הגדולים של מקורות נתונים גדולים רבים הם שהן גובות נתונים לאורך זמן. מדעני החברה קוראים לזה סוג של נתונים לאורך זמן, נתוני האורך. וגם, באופן טבעי, מידע אורכים חשוב מאוד ללימוד שינוי. כדי למדוד שינוי באופן מהימן, אולם, מערכת המדידה עצמה חייבת להיות יציבה. כדברי סוציולוג אוטיס דאדלי דאנקן, "אם אתה רוצה למדוד שינוי, אינו משנה את המדד" (Fischer 2011) .

למרבה הצער, מערכות במיוחד נתונים גדולים רבות מערכת עסקית היוצרים ללכוד עקבות-הם דיגיטליים משתנות כל הזמן, בתהליך שאני אתקשר להיסחף. בפרט, מערכות אלה לשנות בשלוש דרכים עיקריות: האוכלוסייה להיסחף (שינוי אשר משתמש בהם), להיסחף התנהגותי (שינוי האופן שבו אנשים משתמשים בהם), וסחיפה המערכת (שינוי במערכת עצמה). השלושה המקורות של סחיפה אומרים תבנית כלשהי בנתוני עקבות דיגיטליים יכולה להיגרם על ידי שינוי חשוב בעולם, או שזה יכול להיגרם על ידי צורה כלשהי של סחיפה.

המקור הראשון של סחיפה-אוכלוסייה נודדת הוא מי משתמש במערכת, וזה משתנה על זמן ארוך קשקשים וקשקשת קצר זמן. לדוגמא, משנת 2008 להציג את הגיל הממוצע של אנשים במדיה חברתיים גדל. בנוסף למגמות ארוכות טווח אלה, העם באמצעות מערכת בכל רגע משתנה. לדוגמה, במהלך הבחירות לנשיאות ארצות הברית של שנת 2012 בשיעור של טוויטים על פוליטיקה כי נכתבו על ידי נשים נע מיום ליום (Diaz et al. 2016) . לכן, מה עלול להיראות שינוי במצב הרוח של פסוק טוויטר באמת עשוי להיות רק שינויים שמדברים בכל רגע.

בנוסף לשינויים אשר משתמשת במערכת, יש גם שינויים באופן שבו משמשת המערכת. לדוגמא, במהלך לכבוש מחאות פרק הגזים באיסטנבול, טורקיה בשנת 2013 מפגינים השתנו שימושם סולמית ואת המחאה התפתחה. הנה כמה Zeynep טופקסי (2014) תיאר את מהות העניין, אשר הצליחה לזהות כי היא צופה התנהגות בטוויטר ועל הקרקע:

"מה שקרה הוא שברגע המחאה הפך לסיפור הדומיננטי, מספר גדול של אנשים. . . הפסיקו להשתמש hashtags למעט למשוך תשומת לב תופעה חדשה. . .. בעוד נמשכו ההמחאות, ואפילו העמיקו, הסולמית, שככה. ראיונות חשפו שתי סיבות לכך. ראשית, פעם כולם ידעו את הנושא, hashtag היה בבת אחת מיותר ובזבזני על פלטפורמת טוויטר מוגבל אופי. שנית, סולמית, נראו רק שימושי למשיכת תשומת לב לנושא מסוים, לא לדבר על זה. "

לפיכך, חוקרים שחקרו את המחאה על ידי ניתוח טוויטים עם סולמית הקשורים במחאה יצטרכו תחושה מעוותת של מה שקורה בגלל סחף התנהגותי זה. לדוגמה, הם עשויים להאמין שהדיון המחאה ירד הרבה לפני שזה בעצם ירד.

הסוג השלישי של סחיפה הוא להיסחף המערכת. במקרה זה, זה לא העם שינוי או לשנות את התנהגותם, אבל המערכת עצמה משתנה. לדוגמא, לאורך זמן פייסבוק הגדיל את המגבלה על האורך של עדכוני סטטוס. לפיכך, כל מחקר אורך של עדכוני סטטוס יהיה פגיע חפצים הנגרם על ידי שינוי זה. מערכת להיסחף קשור קשר הדוק לבעיה בשם המבלבל אלגוריתמי נעבור עתה.