תמיד-על נתונים גדולים מאפשר המחקר של אירועים בלתי צפויים ומדידה בזמן האמת.
מערכות נתונים גדולות רבות הם תמיד-על; הם אוספים נתונים כל הזמן. תמיד-על מאפיין זה מספק חוקרים עם נתוני אורך (כלומר, נתונים לאורך זמן). להיות תמיד על יש שתי השלכות חשובות למחקר.
ראשית, תמיד-על איסוף מידע מאפשר לחוקרים ללמוד מאירועים בלתי צפויים בדרכים שלא היו אפשריות בעבר. לדוגמה, החוקרים מעוניינים ללמוד את Occupy מחאות גזי בטורקיה בקיץ של שנת 2013 היו בדרך כלל להתמקד בהתנהגות של המפגינים במהלך האירוע. Ceren בודאק ודאנקן ווטס (2015) הצליח לעשות יותר על ידי שימוש הטבע תמיד-על של טוויטר ללמוד מפגיני טוויטר-שימוש לפני, במהלך, ואחרי האירוע. כמו כן, הם הצליחו ליצור קבוצת השוואה של הבלתי משתתפים (או משתתפים שלא ציוץ על המחאה) לפני, במהלך, ואחרי האירוע (איור 2.1). בסך הכל לוח בדיעבד שלהם כללו את טוויטים של 30,000 אנשים מעל גיל שנתיים. על-ידי העשרה הנתונים הנפוצים מההמחאות עם מידע אחר זה, בודאק ו ווטס הצליח ללמוד הרבה יותר: הם הצליחו להעריך אילו סוגים של אנשים נטו יותר להשתתף בהפגנות הגזים וכדי להעריך את השינויים בעמדות של משתתפים הבלתי משתתפים, הוא לטווח הקצר (השוואת טרום גזים כדי במהלך גזים) והן לטווח הארוך (השוואה-גזים מראש כדי שלאחר גזים).
זה נכון שחלק מהאומדנים יכול נעשה ללא תמיד-על מקורות איסוף נתונים (למשל, הערכות לטווח ארוך של שינוי גישה), אם כי איסוף נתונים כזה עבור 30,000 אנשים היה די יקר. וגם, גם בהינתן תקציב בלתי מוגבל, אני לא יכול לחשוב על שום דרך אחרת כי בעצם מאפשרת לחוקרים לנסוע אחורה בזמן ישירות להתבונן בהתנהגות המשתתפים בעבר. החלופה הקרובה תהיה לאסוף דוחות רטרוספקטיבית של התנהגות, אך דיווחים אלה יהיו פירוט מוגבל ודיוק בספק. לוח 2.1 מספק דוגמאות נוספות של מחקרים להשתמש תמיד על מקור נתונים ללמוד אירוע בלתי צפוי.
אירוע בלתי צפוי | תמיד-על נתוני מקור | צִיטָטָה |
---|---|---|
תנועת אוקיופיי גזים בטורקיה | טוויטר | Budak and Watts (2015) |
מחאות אמברלה בהונג קונג | Zhang (2016) | |
ירי של המשטרה בניו יורק | עצור-מקפץ דוחות | Legewie (2016) |
אדם שהצטרף ISIS | טוויטר | Magdy, Darwish, and Weber (2016) |
מתקפת ה -11 בספטמבר, 2001 | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
מתקפת ה -11 בספטמבר, 2001 | הודעות הביפר | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
שנית, תמיד-על איסוף נתונים מאפשר לחוקרים לייצר מדידות בזמן אמת, אשר יכול להיות חשוב במסגרות שבו קובעי מדיניות רוצים לא רק ללמוד מהתנהגות קיימת, אלא גם להגיב על זה. לדוגמא, נתוני מדיה חברתית יכולים לשמש מדריך תגובות אסונות טבע (Castillo 2016) .
לסיכום, תמיד-על נתוני מערכות לאפשר לחוקרים ללמוד מאירועים בלתי צפויים ולספק מידע בזמן אמת לקובעי מדיניות. אני לא, לעומת זאת, מציע כי תמיד-על נתוני מערכות לאפשר לחוקרים לעקוב אחר שינויים לאורך פרקי זמן ארוכים. זאת משום מערכות נתונות גדולות רבות כל זמן משתנות-היסחפות תהליך הנקרא (סעיף 2.3.2.4).