2.3.1.2 מופעל תמיד

תמיד-על נתונים גדולים מאפשר המחקר של אירועים בלתי צפויים ומדידה בזמן האמת.

מערכות נתונים גדולות רבות הם תמיד-על; הם אוספים נתונים כל הזמן. תמיד-על מאפיין זה מספק חוקרים עם נתוני אורך (כלומר, נתונים לאורך זמן). להיות תמיד על יש שתי השלכות חשובות למחקר.

ראשית, תמיד-על איסוף מידע מאפשר לחוקרים ללמוד מאירועים בלתי צפויים בדרכים שלא היו אפשריות בעבר. לדוגמה, החוקרים מעוניינים ללמוד את Occupy מחאות גזי בטורקיה בקיץ של שנת 2013 היו בדרך כלל להתמקד בהתנהגות של המפגינים במהלך האירוע. Ceren בודאק ודאנקן ווטס (2015) הצליח לעשות יותר על ידי שימוש הטבע תמיד-על של טוויטר ללמוד מפגיני טוויטר-שימוש לפני, במהלך, ואחרי האירוע. כמו כן, הם הצליחו ליצור קבוצת השוואה של הבלתי משתתפים (או משתתפים שלא ציוץ על המחאה) לפני, במהלך, ואחרי האירוע (איור 2.1). בסך הכל לוח בדיעבד שלהם כללו את טוויטים של 30,000 אנשים מעל גיל שנתיים. על-ידי העשרה הנתונים הנפוצים מההמחאות עם מידע אחר זה, בודאק ו ווטס הצליח ללמוד הרבה יותר: הם הצליחו להעריך אילו סוגים של אנשים נטו יותר להשתתף בהפגנות הגזים וכדי להעריך את השינויים בעמדות של משתתפים הבלתי משתתפים, הוא לטווח הקצר (השוואת טרום גזים כדי במהלך גזים) והן לטווח הארוך (השוואה-גזים מראש כדי שלאחר גזים).

2.1 איור: עיצוב שמוצג בודאק ו ווטס (2015) ללמוד את Occupy מחאות גזי בטורקיה בקיץ 2013. באמצעות הטבע תמיד-על של טוויטר, החוקרים יצרו את מה שהם כינו פאנל בדיעבד שכלל כ 30,000 אנשים מעל גיל שנתיים. בניגוד המחקר הטיפוסי שהתמקד משתתפים במהלך ההפגנות, בלוח בדיעבד מוסיף 1) נתונים המשתתף לפני ואחרי האירוע 2) נתונים הבלתי משתתף לפני, במהלך, ואחרי האירוע. מבנה נתונים מועשר זו אפשר בודאק ו ווטס להעריך אילו סוגים של אנשים נטו יותר להשתתף בהפגנות הגזים וכדי להעריך את השינויים בעמדות משתתפים הבלתי משתתפים, הוא לטווח הקצר (השוואת טרום גזים כדי במהלך גזים) והן לטווח הארוך (טרום גזי השוואה שלאחר גזים).

2.1 איור: עיצוב שמוצג Budak and Watts (2015) ללמוד את Occupy מחאות גזי בטורקיה בקיץ 2013. באמצעות הטבע תמיד-על של טוויטר, החוקרים יצרו את מה שהם כינו פאנל בדיעבד שכלל כ 30,000 אנשים מעל גיל שנתיים. בניגוד המחקר הטיפוסי שהתמקד משתתפים במהלך ההפגנות, בלוח בדיעבד מוסיף 1) נתונים המשתתף לפני ואחרי האירוע 2) נתונים הבלתי משתתף לפני, במהלך, ואחרי האירוע. מבנה נתונים מועשר זו אפשר בודאק ו ווטס להעריך אילו סוגים של אנשים נטו יותר להשתתף בהפגנות הגזים וכדי להעריך את השינויים בעמדות משתתפים הבלתי משתתפים, הוא לטווח הקצר (השוואת טרום גזים כדי במהלך גזים) והן לטווח הארוך (טרום גזי השוואה שלאחר גזים).

זה נכון שחלק מהאומדנים יכול נעשה ללא תמיד-על מקורות איסוף נתונים (למשל, הערכות לטווח ארוך של שינוי גישה), אם כי איסוף נתונים כזה עבור 30,000 אנשים היה די יקר. וגם, גם בהינתן תקציב בלתי מוגבל, אני לא יכול לחשוב על שום דרך אחרת כי בעצם מאפשרת לחוקרים לנסוע אחורה בזמן ישירות להתבונן בהתנהגות המשתתפים בעבר. החלופה הקרובה תהיה לאסוף דוחות רטרוספקטיבית של התנהגות, אך דיווחים אלה יהיו פירוט מוגבל ודיוק בספק. לוח 2.1 מספק דוגמאות נוספות של מחקרים להשתמש תמיד על מקור נתונים ללמוד אירוע בלתי צפוי.

טבלה 2.1: מחקרים של אירועים בלתי צפויים באמצעות תמיד-על מקורות נתונים גדולים.
אירוע בלתי צפוי תמיד-על נתוני מקור צִיטָטָה
תנועת אוקיופיי גזים בטורקיה טוויטר Budak and Watts (2015)
מחאות אמברלה בהונג קונג Weibo Zhang (2016)
ירי של המשטרה בניו יורק עצור-מקפץ דוחות Legewie (2016)
אדם שהצטרף ISIS טוויטר Magdy, Darwish, and Weber (2016)
מתקפת ה -11 בספטמבר, 2001 livejournal.com Cohn, Mehl, and Pennebaker (2004)
מתקפת ה -11 בספטמבר, 2001 הודעות הביפר Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

שנית, תמיד-על איסוף נתונים מאפשר לחוקרים לייצר מדידות בזמן אמת, אשר יכול להיות חשוב במסגרות שבו קובעי מדיניות רוצים לא רק ללמוד מהתנהגות קיימת, אלא גם להגיב על זה. לדוגמא, נתוני מדיה חברתית יכולים לשמש מדריך תגובות אסונות טבע (Castillo 2016) .

לסיכום, תמיד-על נתוני מערכות לאפשר לחוקרים ללמוד מאירועים בלתי צפויים ולספק מידע בזמן אמת לקובעי מדיניות. אני לא, לעומת זאת, מציע כי תמיד-על נתוני מערכות לאפשר לחוקרים לעקוב אחר שינויים לאורך פרקי זמן ארוכים. זאת משום מערכות נתונות גדולות רבות כל זמן משתנות-היסחפות תהליך הנקרא (סעיף 2.3.2.4).