2.3.2.5 אלגוריתמי מבולבל

ההתנהגות נמצאו נתונים לא טבעית, הוא מונע על ידי מטרות ההנדסה של המערכות.

למרות מקורות נתונים רבים שנמצאו הם הלא מגיבים משום שאנשים אינם מודעים נתוניהם מתועדים (סעיף 2.3.1.3), חוקרים לא צריך לשקול התנהגות במערכות המקוונות אלה להיות "טבעיים" או "טהורים". במציאות, מערכות דיגיטליות שהתנהגות תקליטים הן מהונדסת מאוד לגרום התנהגויות מסוימות כגון לחיצה על מודעות או פרסום תוכן. הדרכים שמטרות מעצבי מערכת יכולות להציג דפוסים לתוך נתונים נקראות בלבול אלגוריתמי. מבלבלים אלגוריתמיים הם יחסית לא ידועים למדענים חברתיים, אבל זה הוא חשש עיקרי בקרב מדעני מידע זהירים. בנוסף, שלא כמו חלק מהבעיות האחרות עם עקבות דיגיטליות, מבלבלים אלגוריתמיים הוא בלתי נראה ברובו.

דוגמא פשוטה יחסי של בלבול אלגוריתמי היא העובדה בפייסבוק יש מספר גבוה באופן חריג של משתמשים עם כ 20 חברים (Ugander et al. 2011) . מדעני ניתוח עם נתונים אלה ללא כל הבנה של איך פייסבוק עובד ללא ספק יכול ליצור הרבה סיפורים על איך 20 איזשהו מספר חברתי קסום. עם זאת, Ugander ועמיתיו היו הבנה מהותית של התהליך שיצר את הנתונים, והם ידעו כי פייסבוק מעודד אנשים עם כמה קשרים בפייסבוק כדי להתיידד יותר עד שהגיעו 20 חברים. למרות Ugander ועמיתיו לא אומרים את זה בעיתון, מדיניות זו ככל הנראה נוצרה על-ידי פייסבוק במטרה לעודד משתמשים חדשים כדי להיות יותר פעיל. בלי לדעת על קיומה של מדיניות זו, עם זאת, קל להסיק את המסקנה הלא הנכונה מהנתונים. במילות אחרות, המספר הגבוה להפתיע של אנשים עם כ -20 חברים מספר לנו יותר על פייסבוק מ התנהגות אנושית.

עוד הממאירה מאשר בדוגמא הקודמת הזה שבו מבלבל אלגוריתמי הניב תוצאה מוזרה כי חוקרים זהירים אולי לחקור את נושא, קיימת גרסה אפילו יותר מסובכת של בלבול אלגוריתמי המתרחשת כאשר מעצבים של מערכות מקוונות מודעים תאוריות חברתיות ולאפות התיאוריות האלה לתוך העבודה של המערכות שלהם. מדעני החברה להתקשר ביצועיות זה: כאשר תיאוריות לשנות את העולם בצורה כזאת שהם מביאים לעולם יותר לתוך קו עם התיאוריה. במקרים של בלבול אלגוריתמי פרפורמטיבי, האופי המבולבל של הנתונים בלתי נראה סביר.

דוגמא אחת של דפוס נוצר על ידי ביצועי היא טרנזיטיביות ברשתות חברתיות באינטרנט. ב -1970 ו -1980, החוקרים מצאו שוב ושוב כי אם אתם ידידים עם אליס אתם חברים עם בוב, אז בוב ואליס נוטים יותר להיות חברים אחד עם השני מאשר שני אנשים שנבחרו באקראי. וגם, דפוס בדיוק זה נמצא בגרף החברתי בפייסבוק (Ugander et al. 2011) . ובכן אפשר להסיק כי דפוסי הידידות בפייסבוק לשכפל דפוסי חברויות מחוברות, לפחות במונחים של טרנזיטיביות. עם זאת, סדר הגודל של טרנזיטיביות בגרף החברתי פייסבוק הוא מונע באופן חלקי על ידי בלבול אלגוריתמי. כלומר, המדענים נתונים על פייסבוק ידע של מחקר אמפירי ותיאורטי על טרנזיטיביות ולאחר מכן אפוי אותו איך פייסבוק עובד. יש פייסבוק "אנשים שאתה עשוי להכיר" בתכונה שמציעה חברים חדשים, ואחת דרכים שפייסבוק מחליטה למי להציע לכם הוא טרנזיטיביות. כלומר, פייסבוק הוא צפוי מציע לך להתיידד עם החברים של החברים שלך. תכונה זו ולכן יש את ההשפעה של הגדלת טרנזיטיביות בגרף החברתי פייסבוק; במילים אחרות, התיאוריה של טרנזיטיביות מביא את העולם לתוך קו עם התחזיות של התיאוריה (Healy 2015) . לפיכך, כאשר מקורות נתונים גדולים מופיעים להתרבות תחזיות של התאוריה החברתית, אנחנו חייבים להיות בטוחים כי התאוריה עצם לא הייתה אפויה לתוך איך המערכת עובדת.

במקום לחשוב על מקורות נתונים גדולים כמו התבוננות אנשים בסביבה טבעית, מטפורה מתאימה יותר היא התבוננות אנשים בקזינו. קזינו הם מהונדסים מאוד סביבות שנועדו לגרום התנהגויות מסוימות, וכן חוקרים לעולם לא לצפות התנהגות בקזינו תספק חלון כבול לתוך התנהגות אנושית. כמובן, נוכל ללמוד משהו על אנשים ללמוד התנהגות אנושיות בבתי קזינו-למעשה קזינו עשוי להיות מסגרת אידיאלית לחקר הקשר בין צריכה וסיכון אלכוהול העדפות-אבל אם התעלמנו שהנתונים שמוקמים קזינו נוכל להסיק כמה מסקנות רעות.

למרבה הצער, התמודדות עם בלבול אלגוריתמי קשה במיוחד בגלל תכונות רבות של מערכות מקוונות הן קנייניים, גרוע מתועד, ומשתנות תדיר. לדוגמא, כפי שאסביר בהמשך פרק זה, בלבול אלגוריתמי היה הסבר אפשרי אחד להפסקה למטה ההדרגתית של Google Flu Trends (סעיף 2.4.2), אך טענה זו הייתה קשה להעריך כי אופן הפעולה הפנימית של החיפוש של Google האלגוריתם הוא קניינים. האופי הדינמי של בלבול אלגוריתמי הוא צורה אחת של סחיפת מערכת. מבלבלים אלגוריתמיים אומרים שאנחנו צריכים להיות זהירים לגבי כל טענה להתנהגות אנושית שמגיעה ממערכת דיגיטלית אחת, לא משנים כמה גדול.