2.3.2.5 مرتبك حسابيا

السلوك في البيانات الموجودة ليست طبيعية، مدفوعة من قبل أهداف هندسة النظم.

على الرغم من أن العديد من المصادر البيانات الموجودة غير قابلة للرد الفعل لأن الناس لا يدركون يتم تسجيل البيانات الخاصة بهم (القسم 2.3.1.3)، يجب على الباحثين أن لا تنظر في السلوك في هذه النظم على الانترنت ليكون "طبيعيا" أو "نقية". وفي الواقع، الأنظمة الرقمية أن السلوك سجل صممت للغاية للحث على سلوكيات معينة مثل النقر على الإعلانات أو نشر المحتوى. الطرق التي أهداف مصممي النظام يمكن إدخال أنماط إلى بيانات يسمى الخلط حسابي. الخلط حسابي غير معروف نسبيا لعلماء الاجتماع، وإنما هو مصدر قلق كبير بين العلماء بيانات دقيق. وخلافا لبعض المشاكل الأخرى مع آثار الرقمية، الخلط حسابي غير مرئية إلى حد كبير.

وهناك مثال بسيط نسبيا من الخلط حسابي هو حقيقة أن في الفيسبوك هناك عددا كبيرا بشكل مفاجئ من المستخدمين مع ما يقرب من 20 أصدقاء (Ugander et al. 2011) . علماء تحليل مع هذه البيانات دون أي فهم كيفية عمل الفيسبوك يمكن أن تولد بلا شك العديد من القصص حول كيفية 20 هو نوع من عدد الاجتماعي السحرية. ومع ذلك، كان Ugander وزملاؤه فهم كبير للعملية التي ولدت البيانات، وكانوا يعرفون أن الفيسبوك تشجيع الناس مع عدد من الوصلات في الفيسبوك لكسب المزيد من الاصدقاء حتى وصلت 20 الأصدقاء. على الرغم من أن Ugander وزملاؤه لا أقول هذا في ورقة، تم إنشاء هذه السياسة يفترض أن الفيسبوك من أجل تشجيع المستخدمين الجدد ليصبحوا أكثر نشاطا. دون أن يعرفوا عن وجود هذه السياسة، ومع ذلك، فمن السهل أن استخلاص نتائج خاطئة من البيانات. وبعبارة أخرى، فإن عددا كبيرا من المستغرب من الناس مع نحو 20 أصدقاء يخبرنا المزيد عن الفيسبوك من السلوك البشري.

أكثر ضررا من هذا المثال السابق حيث تنتج الخلط حسابي نتيجة غريبة أن الباحثين دقيق قد مواصلة التحقيق، هناك نسخة حتى اصعب من الخلط حسابي الذي يحدث عند مصممي نظم على الانترنت على بينة من النظريات الاجتماعية وثم تخبز هذه النظريات في العمل أنظمتها. علماء الاجتماع استدعاء هذا performativity: عندما النظريات تغيير العالم في مثل هذه الطريقة التي يقدمونها العالم أكثر انسجاما مع نظرية. في حالات الخلط حسابي الأدائي، وطبيعة مرتبك من البيانات هي على الأرجح غير مرئية.

مثال واحد من نمط أنشأتها performativity هو transitivity في الشبكات الاجتماعية على الانترنت. في 1970s و 1980s، وجد الباحثون مرارا وتكرارا أنه إذا كنت صديقا مع أليس وكنت مع أصدقاء بوب، ثم بوب وأليس هم أكثر عرضة ليكونوا أصدقاء مع بعضها البعض من شخصين تم اختيارهم عشوائيا. و، تم العثور على نفس هذا النمط جدا في الرسم البياني الاجتماعي في الفيسبوك (Ugander et al. 2011) . وهكذا، يمكن للمرء أن يستنتج أن أنماط الصداقة في الفيسبوك تكرار أنماط من الصداقات حاليا، على الأقل من حيث transitivity. ومع ذلك، هو الدافع وراء حجم transitivity في الرسم البياني الاجتماعي الفيسبوك جزئيا الخلط حسابي. وهذا هو، والعلماء بيانات في الفيسبوك يعرف من البحوث التجريبية والنظرية حول transitivity ثم يخبز عليه في كيفية عمل الفيسبوك. الفيسبوك لديها "أشخاص قد تعرفهم" الميزة التي تشير إلى أصدقاء جدد، وأحد السبل التي الفيسبوك يقرر من أن أقترح عليكم هو transitivity. وهذا هو، من المرجح أن أقترح عليك أن تصبح صديقا مع أصدقاء أصدقائك الفيسبوك. وبالتالي هذه الميزة لديه تأثير زيادة transitivity في الرسم البياني الاجتماعي الفيسبوك. وبعبارة أخرى، فإن نظرية transitivity يجلب العالم متماشية مع التوقعات النظرية (Healy 2015) . وهكذا، عندما تظهر مصادر البيانات الكبيرة لإنتاج التنبؤات النظرية الاجتماعية، يجب أن نكون على يقين من أن النظرية نفسها لم يكن خبز في كيفية عمل النظام.

بدلا من التفكير في مصادر البيانات الكبيرة مثل مراقبة الناس في بيئة طبيعية، كناية أكثر عرضة يراقب الناس في الكازينو. الكازينوهات والبيئات مصممة للحث على بعض السلوكيات هندسيا للغاية، وسيكون على الباحثين لم تتوقع أن هذا السلوك في كازينو توفر نافذة غير المقيد إلى السلوك البشري. وبطبيعة الحال، فإننا يمكن أن تتعلم شيئا عن السلوك دراسة الناس البشري في الكازينوهات في الواقع كازينو قد تكون بيئة مثالية لدراسة العلاقة بين استهلاك الكحول وخطر الأفضليات، ولكن إذا تجاهلنا أن البيانات كان يجري إنشاؤها في كازينو أننا ربما استخلاص بعض النتائج السيئة.

للأسف، والتعامل مع الخلط حسابي من الصعب بشكل خاص لأن العديد من الميزات للنظم على الانترنت هي الملكية، وموثقة توثيقا جيدا، وتتغير باستمرار. على سبيل المثال، كما ساوضح لاحقا في هذا الفصل، وكان الخلط حسابي أحد التفسيرات الممكنة لالتدريجي الاختراق الهبوطي لانفلونزا اتجاهات جوجل (القسم 2.4.2)، ولكن هذا الادعاء الصعب تقييم لأن الأعمال الداخلية لبحث Google الخوارزمية هي الملكية. الطبيعة الديناميكية لالخلط حسابي هو نموذج واحد من الانجراف النظام. الخلط حسابي يعني أن علينا أن نكون حذرين بشأن أي مطالبة للسلوك البشري الذي يأتي من نظام رقمي واحد، مهما كانت كبيرة.