رفتار در سیستم های داده بزرگ طبیعی نیست؛ از اهداف مهندسی سیستمها رانده شده است.
اگر چه بسیاری از منابع بزرگ داده غیر واکنشی هستند زیرا مردم آگاه نیستند که داده های آنها ثبت می شوند (بخش 2.3.3)، محققان نباید رفتار این سیستم های آنلاین را به طور طبیعی در نظر بگیرند. در واقع سیستم های دیجیتالی که رفتار را ثبت می کنند به شدت مهندسی شده است تا رفتارهای خاصی نظیر کلیک کردن بر روی تبلیغات یا ارسال محتوا را ایجاد کند. راه هایی که اهداف طراحان سیستم می توانند الگوها را به داده ها معرفی کنند، الگوریتمی است که با هم مخلوط می شود . مخالفت الگوریتمی نسبتا دانشمندان علوم اجتماعی نسبتا ناشناخته است، اما در میان دانشمندان اطلاعات دقیق، این مسئله مهم است. و بر خلاف برخی از مشکلات دیگر با علامت های دیجیتال، مخلوط الگوریتمی عمدتا نامرئی است.
یک نمونه نسبتا ساده از الگوریتم های مخالف این واقعیت است که در فیس بوک تعداد زیادی از کاربران با حدود 20 دوست وجود دارد، همانطور که توسط یوهان اوگاندر و همکارانش (2011) . دانشمندان با تجزیه و تحلیل این داده ها بدون فهمیدن اینکه چگونه فیس بوک کار می کند، بدون شک می تواند بسیاری از داستان های مربوط به نحوه ایجاد یک نوع اجتماعی جادویی را بدست آورد. خوشبختانه اوگاندر و همکارانش درک عمیقی از روند تولید داده ها داشتند و می دانستند که فیس بوک مردم را با چند ارتباط در فیس بوک تشویق می کند تا دوستان بیشتری را تا زمانی که به 20 دوست نزدیک شده اند، متصل کنند. اگرچه اوگاندر و همکارانش در مقاله خود این را نمی گویند، احتمالا این سیاست توسط فیس بوک ایجاد شده است تا کاربران جدید را تشویق به فعال شدن کند. با این وجود بدون در نظر گرفتن وجود این سیاست، نتیجه گیری اشتباه از داده ها آسان است. به عبارت دیگر تعداد قابل توجهی از افراد با حدود 20 دوست درباره فیس بوک بیشتر درباره رفتار انسان صحبت می کنند.
در این مثال قبلی، مخالفت الگوریتمی نتیجه ای غیرمنتظره ای ایجاد کرد که یک محقق دقیق می تواند آن را بیشتر تشخیص دهد و تحقیق کند. با این حال، یک نسخه حتی پیچیده تر از الگوریتم مخلوط است که زمانی که طراحان سیستم های آنلاین از نظریه های اجتماعی آگاه هستند و پس از آن پخت این نظریه ها را به کار سیستم های خود وجود دارد. دانشمندان علوم اجتماعی این سازگاری را بیان می کنند : زمانی که یک نظریه جهان را به گونه ای تغییر می دهد که جهان را با این نظریه هماهنگ سازد. در مورد تداخل الگوریتم تکراری، ماهیت confused از داده ها برای شناسایی بسیار دشوار است.
یک نمونه از یک الگوی ایجاد شده توسط تکرارپذیری، در شبکه های اجتماعی آنلاین انتقالی است. در دهه های 1970 و 1980، محققان بارها و بارها دریافتند که اگر شما با آلیس و باب دوست هستید، آلیس و باب احتمال بیشتری دارند که با یکدیگر دوست شوند، نه اینکه دو نفر به طور تصادفی انتخاب شدند. این الگوی مشابهی در نمودار اجتماعی در فیس بوک یافت شد (Ugander et al. 2011) . بنابراین، ممکن است نتیجه بگیرد که الگوهای دوستی در فیس بوک، الگوهایی از دوستی های آفلاین را حداقل در شرایط گذارپذیری تکرار می کنند. با این حال، مقدار transitivity در نمودار اجتماعی فیس بوک تقریبا توسط الگوریتمی مخلوط هدایت می شود. به این معنا، دانشمندان داده در فیس بوک از تحقیقات تجربی و نظری در مورد انتقال پذیری می دانستند و سپس آن را به چگونگی کار فیس بوک سوق دادند. فیس بوک دارای ویژگی "People You May Know" است که دوستان جدیدی را نشان می دهد و یکی از راه هایی که فیس بوک تصمیم می گیرد که چه کسی به شما پیشنهاد دهد، Transitivity است. به این ترتیب، فیس بوک احتمال بیشتری دارد که نشان دهد دوست شما با دوستان شما دوست است. این ویژگی در نتیجه اثر افزایشی در نمودار اجتماعی فیس بوک را افزایش می دهد؛ به عبارت دیگر، نظریه (Zignani et al. 2014; Healy 2015) ، جهان را با پیشبینی نظریه به ارمغان می آورد (Zignani et al. 2014; Healy 2015) . بنابراین، زمانی که منابع داده های بزرگ به نظر می رسد پیش بینی های تئوری اجتماعی را بازتولید می کنند، ما باید مطمئن شویم که تئوری خود به نحوه عملکرد سیستم ناپدید نشده است.
به جای فکر کردن به منابع داده های بزرگ به عنوان مشاهدات مردم در یک محیط طبیعی، متافیزیک تر به نظر می رسد مردم در یک کازینو. کازینوها محیطی بسیار مهندسی هستند که برای ایجاد رفتارهای خاص طراحی شده اند و یک محقق هرگز انتظار رفتار در یک کازینو را نداشته باشد تا پنجره ای بی دست و پا را به رفتار انسانی تبدیل کند. البته، شما می توانید چیزی را در مورد رفتار انسان با مطالعه افراد در کازینو یاد بگیرید، اما اگر این واقعیت را نادیده بگیرید که داده ها در یک کازینو ایجاد شده اند، ممکن است نتیجه های بدی را بدست آورید.
متأسفانه، برخورد با الگوریتم های مخالف بسیار دشوار است، زیرا بسیاری از ویژگی های سیستم های آنلاین اختصاصی، ضمانت مستند و دائما در حال تغییر است. به عنوان مثال، همانگونه که بعدا در این فصل توضیح خواهم داد، تردید الگوریتمی یک توضیح ممکن برای تجزیه تدریجی گوگل آنفولانزا (بخش 2.4.2) بود، اما این ادعا سخت بود، زیرا عملکرد درونی الگوریتم جستجو گوگل اختصاصی ماهیت پویا درهم آمیختن الگوریتم، یک شکل رانش سیستم است. مخلوق الگوریتمی به این معنی است که ما باید در مورد هر گونه ادعایی در رابطه با رفتار انسان که از یک سیستم دیجیتال صرف می شود، محتاط باشیم، مهم نیست که چقدر بزرگ است.