বড় ডেটা সিস্টেমে আচরণ স্বাভাবিক নয়; এটি সিস্টেমের প্রকৌশল লক্ষ্য দ্বারা চালিত হয়।
যদিও অনেক বড় তথ্য উৎস অ-প্রতিক্রিয়ার কারণ মানুষ তাদের তথ্য রেকর্ড করা হচ্ছে না (অধ্যায় ২.3.3), গবেষকরা এই অনলাইন সিস্টেমে "স্বাভাবিকভাবেই ঘটতে" আচরণ বিবেচনা করবেন না। প্রকৃতপক্ষে, ডিজিটাল সিস্টেমগুলি যে রেকর্ড আচরণ হয় বিজ্ঞাপনগুলিতে ক্লিক করা বা কন্টেন্ট পোস্টিং হিসাবে নির্দিষ্ট আচরণের প্ররোচিত করার জন্য অত্যন্ত প্রকৌশলী। যে পদ্ধতিগুলি সিস্টেম ডিজাইনারের লক্ষ্যগুলি ডাটাগুলির নিদর্শনগুলি প্রবর্তন করতে পারে তা অ্যালগরিদমিক বিভ্রান্তিকর বলে । অ্যালগরিদমিক সংঘাত সামাজিক বিজ্ঞানীদের কাছে অপ্রত্যাশিত নয়, কিন্তু সতর্কতার সাথে তথ্য বিজ্ঞানীদের মধ্যে এটি একটি প্রধান উদ্বেগ। এবং, ডিজিটাল ট্রেসের সাথে অন্যান্য সমস্যাগুলি থেকে ভিন্ন, আলগোরিদিম বিভ্রান্তিকর প্রধানত অদৃশ্য।
অ্যালগরিদমিক বিভ্রান্তিকর একটি অপেক্ষাকৃত সহজ উদাহরণ হল ফেসবুকের উপর আনুমানিক সংখ্যক ব্যবহারকারীর সংখ্যা প্রায় ২0 জন বন্ধু রয়েছে, যেহেতু জোহান উঙ্গার এবং সহকর্মীরা (2011) দ্বারা আবিষ্কৃত হয়েছে। বিজ্ঞানীরা এই তথ্য বিশ্লেষণ করে কিভাবে ফেসবুকের কোনও ধারণা ছাড়াই নিখুঁতভাবে অনেকগুলি গল্প প্রকাশ করতে পারে যা 20 কীভাবে কোন ধরনের জাদু সামাজিক সংখ্যা সৌভাগ্যবশত, উগান্ডার ও তার সহকর্মীরা তথ্য প্রক্রিয়াকরণের একটি সুস্পষ্ট ধারণা পেয়েছিলেন, এবং তারা জানত যে ফেসবুকে ২0 জন বন্ধুবান্ধব পৌঁছানোর আগেই ফেসবুকে কয়েকজন বন্ধুকে ফেসবুকে আরও বন্ধুদের সাথে উত্সাহ দেওয়ার জন্য উত্সাহ দিয়েছে। যদিও উগান্ডার ও সহকর্মীরা তাদের কাগজে এই কথা বলেন না, এই নীতিটি সম্ভবত ফেসবুকে তৈরি করা হয়েছিল যাতে নতুন ব্যবহারকারীরা আরো সক্রিয় হয়ে উঠতে উৎসাহিত করতে পারে। এই নীতির অস্তিত্ব সম্বন্ধে জানার ছাড়াও, তথ্য থেকে ভুল উপসংহারটি বের করা সহজ। অন্য কথায়, প্রায় 20 জন বন্ধু নিয়ে আশ্চর্যজনকভাবে উচ্চসংখ্যক মানুষ মানুষের আচরণের তুলনায় ফেসবুকে আমাদের আরও বেশি বলে।
এই পূর্ববর্তী উদাহরণে, অ্যালগরিদমিক বিভ্রান্তিকর একটি quirky ফলাফল উত্পন্ন যে একটি সতর্ককারী গবেষক আরও সনাক্ত এবং তদন্ত করতে পারে। যাইহোক, আলগোরিদিম বিভ্রান্তিকর একটি এমনকি trickier সংস্করণ আছে যখন অনলাইন সিস্টেমের ডিজাইনার সামাজিক তত্ত্ব সচেতন হয় এবং তারপর তাদের তত্ত্ব কাজ করে তাদের সিস্টেমের কাজ মধ্যে। সামাজিক বিজ্ঞানীরা এই প্রতিভাধর বলে : যখন একটি তত্ত্ব বিশ্বের পরিবর্তিত হয় এইভাবে বিশ্বকে তত্ত্বের সাথে আরও লাইন করে দেয়। কার্যকরী অ্যালগরিদমসংক্রান্ত সংঘর্ষের ক্ষেত্রে, তথ্য বিদ্বেষপূর্ণ প্রকৃতি সনাক্ত করা খুব কঠিন।
প্রতিযোগিতায় নির্মিত একটি প্যাটার্নের একটি উদাহরণ অনলাইন সোশ্যাল নেটওয়ার্কগুলিতে ট্রানজিটিভিটি। 1970 ও 1980-এর দশকে গবেষকরা বারংবার দেখেছেন যে যদি আপনি অ্যালিস এবং বব উভয়ের বন্ধু হন, তবে এলিস এবং বব একে অন্যের সাথে বন্ধুত্বের সম্ভাবনা দেখাতে পারেন, যদি না তারা দুটি এলোমেলোভাবে নির্বাচিত লোক। এই একই প্যাটার্ন ফেসবুকের সোশ্যাল গ্রাফে পাওয়া গেছে (Ugander et al. 2011) । এইভাবে, কেউ হয়তো মনে করতে পারেন যে ফেসবুকের বন্ধুত্বের ধরনগুলি অফলাইন বন্ধুত্বের প্রতিলিপি তৈরি করে, অন্তত ট্রানজিটিভিটির ক্ষেত্রে। যাইহোক, ফেইসবুক সোশ্যাল গ্রাফের ট্রানজিটিভিটির আংশিকভাবে আংশিকভাবে অ্যালগরিডমিক বিভ্রান্তিকর দ্বারা চালিত হয়। অর্থাৎ ফেইসবুকের তথ্য বিজ্ঞানী ট্রানজিটিভিটির গবেষণামূলক এবং তাত্ত্বিক গবেষণা সম্পর্কে জানতেন এবং তারপর ফেসবুকে কীভাবে কাজ করেন তার মধ্যে এটি তৈরি করেছেন। ফেইসবুক একটি "মানুষ আপনি জানতে পারেন" বৈশিষ্ট্য যে নতুন বন্ধু প্রস্তাব দেয়, এবং ফেসবুক সিদ্ধান্ত নেয় যে আপনি কে ট্রানজিটিভিটি আছে যে, ফেসবুক আপনার বন্ধুদের বন্ধুদের সঙ্গে বন্ধু হয়ে যে সুপারিশ সম্ভবত বেশি হয়। এই বৈশিষ্ট্যটি ফেসবুক সামাজিক গ্রাফে ক্রমবর্ধমান ট্রানজিটিভিটির প্রভাব রয়েছে; অন্য কথায়, ট্রানজিটিভিউয়ের তত্ত্ব তত্ত্বের পূর্বাভাস দিয়ে (Zignani et al. 2014; Healy 2015) । সুতরাং, যখন বড় তথ্য উত্স সামাজিক তত্ত্বের পূর্বাভাস পুনরুত্পূর্ণ বলে মনে হয়, তখন আমাদের অবশ্যই নিশ্চিত হতে হবে যে এই পদ্ধতিটি কীভাবে কাজ করে সেটি কীভাবে তৈরি করা হয়নি।
একটি প্রাকৃতিক সেটিং মানুষের পর্যবেক্ষক হিসাবে বড় তথ্য উত্স চিন্তা করার চেয়ে, একটি আরো apt রূপক একটি ক্যাসিনো মধ্যে মানুষ পর্যবেক্ষক হয়। ক্যাসিনোগুলি বেশিরভাগ আচরণের জন্য ডিজাইন করা পরিবেশে অত্যন্ত পরিবেশিত হয় এবং একজন গবেষক একটি ক্যাসিনোতে মানুষের আচরণের মধ্যে একটি নির্বোধ উইন্ডো প্রদানের আশা করেন না। অবশ্যই, আপনি ক্যাসিনোতে মানুষ অধ্যয়ন করে মানুষের আচরণ সম্পর্কে কিছু শিখতে পারেন, কিন্তু যদি আপনি এই বিষয়টিকে উপেক্ষা করেন যে একটি ক্যাসিনোতে তথ্য তৈরি করা হচ্ছে, তাহলে আপনি কিছু খারাপ সিদ্ধান্ত নিতে পারেন।
দুর্ভাগ্যবশত, অ্যালগরিদমসংক্রান্ত বিভ্রান্তি মোকাবেলা করা বিশেষত কঠিন কারণ অনলাইন সিস্টেমের অনেক বৈশিষ্ট্য মালিকানাধীন, দুর্বল নথিভুক্ত এবং ক্রমাগত পরিবর্তনশীল। উদাহরণস্বরূপ, আমি এই অধ্যায়ে পরে ব্যাখ্যা করবো, গুগল ফ্লু ট্রেন্ডস (সেকশন ২.4.2) এর ধীরে ধীরে ভগ্নাংশের জন্য অ্যালগরিদমিক বিভ্রান্তিকর একটি সম্ভাব্য ব্যাখ্যা ছিল, কিন্তু এই দাবিটি মূল্যায়ন করা কঠিন কারণ Google এর অনুসন্ধান অ্যালগরিদমের ভিতরের কাজ মালিকানা। আলগোরিদিম বিভক্তকরণের গতিশীল প্রকৃতি সিস্টেম ড্রিফ্ট এক ফর্ম। অ্যালগরিদমিক বিভ্রান্তিকর অর্থ হচ্ছে, একক ডিজিটাল সিস্টেম থেকে আসা মানুষের আচরণ সম্পর্কিত যেকোনো দাবি সম্পর্কে সতর্ক হওয়া উচিত, যতটা বড় হোক না কেন।