2.3.2.5 الگوردھمک شرمندہ

پایا ڈیٹا میں رویہ جو نظام کی انجینئرنگ کے مقاصد کے ذریعے کارفرما ہے، قدرتی نہیں ہے.

کیونکہ لوگ آگاہ نہیں ہیں بہت پایا اعداد و شمار ذرائع غیر رد عمل ہیں، لیکن ان کے ڈیٹا ریکارڈ کیا جا رہا ہے (دفعہ 2.3.1.3)، محققین "قدرتی طور پر واقع" یا ہونے کے لئے ان آن لائن نظام میں رویے پر غور نہیں کرنا چاہئے "خالص." حقیقت میں، ڈیجیٹل نظام اس ریکارڈ رویے انتہائی جیسے اشتھارات پر کلک کرنے یا مواد شائع مخصوص طرز عمل دلانا انجنیئر رہے ہیں. نظام ڈیزائنرز کے مقاصد ڈیٹا میں نمونوں کو متعارف کرانے کر سکتے ہیں طریقوں پر algorithmic confounding کہا جاتا ہے. پر algorithmic confounding سماجی سائنسدانوں کے لئے نسبتا نامعلوم ہے، لیکن یہ محتاط اعداد و شمار کے سائنسدانوں کے درمیان ایک بڑی تشویش ہے. اور، ڈیجیٹل نشانات کے ساتھ دوسرے مسائل میں سے کچھ کے برعکس، پر algorithmic confounding بڑی حد تک پوشیدہ ہے.

پر algorithmic confounding کی ایک نسبتا آسان مثال بک پر تقریبا 20 ارکان کے ساتھ صارفین کی anomalously بڑی تعداد نے حقیقت ہے (Ugander et al. 2011) . سائنسدانوں کے لئے کس طرح فیس بک کام کرتا ہے بلاشبہ 20 جادو سماجی تعداد کے کچھ قسم ہے کہ کس طرح کے بارے میں کئی کہانیاں پیدا کر سکتا ہے کے کسی بھی افہام و تفہیم کے بغیر اس کے ڈیٹا کے ساتھ تجزیہ کرتے. تاہم، Ugander اور ان کے ساتھیوں کو ڈیٹا پیدا کی ہے کہ عمل کی کافی سمجھ تھی، اور وہ فیس بک ہے جب تک وہ 20 دوستوں تک پہنچ زیادہ دوست بنانے کے لئے فیس بک پر چند کنکشن کے ساتھ لوگوں کی حوصلہ افزائی کی کہ جانتا تھا. اگرچہ Ugander اور ساتھیوں اخبار میں یہ نہ کہو، اس پالیسی کو شاید نئے صارفین کو زیادہ فعال بننے کے لئے حوصلہ افزائی کرنے کے لئے فیس بک کی طرف سے پیدا کیا گیا تھا. اس پالیسی کے وجود کے بارے میں جاننے کے بغیر، تاہم، یہ آسان ڈیٹا سے غلط نتیجے پر اپنی طرف متوجہ ہے. دوسرے الفاظ میں، کے بارے میں 20 ارکان کے ساتھ لوگوں کی حیرت کی بڑی تعداد نے ہمیں انسانی رویے کے مقابلے میں فیس بک کے بارے میں مزید بتاتا ہے.

پر algorithmic confounding ایک quirky نتیجہ ہے کہ ایک محتاط محققین، مزید تفتیش ہو سکتی آن لائن نظام کے ڈیزائنرز سماجی نظریات سے آگاہ ہوتے ہیں تو اس وقت ہوتی ہے پر algorithmic confounding کا ایک بھی trickier ورژن ہے اور اس کے بعد کام کرنا میں ان نظریات پکانا تیار کی ہے جہاں یہ گزشتہ مثال سے بھی زیادہ نقصان دہ ان کے نظام کی. سماجی سائنسدانوں کو اس performativity کال کریں: نظریات طرح ہے کہ وہ اصول کے ساتھ لائن میں زیادہ دنیا لانے کہ میں دنیا کو تبدیل جب. performative پر algorithmic confounding کے مقدمات میں، اعداد و شمار کے شرمندہ نوعیت کا امکان پوشیدہ ہے.

performativity ذریعے بنائی پیٹرن کی ایک مثال آن لائن سوشل نیٹ ورک میں transitivity ہے. 1970s اور 1980s میں، محققین نے بار بار آپ یلس کے ساتھ دوست ہیں اور تم باب کے ساتھ دوست ہیں، تو پھر باب اور یلس دو تصادفی منتخب کیا لوگوں کے مقابلے میں ایک دوسرے کے ساتھ دوستی کا زیادہ امکان ہے کہ مل گیا. اور، یہ بہت ہی پیٹرن بک پر سماجی گراف میں پایا گیا تھا (Ugander et al. 2011) . اس طرح، ایک فیس بک پر دوستی کے پیٹرن، لائن میں دوستی کے نمونوں کی نقل تیار ہے کہ کم از کم transitivity کے لحاظ سے یہ نتیجہ اخذ کر سکتے ہیں. تاہم، فیس بک سماجی گراف میں transitivity کی شدت جزوی طور پر algorithmic confounding کے ذریعے کارفرما ہے. کہ فیس بک پر اعداد و شمار کے سائنسدانوں transitivity بارے آخباخت اور نظریاتی تحقیق کا علم تھا اور پھر کس طرح فیس بک کے کام میں یہ سینکا ہوا، ہے. فیس بک ایک "لوگ آپ واقف ہوں گے" نئے دوستوں سے پتہ چلتا ہے کہ خصوصیت، اور فیس بک آپ transitivity ہے کرنے کے لئے مشورہ کے لئے جو فیصلہ کرتا ہے کہ ایک ہی راستہ ہے. یہ ہے کہ، فیس بک ہے کہ آپ اپنے دوستوں کے دوستوں کے ساتھ دوست بننے کا مشورہ کرنے کا امکان زیادہ ہے. یہ خصوصیت اس طرح فیس بک سماجی گراف میں transitivity میں اضافہ کا اثر ہے؛ دوسرے الفاظ میں، transitivity کے اصول نظریہ کی پیشن گوئی کے ساتھ لائن میں دنیا لاتا ہے (Healy 2015) . اس طرح، بڑی ڈیٹا ذرائع سماجی نظریے کی پیشین گوئیوں کو دوبارہ پیش کرنے نمودار ہونے پر، ہمیں یقین ہے کہ نظریہ بذات خود نظام کام کیا ہے کہ کس طرح میں سینکا ہوا نہیں کیا گیا تھا کہ ہونا ضروری.

بلکہ ایک قدرتی ماحول میں لوگوں کا مشاہدہ کے طور پر بڑے اعداد و شمار کے ذرائع کی سوچ سے زیادہ، ایک زیادہ مناسب استعارہ ایک کیسینو میں لوگوں کو دیکھ رہا ہے. کیسنو انتہائی مخصوص طرز عمل دلانا کرنے کے لئے ڈیزائن ماحول انجنیئر رہے ہیں، اور ایک محققین ایک کیسینو میں اس رویے انسانی رویے میں ایک نرنکش ونڈو فراہم کرے گا توقع کر کبھی نہیں کرے گا. کورس کے، ہم میں انسانی رویے کا مطالعہ کر کے لوگوں کے بارے میں کچھ سیکھ سکتا ہے جوئے بازی کے اڈوں میں حقیقت یہ ہے کہ ایک کیسینو شراب کی کھپت اور خطرے کے درمیان تعلقات کا مطالعہ کے لئے ایک مثالی ترتیب ہو سکتا ترجیحات-لیکن ہم نظر انداز کر دیا ہے تو ہے کہ ڈیٹا ایک کیسینو میں پیدا کیا جا رہا تھا کو ہم ہی نے کچھ برے نتائج اخذ.

آن لائن نظام کے بہت سے خصوصیات، ملکیتی غیر تسلی بخش سے دستاویزی ہیں، اور مسلسل بدلتے کیونکہ بدقسمتی سے، پر algorithmic confounding ساتھ نمٹنے خاص طور پر مشکل ہے. مثال کے طور پر، میں نے اس باب میں بعد میں وضاحت کریں گے کے طور پر، پر algorithmic confounding گوگل فلو رجحانات (دفعہ 2.4.2) کے بتدریج بریک ڈاون کے لئے ایک ممکنہ وضاحت کی تھی، لیکن اس دعوی کا جائزہ لینے کے لئے مشکل تھا کیونکہ گوگل کی تلاش کے اندرونی کام کاج الگورتھم ملکیتی ہیں. پر algorithmic confounding کی متحرک نوعیت کا نظام آلگائے کا ایک فارم ہے. پر algorithmic confounding مطلب ہے کہ ہم کتنا بڑا کوئی بات انسانی رویے کے لئے کسی بھی دعوے کو کسی ایک ڈیجیٹل نظام سے آتا ہے کہ، کے بارے میں محتاط ہونا چاہئے.