کہکشاں چڑیاگھر بہت سے غیر ماہر رضاکاروں کی کوششوں کو مل کر ایک لاکھ کہکشاں کی درجہ بندی کے لۓ.
2007 میں آکسفورڈ یونیورسٹی میں اقوام متحدہ کے فلسفہ میں ایک گریجویٹ طالب علم کیون سکونسکی کا سامنا کرنا پڑا اس مسئلے سے گلیجیکیو چڑیا گیا. اس سے بہت کچھ آسان تھا، سکوسککی کہکشاںوں میں دلچسپی رکھتی تھی، اور کہکشاں ان کی اخلاقیات یا ہڈیوں کی طرف سے درجہ بندی کی جا سکتی ہیں. ان کے رنگ نیلے یا سرخ سے. اس وقت، مایوسیوں کے درمیان روایتی حکمت یہ تھا کہ سرکش گوشیوں، ہمارے دودھ راستے کی طرح، رنگ میں نیلے رنگ تھے (نوجوانوں کو اشارہ کرتے ہیں) اور لمحات کی چمکیاں سرخ تھیں (عمر کی عمر کا اشارہ). سکونسی نے اس روایتی حکمت پر شکست دی. انہوں نے اس بات پر شک کیا کہ جب یہ پیٹرن عام طور پر درست ہوسکتا ہے تو شاید ممکنہ طور پر استثناء کی ایک بڑی تعداد ہو، اور یہ ان غیر معمولی کہکشاںوں کا مطالعہ کرکے- جو لوگ متوقع نمونہ نہیں رکھتے- وہ اس عمل کے بارے میں کچھ سیکھ سکتے تھے. کہکشاں قائم ہیں.
اس طرح، روایتی حکمت کو ختم کرنے کے لئے کیا شیطانسکی کی ضرورت تھی جس نے مہفالوجی طور پر درجہ بندی کیکشافیوں کا ایک بڑا مجموعہ تھا؛ یہ کہکشاں، جو سرپل یا یلڈیڈیکل کے طور پر درجہ بندی کی گئی ہے. تاہم، یہ مسئلہ یہ تھی کہ سائنسی تحقیق کے لئے درجہ بندی کے لئے موجودہ الگورتھممک طریقوں کو ابھی تک کافی اچھا نہیں تھا؛ دوسرے الفاظ میں، کہکشاںوں کی درجہ بندی کرنا تھا، اس وقت، کمپیوٹرز کے لئے مشکل تھا کہ ایک مسئلہ. لہذا، کیا ضرورت تھی انسانی حقوق کی ایک بڑی تعداد میںکشاں. سکونسیکی نے گریجویٹ طالب علم کی حوصلہ افزائی کے ساتھ اس درجہ بندی کی مسئلہ کا آغاز کیا. سات 12 گھنٹے کے دن کے میراتھن سیشن میں، وہ 50،000 کہکشاںوں کی درجہ بندی کرنے میں کامیاب تھا. جبکہ 50،000 کہکشاںیں بہت ساری آواز لگتی ہیں، یہ تقریبا ایک ملین کیکشاںوں میں سے تقریبا 5 فی صد ہے جو سلوان ڈیجیٹل اسکائی سروے میں فوٹو گرایا گیا ہے. سکونسیکی نے محسوس کیا کہ انہیں ایک زیادہ سکلائبل نقطہ نظر کی ضرورت ہے.
خوش قسمتی سے، یہ پتہ چلتا ہے کی درجہ بندی کہکشاؤں کے کام کو علم فلکیات میں اعلی درجے کی تربیت کی ضرورت نہیں ہے؛ آپ کو بہت فوری طور پر ایسا کرنے کی کسی کو سکھا سکتے ہیں. دوسرے الفاظ، اگرچہ کہکشاؤں کی درجہ بندی کمپیوٹر کے لئے مشکل تھا کہ ایک کام ہے، یہ انسانوں کے لئے بہت آسان تھا. لہذا، آکسفورڈ، Schawinski اور ساتھی ھگولود کرس Lintott میں ایک پب میں بیٹھ کر رضاکاروں کہکشاؤں کی تصاویر کی درجہ بندی کریں گے جہاں ایک ویب سائٹ ہے خواب دیکھا. چند ماہ بعد، کہکشاں چڑیاگھر پیدا ہوا تھا.
کہکشاں چڑیا گھر کی ویب سائٹ میں، رضاکارانہ تربیت کے چند منٹ سے گریز کریں گے؛ مثال کے طور پر، سرپل اور یلسیڈی کہکشاں (5.2 نمبر) کے درمیان فرق سیکھنا. اس تربیت کے بعد، ہر رضاکارانہ طور پر ایک آسان ویب پر مبنی انٹرفیس (5.3 نمبر) کے ذریعہ 15 پراجیکٹز کے 11 میں سے ایک قسم کی درجہ بندی کرنا آسان ہے. رضاکاروں سے رضاکارانہ طور پر منتقلی کی منتقلی 10 منٹ سے کم ہو گی اور صرف کم از کم رکاوٹوں، ایک سادہ کوئز کو منتقل کرنے کی ضرورت ہوتی ہے.
کہکشاں چڑوسی نے اپنے ابتدائی رضاکاروں کو اپنی خبروں میں شامل کرنے کے بعد اپنی خبروں میں شامل کیا تھا، اور تقریبا چھ مہینے میں اس منصوبے میں 100،000 سے زائد شہری سائنسدانوں کو شامل کیا گیا. ساتھ ساتھ، یہ 100،000 رضاکاروں نے 40 ملین سے زائد درجہ بندیوں میں حصہ لیا، زیادہ تر درجہ بندی کی اکثریت نسبتا چھوٹے، شرکاء کے بنیادی گروپ (Lintott et al. 2008) .
محققین جنہوں نے انڈر گریجویٹ ریسرچ کے اسسٹنٹ کی خدمات حاصل کرنے کا تجربہ کیا ہے وہ فوری طور پر ڈیٹا کی معیار کے بارے میں شکست کا باعث بن سکتی ہے. اس تشکیک معقول ہے، کہکشاں زو کہ جب رضاکارانہ شراکت صحیح، صاف debiased، اور مجموعی کر رہے ہیں، وہ اعلی معیار کے نتائج پیدا کر سکتا ہے سے پتہ چلتا ہے (Lintott et al. 2008) . پیشہ ورانہ معیار کے اعداد و شمار بنانے کے لئے بھیڑ حاصل کرنے کے لئے ایک اہم چیلنج بہت زیادہ ہے، اسی طرح کام کرنے کے بہت سے مختلف لوگوں کی طرف سے کارکردگی کا مظاہرہ کیا ہے. کہکشاں زو میں، کہکشاں فی تقریبا 40 درجہ بندی تھی. انڈر گریجویٹ ریسرچ اسسٹنٹز کا استعمال کرتے ہوئے محققین نے اس حد تک بے حد اس حد تک برداشت نہیں کی ہے اور اس وجہ سے ہر فرد کی درجہ بندی کی کیفیت کے بارے میں زیادہ سے زیادہ تعلق ہوگا. رضاکارانہ تربیت میں کمی نہیں آتی، وہ بیکار کے ساتھ بنا رہے تھے.
تاہم، ایک کہکشاں فی کثیر درجہ بندی کے ساتھ، اتفاق رائے کی درجہ بندی کو پیدا کرنے کے لئے رضاکارانہ درجہ بندی کا مجموعہ مشکل تھا. چونکہ بہت سارے چیلنجوں کی وجہ سے زیادہ سے زیادہ انسانی حسابات کے منصوبوں میں پیدا ہوتا ہے، یہ تین مرحلے پر نظر ثانی کرنے میں مددگار ثابت ہوتا ہے کہ کہکشاں چڑیاگھر محققین نے ان کی اتفاق شدہ درجہ بندی پیدا کرنے کے لئے استعمال کیا. سب سے پہلے، محققین باگس درجہ بندی کو ہٹانے کے ذریعے "صاف" ڈیٹا. مثال کے طور پر، جو لوگ بار بار ایک ہی کہکشاں کی درجہ بندی کرتے ہیں وہ جو کچھ ہوتا ہے وہ نتائج کو ہٹانے کی کوشش کر رہے ہیں. یہ اور دیگر اسی طرح کے صفائی کی تمام درجہ بندی کے تقریبا 4٪ کو ہٹا دیا گیا ہے.
دوسرا، صفائی کے بعد، محققین کو درجہ بندی میں منظم طریقے سے نظر انداز کرنے کی ضرورت ہے. اصل منصوبے کے اندر سرایت ہونے والے تعصب مطالعہ کی ایک سلسلے کے ذریعہ، مثال کے طور پر، کچھ رضاکاروں کو رنگ کے بجائے مونوکروم میں کہکشاں میں دکھایا گیا ہے- محققین نے کئی منظم طریقے سے بصیرتیں دریافت کی ہیں، مثلا سرپل کیکشافیوں کے طور پر سلفی کہکشاںوں (Bamford et al. 2009) . ان منظماتی تعصبوں کے لئے ایڈجسٹ کرنا انتہائی اہم ہے کیونکہ بے کارگی خود کار طریقے سے منظم طریقے سے تعصب نہیں ہٹاتا ہے؛ یہ صرف بے ترتیب غلطی کو ہٹانے میں مدد کرتی ہے.
آخر میں، ختم کرنے کے بعد، محققین نے ایک متفق طبق بندی پیدا کرنے کے لئے انفرادی درجہ بندی کو یکجا کرنے کے لئے ایک طریقہ کی ضرورت ہے. ہر کہکشاں کے لئے درجہ بندی کی درجہ بندی کرنے کا سب سے آسان طریقہ سب سے زیادہ عام درجہ بندی کا انتخاب کرنا ہوگا. تاہم، یہ نقطہ نظر ہر رضاکارانہ مساوات برابر ہوتا ہے، اور محققین کو شک ہے کہ کچھ رضاکاروں دوسروں کے مقابلے میں درجہ بندی میں بہتر تھے. لہذا، محققین نے ایک زیادہ پیچیدہ آئرنٹو وزن کا طریقہ کار تیار کیا جس نے بہترین طبقے کا پتہ لگانے کی کوشش کی ہے اور انہیں زیادہ وزن دینے کی کوشش کی ہے.
اس طرح، تین مرحلے کے عمل کے بعد، گیلانی چڑیاگھر کی تحقیق ٹیم نے صفائی، ڈوبنے اور وزن اٹھانے کے بعد 40 ملین رضاکار طبقے کو ایک متفق طب اخلاقی درجہ بندی میں تبدیل کیا. جب یہ کہکشاں چڑھاو درجہ بندی پیشہ ورانہ محافظوں کی طرف سے تین گزشتہ چھوٹے پیمانے پر کوششوں کے ساتھ مقابلے میں تھے، بشمول Schawinski کی طرف سے درجہ بندی سمیت، کہکشاں چڑیا گھر میں حوصلہ افزائی کرنے میں مدد کی، وہاں مضبوط معاہدہ تھا. اس طرح، رضاکاروں، مجموعی طور پر، اعلی معیار کی درجہ بندی فراہم کرنے کے قابل تھے اور پیمانے پر محققین سے مل کر نہیں مل سکا (Lintott et al. 2008) . حقیقت یہ ہے کہ، کہکشاں کے اس بڑی تعداد کے لئے انسانی درجہ بندییں، شاونسککی، لنٹوت، اور دیگر لوگوں کو ظاہر کرنے کے قابل تھا کہ تقریبا 80 فیصد گوکشیاں متوقع نمونہ ہیں- نیلے رنگ کے سرپل اور ریڈ الیڈیکلز - اور بہت سے کاغذات کے بارے میں لکھا گیا ہے. اس دریافت (Fortson et al. 2011) .
اس پس منظر کو دیکھتے ہوئے، اب آپ دیکھ سکتے ہیں کہ کس طرح کہکشاں چڑھاو کو تقلید-درخواست دہندگی کی ہدایت کی پیروی کرتا ہے، وہی ہدایت ہے جو سب سے زیادہ انسانی حساباتی منصوبوں کے لئے استعمال کیا جاتا ہے. سب سے پہلے، ایک بڑی مشکلات میں تقسیم کیا جاتا ہے. اس معاملے میں، ایک کہکشاں کی درجہ بندی کرنے کے لئے ایک لاکھ کہکشاںوں کی درجہ بندی کرنے کا مسئلہ ایک ملین مسائل میں تقسیم کیا گیا تھا. اگلا، ہر ایک حصہ پر آزادانہ طور پر لاگو ہوتا ہے. اس صورت میں، رضاکاروں نے ہر ایک کہکشاں کی درجہ بندی کے طور پر سرپل یا یلڈیڈیکل کی حیثیت سے کی ہے. آخر میں، نتائج اتفاق رائے کے نتائج پیدا کرنے کے لئے مشترکہ ہیں. اس صورت میں، گلیوں میں ہر ایک کہکشاں کے لئے اتفاق رائے کی درجہ بندی کو پیدا کرنے، صفائی، اور وزن میں شامل ہونے میں شامل ہونے کا مجموعہ شامل تھا. اگرچہ زیادہ سے زیادہ منصوبوں کو اس عام ہدایت کا استعمال ہوتا ہے، ہر مرحلے سے مخصوص مسئلہ کو حل کرنے کی ضرورت ہے. مثال کے طور پر، ذیل میں بیان کردہ انسانی ساکھ پروجیکٹ میں، اسی ہدایت کی پیروی کی جائے گی، لیکن اطلاق اور انضمام کے اقدامات بہت مختلف ہو جائیں گے.
کہکشاں زو ٹیم کے لئے، یہ پہلا منصوبہ صرف آغاز تھا. بہت جلد انہوں نے محسوس کیا کہ اگرچہ انہوں نے ایک لاکھ کہکشاں کے قریب درجہ بندی کرنے کے قابل نہیں تھے، اس پیمانے پر نئے ڈیجیٹل اسکائی سروے کے ساتھ کام کرنے کے لئے کافی نہیں ہے، جس میں تقریبا 10 بلین کی کہکشاں (Kuminski et al. 2014) تصویر پیدا (Kuminski et al. 2014) . 1 ملین سے 10 ارب تک اضافہ کرنے کے لئے-10،000-کہکشاں چڑھاو کا ایک عنصر تقریبا 10،000 گنا زیادہ شرکاء بھرنے کی ضرورت ہوگی. اگرچہ انٹرنیٹ پر رضاکاروں کی تعداد بڑی ہے، یہ لامحدود نہیں ہے. لہذا، محققین کو احساس ہوا کہ اگر وہ اعداد و شمار کی بڑھتی ہوئی مقدار کو سنبھالنے کے لئے جا رہے تھے، تو ایک نیا، اس سے بھی زیادہ سکلیبل، نقطہ نظر کی ضرورت تھی.
لہذا، منیڈا بنرجی - شالسکی، لنٹوت، اور کہکشاں زو ٹیم کے دیگر ارکان (2010) ساتھ کام کر رہے ہیں، کہکشاںوں کو درجہ بندی کرنے کے لئے تدریس کمپیوٹرز. زیادہ تر خاص طور پر، کہکشاں زو کی طرف سے پیدا انسانی درجہ بندی کا استعمال کرتے ہوئے، Banerji ایک مشین سیکھنے ماڈل بنایا ہے جس کی تصویر کی خصوصیات کی بنیاد پر ایک کہکشاں کی انسانی درجہ بندی کی پیروی کی جا سکتی ہے. اگر یہ ماڈل اعلی درجہ بندی کے ساتھ انسانی درجہ بندی کو دوبارہ پیش کرسکتا ہے، تو یہ کہکشاں زو محققین کے ذریعہ یہ کہکشاں کے بنیادی طور پر لامحدود تعداد کو درجہ بندی کرنے کے لئے استعمال کیا جا سکتا ہے.
بینرجی اور ساتھیوں کے نقطہ نظر کا اصل بنیادی طور پر تخنیکوں کی طرح بالکل عام ہے جو عام طور پر سماجی تحقیق میں استعمال کیا جاتا ہے، اگرچہ اس کی مساوات پہلی نظر میں واضح نہیں ہوسکتی ہے. سب سے پہلے، Banerji اور ساتھیوں نے ہر تصویر کو ایک خاص اعداد و شمار میں مقرر کیا جس نے اپنی خصوصیات کو خلاصہ کیا. مثال کے طور پر، کہکشاں کی تصاویر کے لئے، تین خصوصیات ہوسکتی ہیں: تصویر میں نیلے رنگ کی مقدار، پکسلز کی چمک میں متغیر، اور غیر سفید پکسلز کا تناسب. صحیح خصوصیات کا انتخاب مسئلہ کا ایک اہم حصہ ہے، اور یہ عام طور پر مضامین کی مہارت کی ضرورت ہوتی ہے. یہ سب سے پہلے مرحلہ، عام طور پر فیچر انجینئرنگ کہا جاتا ہے ، جس کے نتیجے میں ڈیٹا میٹرکس میں ایک قطار فی تصویر ہے اور اس کے بعد تین کالم اس تصویر کی وضاحت کرتی ہیں. اعداد و شمار میٹرکس اور مطلوب پیداوار (مثال کے طور پر، اگر کوئی تصویر elliptical کہکشاں کے طور پر انسانی کی طرف سے درجہ بندی کیا گیا تھا) کو دیکھتے ہوئے، محقق ایک اعداد و شمار یا مشینری سیکھنے کے ماڈل کی تخلیق کرتا ہے- مثال کے طور پر، لاجسٹک ریپریشن - جو خصوصیات کے مطابق انسانی درجہ بندی کی پیش گوئی کرتا ہے. تصویر کی. آخر میں، محققین نے نئی اعداد و شمار کے اندازے کی درجہ بندی (اعداد و شمار 5.4) پیدا کرنے کے لئے اس اعداد و شمار کے ماڈل میں پیرامیٹرز کا استعمال کیا ہے. مشینی سیکھنے میں، اس نقطہ نظر سے لیبل شدہ مثالوں کا استعمال کرتے ہوئے ایک ایسا ماڈل بنانا جو نئے اعداد و شمار کو لیبل کرسکتا ہے- اسے نگرانی سیکھنے کا نام دیا جاتا ہے.
Banerji اور ساتھیوں کے مشینری سیکھنے کے ماڈل میں خصوصیات میری کھلونا مثال کے طور پر ان میں سے زیادہ پیچیدہ تھے - مثال کے طور پر، وہ "Va Vaououleurs فٹ محوری تناسب" جیسے خصوصیات کا استعمال کرتے تھے- اور اس کا ماڈل لاجسٹک ریگریشن نہیں تھا، یہ ایک مصنوعی نیند نیٹ ورک تھا. اس کی خصوصیات، اس کے ماڈل اور اتفاق رائے کی کہکشاں زو کی درجہ بندی کا استعمال کرتے ہوئے، وہ ہر ایک خصوصیت پر وزن پیدا کرنے میں کامیاب تھے، اور پھر یہ کہکشاںوں کی درجہ بندی کے بارے میں پیش گوئی کرنے کے لئے ان وزن کا استعمال کرتے ہیں. مثال کے طور پر، اس کے تجزیہ سے پتہ چلتا ہے کہ کم "ڈی ویوولیس فٹ محوری تناسب" کی تصاویر سرپل کی گلیاں بننے کے امکانات کا حامل تھیں. ان وزنوں کو دیکھتے ہوئے، وہ ایک گلیسی کی انسانی درجہ بندی کو مناسب درستگی کے ساتھ پیش کرنے میں کامیاب تھے.
بنرجی اور ساتھیوں کے کام نے کہکشاں چڑیا گھر کو تبدیل کر دیا جس میں میں نے ایک کمپیوٹر کی مدد سے انسان کی ساکھ نظام سنا. ان ہائبرڈ سسٹم کے بارے میں سوچنے کا بہترین طریقہ یہ ہے کہ انسانوں کو کسی مسئلے کو حل کرنے کے بجائے، انسانوں کو ڈیٹا بیس بنانا ہے جو اس مسئلے کو حل کرنے کے لئے کمپیوٹر کو تربیت دینے کے لئے استعمال کیا جا سکتا ہے. کبھی کبھی، اس مسئلے کو حل کرنے کے لئے ایک کمپیوٹر کی تربیت کر سکتے ہیں بہت سارے مثال کی ضرورت ہے، اور کافی تعداد میں مثالیں پیدا کرنے کا ایک ہی طریقہ بڑے پیمانے پر تعاون ہے. اس کمپیوٹر سے معاون نقطہ نظر کا فائدہ یہ ہے کہ یہ آپ کو انسانی کوششوں کے صرف ایک مکمل رقم کا استعمال کرتے ہوئے اعداد و شمار کے بنیادی طور پر لامحدود مقدار کو سنبھالنے کے قابل بناتا ہے. مثال کے طور پر، ایک لاکھ انسان کی درجہ بندی کے ساتھ ایک محقق ایک پیش گوئی ماڈل بنا سکتا ہے جو اس کے بعد ایک ارب یا اس سے بھی ایک ٹریلین کہکشاں کو درجہ بندی کرنے کے لئے استعمال کیا جا سکتا ہے. اگر کہکشاں کی بہت بڑی تعداد ہیں، تو اس طرح کے انسانی کمپیوٹر ہائبرڈ واقعی ممکن حل ہے. تاہم، یہ لامحدود اسکالبلائٹی آزاد نہیں ہے. ایک مشین سیکھنے والی ماڈل بنانا جو انسانی درجہ بندی کو صحیح طریقے سے دوبارہ بنانا پڑتا ہے، خود کو ایک مشکل مسئلہ ہے، لیکن خوش قسمتی سے پہلے ہی اس مضمون کے لئے وقف بہترین کتابیں ہیں (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .
کہکشاں چڑیاگھر ایک اچھا مثال ہے کہ انسان کی کتب کے منصوبوں کی ترقی کیسے کی گئی ہے. سب سے پہلے، ایک محقق اپنے آپ کو یا تحقیق معاونوں کی ایک چھوٹی سی ٹیم کے ساتھ منصوبے کی کوشش کرتا ہے (مثال کے طور پر، Schawinski کی ابتدائی درجہ بندی کی کوشش). اگر یہ نقطہ نظر اچھی طرح سے پیمائش نہیں کرتا ہے تو، محققین کو بہت سے مباحثے کے ساتھ انسانی حساباتی منصوبے میں منتقل کر سکتا ہے. لیکن، ایک مخصوص حجم کے اعداد و شمار کے لئے، خالص انسانی کوشش کافی نہیں ہوگی. اس موقع پر، محققین کو کمپیوٹر سے معاون انسانی ساکھ نظام کا قیام کرنے کی ضرورت ہے جس میں انسانی درجہ بندی ایک مشین سیکھنے کے ماڈل کو تربیت دینے کے لئے استعمال کیا جاتا ہے جو اس کے بعد ڈیٹا کے تقریبا لامحدود مقدار میں لاگو کیا جا سکتا ہے.