کہکشاں چڑیاگھر ایک ملین کہکشاؤں کی درجہ بندی کرنے بہت سے غیر ماہر رضاکاروں کی کوششوں کو یکجا کیا.
ان کی morphology-انڈاکار یا کہکشاں چڑیاگھر، Schawinski کہکشاؤں میں دلچسپی رکھتا تھا 2007. بہت تھوڑا سا آسان بنانے میں Kevin Schawinski، آکسفورڈ یونیورسٹی میں علم فلکیات میں ایک گریجویٹ طالب علم کو درپیش ایک مسئلہ سے باہر اضافہ ہوا، اور کہکشاؤں کی طرف سے درجہ بندی کر سکتے سرپل اور ان کے رنگ نیلے رنگ یا سرخ کر. وقت، ھگولودوں کے درمیان روایتی دانش سرپل کہکشاؤں، ہماری آکاشگنگا کی طرح، رنگ (کا اشارہ یوتھ) میں نیلے تھے اور یہ کہ انڈاکار کہکشاؤں رنگ میں سرخ تھے (بڑھاپے کا اشارہ). Schawinski اس روایتی دانش پر شک کیا. انہوں نے کہا کہ اس روش عام طور پر سچ ہو سکتا ہے، مستثنیات کی ایک کافی تعداد میں شاید وہاں تھے، اور یہ کہ جو مشکوک ان غیر معمولی کہکشاؤں-قابل نہیں تھا کہ لوگوں میں سے بہت سی کے مطالعہ کی طرف سے توقع پیٹرن-انہوں نے اس عمل کے بارے میں کچھ سیکھ سکتا ہے جس کے ذریعے کہکشاؤں تشکیل دی.
اس طرح، کیا Schawinski روایتی دانش کو تبدیل کرنے کے لئے کی ضرورت morphologically خفیہ کہکشاؤں کی ایک بڑی سیٹ تھا. کہ، سرپل یا انڈاکار یا تو کے طور پر درجہ بندی کیا گیا تھا کہ کہکشاؤں ہے. مسئلہ، تاہم، کہ درجہ بندی کے لئے موجودہ پر algorithmic طریقوں کو ابھی تک کافی اچھی سائنسی تحقیق کے لیے استعمال کیا جائے گا نہیں تھے؛ دوسرے الفاظ میں، درجہ بندی کہکشاؤں کمپیوٹر کے لئے مشکل تھا کہ ایک مسئلہ اس وقت تھا،. لہذا، ضرورت تھی کہ کیا انسانی درجہ بندی کی کہکشاؤں کی ایک بڑی تعداد تھی. Schawinski ایک گریجویٹ طالب علم کی حوصلہ افزائی کے ساتھ اس درجہ بندی مسئلہ چلایا. سات، 12 گھنٹے دن کی میراتھن سیشن میں انہوں 50،000 کہکشاؤں کی درجہ بندی کرنے کے قابل تھا. 50،000 کہکشاؤں ایک بہت کی طرح لگتی ہے جبکہ، یہ اصل سلون ڈیجیٹل اسکائی سروے میں تصاویر گیا تھا کہ تقریبا ایک ملین کہکشاؤں میں سے صرف 5 فیصد ہے. Schawinski وہ ایک سے زیادہ توسیع پذیر اپروچ کی ضرورت احساس ہوا.
خوش قسمتی سے، یہ پتہ چلتا ہے کی درجہ بندی کہکشاؤں کے کام کو علم فلکیات میں اعلی درجے کی تربیت کی ضرورت نہیں ہے؛ آپ کو بہت فوری طور پر ایسا کرنے کی کسی کو سکھا سکتے ہیں. دوسرے الفاظ، اگرچہ کہکشاؤں کی درجہ بندی کمپیوٹر کے لئے مشکل تھا کہ ایک کام ہے، یہ انسانوں کے لئے بہت آسان تھا. لہذا، آکسفورڈ، Schawinski اور ساتھی ھگولود کرس Lintott میں ایک پب میں بیٹھ کر رضاکاروں کہکشاؤں کی تصاویر کی درجہ بندی کریں گے جہاں ایک ویب سائٹ ہے خواب دیکھا. چند ماہ بعد، کہکشاں چڑیاگھر پیدا ہوا تھا.
کہکشاں چڑیاگھر ویب سائٹ پر، رضاکاروں کی تربیت کے چند منٹ سے گزرنا گا؛ مثال کے طور پر، ایک سرپل اور انڈاکار کہکشاں (چترا 5.2) کے درمیان فرق سیکھنے. اس تربیت کے بعد، رضاکاروں پر جانا جاتا ہے کے ساتھ ایک نسبتا آسان کوئز-صحیح درجہ بندی میں 15 میں سے 11 کہکشاؤں منظور تھا درجہ بندی-اور پھر رضاکار ایک سادہ ویب کی بنیاد پر انٹرفیس (چترا 5.3) کے ذریعے نامعلوم کہکشاؤں کے حقیقی درجہ بندی کے شروع ہوگا. رضاکار سے ھگولود پر منتقلی سے کم 10 منٹ میں جگہ لے جائے گا اور صرف رکاوٹیں، ایک سادہ کوئز کی سب سے کم پاسنگ کی ضرورت.
کے بعد ایک خبر مضمون میں اس منصوبے شامل کیا گیا تھا، اور تقریبا چھ ماہ میں اس منصوبے سے زیادہ 100،000 شہری سائنسدانوں، کیونکہ وہ کام لطف اٹھایا ہے اور وہ پہلے فلکیات مدد کرنا چاہتے تھے حصہ لینے والے لوگوں کو شامل کرنے کے لئے اضافہ ہوا کہکشاں چڑیاگھر اس کی ابتدائی رضاکاروں کی طرف متوجہ. ایک ساتھ مل کر، ان 100،000 رضاکاروں نے شرکاء میں سے ایک نسبتا چھوٹے، کور گروپ سے آنے والے درجہ بندی کی اکثریت کے ساتھ، سے زیادہ 40 ملین کی درجہ بندی کی کل حصہ ڈالا (Lintott et al. 2008) .
محققین کے تجربے کی خدمات حاصل کرنے کے انڈر گریجویٹ تحقیق کے معاونین ہیں جو فوری طور پر اعداد و شمار کے معیار کے بارے میں شبہ ہو سکتا ہے. اس تشکیک معقول ہے، کہکشاں چڑیاگھر کہ جب رضاکارانہ شراکت صحیح، صاف کیا debiased، اور مجموعی کر رہے ہیں، وہ اعلی معیار کے نتائج پیدا کر سکتا ہے سے پتہ چلتا ہے (Lintott et al. 2008) . پیشہ ورانہ معیار کے اعداد و شمار کو پیدا کرنے کے ہجوم ہو رہی ہے کے لئے ایک اہم چال فالتوپن ہے؛ یہ ہے کہ، کر ایک ہی کام کو بہت سے مختلف لوگوں کی طرف سے کارکردگی کا مظاہرہ کیا. کہکشاں چڑیا گھر میں، کہکشاں کے مطابق تقریبا 40 درجہ بندیوں تھے. انڈر گریجویٹ تحقیق کے معاونین کا استعمال کرتے ہوئے فالتوپن کی اس سطح کے متحمل اور اس وجہ سے کبھی نہیں ہو سکتا محققین ہر فرد کی درجہ بندی کے معیار کے ساتھ بہت زیادہ فکر مند ہونے کی ضرورت ہے. رضاکاروں کی تربیت میں کمی رہ گئی تھی کیا انہوں فالتوپن کے لئے مل کر بنا.
یہاں تک کہ کہکشاں مطابق ایک سے زیادہ کی درجہ بندی کے ساتھ، تاہم، پیدا کرنے کے لئے رضاکار درجہ بندی کے سیٹ کو ملا اتفاق رائے کی درجہ بندی مشکل ہے. بہت ملتا جلتا چیلنجز سب سے زیادہ انسانی شمارندگی منصوبوں میں پیدا کیونکہ اس میں مختصر طور پر کہکشاں چڑیاگھر محققین ان اجماع درجہ بندی پیدا کرنے کے لئے استعمال کیا ہے کہ تین مراحل کا جائزہ لینے کے لئے مددگار ہے. سب سے پہلے، محققین بوگس درجہ بندیوں کو ہٹا کر ڈیٹا "صاف". مثال کے طور پر، بار بار ہو گا کہ وہ جوڑتوڑ کرنے کی کوشش کر رہے تھے تو ایک ہی کہکشاں کچھ پر درجہ بندی ہے جو لوگوں کے نتائج پر تھا ان کی تمام درجہ بندی ضائع. یہ اور اس طرح کی دوسری صفائی کی تمام درجہ بندی کے بارے میں 4 فیصد ہٹا دیا.
دوسرا، صفائی کے بعد، محققین درجہ بندیوں میں منظم تعصبات کو دور کرنے کی ضرورت. اصل منصوبے کے لئے مثال کے اندر اندر سرایت تعصب کا پتہ لگانے اسٹڈیز، کچھ رضاکاروں کے بجائے مونوکروم میں کہکشاں دکھا کے ایک سلسلہ کے ذریعہ رنگ محققین جیسے انڈاکار کہکشاؤں کے طور پر دور سرپل کہکشاؤں کی درجہ بندی کرنے ایک منظم تعصب کئی منظم تعصبات، دریافت (Bamford et al. 2009) . بہت سے شراکت کی اوسط منظم تعصب کو ختم نہیں کرتا کیونکہ یہ منظم تعصبات کے لئے ایڈجسٹ کرنے کے لئے انتہائی اہم ہے؛ یہ صرف بے ترتیب غلطی کو ہٹا دیتا ہے.
آخر میں، debiasing بعد، محققین ایک اتفاق رائے کی درجہ بندی پیدا کرنے کے انفرادی درجہ بندی کے جمع کرنے کا طریقہ کی ضرورت ہے. ہر ایک کہکشاں کے لئے درجہ بندی کو اکٹھا کرنے کا آسان ترین طریقہ سب سے زیادہ عام کی درجہ بندی منتخب کرنے کے لئے ہو جائے گا. تاہم، اس نقطہ نظر سے ہر ایک رضاکار برابر وزن دے گی، اور محققین مشتبہ کچھ دوسروں کے مقابلے میں رضاکاروں کی درجہ بندی میں بہتر تھے کہ. لہذا، محققین خود بخود بہترین classifiers کا پتہ لگانے اور ان کو زیادہ وزن دینے کے لئے کی کوشش ہے کہ ایک زیادہ پیچیدہ تکراری weighting کے طریقہ کار تیار کی.
اس طرح، ایک تین قدم کے عمل کی صفائی، debiasing، اور ویٹنگ-کہکشاں چڑیاگھر تحقیقی ٹیم کے بعد اتفاق رائے صرفی درجہ بندی کی ایک سیٹ میں 40 ملین رضاکار درجہ بندی قبول کیا تھا. ان کہکشاں چڑیاگھر درجہ بندی کہکشاں چڑیاگھر حوصلہ افزائی کرنے میں مدد ملی ہے کہ Schawinski طرف کی درجہ بندی سمیت پیشہ ورانہ ماہرین فلکیات کی طرف سے تین پچھلے چھوٹے پیمانے کی کوششوں کے مقابلے میں کر رہے تھے، مضبوط معاہدہ تھا. اس طرح، رضاکاروں، مجموعی طور پر، اعلی معیار کی درجہ بندی فراہم کرنے کے قابل تھے اور ایک پیمانے محققین سے میل نہیں کر سکتا ہے کہ میں (Lintott et al. 2008) . سچ تو یہ ہے، کہکشاؤں کی اتنی بڑی تعداد کے لئے انسانی کی درجہ بندی حاصل کرنے سے، Schawinski، Lintott، اور دوسروں کہکشاؤں میں سے صرف 80 فی صد کی توقع پیٹرن نیلے اور سرخ ہے spirals ellipticals-اور متعدد کاغذات کی پیروی اس کے بارے میں لکھا گیا ہے ظاہر کرنے کے لئے کے قابل تھے اس دریافت (Fortson et al. 2011) .
اس پس منظر کو دیکھتے ہوئے، ہم ابھی دیکھ سکتے ہیں کہکشاں چڑیاگھر مندرجہ ذیل ہے کہ کس طرح تقسیم کی درخواست دے-یکجا ہدایت، ایک ہی ہدایت سب سے زیادہ انسانی شمارندگی کے منصوبوں کے لئے استعمال کیا جاتا ہے. سب سے پہلے، ایک بڑا مسئلہ حصوں میں تقسیم کیا جاتا ہے. اس صورت میں، ایک ملین کہکشاؤں درجہ بندی کا مسئلہ ایک کہکشاں کی درجہ بندی کا ایک ملین مسائل میں تقسیم کیا جاتا ہے. اگلا، ایک آپریشن آزادانہ طور پر ہر حصہ پر اطلاق ہوتا ہے. اس صورت میں، ایک رضاکار سرپل یا انڈاکار یا تو کے طور پر ہر کہکشاں کی درجہ بندی کریں گے. آخر میں، نتائج ایک اتفاق رائے نتیجہ پیدا کرنے کے لئے مل کر کر رہے. اس صورت میں، یکجا قدم کی صفائی، debiasing، اور ہر کہکشاں کے لئے اتفاق رائے پیدا کرنے کے لئے کی درجہ بندی کی weighting کے شامل. سب سے زیادہ منصوبوں اس عام ہدایت کا استعمال اگرچہ، اقدامات میں سے ہر ایک مخصوص مسئلے سے خطاب کیا جا رہا کرنے کے لئے اپنی مرضی کے مطابق کرنے کی ضرورت ہے. مثال کے طور پر، ذیل میں بیان انسانی گنتی منصوبے میں، اسی ہدایت کی پیروی کی جائے گی، لیکن اطلاق اور یکجا اقدامات بالکل مختلف ہو جائے گا.
کہکشاں چڑیاگھر ٹیم کے لئے، یہ پہلا منصوبہ صرف آغاز تھا. بہت جلد وہ احساس ہوا کہ اگرچہ وہ ایک ملین کہکشاؤں کے قریب درجہ بندی کرنے کے قابل تھے کہ، اس پیمانے جدید ڈیجیٹل اسکائی سروے، تقریبا 10 ارب کہکشاؤں کے تصاویر کو پیدا کر سکتا ہے جس کے ساتھ کام کرنے کے لئے کافی نہیں ہے (Kuminski et al. 2014) . 1 کروڑ سے 10 اضافہ ہوا ہینڈل کرنے ارب 10،000 کہکشاں چڑیا گھر کا عنصر تقریبا 10،000 گنا زیادہ شرکاء کو بھرتی کرنے کی ضرورت ہو گی. انٹرنیٹ پر رضاکاروں کی تعداد بڑی ہے، اگرچہ، یہ لامحدود نہیں ہے. لہذا، محققین نے محسوس کیا کہ وہ اعداد و شمار، ایک نیا، اس سے بھی زیادہ توسیع پذیر، نقطہ نظر کی ضرورت تھی کی بڑھتی ہوئی مقدار کو ہینڈل کرنے کے لئے جا رہے ہیں تو.
لہذا، مندا Banerji کی کام والے کہکشاؤں کی درجہ بندی کرنے کیون Schawinski، کرس Lintott، اور کہکشاں چڑیاگھر ٹیم کے شروع ہونے تدریس کمپیوٹر کے دیگر ارکان کے ساتھ. مزید خاص طور پر، کہکشاں چڑیاگھر، انسانی کی طرف سے پیدا کی درجہ بندی کا استعمال کرتے ہوئے Banerji et al. (2010) تصویر کی خصوصیات کی بنیاد پر ایک کہکشاں کے انسانی درجہ بندی پیشن گوئی کر سکتے ہیں کہ ایک مشین لرننگ ماڈل بنایا. اس مشین لرننگ ماڈل ہائی درستگی کے ساتھ انسانی درجہ بندیوں کو دوبارہ پیش کر سکتے ہیں تو، پھر اس کے کہکشاؤں کے ایک بنیادی طور پر لامحدود تعداد کی درجہ بندی کرنے کہکشاں چڑیاگھر محققین کی طرف سے استعمال کیا جا سکتا ہے.
Banerji کی اور ان کے ساتھیوں 'نقطہ نظر کے بنیادی ہے کہ مماثلت پہلی نظر میں واضح نہیں ہو سکتا ہے، اگرچہ، عام طور پر سماجی تحقیق میں استعمال کیا جاتا تکنیک پر خوبصورت اسی طرح اصل میں ہے. سب سے پہلے، Banerji کی اور ساتھیوں یہ خصوصیات ہے کہ خلاصہ تیار عددی خصوصیات میں سے ایک سیٹ میں ہر تصویر تبدیل. تصویر میں نیلے رنگ کی رقم، پکسلز کی چمک میں تغیر، اور غیر سفید پکسلز کا تناسب: مثلا، کہکشاؤں کے تصاویر کے لئے تین خصوصیات نہیں ہو سکتا ہے. صحیح خصوصیات کے انتخاب کے مسئلے کا ایک اہم حصہ ہے، اور یہ عام طور پر مشروط علاقے مہارت کی ضرورت. یہ پہلا قدم، عام خصوصیت انجینئرنگ کہا جاتا، تصویر کے مطابق ایک صف اور پھر تین کالموں کہ تصویر بیان کے ساتھ ایک ڈیٹا میٹرکس میں یہ نتائج. ایک لاجسٹک رجعت ہے کہ بنیاد پر انسانی درجہ بندی کی پیش گوئی کی طرح ڈیٹا میٹرکس اور مطلوبہ پیداوار (مثلا، تصویر ایک انڈاکار کہکشاں کے طور پر ایک انسانی کی طرف سے درجہ بندی کر دیا گیا تھا کہ آیا)، محقق ایک شماریاتی ماڈل کے لئے مثال کے پیرامیٹرز کا اندازہ ہے، کچھ دیا تصویر کی خصوصیات پر. آخر میں، محقق نئی کہکشاؤں کے اندازے کے مطابق درجہ بندی (چترا 5.4) کو پیدا کرنے کے اس اعداد و شمار کے ماڈل میں پیرامیٹرز کو استعمال کرتا ہے. ایک سماجی مطابق کے بارے میں سوچنا، آپ کو ایک ملین طالب علموں کے بارے شماریات آبادی معلومات تھا کہ ذرا تصور کریں، اور آپ جانتے ہیں کہ وہ کالج سے گریجویشن یا نہیں چاہے. آپ اس ڈیٹا تک ایک لاجسٹک رجعت فٹ کر سکتے ہیں، اور پھر آپ کی پیشن گوئی کرنے کے لئے نئے طالب علموں کو کالج سے تعلیم مکمل کرنے کے لئے جا رہے ہیں کہ آیا نتیجے ماڈل پیرامیٹرز کا استعمال کرسکتے ہیں. مشین سیکھنے میں، اس نقطہ نظر کا استعمال کرتے ہوئے لیبل لگا مثالیں پھر نئے لیبل کر سکتے ہیں کہ ایک شماریاتی ماڈل بنانے کے لئے سیکھنے نگرانی ڈیٹا جاتا (Hastie, Tibshirani, and Friedman 2009) .
میں خصوصیات Banerji et al. (2010) مشین لرننگ ماڈل میرا کھلونا میں ان لوگوں کی مثال کے لئے مثال، وہ خصوصیات کی طرح تھے کے مقابلے میں زیادہ پیچیدہ تھے "ڈی Vaucouleurs محوری تناسب فٹ" ہیں.اور اس ماڈل لاجسٹک رجعت نہیں تھا، یہ ایک مصنوعی عصبی نیٹ ورک تھا. اس کی خصوصیات، اس ماڈل، اور اتفاق رائے کہکشاں چڑیاگھر کی درجہ بندی کا استعمال کرتے ہوئے، وہ ہر ایک خصوصیت پر وزن تخلیق، اور پھر کہکشاؤں کی درجہ بندی کے بارے میں پیشن گوئی بنانے کے لئے ان کے وزن کا استعمال کرنے کے قابل تھا. مثال کے طور پر، اس کے تجزیےکی پتہ چلا ہے کہ کم سے "ڈی Vaucouleurs محوری تناسب فٹ ہونے کے" تصاویر سرپل کہکشاؤں ہونے کا زیادہ امکان تھے. ان کے وزن کو دیکھتے ہوئے، وہ معقول درستگی کے ساتھ ایک کہکشاں کی انسانی کی درجہ بندی کی پیشن گوئی کرنے کے قابل تھا.
کے کام Banerji et al. (2010) میں ایک دوسری نسل انسانی گنتی کے نظام کو فون کیا میں کہکشاں چڑیاگھر تبدیل کر دیا. ان کی دوسری نسل کے نظام کے بارے میں سوچنے کے لئے بہترین راستے ہونے انسانوں کو ایک مسئلہ کو حل کرنے کی بجائے، وہ انسانوں کے مسئلے کو حل کرنے کے لئے ایک کمپیوٹر کو تربیت کرنے کے لئے استعمال کیا جا سکتا ہے کہ ایک ڈیٹا سیٹ کی تعمیر کی ضرورت ہے. کمپیوٹر کی تربیت کرنے کی ضرورت ڈیٹا کی رقم اتنی بڑی ہے اسے بنانے کے لئے ایک انسانی ماس تعاون کی ضرورت ہے کہ ہو سکتا ہے. کہکشاں چڑیاگھر، کی طرف سے استعمال عصبی نیٹ ورک کی صورت میں Banerji et al. (2010) معتبر انسانی درجہ بندی کے دوبارہ پیش کرنے کے قابل تھا کہ ایک ماڈل کی تعمیر کے لئے انسانی لیبل لگا مثالوں کی ایک بہت بڑی تعداد کی ضرورت.
اس کمپیوٹر کی مدد سے نقطہ نظر کا فائدہ یہ آپ کو انسانی کوشش کا صرف ایک محدود رقم کا استعمال کرتے ہوئے اعداد و شمار کے بنیادی طور پر لامحدود مقدار کو ہینڈل کرنے کے قابل بناتا ہے ہے. مثال کے طور پر، ایک ملین انسانی درجہ بندی کر کہکشاؤں کے ساتھ ایک محقق پھر ایک ارب یا اس سے بھی ایک کھرب کہکشاؤں کی درجہ بندی کرنے کے لئے استعمال کیا جا سکتا ہے کہ ایک امکانات ماڈل تعمیر کر سکتے ہیں. کہکشاؤں کی بہت زیادہ تعداد میں موجود ہیں، تو انسانی کمپیوٹر ہائبرڈ کی اس قسم واقعی صرف ممکن حل ہے. اس لامحدود اسکیل ایبلٹی تاہم آزاد نہیں ہے،. صحیح انسانی درجہ بندیوں کو دوبارہ پیش کر سکتے ہیں کہ خود کو ایک مشکل مسئلہ ہے ایک مشین لرننگ ماڈل عمارت، لیکن خوش قسمتی سے اس موضوع کے لیے وقف عمدہ کتابوں کو پہلے سے ہی موجود ہیں (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .
کہکشاں چڑیاگھر کئی انسانی شمارندگی منصوبوں کے ارتقاء کو ظاہر کرتا ہے. سب سے پہلے، ایک محقق خود کی طرف سے یا تحقیق کے معاونین کی ایک چھوٹی سی ٹیم (مثلا، Schawinski کے ابتدائی درجہ بندی کوشش) کے ساتھ اس منصوبے کی کوشش ہے. اس نقطہ نظر کے ساتھ ساتھ بڑے پیمانے پر نہیں ہے، تو، محقق ایک انسانی گنتی منصوبے کے جہاں بہت سے لوگوں کی درجہ بندی میں شراکت کے لئے منتقل کر سکتے ہیں. لیکن، کے اعداد و شمار کی ایک مقررہ حجم کے لئے، خالص انسانی کوشش نہیں کافی ہو جائے گا. اس مرحلے پر، محققین دوسری نسل کے نظام انسانی درجہ بندی پھر ڈیٹا کے تقریبا لامحدود مقدار پر لاگو کیا جا سکتا ہے کہ ایک مشین لرننگ ماڈل تربیت دینے کے لئے استعمال کیا جاتا ہے جہاں تعمیر کرنے کی ضرورت.