گليڪس زو ڪيترن ئي غير ماهر رضاکارين جي ڪوششن کي ملين ڪليڪڪسين کي بندي ڪرڻ لاء گڏ ڪري ٿو.
2007 ۾ آڪسفورڊ يونيورسٽيء ۾ گريجوئيشن جو هڪ گريجوئيٽ شاگرد، ڪيئين اسڪواسڪي، ڪيئين اسڪالسڪي جي سامهون اچڻ جو مسئلو اٿيو. هڪٻئي کي آسان ڪرڻ، اسڪواسڪي نيٽورين ۾ دلچسپي هئي، ۽ ڪيڪائيڪس ان جي مورفولوجي-اذيرائي يا اسپيرل طرفان ترتيب ڏئي سگهجي ٿو. انهن جي رنگ جو ڳاڙهو يا ڳاڙهي هن وقت، astronomers جي وچ ۾ روايتي حڪمت اهو هو ته اسان جي ملڪي رستو وانگر رنگا رنگا (نوجوانن کي اشارو ڪيو ويو) ۽ عمدي گلابيون ڳاڙهو ٿي ويا (پراڻي عمر جو اشارو). Schawinski هن روايتي حڪمت تي شڪ ڪيو. هن جو اهو شڪ آهي ته هي نمون عام عام طور تي صحيح ٿي سگهي ٿو، شايد غالبا هڪ قابل تعداد جو وڏو تعداد هو، ۽ هي غير معمولي اهڙن ڪيتريون ئي اهڙيون آڪسائيزيشن پڙهندا آهن، جيڪي جيڪي توقع واري نموني سان نه هوندا هئا سي هن پروسيس بابت ڪجهه سکڻ جي ڪوشش ڪري سگهي ٿي galaxies ٺهيل آهي.
اهڙيء طرح، روايتي حڪمت کي ختم ڪرڻ لاء سکيوينڪکي جي ضرورت هئي، جيڪا مافياجيڪليء واري اندازي جي وڏي مرتبي واري هئي. اهو آهي، ڪڪڙيسس جيڪي ويرير يا اوندائيڪل طور تي گڏي وئي هئي. بهرحال، اهو مسئلو هو ته موجوده الفورائٽيمڪ طريقن جي طبقن جي لاء اڃا تائين ڪافي نه ڄاڻيا ويا ته سائنسي تحقيق لاء استعمال ڪيو وڃي. ٻين لفظن ۾، ڪاريڪسيڪيشن کي ترتيب ڏيڻ هو، ان وقت، هڪ ڳڻپيوڪر جو ڪمپيوٽر لاء ڏکيو هو. تنهنڪري، گهريلو ٿيو ته گهڻائي انسانن جي وڏي تعداد هئي. Schawinski هن طبقياتي مسئلي کي گريجوئيٽي شاگردن جي جوش سان گڏ ڪيو. ست 12 ڪلاڪ جي ڏينهن جي ميٽرن جي سيشن ۾، هو 50 هزار ڪڪڙڪين کي بندي ڪرڻ جي قابل هو. جيتوڻيڪ 50،000 galaxies تمام گهڻو ڪري سگهون ٿا، حقيقت اها آهي ته تقريبا هڪ لک ڪڪڙن جي صرف 5 سيڪڙو، جيڪا سلوان ڊجيٽل اسٽو سروي ۾ تصويرون ڪئي وئي هئي. شوالڪيڪي ڳالهه اها آهي ته هن وڌيڪ محتاط طريقي جي ضرورت هئي.
خوشقسمتي، ان کي ٻاهر ڦرندو ته انيڪ classifying جي ڪم اپگرهه ۾ اعلي درجي جي تربيت جي ضرورت نه رکندو آھي. اوھان کي ڪو ان کي پيارو جلدي ڪندا هڪٻئي ڪري سگهو ٿا. ٻين لفظن ۾، جيتوڻيڪ classifying Galaxies هڪ ڪم ته ڪمپيوٽرن جي لاء ڏاڍي ڏکي هئي آهي، ان کي انسان جي لاء خوبصورت آسان ٿي ويو آهي. پوء، جڏهن ته گاڏيء، Schawinski ۽ ساٿي نجومي ڪرس Lintott ۾ هڪ سرائي ۾ ويٺي هڪ ويب سائيٽ جتي رضاڪارن Galaxies جي تصويرون classify ها مٿي dreamed. ڪجهه مهينن کان پوء، ڪيتري جانورن جو پيدا ٿيو.
گليڪس زو ويب سائيٽ تي، رضاکار ٽريننگ جا ڪجهه منٽ هوندا هئا. مثال طور، هڪ سرپل ۽ يلدائيلي گليڪس جي وچ ۾ فرق سکڻ (انگ اکر 5.2). ھن تربيت کان پوء، ھر ھڪ رضاکار ھڪڙو نسبتا آسانيء سان گڏ 15 گيڪڪسين مان ھڪڙي قسم جي طبقن سان گڏ ھڪٻئي سان گڏ ٿين. رضاکار کان ستاره ڇڏيندڙن جي منتقلي کان 10 منٽ کان گهٽ ۾ گهٽ ٿيندو ۽ صرف تمام گهٽ رکاوٽ، هڪ سادي سوالن کي گهري ٿو.
گليڪس زو پنهنجي ابتدائي رضاکارن کي پروپيگنڊا ڪرڻ کان پوء هڪ خبر آرٽيڪل ۾ شامل ڪيو ويو ۽ اٽڪل ڇهن مهينن ۾ اهو منصوبو شامل ڪيو ويو جيڪو 100،000 شهرين جي سائنسدانن، جنهن ۾ شرڪت ڪئي هئي انهن کي شامل ڪيو ويو آهي ڇاڪاڻ ته انهن کي ڪم ڪيو هو ۽ اهي astronomy اڳيان مدد ڪرڻ چاهيندا هئا. گڏو گڏ، انهن 100،000 رضاکارن کي مجموعي طور تي 40 ملين ڊائريڪٽرن جي مدد ڪئي، جن جي اڪثر طبقن جو نسبتا ننڍڙو، بنيادي ڌرين جي بنيادي گروپ (Lintott et al. 2008) .
محقق جيڪي روزگار جي تحقيقي تحقيقي معاون نوڪرين جي تجربا ڪيا آهن، انهن کي فوري طور تي ڊيٽا جي معيار بابت شڪايت ٿي سگهي ٿي. جيتوڻيڪ هي شڪايت مناسب آهي، گليڪس زو ڏيکاري ٿو ته جڏهن رضاکارانه تعاون صحيح صاف، ٺهڪندڙ ۽ مجموعي طور تي صحيح آهن، اهي اعلي معيار جا نتيجا (Lintott et al. 2008) پيدا ڪري سگهجن ٿيون. پيشه ورڊ جي ڊيٽا کي هٽائڻ لاء گڏ ڪرڻ لاء هڪ اهم چال بيچاري آهي ، انهي ڪري ، انهي ساڳئي ڪم کي ڪيترن ئي مختلف ماڻهن طرفان انجام ڏني وئي آهي. گليڪس زو ۾، اتي ڪيتري ئي تقريبا 40 درجي بندي هئا. گريجوئيٽري تحقيقي اسسٽنٽ استعمال ڪندي محقق ڪڏهن به هن بي حد جي سطح کي برداشت ڪري نه سگهيا ۽ تنهنڪري هر فرد جي درجه بندي جي معيار سان وڌيڪ ڳڻتي ٿيڻ گهرجي. جيڪي رضاکار تربيت ۾ رهندا آهن، انهن کي بغاوت سان گڏ بنايو ويو آهي.
جيتوڻيڪ فيصلن جي ڪيترن ئي صنفين سان گڏ، اتفاق سان، رضامند طبقي جي سيٽ کي اتفاق ڪرڻ جي درجي بندي تيار ڪرڻ ۾ مشڪل هئي. ڇاڪاڻ ته گهڻا ئي انساني ڪمپيوٽرن جي منصوبن ۾ تمام گهڻا ئي مسئلا پيدا ٿين ٿا، اهو مددگار ثابت ٿيندو ته گليڪس زو محقق انهن جي اتفاق جي صنف جي پيداوار لاء استعمال ٿيندڙ ٽن قدمن جو جائزو وٺڻ لاء. پهرين، محقق "باڪس" ڊيٽا بيگس طبقن کي ختم ڪندي ڪندي. مثال طور، جيڪي ماڻهن کي بار بار ساڳيا ئي ساڳي گليڪس کي محاذ ڪن ٿا. ڪجهه به اهو محسوس ٿئي ٿو ته اهي نتيجن کي هٽائڻ جي ڪوشش ڪري رهيا هئا، انهن سڀني جي اشتقاق کي رد ڪري ڇڏيو. هي ۽ ٻئي ساڳيء صفائي جي سڀني طبقن مان 4 سيڪڙو ختم ٿي ويا آهن.
ٻيو، صفائي کان پوء، محققن ۾ منظم ترتيبن کي ختم ڪرڻ لاء محقق جي ضرورت آهي. اصل منصوبي-لاء مثال اندر وڌوسون بياس نظربند پڙهائي جو سلسلو ذريعي، monochrome ۾ ڪجهه رضاڪارن جي ڪيتري ڄاڻائي جي بدران رنگ-جي تحقيق اهڙي هڪ منظم تعصب طور تي ڪيترن ئي منظم پير پساري، دريافت elliptical Galaxies طور faraway کي گهاڻي ۾ Galaxies classify کي (Bamford et al. 2009) . هنن سسٽماتي ترتيبن جي ترتيب ڏيڻ ۾ تمام ضروري آهي ڇو ته لافاني نظام خودڪار طريقي سان ختم نٿو ڪري. اهو صرف مدد کي بي ترتيب غلطي ختم ڪري ٿو.
آخرڪار، ٺهڪندڙ ٿيڻ کانپوء، محقق هڪ قاعده طبقن جي پيداوار لاء فرد طبقن کي گڏ ڪرڻ لاء هڪ طريقو رکي ٿو. هر گليڪس لاء طبقن کي گڏ ڪرڻ جو آسان طريقو تمام عام طبقي کي چونڊيو هوندو. بهرحال، هن طريقي سان هر رضاکار وزن جيتري وزن ڏني هئي، ۽ محقق کي شڪ ٿيو ته ڪجهه رضاکار ٻين کان وڌيڪ طبقاتي طور تي بهتر هئا. تنهن ڪري، محقق هڪ وڌيڪ پيچيده وارين وزن کڻڻ واري طريقيڪار کي ترقي ڪئي جيڪا بهترين classifiers کي ڳولڻ جي ڪوشش ڪئي ۽ انهن کي وڌيڪ وزن ڏيو.
ان ڪري، گليڪس زو جي تحقيقاتي ٽيم کي صاف ڪرڻ، ٺهڪندڙ ۽ وزن جي شروعات ڪرڻ کان پوء 40 ملين رضاکار طبقي کي ميفولوجيڪل طبقن سان اتفاق ڪيو ويو. جڏهن اهي گليڪس زو طبقي جون ماهر ننڍن ننڍن ننڍن ننڍن ننڍن ننڍن پيٽن جي مقابلي جي مقابلي ۾ هئا، جن ۾ اسڪوازيکي جي صنف بندي شامل هئي جيڪا گليڪس زو کي متاثر ڪرڻ ۾ مدد ڪئي هئي، اتي هڪ مضبوط معاهدو هو. ان ڪري، رضاڪار، مجموعي طور تي، اعلي معيار جي معيارن کي مهيا ڪري سگھندا هئا ۽ اندازو آهي ته محقق مچائي نه سگهيو (Lintott et al. 2008) . حقيقت ۾، انساني ڪمنون حاصل ڪرڻ لاء انيڪڪسس، Schawinski، لنٽٽٽ ۽ ٻين جي وڏي تعداد ۾ اهو ظاهر ڪرڻ جي قابل ٿي چڪا هئا ته نيڪسين جو 80 سيڪڙو رڳو توقع جي نموني جي نيري سرپل ۽ ڳاڙهو آثار جي پيروي ۽ ڪيترن ئي مقالا جي باري ۾ لکيل هن دريافت (Fortson et al. 2011) .
هن پس منظر ۾، توهان هاڻي ڏسي سگهو ٿا ته ڪئين گليڪس زو تقسيم-اپ-گڏيل نموني جي طريقي سان عمل ڪري ٿو، ساڳي طريقن سان جيڪا انساني مرڪب جي منصوبن لاء استعمال ٿيندي آهي. پهرين، هڪ وڏو مسئلو ڪنن ۾ ورهايو ويندو آهي. انهي صورت ۾، هڪ ملائي ڪڪڙين جي درجي جي مسئلي هڪ وڏي گولي کي درپيش جي هڪ ملي مسئلن ۾ ورهايو ويو. اڳيون، هڪ آپريشن هر chunk کي هڪ خودمختيار لاڳو آهي. انهي صورت ۾، رضاکار هر هر انيڪيڪل کي سرفري يا غير ارادي طور تي بيان ڪيو آهي. آخرڪار، نتيجن سان اتفاق ٿيل نتيجو پيدا ڪرڻ لاء گڏيل آهن. انهي صورت ۾، گڏيل ڪائنات ۾ هر گليڪس لاء مفاصلي، تقسيم ۽ وزن شامل ڪرڻ لاء اتفاق ڪنڊيشن تيار ڪرڻ شامل آهن. جيتوڻيڪ سڀ کان وڌيڪ منصوبو هن عام طريقيڪار کي استعمال ڪن ٿا، هر قدم کي مخصوص مسئلن ڏانهن حساس ٿيڻ جي ضرورت آهي. مثال طور، هيٺ ڏنل انساني مرڪب منصوبي ۾، ساڳيء طريقي جي پٺيان هوندي، پر لاڳو ٿينديون ۽ انهن جي جوڙجڪ بلڪل مختلف ٿي وينديون.
گليڪس زو ٽيم لاء، هي پهريون منصوبو صرف شروعات هو. تمام جلدي انهن کي محسوس ڪيو ته جيتوڻيڪ اهي هڪ لکين ڪڪڙين جي لڳاتار بندي ڪرڻ جي قابل هئا، هن سطح کي نئين ڊجيٽل آسمان سروي سان ڪم ڪرڻ ڪافي نه آهي، جيڪا تقريبا 10 ارب ڪيڪائيڪسائيڪس (Kuminski et al. 2014) تصويرون پيدا ڪري سگهي ٿي. 1 ملين کان 10 بلين تائين وڌائڻ لاء هڪ هزار گيڪڪس زو جو هڪ عنصر جيڪو 10 هزار کان وڌيڪ شرڪت ڪندڙن کي ڀرتي ڪرڻ جي ضرورت آهي. جيتوڻيڪ انٽرنيٽ تي رضاکارين جو تعداد وڏو آهي، اهو لامحدود نه آهي. تنهن ڪري، محقق اهو محسوس ڪيو آهي ته جيڪڏهن اهي ڪڏهن به وڌندڙ اعداد و شمار کي سنبھالڻ جاڳيا ويندا هئا، هڪ نئين، حتي وڌيڪ اسيبلبل، طريقي جي ضرورت هئي.
تنهن ڪري، Manda Banerji- Schawinski، Lintott، ۽ گليڪس زو ٽيم جي ٻين ميمبرن (2010) ڪندي درس تدريس وارا ڪمپيوٽرن کي ڪيڪائيڪس بندي ڪرڻ. خاص طور تي، گليڪس زو پاران پيدا ڪيل انساني طبقن کي استعمال ڪندي، بينيرجي هڪ مشيني سکيا وارو نمونہ ٺهيل آهي جنهن جي تصوير جي خاصيتن تي ٻڌل وڏي انسان جي درجي بندي ڪري سگهي ٿي. جيڪڏهن هن نموني انساني طبقن کي اعلي درستگي سان ٻيهر بڻائي سگهون ٿا، پوء اهو گليڪل زو تحقيق ڪندڙن طرفان استعمال ڪري سگهجي ٿو ته ان کي لازمي طور تي لائيڪسائيز جي لامحدود تعداد کي ڪلب ڪرڻ گهرجي.
بنيرجي ۽ ان جي ڀائيوارن جو نقطو اصل ۾ تخليقي طريقن سان آهي، جيڪا عام طور تي سماجي تحقيق ۾ استعمال ٿيندي هئي، جيتوڻيڪ اهڙي جهڙي پهرين نظر ۾ واضح نه ٿي سگهي. پهريون، بينرجي ۽ ڀائيوارن هر تصوير کي عددي خصوصيتن جي هڪ سيٽ ۾ تبديل ڪري ڇڏيا جيڪي پنهنجي ملڪيت کي مختص ڪيو. مثال طور، وڏي ڄڻن جي شڪلن لاء، هتي ٽي خاصيتون ٿي سگهي ٿي: تصوير ۾ نيري جي رقم، پکسل جي روشني ۾ مختلف آهي ۽ غير سفيد پگهار جو تناسب. صحيح خاصيتن جي چونڊ مسئلي جو هڪ اهم حصو آهي، ۽ اهو عام طور تي موضوع جي شعبي جي ماهر جي ضرورت آهي. اهو پهريون قدم، عام طور تي خاص انجنيئرنگ سڏيندي، ڊيٽا ميٽرڪس ۾ هڪ قطار في تصوير سان ۽ نتيجن جي ٽن شاخن جي تصوير کي بيان ڪري ٿو. ڊيٽا کي ميٽرڪس ۽ گهربل مطلوب (مثال جي طور تي، ڇا تصوير هڪ ايليلائيڪل گوليڪس جي حيثيت سان انسان پاران طبقاتي ٿي ويو آهي)، محقق هڪ عدديه يا مشين سکيا وارو نمونو پيدا ڪري ٿو، مثال طور، ريزيڪريشن ريگريشن جو، جيڪو خاصيتن جي بنياد تي انساني درجي بندي پيش ڪري ٿو تصوير جو. آخرڪار، محقق هن اسٽيبلشمينٽ ماڊل جي معيارن کي استعمال ڪري ٿو، نون ڪيڪڪسين (اندازي مطابق 5.4) جي اندازي مطابق صنف پيدا ڪرڻ لاء. مشيني سکيا ۾، ليبل ٿيل مثالن جو استعمال ڪندي هن نموني کي نموني ٺاهي سگھي ٿو ته پوء ليبل نئين ڊيٽا کي نگراني جي سکيا سڏيو وڃي ٿو.
Banerji ۽ پنهنجن ڀائرن جي مشين سکيا جو ماهر منهنجي ننڍڙي مثال ۾ انهن جي ڀيٽ ۾ وڌيڪ پيچيده هو. مثال طور، هن کي "ويوئليلز فٽ محيطي واريون" وانگر استعمال ڪيو ويو آهي ۽ هن جو ماهر لازياتي رجعت نه هو، اهو هڪ مصنوعي خشڪ نيٽورڪ هو. هن جا خاصيتون، سندس نمونا، ۽ گڏيل اتفاق سان گليڪس زيو طبقن جي استعمال ڪندي، هوء هر خاصيتن تي وزن پيدا ڪرڻ جي قابل ٿي، ۽ پوء اهي سائيزائيزيشن جي درجي جي باري ۾ پيشڪش ڪرڻ لاء اهي وزن استعمال ڪندا هئا. مثال طور، هن جا تجزيا مليا آهن جيڪي تصويرن جي گهٽ "دي ويوئليل فوجي محيص" سان گڏ هونديون آهن ان جي وڌيڪ گهڻائي واريون ڪڪڙيون آهن. انهن وزنن کي ڏنو ويو، هوء مناسب انداز سان گڏ هڪ وڏي سائيڪل جي انساني درجي جي پيروي ڪرڻ جي قابل هئي.
بينرجي جي ڪم ۽ پنهنجن ڀائرن کي گليڪس زو کي تبديل ڪيو جنهن کي آئون ڪمپيوٽر جي مدد سان انساني ميلاپ سسٽم سڏيندو. هنن هائبرڊ سسٽم بابت سوچڻ جو بهترين طريقو اهو آهي ته انسان کي ڪنهن مسئلي جي حل ڪرڻ کان سواء، انهن وٽ انسان کي ڊيٽاسٽ تعمير ڪيو آهي جيڪو مسئلو حل ڪرڻ لاء ڪمپيوٽر کي ٽرين ڏيڻ لاء استعمال ڪري سگهجي ٿو. ڪڏهن ڪڏهن، مسئلي کي حل ڪرڻ لاء ڪمپيوٽر ٽريننگ تمام گهڻو مثال جي ضرورت آهي، ۽ مثالن جو ڪافي تعداد پيدا ڪرڻ جو واحد طريقو ڪاميٽي ڪاميٽي آهي. هن ڪمپيوٽرن جي مدد جي فائدي جو فائدو اهو آهي ته اهو توهان کي صرف انساني طور پر انساني ڪوشش کي استعمال ڪندي بنيادي طور پر لاتعداد مقدار کي هٿي ڏيڻ جي قابل بنائي ٿو. مثال طور، هڪ محقق هڪ لک انسانن جي درجي سان گڏ هڪ پيش گواري نموني ٺاهي سگهي ٿو جيڪو پوء هڪ ارب يا ڪروڙ ٽڪريين ڪليڪشن کي طبقي طور تي استعمال ڪري سگهجي ٿو. جيڪڏهن اهڙا ڪيتريون ئي ڪيتريون ئي ڪيتريون ئي تعداد آهن، پوء هن قسم جي انساني ڪمپيوٽرن کي هائي قسم جو واحد ممڪن حل آهي. بهرحال هي لاتعداد اسڪالر آزاد ناهي. بلڊنگ هڪ مشين سکيا جو نمونو جيڪا انساني طبقن کي وري صحيح بڻائي سگهي ٿي پاڻ کي هڪ ڏکيو مسئلو آهي، پر خوش قسمتي طور تي هن موضوع لاء وقف ٿيل شاندار ڪتاب موجود آهن (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .
گليڪس زو هڪ سٺو مثال آهي، ڪيتري قدر انساني سنگتين جي منصوبي کي بهتر آهي. پهريون، هڪ محقق پنهنجو پاڻ کي يا تحقيق ڪندڙ اسسٽنٽ جي ننڍي ٽيم سان منصوبي جي ڪوشش ڪري ٿو (مثال طور، Schawinski جي ابتدائي طبقياتي ڪوشش). جيڪڏهن اهو نقشو چڱي طرح طئي نه ٿو ڪري، محقق ڪيترن ئي شرڪت سان انساني مرڪب پروجيڪٽ ڏانهن منتقل ڪري سگهي ٿو. پر، ڪجهه خاص ڊيٽا لاء، خالص انساني ڪوشش ڪافي نه هوندي. انهي نقطي تي، محقق هڪ ڪمپيوٽر جي مدد سان انساني مرڪب سسٽم ٺاهڻ جي ضرورت آهي، جنهن ۾ انساني طبقن کي هڪ مشين سکيا جي نموني کي تربيت ڏيڻ لاء استعمال ڪيو وڃي ٿو، انهي کان پوء انهي کان پوء ڊيٽا کي اڻ لامحدود مقدار ۾ لاڳو ڪيو ويندو.