جمعت حديقة حيوانات غالاكسي جهود العديد من المتطوعين غير الخبراء لتصنيف مليون مجرة.
نشأت حديقة حيوان غالاكسي عن مشكلة واجهها كيفين شوينسكي ، وهو طالب دراسات عليا في علم الفلك في جامعة أكسفورد في عام 2007. وتبسيطًا ، كان شوينسكي مهتمًا بالمجرات ، ويمكن تصنيف المجرات من خلال مورفولوجيتها - بيضاوي الشكل أو حلزوني - و بلونهم - أزرق أو أحمر. في ذلك الوقت ، كانت الحكمة التقليدية بين علماء الفلك هي أن المجرات الحلزونية ، مثل مجرتنا درب التبانة ، كانت زرقاء اللون (تشير إلى الشباب) وكانت المجرات الإهليلجية حمراء (تشير إلى الشيخوخة). شكك شوينسكي في هذه الحكمة التقليدية. كان يشك أنه في حين أن هذا النمط قد يكون صحيحًا بشكل عام ، ربما كان هناك عدد كبير من الاستثناءات ، وأنه من خلال دراسة الكثير من هذه المجرات غير العادية - تلك التي لا تتلاءم مع النموذج المتوقع - يمكن أن يتعلم شيئًا عن العملية التي من خلالها تشكلت المجرات.
وهكذا ، فإن ما احتاجه شاووينسكي من أجل قلب الحكمة التقليدية كان مجموعة كبيرة من المجرات المصنفة شكليا. أي المجرات التي تم تصنيفها إما لولبية أو بيضاوية. لكن المشكلة كانت أن الطرق الحسابية القائمة للتصنيف لم تكن جيدة بما يكفي لاستخدامها للبحث العلمي ؛ وبعبارة أخرى ، كان تصنيف المجرات في ذلك الوقت مشكلة صعبة لأجهزة الكمبيوتر. لذلك ، كان المطلوب هو عدد كبير من المجرات البشرية . قام Schawinski بمشكلة التصنيف هذه بحماسة طالب دراسات عليا. في جلسة ماراثونية سبعة أيام من 12 ساعة ، كان قادرا على تصنيف 50000 مجرة. في حين أن 50000 مجرة قد تبدو مثل الكثير ، إلا أنها في الواقع فقط حوالي 5٪ من ما يقرب من مليون مجرة تم تصويرها في استطلاع Skyan Digital Sky Survey. أدرك شوينسكي أنه بحاجة إلى نهج أكثر قابلية للتوسع.
لحسن الحظ، اتضح أن مهمة المجرات تصنيف لا يتطلب تدريبا متقدما في علم الفلك. يمكنك تعليم شخص للقيام بذلك بسرعة كبيرة. وبعبارة أخرى، على الرغم من تصنيف المجرات ليست بالمهمة التي كان من الصعب على أجهزة الكمبيوتر، وكان من السهل جدا بالنسبة للبشر. لذلك، في حين يجلس في حانة في أكسفورد، Schawinski وزميله الفلكي كريس Lintott يحلم موقع على شبكة الانترنت حيث المتطوعين سيقومون تصنيف الصور للمجرات. وبعد بضعة أشهر، ولدت حديقة حيوان جالاكسي.
في موقع حديقة حيوانات غالاكسي على الإنترنت ، سيخضع المتطوعون لبضع دقائق من التدريب ؛ على سبيل المثال ، تعلم الفرق بين المجرة الحلزونية والإهليلجية (الشكل 5.2). بعد هذا التدريب ، كان على كل متطوع أن يجتاز اختبارًا سهلًا نسبيًا - يصنف 11 من مجرات مع تصنيفات معروفة بشكل صحيح - ثم يبدأ تصنيفًا حقيقيًا للمجرات غير المعروفة من خلال واجهة بسيطة تعتمد على الويب (الشكل 5.3). الانتقال من المتطوع إلى الفلكي سيحدث في أقل من 10 دقائق ، ويتطلب فقط تمرير أدنى عقبة ، وهو اختبار بسيط.
جذبت حديقة حيوانات غالاكسي المتطوعين الأوليين بعد أن ظهر المشروع في مقالة إخبارية ، وفي غضون ستة أشهر ، نما المشروع ليشمل أكثر من 100000 من العلماء المواطنين ، والأشخاص الذين شاركوا لأنهم استمتعوا بالمهمة وأرادوا المساعدة في تطوير علم الفلك. وقد ساهم هؤلاء المتطوعون البالغ عددهم 100000 شخص في إجمالي ما يزيد عن 40 مليون تصنيف ، حيث تأتي غالبية التصنيفات من مجموعة أساسية صغيرة من المشاركين (Lintott et al. 2008) .
قد يكون الباحثون الذين لديهم خبرة في توظيف مساعدي البحث الجامعيين على الفور متشككين في جودة البيانات. في حين أن هذا التشكك معقول ، إلا أن حديقة حيوانات جالاكسي تُظهر أنه عندما يتم تنظيف المساهمات التطوعية بشكل صحيح ، ومنحازها ، وتجميعها ، يمكنها أن تنتج نتائج عالية الجودة (Lintott et al. 2008) . إن الخدعة المهمة التي تجعل الحشد ينشئ بيانات ذات جودة احترافية هو تكرار ، أي أن يكون لديه نفس المهمة التي يؤديها العديد من الأشخاص المختلفين. في حديقة حيوانات جالاكسي ، كان هناك حوالي 40 تصنيفًا لكل مجرة ؛ لم يتمكن الباحثون الذين يستخدمون مساعدين جامعيين في الأبحاث الجامعية من تحمل هذا المستوى من التكرار ، وبالتالي يجب أن يكونوا أكثر اهتمامًا بجودة كل تصنيف فردي. ما كان المتطوعون يفتقرون إلى التدريب ، فهم عوضوا عن الحاجة بتكرار.
وحتى مع التصنيفات المتعددة لكل مجرة ، فإن الجمع بين مجموعة التصنيفات التطوعية لإنتاج تصنيف متفق عليه كان أمراً صعباً. ونظرًا لأن هناك تحديات مشابهة جدًا تنشأ في معظم مشاريع الحوسبة البشرية ، من المفيد استعراض الخطوات الثلاث التي استخدمها باحثو حديقة حيوانات Galaxy لإنتاج التصنيفات التي يجمعونها. أولاً ، قام الباحثون "بتنظيف" البيانات عن طريق إزالة التصنيفات الزائفة. على سبيل المثال ، فإن الأشخاص الذين قاموا بتصنيف المجرة نفسها مرارًا وتكرارًا - وهو أمر قد يحدث إذا كانوا يحاولون التلاعب في النتائج - فقد تم تجاهل كل تصنيفاتهم. هذا و غيرها من التنظيف مماثلة إزالة حوالي 4 ٪ من جميع التصنيفات.
ثانياً ، بعد التنظيف ، احتاج الباحثون إلى إزالة التحيزات المنهجية في التصنيفات. من خلال سلسلة من دراسات كشف التحيز المضمنة في المشروع الأصلي - على سبيل المثال ، إظهار بعض المتطوعين المجرة في أحادية اللون بدلاً من اللون - اكتشف الباحثون العديد من التحيزات المنهجية ، مثل التحيز المنهجي لتصنيف المجرات الحلزونية البعيدة كمجرات إهليلجية (Bamford et al. 2009) . يعد ضبط هذه التحيزات المنهجية أمرًا في غاية الأهمية لأن التكرار لا يزيل التحيز المنهجي تلقائيًا ؛ يساعد فقط على إزالة الخطأ العشوائي.
وأخيرًا ، وبعد إجراء التحريف ، احتاج الباحثون إلى طريقة للجمع بين التصنيفات الفردية لإنتاج تصنيف متفق عليه. إن أبسط طريقة للجمع بين التصنيفات لكل مجرة هي اختيار التصنيف الأكثر شيوعًا. ومع ذلك ، كان من شأن هذا النهج أن يمنح كل متطوع وزناً متساوياً ، ويشك الباحثون في أن بعض المتطوعين كانوا أفضل في التصنيف من غيرهم. لذلك ، طور الباحثون إجراءًا أكثر تعقيدًا للترجيح التكراري حاولوا اكتشاف أفضل المصنّجين ومنحهم المزيد من الوزن.
وهكذا ، بعد عملية من ثلاث خطوات - التنظيف ، التحيز ، والترجيح - قام فريق أبحاث حديقة حيوانات جالاكسي بتحويل 40 مليون تصنيف تطوعي إلى مجموعة من التصنيفات المورفولوجية الإجماعية. عندما تمت مقارنة تصنيفات حديقة حيوانات غالاكسي مع ثلاث محاولات سابقة أصغر حجما قام بها علماء فلك محترفون ، بما في ذلك التصنيف من قبل Schawinski الذي ساعد على إلهام حديقة حيوانات Galaxy ، كان هناك اتفاق قوي. وهكذا ، كان المتطوعون ، بشكل إجمالي ، قادرين على توفير تصنيفات عالية الجودة وعلى نطاق لم يستطع الباحثون مطابقته (Lintott et al. 2008) . في الواقع ، من خلال وجود تصنيفات بشرية لمثل هذا العدد الكبير من المجرات ، تمكن شوينسكي ولينتوت وغيرهم من إظهار أن حوالي 80٪ فقط من المجرات تتبع النمط المتوقع - اللوالب الزرقاء والإهليلجية الحمراء - وقد كتبت العديد من الأبحاث حول هذا الاكتشاف (Fortson et al. 2011) .
بالنظر إلى هذه الخلفية ، يمكنك الآن رؤية كيفية اتباع Galaxy Zoo لوصف وصفة التقسيم-الجمع ، وهي نفس الوصفة المستخدمة لمعظم مشاريع الحوسبة البشرية. أولا ، تنقسم مشكلة كبيرة إلى أجزاء. في هذه الحالة ، تم تقسيم مشكلة تصنيف مليون مجرة إلى مليون مشكلة لتصنيف مجرة واحدة. بعد ذلك ، يتم تطبيق العملية على كل قطعة بشكل مستقل. في هذه الحالة ، يصنف المتطوعون كل مجرة إما لولبية أو بيضاوية. وأخيرا ، يتم الجمع بين النتائج لإعطاء نتيجة توافقية. في هذه الحالة ، تضمنت الخطوة المشتركة التنظيف والتنقيط والترجيح لإنتاج تصنيف إجماع لكل مجرة. على الرغم من أن معظم المشاريع تستخدم هذه الوصفة العامة ، إلا أنه يجب تخصيص كل خطوة للمشكلة المحددة التي يتم تناولها. على سبيل المثال ، في مشروع الحوسبة البشرية الموضح أدناه ، سيتم اتباع نفس الوصفة ، ولكن الخطوات التي يتم تطبيقها والدمج ستكون مختلفة تمامًا.
بالنسبة لفريق Galaxy Zoo ، كان هذا المشروع الأول مجرد البداية. أدركوا بسرعة أنه على الرغم من أنهم كانوا قادرين على تصنيف ما يقرب من مليون مجرة ، إلا أن هذا المقياس ليس كافياً للعمل مع استطلاعات السماء الرقمية الحديثة ، التي يمكن أن تنتج صوراً لنحو 10 مليارات مجرة (Kuminski et al. 2014) . للتعامل مع الزيادة من مليون إلى 10 مليارات - وهو عامل 10000 - ستحتاج حديقة حيوانات جالاكسي إلى توظيف ما يقرب من 10،000 مرة من المشاركين. على الرغم من أن عدد المتطوعين على الإنترنت كبير ، إلا أنه ليس بلا حدود. لذلك ، أدرك الباحثون أنه إذا كانوا سيعالجون كميات متزايدة من البيانات ، فإن هناك حاجة إلى نهج جديد أكثر قابلية للتوسع.
ولذلك ، بدأت ماندا بانيرجي - التي تعمل مع شوينسكي ولينتوت وأعضاء آخرين في فريق حديقة حيوانات جالاكسي (2010) بتدريس أجهزة الكمبيوتر لتصنيف المجرات. وبشكل أكثر تحديدًا ، باستخدام تصنيفات الإنسان التي أنشأتها حديقة حيوانات جالاكسي ، بنى بانيرجي نموذجًا للتعلم الآلي يمكنه التنبؤ بالتصنيف البشري لمجرة تعتمد على خصائص الصورة. إذا استطاع هذا النموذج إعادة إنتاج التصنيفات البشرية بدقة عالية ، فيمكن أن يستخدمها الباحثون في جالاكسي زو لتصنيف عدد لا نهائي من المجرات.
يشبه جوهر نهج Banerji وزملاؤه في الواقع التقنيات المستخدمة بشكل شائع في البحث الاجتماعي ، على الرغم من أن هذا التشابه قد لا يكون واضحًا للوهلة الأولى. أولاً ، حولت بانيرجي وزملاؤها كل صورة إلى مجموعة من السمات العددية التي لخصت خصائصها. على سبيل المثال ، بالنسبة لصور المجرات ، يمكن أن تكون هناك ثلاث ميزات: مقدار اللون الأزرق في الصورة ، التباين في سطوع البكسل ، ونسبة البيكسل غير البيضاء. يعد اختيار الميزات الصحيحة جزءًا هامًا من المشكلة ، ويتطلب عمومًا خبرة منطقة موضوعية. هذه الخطوة الأولى ، التي يطلق عليها عادةً اسم هندسة الميزات ، تؤدي إلى مصفوفة بيانات ذات صف واحد لكل صورة ثم ثلاثة أعمدة تصف هذه الصورة. بالنظر إلى مصفوفة البيانات والناتج المرغوب (على سبيل المثال ، ما إذا كانت الصورة مصنفة من قبل الإنسان كمجرة بيضاوية) ، يقوم الباحث بإنشاء نموذج تعليمي إحصائي أو آلي - على سبيل المثال ، الانحدار اللوجستي - يتنبأ بتصنيف الإنسان بناءً على الميزات من الصورة. وأخيرًا ، يستخدم الباحث المعايير في هذا النموذج الإحصائي لإنتاج التصنيفات المقدرة للمجرات الجديدة (الشكل 5.4). في التعلم الآلي ، يُطلق على هذا النهج - باستخدام الأمثلة المصنّفة لإنشاء نموذج يمكن بعد ذلك تصنيف البيانات الجديدة - اسم التعلم تحت الإشراف .
كانت الميزات في نموذج التعلم الآلي من زملاء Banerji وزملائها أكثر تعقيدًا من تلك الموجودة في مثال لعبتي - على سبيل المثال ، استخدمت ميزات مثل "de Vaucouleurs fit axial ratio" - ولم يكن نموذجها انحدارًا لوجستيًا ، بل كان عبارة عن شبكة عصبية اصطناعية. باستخدام ميزاتها ، ونموذجها ، وتصنيفات حديقة حيوانات غالاكسي الإجماعية ، تمكنت من إنشاء أوزان على كل ميزة ، ثم استخدام هذه الأوزان لعمل تنبؤات حول تصنيف المجرات. على سبيل المثال ، وجد تحليلها أن الصور ذات "نسبة محورية مناسبة منخفضة" de Vaucouleurs fit هي الأكثر احتمالاً أن تكون مجرات حلزونية. في ضوء هذه الأوزان ، كانت قادرة على التنبؤ بتصنيف الإنسان لمجرة ذات دقة معقولة.
وحولت بانيرجي وزملاؤها حديقة حيوان جالاكسي إلى ما أسميه نظام حساب بشري بمساعدة الحاسوب . أفضل طريقة للتفكير في هذه الأنظمة الهجينة هي أنه بدلاً من أن يحل البشر مشكلة ما ، فإن لديهم البشر ينشئون مجموعة بيانات يمكن استخدامها لتدريب الكمبيوتر على حل المشكلة. في بعض الأحيان ، قد يتطلب تدريب الكمبيوتر لحل المشكلة الكثير من الأمثلة ، والطريقة الوحيدة لإنتاج عدد كاف من الأمثلة هو التعاون الجماعي. ميزة هذا الأسلوب بمساعدة الكمبيوتر هو أنه يمكنك من التعامل مع كميات لا نهائية من البيانات باستخدام كمية محدودة من الجهد البشري. على سبيل المثال ، يمكن لباحث لديه مليون مجرة بشرية أن يبني نموذجًا تنبئيًا يمكن استخدامه بعد ذلك لتصنيف مليار أو حتى تريليون مجرة. إذا كانت هناك أعداد هائلة من المجرات ، فإن هذا النوع من الهجين بين الإنسان والحاسوب هو في الواقع الحل الوحيد الممكن. هذه قابلية التوسع اللانهائي ليست حرة ، ولكن. إن بناء نموذج التعلم الآلي الذي يمكنه إعادة تصنيف التصنيفات البشرية بشكل صحيح هو بحد ذاته مشكلة صعبة ، ولكن لحسن الحظ هناك كتب ممتازة بالفعل مخصصة لهذا الموضوع (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .
تعد حديقة حيوانات غالاكسي مثالاً جيداً على عدد مشاريع الحوسبة البشرية التي تتطور. أولاً ، تحاول الباحثة المشروع بنفسها أو مع فريق صغير من مساعدي الأبحاث (على سبيل المثال ، جهد التصنيف الأولي لـ Schawinski). إذا لم يتطور هذا النهج بشكل جيد ، يمكن للباحث الانتقال إلى مشروع حساب بشري مع العديد من المشاركين. ولكن بالنسبة لحجم معين من البيانات ، لن يكون الجهد البشري النقي كافياً. عند هذه النقطة ، يحتاج الباحثون إلى بناء نظام حوسبة بشرية بمساعدة الحاسوب ، حيث يتم استخدام التصنيفات البشرية لتدريب نموذج التعلم الآلي الذي يمكن تطبيقه بعد ذلك على كميات غير محدودة من البيانات.