Galaxy Zoo මිලියන මන්දාකිණි වර්ගීකරණය බොහෝ-විශේෂඥ නොවන ස්වේච්ඡා සේවකයන් උත්සාහයන් එළඹේ.
Galaxy Zoo කෙවින් Schawinski, 2007 දී ඔක්ස්ෆර්ඩ් විශ්ව විද්යාලයේ තාරකා විද්යා උපාධිධාරියකු ශිෂ්ය ටිකක් විතර සරල මුහුණ ප්රශ්නයක් පිටතට වර්ධනය වී, Schawinski මන්දාකිණි ගැන උනන්දු වූ අතර, මන්දාකිනි ඔවුන්ගේ ඵලයේ-ඉලිප්සාකාර හෝ වර්ගීකරණය කළ හැකිය සර්පිලාකාර-හා ඔවුන්ගේ වර්ණ නිල් හෝ රතු විසින්. එම අවස්ථාවේ දී, තාරකා විද්යාඥයින් අතර සාම්ප්රදායික ප්රඥාව සර්පිලාකාර මන්දාකිණි, අපගේ ක්ෂීර පථ මෙන් නිල් වර්ණ (යොවුන් පෙන්නුම්) වූ අතර ඉලිප්සීය මන්දාකිනි (වයස පෙන්නුම්) රතු පැහැයෙන් වර්ණ බව ය. Schawinski මෙම සාම්ප්රදායික ප්රඥාව සැක කළහ. ඔහු මේ අසාමාන්ය මන්දාකිණි වන අපේක්ෂිත රටා ඔහු ලබන ක්රියාවලිය ගැන යමක් ඉගෙනගන්න පුළුවන් නො ගැලපෙන බව අය ගොඩක් අධ්යයනය කිරීම මගින් මෙම රටාව පොදුවේ සත්ය විය හැකි අතර, සමහර විට ව්යතිරේකයන් ක සැලකිය යුතු සංඛ්යාවක් සිටි බව සැක, ඒ මන්දාකිණි පිහිටුවා ගත්හ.
මේ අනුව, Schawinski සාම්ප්රදායික ප්රඥාව පෙරලා කිරීම සඳහා අවශ්ය දේ උල්කාෂ්මයේ ලුහුඬු මන්දාකිණි විශාල සමූහයක් විය; බව, සර්පිලාකාර හෝ ඉලිප්සාකාර ලෙස වර්ගීකරණය කර ඇති බව මන්දාකිණි වේ. කෙසේ වෙතත් ගැටළුව වර්ගීකරණය සඳහා, පවතින Algorithmic ක්රමය තවමත් විද්යාත්මක පර්යේෂණ සඳහා භාවිතා කල යුතු තරම් හොඳ නොවන බව ය; වෙනත් වචනවලින් කිවහොත්, වර්ගීකරණය මන්දාකිණි, එම අවස්ථාවේ දී, පරිගණක සඳහා වෙහෙස මහන්සි වූ බව ප්රශ්නයක් විය. ඒ නිසා, වුවමනා දේ මානව ලුහුඬු මන්දාකිණි විශාල සංඛ්යාවක් විය. Schawinski උපාධි ශිෂ්යයෙකු වන උද්යෝගයකින් මෙම වර්ගීකරණයට ප්රශ්නය ලදී. හත, පැය 12 ක කාලයක් දින මැරතන් සැසිය දී, ඔහු මන්දාකිණි 50,000 වර්ගීකරණය කිරීමට හැකි විය. මන්දාකිණි 50,000 ගොඩක් වගේ විය හැකි වුවත්, එය සැබවින්ම ස්ලෝන් ඩිජිටල් ස්කයි සමීක්ෂණ ඡායාරූප ඇති බව මිලියන එකක් පමණ චක්රාවාට 5 ක් පමණ% ක් පමණක් වේ. Schawinski ඔහු වඩාත් බාධාවන් ප්රවේශය අවශ්ය බව.
එහෙත් වාසනාවකට මෙන්, එය මන්දාකිණි වර්ගීකරණය කිරීමේ කාර්යය තාරකා විද්යාව දියුණු පුහුණු අවශ්ය නොවේ බව හැරෙනවා; ඔබ ලස්සන ඉක්මනින් එය කිරීමට කෙනෙක් ඉගැන්විය හැක. වෙනත් වචන වලින් කිවහොත්, වර්ගීකරණය මන්දාකිණි පරිගණක සඳහා වෙහෙස මහන්සි වූ බව කාර්යය වුවත්, එය මිනිසුන්ට ලස්සන පහසු වුණා. ඒ නිසා, ඔක්ස්ෆර්ඩ්, Schawinski හා සෙසු තාරකා විද්යාඥ ක්රිස් Lintott දී පන්නයේ සමාජ වාඩි අතර ස්වේච්ඡා මන්දාකිනි රූප වර්ගීකරණය කරනු ඇත, වෙබ් අඩවියක් දක්වා සිහින මැව්වා. මාස කිහිපයකට පස්සේ, Galaxy සත්වෝද්යානය උපත ලැබීය.
වූ Galaxy සත්වෝද්යානය වෙබ් අඩවිය, ස්වේච්ඡා පුහුණුව විනාඩි කිහිපයක් ඇතිවන; උදාහරණයක් ලෙස, සර්පිලාකාර හා ඉලිප්සාකාර galaxy (රූපය 5.2) අතර වෙනස ඉගෙන. මෙම පුහුණුවෙන් පසු, ස්වේච්ඡා දන්නා වර්ගීකරණයන්-හා සමග 11 15 මන්දාකිණි වර්ගීකරණය පසුව ස්වේච්ඡා සරල වෙබ් පදනම් කරගත් අතුරු මුහුණත් (රූපය 5.3) හරහා නොදන්නා මන්දාකිණි සැබෑ වර්ගීකරණය ආරම්භ කරන සාපේක්ෂව පහසු ප්රශ්න විචාරාත්මක-නිවැරදිව ගමන් කිරීමට සිදු විය. ස්වේච්ඡා සිට තාරකා විද්යාඥ දක්වා පරිවර්තනය මිනිත්තු 10 කටත් වඩා අඩු කාලයක් තුළ සිදු වන අතර අවශ්ය, සරල ප්රශ්න විචාරාත්මක කඩුලු මතින් දිවීමේ අඩුම පසුකර පමණි.
මෙම ව්යාපෘතිය පුවතක් ඇතුළත්ව පසු Galaxy සත්වෝද්යානය එහි ආරම්භක ස්වේච්ඡා ආකර්ෂණය හා මාස හයකට පමණ මෙම ව්යාපෘතිය 100,000 කට වඩා වැඩි පුරවැසියෙකු විද්යාඥයන්, ඔවුන් කර්තව්යය භුක්ති හා ඒවා කල්තියා තාරකා විද්යාව උදව් කිරීමට අවශ්ය වූ නිසා සහභාගි වූ ජනතාව සම්බන්ධ ක් දක්වා වර්ධනය වී ඇත. එකට, මෙම ස්වේච්ඡා 100,000 වර්ගීකරණයන් බහුතරය සහභාගීවූවන් සාපේක්ෂව කුඩා, මූලික කණ්ඩායම සිට පැමිණෙන සමග, වර්ගීකරණයන් මිලියන 40 කට වඩා වැඩි මුළු දායක (Lintott et al. 2008) .
අත්දැකීම් උපාධි පර්යේෂණ සහායකයන් බඳවා ගැනීම ලබන පර්ෙය්ෂකයන් වහාම දත්ත ගුණාත්මකභාවය පිළිබඳ සැක සංකා මතු විය හැකිය. මෙම සැක සහිත බව සාධාරණ වන අතර, Galaxy සත්වෝද්යානය ස්වේච්ඡා දායකත්වය, නිවැරදිව පිරිසිදු වේ debiased, සහ සමස්ත විට, ඔවුන් උසස් තත්වයේ ප්රතිඵල කළ හැකි බවයි (Lintott et al. 2008) . වෘත්තීය ගුණාත්මක දත්ත නිර්මාණය කිරීමට සමූහයා ලබා ගැනීම සඳහා වැදගත් උපක්රමය අතිරික්ත සේවකයන් ඉවත් කිරීම ය; බොහෝ විවිධ මිනිසුන් විසින් ඉටු කරන ලද කාර්යය සහිත, වේ. Galaxy Zoo දී, මන්දාකිනි අනුව වර්ගීකරණය කළ 40 පමණ එහි සිටි; උපාධි පර්යේෂණ සහායකයන් භාවිතා පර්යේෂකයන් අතිරික්ත සේවකයන් ඉවත් කිරීම මෙම මට්ටමේ දැරිය හා ඒ එක් එක් පුද්ගලයා වර්ගීකරණය ගුණාත්මකභාවය සමග වඩාත් උත්සුක විය යුතු බැහැ. ස්වේච්ඡා පුහුණු නො තිබුනු දේ, ඔවුන් අතිරික්ත සේවකයන් ඉවත් කිරීම සමග සඳහා ය.
galaxy අනුව බහු වර්ගීකරණයන් සමග පවා, කෙසේ වෙතත්, සම්මුතියක් වර්ගීකරණය නිෂ්පාදනය කිරීමට ස්වේච්ඡා වර්ගීකරණයන් කුලකයකි ඒකාබද්ධ ගැටලුව නිරාකරණය වේ. ඉතා සමාන අභියෝගයන්ට බොහෝ මානව හැටිත් ව්යාපෘති බව නිසා, එය කෙටියෙන් ඔවුන්ගේ එකඟත්වය වර්ගීකරණයන් නිෂ්පාදනය කිරීමට Galaxy සත්වෝද්යානය පර්යේෂකයන් විසින් භාවිතා කරන ලද පියවර තුනක් සමාලෝචනය කිරීමට ප්රයෝජනවත් වේ. පළමුව, පර්යේෂකයන් ව්යාජ වර්ගීකරණයන් ඉවත් විසින් දත්ත "පිරිසිදු". උදාහරණයක් ලෙස, මිනිසුන් නැවත නැවතත් එම මන්දාකිනියේ-යමක් ඔවුන් ප්රතිඵල-තිබූ ඔවුන්ගේ සියලු වර්ගීකරණයන් ඉවතලන හැසිරවීමට උත්සාහ නම් සිදු වෙන වර්ගීකරණය කරන. මෙය සහ අනෙකුත් සමාන පිරිසිදු සියලු වර්ගීකරණයන් 4% ක් පමණ ඉවත් කර ඇත.
දෙවනුව, පිරිසිදු කොට, පර්යේෂකයෝ වෛතුල්ය ක්රමානුකූල අගතීන් ඉවත් කිරීම සඳහා අවශ්ය. මුල් ව්යාපෘති නිදසුනක් තුළ කා වැදී නැඹුරුව හඳුනා අධ්යයන මාලාවක් මගින්, ඊට හේතුවක් සමහර ස්වේච්ඡා මන්දාකිනියේ පෙන්වනවා වෙනුවට වර්ණ පර්යේෂකයන් එවැනි ක්රමවත් නැඹුරුව ලෙස කිහිපයක් ක්රමානුකූලව අගතීන්, ඉලිප්සීය මන්දාකිණි ලෙස සර්පිලාකාර මන්දාකිණි දුර වර්ගීකරණය කිරීමට සොයා (Bamford et al. 2009) . බොහෝ දායකත්වයන් සාමාන්යයෙන් ක්රමානුකූල නැඹුරුව ඉවත් නැති නිසා මෙම ක්රමානුකූල අගතීන් ගැලපීමෙන් අතිශයින්ම වැදගත් වේ; එය පමණක් අහඹු දෝෂයක් ඉවත් කරයි.
අවසාන වශයෙන්, debiasing පසු, පර්යේෂකයන් සම්මුතියක් වර්ගීකරණය නිෂ්පාදනය කිරීමට තනි තනි වර්ගීකරණයන් ඒකාබද්ධ කිරීමේ ක්රමය අවශ්ය විය. එක් එක් මන්දාකිනිය සඳහා වර්ගීකරණයන් ඒකාබද්ධ කිරීමට සරලම ආකාරය වඩාත් පොදු වර්ගීකරණයක් තෝරා ගැනීමට වනු ඇත. කෙසේ වෙතත්, මෙම ප්රවේශය එක් එක් ස්වේච්ඡා සමාන බර ලබා දෙන අතර, පර්යේෂකයන් සමහර ස්වේච්ඡා අනිත් අයට වඩා වර්ගීකරණය වඩා හොඳ බව සැක කෙරේ. එම නිසා, පර්යේෂකයන් හොඳම classifiers ස්වයංක්රීයව හඳුනාගත සහ තවත් බර දෙන්න උත්සාහ කල වඩාත් සංකීර්ණ වැඩිපුර බර පටිපාටිය සංවර්ධනය.
මේ අනුව, තුන් පියවරෙන් පියවර-පිරිසිදු පසු, debiasing, සහ බර වන Galaxy Zoo පර්යේෂණ කණ්ඩායම සම්මුතියක් එවායේ බාහිර වර්ගීකරණයන් මාලාවක් බවට ස්වේච්ඡා වර්ගීකරණයන් මිලියන 40 බවට පත් කර ඇත. මෙම Galaxy සත්වෝද්යානය වර්ගීකරණයන් පෙර කුඩා පරිමාණ Galaxy සත්වෝද්යානය ආස්වාදයක් උදව් කරන Schawinski විසින් වර්ගීකරණය ඇතුළු වෘත්තීය තාරකා විද්යාඥයින් විසින් උත්සාහයන් තුනක් සන්සන්දනය කරන විට, ශක්තිමත් ගිවිසුම ඇති විය. මේ අනුව, ස්වේච්ඡා සේවකයන්, සමස්ත තුළ, උසස් තත්ත්වයේ වර්ගීකරණයන් ලබා ගැනීමට හැකි හා පර්යේෂකයන් නොගැලපේ හැකි බව පරිමානයේ දී, විය (Lintott et al. 2008) . ඇත්ත වශයෙන්ම, මන්දාකිණි වැනි විශාල පිරිසක් සඳහා මානව වර්ගීකරණයන් සහිත විසින්, Schawinski, Lintott, සහ එවැනි අනෙකුත් චක්රාවාට වලින් 80% ක් පමණක් අපේක්ෂා රටාව නිල් spirals සහ රතු ellipticals-හා විවිධ ප්රශ්න පත්ර ගැන ලියා ඇති අනුගමනය කරන බව පෙන්විය හැකි විය මේ සොයා ගැනීම (Fortson et al. 2011) .
මෙම පසුබිම හමුවේ, දැන් අප Galaxy සත්වෝද්යානය භේදය-අයදුම්-ඒකාබද්ධ වට්ටෝරුව, බොහෝ මානව හැටිත් ව්යාපෘති සඳහා භාවිත කරනු ලබන බව එම වට්ටෝරුව පහත ආකාරය අපට දැකගත හැකිය. පළමුව, ලොකු ප්රශ්නයක් කුට්ටි බෙදී ඇත. මේ අවස්ථාවේ දී, මිලියන ගනන් චක්රාවාට වර්ගීකරණය පිළිබඳ ගැටලුව එක් galaxy වර්ගීකරණය ක ගැටලු මිලියන බෙදී ඇත. ඊළඟට, මෙහෙයුමක් ස්වාධීනව එක් එක් කොටසේ ආලේප කරයි. මේ අවස්ථාවේ දී, ස්වේච්ඡා සර්පිලාකාර හෝ ඉලිප්සාකාර හෝ එක් එක් මන්දාකිනිය වර්ගීකරණය වනු ඇත. අවසාන වශයෙන්, ප්රතිඵල සම්මුතියක් ප්රතිඵලයක් නිෂ්පාදනය කිරීමට සංකලනය වී ඇත. මේ අවස්ථාවේ දී, ඒකාබද්ධ පියවර පිරිසිදු කිරීම, debiasing අතර, එක් එක් මන්දාකිනිය සඳහා සම්මුතියක් වර්ගීකරණය නිෂ්පාදනය කිරීමට බර ඇතුළත් වේ. බොහෝ ව්යාපෘති මෙම පොදු වට්ටෝරුව භාවිතා වුවද, පියවර එක් එක් ආමන්ත්රණය කරනු ලබන විශේෂිත ගැටලුව රක්ෂණාවරණය යුතුය. උදාහරණයක් ලෙස, පහත විස්තර කර ඇති මානව හැටිත් ව්යාපෘතිය, එම වට්ටෝරුව අනුගමනය කළ යුතු වනු ඇත, නමුත් අදාළ සහ ඒකාබද්ධ පියවර බෙහෙවින් වෙනස් වනු ඇත.
වූ Galaxy සත්වෝද්යානය කණ්ඩායම සඳහා, මෙම ව්යාපෘතියේ පළමු ආරම්භය විය. ඉතා ඉක්මනින් ඔවුන් ඔවුන් මන්දාකිණි මිලියන සමීප වර්ගීකරණය කිරීමට හැකි විය නමුත්, මෙම පරිමාණය බිලියන 10 ක් පමණ චක්රාවාට රූප ඇති කල හැකි, නව ඩිජිටල් අහස සමීක්ෂණ, සමග වැඩ කිරීමට ප්රමාණවත් නොවන බව වටහා (Kuminski et al. 2014) . 10 සඳහා රුපියල් මිලියන 1 සිට ඉහළ හැසිරවීමට බිලියන 10,000-Galaxy ජාතික සත්වෝද්යානයට සාධකය 10,000 ගුණයකින් දළ වශයෙන් වැඩි සහභාගී බඳවා ගැනීමට අවශ්ය වනු ඇත. අන්තර්ජාලය මත ස්වේච්ඡා සේවකයන් සංඛ්යාව විශාල වුවත්, එය අනන්ත නොවේ. එම නිසා, පර්යේෂකයන් ඔවුන් කිසි දත්ත වර්ධනය වන ප්රමාණයක් හැසිරවීමට යන්නේ නම් කියලා, නව, ඊටත් වඩා බාධාවන්, ප්රවේශය, අවශ්ය විය.
ඒ නිසා, Manda මන්දාකිණි වර්ගීකරණය කිරීමට කෙවින් Schawinski, ක්රිස් Lintott, සහ Galaxy සත්වෝද්යානය කණ්ඩායම් ආරම්භ ඉගැන්වීම පරිගණක සාමාජිකයින් සමග බැනර්ජි-වැඩ. වඩාත් විශේෂිතව, Galaxy සත්වෝද්යානය, විසින් නිර්මාණය කරන ලද මානව වර්ගීකරණයන් භාවිතා Banerji et al. (2010) මෙම පින්තූරය ලක්ෂණ මත පදනම් වූ මන්දාකිනියේ මානව වර්ගීකරණය අනාවැකි හැකි බව යන්ත්රයක් ඉගෙනුම් ආදර්ශ ඉදි කළේය. මෙම යන්ත්රය ඉගෙනුම් ආදර්ශ නිරවද්යතාවයක් සමග මානව වර්ගීකරණයන් ප්රතිනිර්මාණය කළ හැකි නම්, එය මන්දාකිණි අවශ්යයෙන්ම අපරිමිත සංඛ්යා වර්ගීකරණය කිරීමට Galaxy සත්වෝද්යානය පර්යේෂකයන් විසින් භාවිතා කළ හැකි විය.
බව සමාන බැලූ බැල්මට පැහැදිලි විය නොහැකි විය නමුත් බැනර්ජි හරය හා සගයන් 'ප්රවේශය ඇත්තටම, පොදුවේ සමාජ විද්යාත්මක පර්යේෂණ සඳහා භාවිතා තාක්ෂණික ක්රම ඉතා සමාන වේ. පළමුව, බැනර්ජි හා සගයන් එය ගුණ තියෙන්නේ සාරාංශ බව සංඛ්යා ලක්ෂණ සමූහයක් බවට එක් එක් රූප පරිවර්තනය. රූපයේ නිල් කරන ලද මුදල පික්සල දීප්ති විචලතාව, සහ සුදු ජාතික නොවන පික්සල අනුපාතය: උදාහරණයක් ලෙස, මන්දාකිනි පින්තූර සඳහා තුන් ලක්ෂණ ඇති විය හැකිය. නිවැරදි ලක්ෂණ තෝරා ඇති ගැටළුව පිළිබඳ වැදගත් කොටසක් වන අතර, එය සාමාන්යයෙන් විෂය ප්රදේශයේ විශේෂඥ දැනුම අවශ්ය වේ. පොදුවේ ලක්ෂණය ඉංජිනේරු විද්යාව, රූප එක් පේළිය සමග දත්ත න්යාසය ප්රතිඵල එවිට ඒ රූප විස්තර තීරු තුනක් ලෙස මෙම පළමු පියවර. දත්ත න්යාසය හා අපේක්ෂිත ප්රතිඵලය ලබා (උදා, ප්රතිරූපය ඉලිප්සීය galaxy ලෙස මානව විසින් වර්ගීකරණය කරන ලදී යන්න), පර්යේෂකයා සංඛ්යානමය ආදර්ශ නිදසුනක් හි පරාමිතීන් ඇස්තමේන්තු, එය ලොජිස්ටික් 'ප්රතිපායන එනම් පදනම් මානව වර්ගීකරණය පුරෝකථනය වගේ දෙයක් රූපයේ ලක්ෂණ මත. අවසාන වශයෙන්, පර්යේෂකයෙකු නව මන්දාකිණි (රූපය 5.4) ඇස්තමේන්තුගත වර්ගීකරණයන් නිෂ්පාදනය කිරීමට මෙම සංඛ්යා ලේඛන ආකෘතිය පරාමිතීන් භාවිතා කරයි. සමාජ ඇනලොග් හිතන්න, ඔබ මිලියන සිසුන් පිළිබඳව ජනවිකාශ තොරතුරු තිබූ අතර ඔබ ඔවුන් විද්යාලයේ ලැඟුම් නැද්ද යන්න දන්නා බව සිතන්න. ඔබ මෙම දත්ත සඳහා ලොජිස්ටික් 'ප්රතිපායන ගැලපෙන හැකි, සහ ඉන් අනතුරුව, නව සිසුන් විශ්ව විද්යාල වලින් උපාධි සඳහා යන්නේ ද යන්න අනුමාන කිරීමට එහි ප්රතිඵලයක් ආදර්ශ පරාමිතීන් භාවිතා විය. යන්ත්රය ඉගෙනුම්, මෙම ප්රවේශය-භාවිතා පසුව නව දත්ත-ඉගෙනුම් අධීක්ෂණය නමින් ලේබලයක් හැකි බව සංඛ්යා ලේඛන ආකෘතිය නිර්මාණය කිරීමට උදාහරණ ලේබල් (Hastie, Tibshirani, and Friedman 2009) .
දී ලක්ෂණ Banerji et al. (2010) යන්ත්රය ඉගෙනුම් ආදර්ශ මගේ සෙල්ලම් බඩු උදාහරණයක් නිදසුනක් අයට වඩා වැඩි වඩාත් සංකීර්ණ විය, ඇය මෙන් "ද Vaucouleurs ආක්ෂීය අනුපාතය ගැලපෙන" විශේෂාංගය භාවිතා ඇගේ ආදර්ශ ලොජිස්ටික් 'ප්රතිපායන නොවේ -එසේම, එය කෘත්රිම ස්නායු ජාලය විය. ඇගේ අංග, ඇගේ ආකෘතිය හා පොදු එකඟත්වය Galaxy සත්වෝද්යානය වර්ගීකරණයන් භාවිතා කරමින්, ඇය එක් එක් අංගයක් අඩු බර නිර්මාණය, පසුව චක්රාවාට වර්ගීකරණය කිරීම පිළිබඳව අනාවැකි මෙම බර ඇති භාවිතා කිරීමට හැකි විය. උදාහරණයක් ලෙස, සිය විශ්ලේෂණය අඩු රූප "ද Vaucouleurs ආක්ෂීය අනුපාතය ගැලපෙන" සර්පිලාකාර මන්දාකිණි සඳහා වැඩි බවක් පෙනී යන බව සොයාගෙන ඇත. මෙම හොර කිරුම් පඩි ලබා දී, ඇය සාධාරණ නිරවද්යතාව සමග මන්දාකිනියේ මානව වර්ගීකරණය අනාවැකි ගැනීමට හැකි විය.
වැඩ කටයුතු Banerji et al. (2010) මම දෙවන පරම්පරාවේ මානව හැටිත් පද්ධතිය එපරිද්දෙන්ම තුලට Galaxy සත්වෝද්යානය හැරී. මෙම දෙවන පරම්පරාව ගැන සිතා ගැනීමට හොඳම ක්රමය වෙනුවට මිනිසුන් ප්රශ්නයක් විසඳීමට සහිත වඩා එනම්, ඔවුන් මිනිසුන්ට එම ගැටළුව විසඳීම සඳහා පරිගණක පුහුණු කිරීම සඳහා යොදා ගත හැකි බව දත්ත සමුදාය ඉදි වෙනවා. පරිගණක පුහුණු කිරීම සඳහා අවශ්ය දත්ත ප්රමාණය ඉතා විශාල එය නිර්මාණය කිරීම සඳහා මානව මහා එක්ව අවශ්ය බව විය හැක. Galaxy Zoo විසින් භාවිතා ස්නායුක ජාල පිළිබඳ පැමිණිල්ලේ දී Banerji et al. (2010) විශ්වාසවන්ත කටයුතු මානව වර්ගීකරණය ප්රජනනය හැකි වූ බව මාදිලියක් හදන්න කිරීම සඳහා මානව ලේබල් උදාහරණ ඉතා විශාල සංඛ්යාවක් අවශ්ය විය.
මෙම පරිගණකය-සහාය ප්රවේශය වාසිය මානව උත්සාහයක් පමණක් අසාදාරණ භාවිතා දත්ත අවශ්යයෙන්ම අනන්ත ප්රමාණයක් හැසිරවීමට ඔබට හැකියාව බව ය. උදාහරණයක් ලෙස, මානව වර්ගීකරණය මන්දාකිණි මිලියන පර්යේෂකයෙක් පසුව බිලියන හෝ ට්රිලියන පවා මන්දාකිණි වර්ගීකරණය කිරීම සඳහා භාවිතා කළ හැකි බව අනාවැකි ආදර්ශ ගත හැක. චක්රාවාට දැවැන්ත අංක තිබේ නම්, එසේ නම් මානව පරිගණක, දෙමුහුන් මේ ආකාරයේ එකම විසඳුමක් ඇත්තටම වේ. අනන්ත පරිමාණය කෙසේ වෙතත්, නිදහස් නැත. මානව වර්ගීකරණයන් නිවැරදිව පිටපත් හැකි බව ගොඩනැගීම සඳහා පරිගණකය ඉගෙනුම් ආදර්ශ ම අමාරු ප්රශ්නයක්, නමුත් වාසනාවකට මෙන් මෙම මාතෘකාව කැප විශිෂ්ට පොත් එහි දැනටමත් (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .
Galaxy Zoo බොහෝ මානව හැටිත් ව්යාපෘති පරිණාමය පෙන්වයි. පළමු, පර්යේෂකයකු ඇය විසින් හෝ පර්යේෂණ සහායකයන් (උදා, Schawinski ගේ මූලික වර්ගීකරණය උත්සාහයක්) කුඩා කණ්ඩායම සමඟ මෙම ව්යාපෘතිය උත්සාහ දරයි. මෙම ප්රවේශය මෙන්ම වැඩි නොවේ නම්, පර්යේෂකයා බොහෝ මිනිසුන් වර්ගීකරණයන් දායක එහිදී මානව හැටිත් ව්යාපෘතිය ගෙන යා හැක. එහෙත්, දත්ත යම් පරිමාවක් සඳහා වන, පවිත්ර, මානව උත්සාහයක් තරම් වනු ඇත. ඒ අවස්ථාවේදී, පර්යේෂකයන් මානව වර්ගීකරණයන් නම් දත්ත පාහේ අසීමිත ප්රමාණයක් යෙදිය හැකි බව යන්ත්රයක් ඉගෙනුම් ආදර්ශ පුහුණු කිරීම සඳහා භාවිතා වන දෙවන පරම්පරාව පද්ධති නිර්මාණය කිරීම සඳහා අවශ්ය.