Choisinn Galaxy Zoo na h-oidhirpean aig mòran de shaor-thoilich neo-eòlach gus millean galaxies a chlasachadh.
Dh'fhàs Galaxy Zoo a-mach à duilgheadas mu choinneamh Kevin Schawinski, oileanach ceumnaichte ann an Rionnag aig Oilthigh Oxford ann an 2007. A 'sìmplidh gu math, bha ùidh aig Schawinski ann an galaxies, agus faodaidh galax a bhith air an seòrsachadh le am morphology-elliptical or spiral-and leis an dath-ghorm no dearg aca. Aig an àm, b 'e an gliocas gnàthach am measg nan saidheansan gu robh galax spioradail, mar ar Slighe Bainneach, ann an dath gorm (a' sealltainn òigridh) agus bha galaraidhean eipipteach dearg (a 'sealltainn aois). Bha Schawinski a 'teagamh air a' ghliocas gnàthach seo. Bha amharas aige ged a dh'fhaodadh a 'phàtran seo a bhith fìor san fharsaingeachd, is dòcha gu robh àireamh de dh' easbhaidhean ann, agus le bhith a 'sgrùdadh tòrr de na galaxan neo-àbhaisteach sin - na feadhainn nach robh a' freagairt air a 'phàtran a bha an dùil - dh'fhaodadh e ionnsachadh rudeigin mun phròiseas tron Chaidh galaxies a chruthachadh.
Mar sin, bha na Schawinski a dhìth gus gliocas gnàthach a thionndadh mar sheata mòr de ghalaidean a chaidh a chlàradh le morpholog; is e sin, galaxies a bha air an seòrsachadh mar spioradail no annasach. B 'e an duilgheadas, ge-tà, nach robh na modhan algorithm a th' ann airson seòrsachadh fhathast math gu leòr airson a bhith air an cleachdadh airson rannsachadh saidheansail; ann am faclan eile, b 'e duilgheadas a bha cruaidh dha coimpiutaran a bha a' seòrsachadh galaxies, aig an àm sin. Mar sin, b 'e àireamh mhòr de ghalair- daonna ainmichte a bha a dhìth. Ghabh Schawinski an duilgheadas seòlaidh seo le dealas oileanach ceumnaiche. Ann an seisean marathon de sheachd latha 12-uair, bha e comasach dha 50,000 galaxy a chomharrachadh. Ged a dh 'fhaodadh 50,000 galax a bhith coltach ri mòran, chan eil ann ach mu 5% den cha mhòr aon millean galaxies a chaidh a thogail anns an t-Suirbhidh Sloan Digital Sky. Thuig Schawinski gu robh feum air dòigh-obrach nas sàbhailte.
Gu fortanach, tha e a 'tionndadh a-mach gu bheil an obair a' seòrsachadh galaxies Chan eil feum adhartach trèanadh ann an reul-eòlas; faodaidh tu teagasg cuideigin ga dhèanamh gu math luath. Ann am briathran eile, ged seòrsachadh galaxies 'S e obair chruaidh a bha airson coimpiutairean, bha i gu math furasta do dhaoine. Mar sin, fhad 'sa bha na shuidhe ann an taigh-seinnse ann an Oxford, Schawinski agus fear Reul-eòlaiche Chris Lintott bhruadair suas làrach-lìn far an robh saor-thoileach a bhiodh an seòrsachadh ìomhaighean de galaxies. Beagan mhìosan an dèidh sin, Galaxy Zoo Rugadh.
Aig làrach-lìn Galaxy Zoo, gheibheadh saor-thoilich beagan mhionaidean trèanaidh; mar eisimpleir, ag ionnsachadh an eadar-dhealachadh eadar galaxy spiral agus elliptical (figear 5.2). Às deidh an trèanadh seo, dh'fheumadh gach saor-thoileach ceumannan a dhèanamh gu ìre mhath furasta de 11 de 15 galaxies le clasaichean aithnichte - agus an uairsin thòisicheadh iad clasachadh fìor de galaxies neo-aithnichte tro eadar-aghaidh sìmplidh stèidhichte air an lìon (figear 5.3). Bhiodh an gluasad bho neach saor-thoileach gu reul-eòlaiche ann an nas lugha na 10 mionaidean agus cha robh feum ach air a bhith a 'dol seachad air na cnapan-starra as ìsle, ceisneachadh sìmplidh.
Bha Galaxy Zoo a 'tàladh a luchd-obrach saor-thoileach an dèidh don phròiseact a bhith air a nochdadh ann an artaigil naidheachd, agus ann an mu shia mìosan dh'fhàs am pròiseact gu bhith a' toirt a-steach còrr is 100,000 neach-saidheans saoranaich, daoine a ghabh pàirt oir bha iad a 'còrdadh ris a' ghnìomh agus bha iad airson cuideachadh le bhith a 'leasachadh astronomy. Còmhla, chuir na 100,000 neach saor-thoileach sin còrr is 40 millean seòrsachadh, leis a 'mhòr-chuid de na seòrsachadh a' tighinn bho bhuidheann bunaiteach beag, beag, beag (Lintott et al. 2008) .
Is dòcha nach bi luchd-rannsachaidh aig a bheil eòlas air fastadh luchd-cuideachaidh rannsachaidh fo-cheum sa bhad a thaobh càileachd dàta. Ged a tha an t-amharas seo reusanta, tha Galaxy Zoo a 'sealltainn, nuair a tha tabhartasan saor-thoileach air an glanadh gu ceart, air an toirt gu buil, agus air an lìonadh, is urrainn dhaibh toraidhean àrd-inbheach (Lintott et al. 2008) thoirt gu buil. Is e cleas cudromach a th 'ann a bhith a' faighinn an t-sluaigh gus dàta càileachd proifeasanta a chruthachadh neo-dhreuchd , is e sin, le bhith a 'dèanamh an aon obair le mòran dhaoine eadar-dhealaichte. Ann an Galaxy Zoo, bha timcheall air 40 seòrsachadh air gach galaxy; cha b 'urrainn do luchd-rannsachaidh a bha a' cleachdadh cuideachaidh rannsachaidh fo-cheum a bhith a 'cosg an ìre seo de dhreuchd agus mar sin dh'fheumadh iad mòran a bhith an sàs ann an càileachd gach seòrsachadh fa leth. Na dìth trèanadh a bh 'aig na saor-thoilich, bha iad a' dèanamh suas le gainnead.
Fiù 's le iomadh seòrsachadh airson gach galaxy, ge-tà, bha a bhith a' toirt còmhla an t-seata seòrsachadh saor-thoileach gus seòmar co-aontachd a dhèanamh gu math duilich. Leis gu bheil dùbhlain glè choltach a 'nochdadh anns a' mhòr-chuid de phròiseactan coimpiutaireachd daonna, tha e na chuideachadh ath-bhreithneachadh goirid a dhèanamh air na trì ceumannan a chleachd luchd-rannsachaidh Galaxy Zoo gus an seòrsachadh co-aonta a dhèanamh. An toiseach, chuir na rannsaichean "glanadh" an dàta le bhith a 'toirt air falbh seòrsachadh boglach. Mar eisimpleir, daoine a bha a 'seòrsachadh an aon galaxy a-rithist - rudeigin a bhiodh a' tachairt ma bha iad a 'feuchainn ri na toraidhean a thionndadh - chaidh na seòrsachadh aca uile a thoirt air falbh. Chaidh seo agus glanadh coltach ris an sin a thoirt air falbh mu 4% de na seòrsachadh.
An dàrna àite, an dèidh a bhith air a ghlanadh, dh'fheumadh an luchd-rannsachaidh claonadh riaghailteach a thoirt air falbh ann an seòrsachadh. Tro shreath de sgrùdaidhean claisneachd a chaidh a stèidheachadh taobh a-staigh a 'phròiseict thùsail - mar eisimpleir, a' sealltainn cuid de shaor-thoilich an galaxy ann am monacrach seach dath. Fhuair na luchd-rannsachaidh grunn claonadh eagarach, leithid claonadh eagarach airson clasaichean galar cromallach a chlasachadh mar galaxan eipipteach (Bamford et al. 2009) . Tha atharrachadh airson nan claonadh riaghailteach seo air leth cudromach seach nach eil an t-iomadachd a 'toirt às do chlaonadh eagarach gu fèin-ghluasadach; chan eil e ach a 'cuideachadh le bhith a' toirt às do mhearachd thiotalach
Mu dheireadh, an dèidh a bhith a 'dol air adhart, dh'fheumadh luchd-rannsachaidh dòigh gus na seòrsachan fa leth a chur còmhla gus seòmar co-aontachaidh a dhèanamh. B 'e an dòigh as sìmplidh seòrsachadh a chur còmhla airson gach galaxy a bhith a' taghadh an seòrsachadh as cumanta. Ach, bhiodh an dòigh-obrach seo air a thoirt do gach cuideam saor-thoileach, agus bha an luchd-rannsachaidh a 'creidsinn gu robh cuid de shaor-thoilich na b' fheàrr aig an t-seòrsachadh na feadhainn eile. Mar sin, leasaich na luchd-rannsachaidh modh cuideachaidh nas iom-fhillte a bha a 'feuchainn ris na clasaichean as fheàrr a lorg agus barrachd cuideam a thoirt dhaibh.
Mar sin, às deidh pròiseas trì-cheum a ghlanadh, a 'gabhail gnothaich, agus cuideam, bha sgioba rannsachaidh Galaxy Zoo air 40 millean seòrsachadh saor-thoileach atharrachadh gu seata de chlàraidhean morphologach co-aonta. Nuair a chaidh na clasaichean Galaxy Zoo seo an coimeas ri trì oidhirpean beaga nas lugha roimhe le saighdearan proifeasanta, a 'gabhail a-steach an seòrsachadh le Schawinski a chuidich le bhith a' brosnachadh Galaxy Zoo, bha aonta làidir ann. Mar sin, bha na saor-thoilich, gu h-iomlan, comasach air clasaichean àrd-inbhe a sholarachadh agus aig sgèile nach b 'urrainn don luchd-rannsachaidh co-fhreagairt (Lintott et al. 2008) . Gu dearbh, le bhith ag ainmeachadh seòrsachan daonna airson àireamh cho mòr de ghalair, Schawinski, Lintott, agus feadhainn eile bha e comasach sealltainn nach eil ach mu 80% de galaxies a 'leantainn nan spioradan pàtranach gorm agus na h-ail-fhiaclan dearga - agus chaidh mòran phàipearan a sgrìobhadh mu dheidhinn an lorg seo (Fortson et al. 2011) .
Air sgàth a 'chùl-fhiosrachaidh seo, faodaidh tu a-nis faicinn mar a tha Galaxy Zoo a' leantainn an ribe split-apply, an aon ribe a tha air a chleachdadh airson a 'mhòr-chuid de phròiseactan coimpiutaireachd daonna. An toiseach, tha duilgheadas mòr air a roinn na chruth. Anns a 'chùis seo, chaidh an duilgheadas de bhith a' seòrsachadh millean galaxies a roinn na millean duilgheadasan le bhith a 'seòrsachadh aon galaxy. An ath rud, thèid obrachadh a chur gu gach ceann gu neo-eisimeileach. Anns a 'chùis seo, bha luchd saor-thoileach a' seòrsachadh gach galaxy mar aon de na h-innealan-dubha. Mu dheireadh, thèid na toraidhean a thoirt còmhla gus toradh co-aontachaidh a thoirt gu buil. Anns a 'chùis seo, bha an ceum còmhla a' toirt a-steach glanadh, deasbad, agus cuideam gus seòmar co-aontachaidh a dhèanamh airson gach galaxy. Ged a bhios a 'chuid as motha de phròiseactan a' cleachdadh an t-sreataidh choitcheann seo, feumar gach ceum a bhith air a chur gu feum gus an duilgheadas sònraichte a thathar a 'dèiligeadh. Mar eisimpleir, anns a 'phròiseas coimpiutaireachd daonna a tha air a mhìneachadh gu h-ìosal, thèid an aon reata a leantainn, ach bidh na ceumannan co-cheangailte gu math eadar-dhealaichte.
Airson sgioba Galaxy Zoo, b 'e seo a' chiad phròiseact seo a-mhàin. Gu math luath thug iad a-mach, ged a b 'urrainn dhaibh a bhith a' seòrsachadh faisg air millean galaxies, chan eil an sgèile seo gu leòr airson obrachadh le sgrùdaidhean adhar didseatach nas ùire, a dh'fhaodas ìomhaighean de mu 10 billean galaxies a chruthachadh (Kuminski et al. 2014) . Gus àrdachadh a làimhseachadh bho 1 millean gu 10 billean, b 'e factar de 10,000-Galaxy Zoo a bhiodh a' fastadh timcheall air 10,000 uair a bharrachd de chom-pàirtichean. Ged a tha an àireamh de luchd saor-thoileach air an eadar-lìon mòr, chan eil e neo-chrìochnach. Mar sin, thuig na luchd-rannsachaidh, nam biodh iad a 'dèiligeadh ri tomhas de dhàta a bha a' sìor fhàs, feumar dòigh ùr, eadhon nas so-sgaraichte.
Mar sin, bha Manda Banerji - ag obair le Schawinski, Lintott, agus buill eile den sgioba Galaxy Zoo (2010) - coimpiutaran teagaisg a 'tòiseachadh airson clasaichean a chlasachadh. Nas sònraichte gu sònraichte, a 'cleachdadh nan seòrsachan daonna a chaidh a chruthachadh le Galaxy Zoo, thog Banerji modal ionnsachaidh inneal a dh'fhaodadh a bhith a' toirt ro-innse do chlasachadh daonna galaxy stèidhichte air feartan an ìomhaigh. Nam b 'urrainn don mhodail seo ath-chruthachadh clasaichean daonna le fìor chruinneas, ghabhadh luchd-rannsachaidh Galaxy Zoo a chleachdadh gus àireamh neo-chrìochnach de galaxies a chomharrachadh.
Tha cridhe dòigh-obrach Banerji agus co-oibrichean glè choltach ri dòighean a tha gu tric air an cleachdadh ann an rannsachadh sòisealta, ged nach biodh e coltach gu bheil sin coltach ri fhaicinn aig a 'chiad àm. An toiseach, dh'atharraich Banerji agus co-obraichean gach ìomhaigh gu seata de fheartan àireamhach a thug geàrr-chunntas air na togalaichean aige. Mar eisimpleir, airson ìomhaighean de ghalair, dh'fhaodadh trì feartan a bhith ann: an ìre gorm san ìomhaigh, an eadar-dhealachadh ann an soilleireachd nan piogsail, agus an tomhas de piogsailean neo-gheal. Tha taghadh nan feartan ceart na phàirt chudromach den duilgheadas, agus mar as trice bidh feum air eòlas cuspair. Tha a 'chiad cheum seo, mar as trice ris an canar einnseanaireachd feartan , a' toirt a-mach matrix dàta le aon sreath gach ìomhaigh agus an sin trì colbhan a 'toirt tuairisgeul air an ìomhaigh sin. Air sgàth matric dàta agus an toradh a tha a dhìth (me, co dhiubh a chaidh an ìomhaigh a chomharrachadh le duine mar galaxy eas-fhillte), tha an neach-rannsachaidh a 'cruthachadh modal ionnsachaidh àireamhachd no inneal-mar eisimpleir, ath-thionndadh seasmhach - a tha a' fàgail a 'chinne-daonna stèidhichte air na feartan den ìomhaigh. Mu dheireadh, bidh an neach-rannsachaidh a 'cleachdadh nam paramadairean anns a' mhodail staitistigeil seo gus seòrsachadh tuairmseach de ghalair ùra a chruthachadh (figear 5.4). Ann an ionnsachadh innealan, is e an dòigh-obrach seo - a 'cleachdadh eisimpleirean le bileag gus cruth a dhèanamh air modail a bheir an uairsin dàta ùr a dh' ainmeachadh - air a bheil e air a stiùireadh mar ionnsachadh fo stiùir .
Bha na feartan ann am modail ionnsachaidh innealan Banerji agus co-obraichean nas duilghe na an fheadhainn a bh 'ann am m' eisimpleir dèideag-mar eisimpleir, chleachd i feartan mar "de Vaucouleurs fit axial ratio" - agus cha robh a samhla cho-inntinn logistic, b 'e lìonra neònach fuadain a bh' ann. A 'cleachdadh a feartan, a modail, agus na co-aontan clasaigeach Galaxy Zoo, b' urrainn dhi cuideaman a chruthachadh air gach feart, agus an uairsin na cuideaman sin a chleachdadh gus ro-innse a dhèanamh mu bhith a 'seòrsachadh galaraidhean. Mar eisimpleir, chunnaic a mion-sgrùdadh gu robh ìomhaighean le ìre bheag de "de Vaucouleurs fit axial ratio" nas buailtiche a bhith nan galar spioradail. Leis na cuideaman sin, bha i comasach air ro-innse a dhèanamh air seòrsachadh daonna galaxy le ceartachd reusanta.
Thionndaidh obair Banerji agus co-obraichean Galaxy Zoo a-steach don t -siostam cunntachaidh daonna le taic coimpiutair . Is e an dòigh as fheàrr air smaoineachadh mu na siostaman dà-chonnaidh sin, an àite a bhith aig daoine a bhith a 'fuasgladh duilgheadas, tha iad a' togail clàr-data a dh'fhaodar a chleachdadh gus coimpiutair a threànadh gus an duilgheadas fhuasgladh. Uaireannan, faodaidh tu coimpiutair a thrèanadh airson an duilgheadas fhuasgladh tòrr eisimpleirean a dhìth, agus an aon dòigh air àireamh gu leòr de eisimpleirean a thoirt gu buil na cho-obrachadh mòr. Is e a 'bhuannachd a tha an lùib seo a' cuideachadh le coimpiutair gu bheil e a 'toirt cothrom dhut tomhas neo-chrìochnach de dhàta a làimhseachadh le bhith a' cleachdadh ach tomhas de oidhirp daonna. Mar eisimpleir, faodaidh neach-rannsachaidh le millean galaxy clasaichte a chruthachadh modal ro-innseach a ghabhas a chleachdadh an uairsin airson clas billean no eadhon trilliún galaxies a chlàradh. Ma tha àireamh mhòr de ghalair ann, is e an seòrsa coimpiutaireachd daonna seo an aon fhuasgladh a dh'fhaodadh a bhith ann. Chan eil an cìsachadh neo-chrìochnach seo an-asgaidh, ge-tà. Is e cruaidh-dhuilgheadas a th 'ann am modail ionnsachaidh togail innealan a tha comasach na clasaichean daonna a ghleidheadh gu ceart, ach gu fortanach tha leabhraichean sàr-mhath a tha co-cheangailte ris a' chuspair seo (Hastie, Tibshirani, and Friedman 2009; Murphy 2012; James et al. 2013) .
Tha Galaxy Zoo na dheagh eisimpleir de na pròiseactan coimpiutaireachd daonna a tha ag atharrachadh. An toiseach, tha rannsaiche a 'feuchainn ris a' phròiseact leis fhèin no le sgioba beag de luchd-cuideachaidh rannsachaidh (me, oidhirp seòrsachaidh tùsail Schawinski). Mura h-eil an dòigh-obrach seo a 'dèanamh sgèile math, faodaidh an neach-rannsachaidh gluasad gu pròiseact cunntadh daonna le mòran chom-pàirtichean. Ach, airson tomhas sònraichte de dhàta, cha bhi oidhirp fhìor dhaonna gu leòr. Aig an àm sin, feumaidh luchd-rannsachaidh siostam coimpiutaireachd daonna a chuideachadh le coimpiutairean a thogail far a bheil seòrsachadh daonna air an cleachdadh gus modal ionnsachaidh inneal a thrèanadh a dh'fhaodar an uair sin a chur an sàs ann an àireamhan nach eil cho sìmplidh.