La Netflix Premio uzas malferma alvoko al antaŭdiri kio filmojn homoj ŝatos.
La plej konata malferma vokiteja projekto estas la Netflix-Premio. Netflix estas interreta filma luo-firmao, kaj en 2000 ĝi lanĉis Cinematch, servon por rekomendi filmojn al klientoj. Ekzemple, Cinematch povus rimarki, ke vi ŝatis Star Wars kaj The Empire Strikes Back kaj tiam rekomendas, ke vi rigardu Return of the Jedi . Komence, Cinematch laboris malbone. Sed dum multaj jaroj daŭre plibonigis sian kapablon antaŭdiri kion filmoj klientoj ĝuos. Tamen, en 2006, la progreso de Cinematch havis alteblanke. La esploristoj de Netflix multe provis ĉion, kion ili povis pensi, sed samtempe ili suspektis, ke ekzistas aliaj ideoj, kiuj povus helpi ilin plibonigi sian sistemon. Tiel, ili aperis kun kio, en la epoko, estis radikala solvo: malfermita voko.
Kritika al la eventuala sukceso de la Netflix-Premio estis kiel la malfermita voko estis desegnita, kaj ĉi tiu dezajno havas gravajn lecionojn por kiel malfermaj alvokoj povas esti uzataj por socia esplorado. Netflix ne nur elmetis senstrukturan peton por ideoj, kio estas, kion multaj homoj imagas kiam ili unue konsideras malfermitan alvokon. Pli ĝuste, Netflix posedis klaran problemon per simpla taksado: ili defiis al homoj uzi aron da 100 milionoj da filmaj taksadoj por antaŭdiri 3 milionojn da rezignaj ratings (ratings, kiujn uzantoj faris, sed Netflix ne liberigis). La unua persono kreis algoritmon, kiu antaŭdiris la 3 milionojn rezignitajn taksojn 10% pli bonan ol Cinematch gajnus milionon da dolaroj. Ĉi tiu klara kaj facila apliki takson-proceduron-komparante antaŭviditajn rangojn kun rezignoj-elsenditaj- signifis, ke la Premio Netflix estis enkadrigita tiel ke solvoj pli facile kontrolis ol generi; ĝi turnis la defion plibonigi Cinematch en problemon taŭgan por malferma alvoko.
En oktobro de 2006, Netflix publikigis datumeton enhavantan 100 milionojn da filmoj de ĉirkaŭ 500,000 klientoj (ni konsideros la implikaĵojn de ĉi tiu datumo en ĉapitro 6). La Netflix-datumoj povas esti konceptitaj kiel grandega matrico, kiu proksimume 500,000 klientoj havas 20,000 filmojn. Ene de ĉi tiu matrico, ekzistis ĉirkaŭ 100 milionoj da rangoj sur skalo de unu al kvin steloj (tablo 5.2). La defio estis uzi la observitajn datumojn en la matrico por antaŭdiri la 3 milionojn rezignitajn taksojn.
Filmo 1 | Filmo 2 | Filmo 3 | ... | Filmo 20,000 | |
---|---|---|---|---|---|
Kliento 1 | 2 | 5 | ... | ? | |
Kliento 2 | 2 | ? | ... | 3 | |
Kliento 3 | ? | 2 | ... | ||
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) | |
Kliento 500,000 | ? | 2 | ... | 1 |
Esploristoj kaj hackers ĉirkaŭ la mondo estis turnitaj al la defio, kaj antaŭ 2008 pli ol 30,000 homoj laboris pri ĝi (Thompson 2008) . Dum la konkurso, Netflix ricevis pli ol 40,000 proponitajn solvojn de pli ol 5,000 teamoj (Netflix 2009) . Evidente, Netflix ne povis legi kaj kompreni ĉiujn ĉi tiujn proponitajn solvojn. La tuta afero kuris glate, tamen, ĉar la solvoj estis facile kontroli. Netflix nur povus komputi kompari la antaŭdiritajn rangojn per la eksterordinaraj taksoj uzanta prespecigitan metrikon (la aparta metriko kiun ili uzis estis la kvadrata radiko de la meza kvadrata eraro). Estis ĉi tiu kapablo rapide taksi solvojn, kiuj ebligis Netflix akcepti solvojn de ĉiuj, kiuj rezultis gravas ĉar bonaj ideoj venis de iuj mirindaj lokoj. Fakte, la venka solvo estis prezentita de teamo komencita fare de tri esploristoj, kiuj ne havis antaŭajn spertojn konstruante filmajn rekomendajn sistemojn (Bell, Koren, and Volinsky 2010) .
Unu bela aspekto de la Netflix-Premio estas, ke ĝi ebligis ĉiujn taksajn solvojn esti taksitaj juste. Tio estas, kiam homoj alŝutis siajn antaŭdiritajn rangojn, ili ne bezonis alŝuti siajn akademiajn akreditojn, sian aĝon, rason, sekson, seksan orientiĝon, aŭ ion ajn pri si mem. La antaŭviditaj taksoj de fama profesoro de Stanford estis traktitaj ĝuste kiel tiuj de adoleskanto en sia dormoĉambro. Bedaŭrinde, ĉi tio ne estas vera en la plej multaj sociaj esploroj. Tio estas, por plej multaj sociaj esploroj, taksado estas tre tempo kaj parte subjektiva. Do, plejpartoj de esploraj ideoj neniam serioze taksas, kaj kiam ideoj estas taksataj, malfacile disigi tiujn taksojn de la kreinto de la ideoj. Malfermaj alvokaj projektoj, aliflanke, havas facilan kaj justan taksadon, por ke ili povu malkovri ideojn, kiuj estus alie difektitaj.
Ekzemple, ĉe unu punkto dum la Netflix-Premio, iu kun la ekrana nomo, Simon Funk, publikigis sur sia blogo proponitan solvon bazitan sur unuopa valora malkomponaĵo, alproksimiĝo de lineara algebro kiu ne antaŭe uzis aliajn partoprenantojn. La poŝto de Funk estis samtempe teknika kaj tre strange senkonsidera. Ĉu ĉi tiu bloga poŝto priskribis bonan solvon aŭ ĉu ĝi estis malŝparado de tempo? Ekstere de malferma vokita projekto, la solvo eble neniam ricevis seriozan taksadon. Antaŭ ĉio, Simon Funk ne estis instruisto ĉe MIT; li estis programisto-programisto, kiu, en la tempo, estis tornistro ĉirkaŭ Nov-Zelando (Piatetsky 2007) . Se li sendis ĉi tiun ideon al inĝeniero ĉe Netflix, ĝi certe certe ne estus legita.
Feliĉe, ĉar la kriteriaj kriterioj estis klaraj kaj facilaj por apliki, liaj antaŭviditaj taksadoj estis taksitaj, kaj ĝi tuj eksciis, ke lia aliro estis tre potenca: li raketis al kvara loko en la konkurado, terura rezulto donita ke aliaj teamoj jam estis laborante dum monatoj sur la problemo. Al la fino, partoj de lia aliro estis uzataj de preskaŭ ĉiuj gravaj konkurantoj (Bell, Koren, and Volinsky 2010) .
La fakto, ke Simon Funk elektis skribi blogan poŝton klarigante sian aliron, prefere ol provante konservi ĝin sekrete, ankaŭ ilustras, ke multaj partoprenantoj en la Netflix-Premio ne estis ekskluzive motivitaj per la miliono-dolaro. Prefere, multaj partoprenantoj ankaŭ ŝajnis ĝui la intelektan defion kaj la komunumon, kiu disvolvis ĉirkaŭ la problemo (Thompson 2008) , sentojn, kiujn mi esperas, ke multaj esploristoj povas kompreni.
La Netflix-Premio estas klasika ekzemplo de malferma alvoko. Netflix proponis demandon kun specifa celo (antaŭdiri filmojn) kaj petis solvojn de multaj homoj. Netflix povis taksi ĉiujn ĉi tiujn solvojn ĉar ili estis pli facilaj kontroli ol krei, kaj fine Netflix elektis la plej bonan solvon. Poste mi montros al vi, kiel ĉi tiu sama maniero povas esti uzata en biologio kaj juro, kaj sen miliono-dolaro.