La Netflix Premio uzas malferma alvoko al antaŭdiri kio filmojn homoj ŝatos.
La plej bone konata malfermita alvoko projekto estas la Netflix Premio. Netflix estas reta filmo luo kompanio, kaj en 2000 ĝi lanĉis Cinematch, servo rekomendi filmojn al klientoj. Ekzemple, Cinematch povus rimarki, ke vi ŝatis Stelmilito kaj Empire Strikes Back kaj tiam rekomendas ke vi rigardas Reveno de la Jedi. Komence, Cinematch laboris nebone. Sed, dum de multaj jaroj, Cinematch daŭre plibonigi lian kapablon antaŭdiri kion filmoj klientoj ĝuus. De 2006, tamen, progreso sur Cinematch plateaued. La investigadores de Netflix provis preskaux io ili povus pensi, sed samtempe, ili suspektis ke estis aliaj ideoj kiuj povus helpi ilin plibonigi ilian sistemon. Tiel, ili venis supren kun kio estis, tiutempe, radikala solvo: malfermita alvoko.
Kritika al la sukceso fino de la Netflix Premio estis kiel la malfermita alvoko estis desegnita, kaj tiu dezajno havas gravajn lecionojn por kiel malferma alvokoj povas esti uzita por sociaj esploroj. Netflix ne nur estingis la strukturitaj peton por ideoj, kiu estas kio multaj homoj imagi kiam ili unue konsideri malfermita alvoko. Prefere, Netflix prezentis klaran problemon kun simpla pritakso kriterioj: ili defiis homojn uzi aron de 100 milionoj filmo rangigoj antaŭdiri 3 milionoj tenis-ekstere rangigoj (rangigoj ke uzantoj faris sed ke Netflix ne liberigas). Ĉiu kiu povus krei algoritmon kiu povis antaŭdiri la 3 milionoj tenis-ekstere rangigoj 10% pli bona ol Cinematch gajnus 1 miliono da dolaroj. Tiu klara kaj facile apliki pritakso kriterioj-komparante antaŭdiris rangigoj por tenis-ekstere rangigoj-signifis ke la Netflix Premio estis enkadrigita en tia maniero ke solvoj estas pli facilaj por kontroli ol generi; plenumis la defion de plibonigado Cinematch enen problemon taŭga por malferma alvoko.
En oktobro de 2006, Netflix ĵetis datumaro enhavanta 100 milionojn filmo rangigoj de proksimume ĉirkaŭ 500.000 klientoj (ni konsideros la privateco implikaĵoj de ĉi datumoj liberigo en Ĉapitro 6). La Netflix datumoj povas konceptita kiel grandega matrico kiu estas proksimume 500.000 klientoj de 20.000 filmoj. Ene tiu matrico, ekzistis proksimume 100 milionoj rangigoj en skalo de 1 al 5 steloj (Tabelo 5.2). La defio estis uzi la observitaj datumoj en la matrico antaŭdiri la 3 milionoj tenis-ekstere rangigoj.
filmo 1 | movie 2 | movie 3 | . . . | movie 20,000 | |
---|---|---|---|---|---|
kliento 1 | 2 | 5 | . | ? | |
kliento 2 | 2 | ? | . | 3 | |
kliento 3 | ? | 2 | . | ||
. . . | . | . | . | . | . |
kliento 500.000 | ? | 2 | . | 1 |
Esploristoj kaj hackers tutmonde estis tiritaj al la defio, kaj de 2008 pli ol 30,000 homoj estis laboranta sur ĝi (Thompson 2008) . Super la kurso de la konkurso, Netflix ricevis pli ol 40,000 proponitaj solvoj de pli ol 5,000 teamoj (Netflix 2009) . Evidente, Netflix povis legi kaj kompreni ĉiujn tiujn proponitaj solvoj. La tuta afero kuris glate, tamen, ĉar la solvoj estis facile kontroli. Netflix povus nur havi komputilon kompari la antaŭvidita rangigoj por la tenis-ekstere rangigoj per antaŭ- specifita metriko (la aparta metriko ili uzis estis la kvadrata radiko de la meznombra-kvadrata eraro). Estis tiu kapablo rapide taksi solvojn kiuj ebligis Netflix akcepti solvojn de ĉiuj, kiuj montriĝis por grava ĉar bonaj ideoj venis de iu mirinda loko. Fakte, la venka solvo estis prezentita de teamo komenciĝis per tri esploristoj kiuj havis neniun antaŭan sperton konstruaĵo filmo rekomendo sistemoj (Bell, Koren, and Volinsky 2010) .
Unu bela aspekto de la Netflix Premio estas kiu ebligis ĉiuj en la mondo havi sian solvon taksita juste. Kiam homoj alŝutis iliajn antaŭdiris rangigoj, ili ne bezonas alŝuti siajn akademiajn akreditaĵojn, ilia aĝo, raso, sekso, seksa orientiĝo, aŭ ion pri si mem. Tiel, la antaŭvidita rangigoj de fama profesoro de Stanford estis traktitaj ekzakte la sama kiel tiuj de adoleskanto en ŝia dormoĉambro. Bedaŭrinde, tio ne estas vera en plej sociaj esploroj. Tio estas, por la plimulto socia esploro, pritakso estas tre tempo konsumanta kaj parte subjektiva. Do, plej esploro ideoj neniam serioze taksita, kaj kiam ideoj estas taksitaj, estas malfacile deŝiri tiujn evaluaciones de la kreinto de la ideoj. Ĉar solvaĵoj estas facilaj al kontroli, malferma alvokoj permesas esploristoj aliri ĉiujn potenciale mirindaj solvoj kiuj falus tra la fendoj se ili nur konsideris solvoj de famaj profesoroj.
Ekzemple, ĉe unu poento dum la Netflix Premio iu kun la ekrano nomo Simon Funk eldonis en lia blog proponita solvo bazita sur singulara valora malkomponaĵo, alproksimiĝo de lineara algebro kiu ne estis uzita antaŭe por aliaj partoprenantoj. Funk la blog estis samtempe teknikajn kaj strange neformala. Estis tiu bloga poŝto priskribas bona solvo aŭ ĉu tempoperdo? Eksteren de malfermita alvoko projekto, la solvo povus neniam ricevis seriozan pritakso. Post ĉiu Simon Funk estis profesoro ĉe Cal Tech aŭ MIT; Li estis softvara ellaboranto kiu, tiutempe, estis backpacking ĉirkaŭ Nov-Zelando (Piatetsky 2007) . Se li retpoŝte tiu ideo inĝeniero ĉe Netflix, ĝi preskaŭ certe ne estus prenita serioze.
Feliĉe, ĉar la pritakso kriterioj estis klara kaj facile apliki, lia antaŭdiris rangigoj estis taksita, kaj ĝi estis senprokraste certe ke lia aliro estis tre potenca, li raketojn al kvara loko en la konkurado, teruran rezulton pro tio ke aliaj teamoj jam estis labori dum monatoj sur la problemo. En la fino, partoj de Simon Funk alproksimiĝo estis uzita de preskaŭ ĉiuj seriozaj competidores (Bell, Koren, and Volinsky 2010) .
La fakto ke Simon Funk elektis verki blog klarigante lia alproksimiĝo, prefere ol provanta teni ĝin sekreta, ankaŭ ilustras ke multaj partoprenantoj en la Netflix Premio ne ekskluzive motivita de la miliono dolaro premio. Prefere, multaj partoprenantoj ankaŭ ŝajnis ĝui la intelekta defio kaj la komunumo kiu disvolvis ĉirkaŭ la problemo (Thompson 2008) , sentojn ke mi atendas multe esploristoj povas kompreni.
La Netflix Premio estas klasika ekzemplo de malfermita alvoko. Netflix prezentis demandon kun specifa celo (antaŭdirante filmo ratings) kaj petis solvojn de multaj personoj. Netflix povis taksi ĉiujn tiujn solvojn ĉar ili pli facile kontroli ol krei kaj finfine Netflix elektis la plej bonan solvon. Sekva, mi montros al vi kiom tiu sama alproksimiĝo povas esti uzata en biologio kaj juro.