Netflix Cena využívá otevřenou výzvu předpovědět, jaké filmy se budou lidé rádi.
Nejznámějším otevřeným voláním je cena Netflix. Společnost Netflix je online půjčovna filmů a v roce 2000 zahájila službu Cinematch, která doporučuje filmům zákazníkům. Například Cinematch si možná všimne, že se vám líbí Star Wars a The Empire Strikes Back a pak doporučujeme sledovat Návrat Jedi . Zpočátku Cinematch pracoval špatně. Ale v průběhu mnoha let pokračovala ve zlepšování své schopnosti předpovědět, co by zákazníci filmu měli rádi. Do roku 2006 však došlo k pokroku v oblasti Cinematch. Výzkumníci z Netflixu se snažili skoro všechno, o čem si mysleli, ale současně podezřívali, že existují další nápady, které by jim mohly pomoci zlepšit jejich systém. Takže přišli s tím, co bylo v té době radikálním řešením: otevřeným voláním.
Klíčem k eventuálnímu úspěchu ceny Netflixu bylo, jak byl otevřený hovor navržen, a tento návrh má důležité ponaučení, jak volné volání lze využít pro společenský výzkum. Netflix nevydala jen nestrukturovanou žádost o nápady, což si mnozí lidé představují, když poprvé zváží otevřené volání. Spíše Netflix představoval jednoznačný problém s jednoduchým postupem hodnocení: vyzvali lidi, aby použili soubor 100 milionů filmových hodnocení, aby předpověděli 3 miliony vyhrazených ratingů (hodnocení, které uživatelé provedli, ale Netflix se nezveřejnil). První osoba, která vytvořila algoritmus, který předpokládal, že 3 miliony držela rating o 10% lepší než Cinematch, získala milion dolarů. Tento jasný a snadno aplikovatelný postup hodnocení - porovnávající předpovědi ratingů s rozhodujícími hodnoceními - znamenal, že cena Netflixu byla vytvořena tak, aby byla řešení snadněji kontrolovatelná než generování; to změnilo výzvu zlepšení Cinematch do problému vhodného pro otevřené volání.
V říjnu 2006 společnost Netflix vydala soubor dat obsahujících 100 milionů filmových recenzí od zhruba 500 000 zákazníků (uvědomíme si důsledky tohoto vydání v kapitole 6). Data Netflix mohou být koncipována jako obrovská matice, která je přibližně 500 000 zákazníků o 20 000 filmů. V rámci této matice bylo na stupnici od 1 do 5 hvězdiček zhruba 100 milionů ratingů (tabulka 5.2). Úkolem bylo použít zjištěné údaje v matici, aby bylo možné předpovědět 3 miliony držených ratingů.
Film 1 | Film 2 | Film 3 | ... | Film 20 000 | |
---|---|---|---|---|---|
Zákazník 1 | 2 | 5 | ... | ? | |
Zákazník 2 | 2 | ? | ... | 3 | |
Zákazník 3 | ? | 2 | ... | ||
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) | |
Zákazník 500 000 | ? | 2 | ... | 1 |
Výzkumní pracovníci a hackeři na celém světě byli na tuto výzvu upozorněni a do roku 2008 na ní pracovalo více než 30 000 lidí (Thompson 2008) . Během soutěže společnost Netflix získala více než 40 000 navrhovaných řešení od více než 5 000 týmů (Netflix 2009) . Společnost Netflix samozřejmě nemohla přečíst a pochopit všechna tato navržená řešení. Celá věc probíhala hladce, protože řešení byla snadno kontrolovatelná. Netflix mohl mít pouze počítač, který porovnával předpověděné ratingy s ratingy, které byly přiděleny, pomocí předem určených metrik (konkrétní metrika, kterou použili, byla druhá odmocnina střední chyby v čtverečnosti). Byla to tato schopnost rychle vyhodnotit řešení, která umožnila společnosti Netflix přijmout řešení od každého, což se ukázalo být důležité, protože dobré nápady pocházejí z některých překvapivých míst. Vítězné řešení ve skutečnosti předložil tým, který zahájili tři výzkumní pracovníci, kteří neměli žádné předchozí zkušenosti s vytvářením systémů pro doporučení filmů (Bell, Koren, and Volinsky 2010) .
Jedním z krásných aspektů ceny Netflix je to, že umožnilo, aby všechna navrhovaná řešení byla hodnocena spravedlivě. To znamená, že když lidé nahrál své předpověděné hodnocení, nemuseli nahrát své akademické údaje, věk, rasu, pohlaví, sexuální orientaci nebo něco o sobě. Předpovídané hodnocení slavného profesora z Stanfordu se zacházelo zcela stejně jako s teenagerkou v její ložnici. Bohužel to není pravda ve většině sociálních výzkumů. To znamená, že pro většinu sociálního výzkumu je hodnocení velmi časově náročné a částečně subjektivní. Takže většina výzkumných myšlenek se nikdy vážně nehodnotí a když se hodnotí nápady, je těžké tyto hodnocení oddělit od tvůrce myšlenek. Otevřené projekty volání mají na druhé straně snadné a spravedlivé hodnocení, takže mohou objevovat myšlenky, které by jinak nebyly vynechány.
Například, v jednom okamžiku během ceny Netflix, někdo s obrazovkou Simon Funk zveřejnil na svém blogu navrhované řešení založené na rozkladě singulární hodnoty, což je přístup z lineární algebry, který předtím nepoužívali jiní účastníci. Funkův blogový příspěvek byl současně technický a divně neformální. Byl tento příspěvek blogu popisující dobré řešení nebo byl ztrátou času? Mimo otevřeného projektu volání by řešení nemuselo být nikdy hodnoceno vážně. Koneckonců, Simon Funk nebyl profesorem na MIT; on byl vývojář softwaru, který se v té době (Piatetsky 2007) na Nový Zéland (Piatetsky 2007) . Pokud by tento námět zaslal inženýři z Netflixu, tak by to určitě nebylo číst.
Naštěstí, vzhledem k tomu, že kritéria hodnocení byla jasná a snadno použitelná, byly vyhodnoceny jeho předpovědi a okamžitě bylo zřejmé, že jeho přístup byl velmi silný: do soutěže se dostal na čtvrté místo, obrovský výsledek vzhledem k tomu, několik měsíců pracovat na problému. Nakonec, část jeho přístupu využili prakticky všichni vážní konkurenti (Bell, Koren, and Volinsky 2010) .
Skutečnost, že se Simon Funk rozhodl napsat blogový příspěvek vysvětlující jeho přístup, než aby se snažil udržet jeho tajemství, také ukazuje, že mnoho účastníků Netflixovy ceny nebylo výhradně motivováno milionovou dolarovou cenou. Spíše mnozí účastníci se také zdál, že se těší intelektuální výzvě a komunitě, která se kolem problému vyvíjela (Thompson 2008) , pocity, které od mnoha vědců očekávám.
Cena Netflixu je klasickým příkladem otevřeného hovoru. Netflix položil otázku s konkrétním cílem (předvídání hodnocení filmů) a vyžádala si řešení od mnoha lidí. Společnost Netflix byla schopna vyhodnotit všechna tato řešení, protože byla snadněji kontrolována, než vytvořit, a nakonec Netflix vybral to nejlepší řešení. Dále vám ukážeme, jak lze tento přístup použít v biologii a právu a bez ceny za milion dolarů.