Је Нетфлик награда користи отворени позив да предвиди који филмови ће људи воле.
Најпознатији пројекат отворен позив је Нетфликс награда. Нетфлик је онлине изнајмљивање кино компанија, а 2000. је покренула Цинематцх, сервис за препоручити филмове клијентима. На пример, Цинематцх приметити да вам се свидја Стар Варс и Емпире Стрикес Бацк па препоручујемо да гледате Ретурн оф тхе Једи. У почетку, Цинематцх радио лоше. Али, током многих година, Цинематцх наставио да побољшају своју способност да предвиди шта кино купци ће уживати. До 2006. године, међутим, напредак у Цинематцх зауставила. Истраживачи на Нетфлик је покушао скоро све што могу да замислите, али у исто време, они се сумња да су друге идеје које могу помоћи да побољшају свој систем. На тај начин, они су смислили шта је, у то време, а радикално решење: отворени позив.
Од кључне важности за евентуалном успеху на Нетфлик награде је како је отворен позив дизајнирана, а овај дизајн има важне лекције о томе како отворено позива може да се користи за друштвена истраживања. Нетфлик није само гасе се развијене структуре захтев за идеје, што је оно што многи људи мисле када су први пут у обзир отворен позив. Уместо тога Нетфлик представљало јасан проблем са једноставним критеријумима оцењивања: они изазвао људе да користе низ од 100 милиона оцену филма предвидети 3 милиона држе оут оцене (ратингс које корисници су данас, али да Нетфлик није објавила). Свако ко би могао створити алгоритам који може да предвиди 3 милиона држе оут рејтинг 10% боље него што би Цинематцх освојити 1 милион долара. Ово јасно и лако се наноси евалуације Критеријуми-поређења предвиђених рејтинга држе ван оцена-значило да је Нетфлик награда је урамљена на такав начин да решења су лакше да провери од генерисати; Испоставило се са изазовом побољшања Цинематцх у проблем који је погодан за отвореног позива.
У октобру 2006. године, Нетфлик објавио скуп података која садржи 100 милиона филмске оцене од око око 500.000 купаца (ми ћемо размотрити импликације приватности тих података издању у поглављу 6). Тхе Нетфлик подаци могу бити конципиран као велики матрици која је приближно 500.000 купаца за 20.000 филмова. У оквиру ове матрице, било је око 100 милиона рејтинг на скали од 1 до 5 звездица (Табела 5.2). Изазов је био да се посматраних података у матрици предвидети 3 милиона држе оут оцене.
film 1 | film 2 | film 3 | . . . | film 20.000 | |
---|---|---|---|---|---|
купац 1 | 2 | 5 | . | ? | |
купац 2 | 2 | ? | . | 3 | |
купац 3 | ? | 2 | . | ||
. . . | . | . | . | . | . |
купац 500.000 | ? | 2 | . | 1 |
Истраживача и хакери широм света су извучени на изазов, а до 2008. више од 30.000 људи је радило на томе (Thompson 2008) . Током такмичења, Нетфлик примио више од 40.000 предложених решења из више од 5.000 тимова (Netflix 2009) . Очигледно, Нетфлик не може да прочита и разуме све ове предложених решења. Цела ствар глатко, међутим, јер су решења су лако проверити. Нетфлик би могао само да компјутер упоредити предвиђене рејтинга одржаних-од оцене по претходно наведено метричком (одређену метрику који су користили био је квадратни корен грешке средње-квадрат). Било је то способност да брзо процене решења који су омогућили Нетфлик да прихвати решења од свих, који се испоставило да је важно, јер добре идеје долазе из неких изненађујућих места. У ствари, Победничко решење је поднесена тим почео је три истраживача који су имали претходно искуство за изградњу кино препорука система (Bell, Koren, and Volinsky 2010) .
Један леп аспект Нетфлик награде је да је омогућено свима у свету да им се решење процењују доста. Када људи уплоадед своје предвиђене оцене, они нису морали да поставе своје академске акредитиве, њихов узраст, расу, пол, сексуалну оријентацију, или било шта о себи. Тако су предвиђене рејтинг познатог професора на Станфорду су третирани исто као и они из тинејџер у њеној спаваћој соби. На жалост, то није тачно у већини друштвених истраживања. То је, за већину друштвена истраживања, процена је много времена и делимично субјективно. Дакле, већина истраживања су идеје никада озбиљно процењују, и када се процењују идеје, тешко је одвојити те оцене од креатора идеја. Јер решења су лако проверити, отворени позиви омогућавају истраживачима да приступе свим потенцијално дивне решења која ће пропасти кроз пукотине ако се само разматрати решења из познатих професора.
На пример, у једном тренутку током Нетфлик награду неко са именом екрана Сајмон Функ постед он његов блог предложеног решења заснована на јединственом вредности распадања, приступ из линеарне алгебре које нису раније користили осталих учесника. Функ блог пост је истовремено технички и чудно неформално. Да ли је ово блогу описује добро решење или је то губљење времена? Ван отвореног пројекта позива, решење можда никада не би добио озбиљну процену. Уосталом Сајмон Функ није био професор на Цал Тецх или МИТ; Он је програмер који је, у то време, био путује око Новог Зеланда (Piatetsky 2007) . Ако је послат ту идеју да инжењер у Нетфлик, готово сигурно не би био озбиљно схваћени.
На срећу, јер критеријуми евалуације били су јасни и лако се наноси, његови предвиђене рејтинг су потврђене, а било је одмах јасно да је његов приступ био веома моћан: он је порастао на четвртом месту у конкуренцији, огроман резултат с обзиром да су остали тимови већ ради месецима проблем. На крају, делови приступа Симон Функ коришћени су буквално сви озбиљни конкуренти (Bell, Koren, and Volinsky 2010) .
Чињеница да је Симон Функ одлучио да напише блог пост објашњавајући свој приступ, уместо да га држи у тајности, такође показује да многи учесници у Нетфлик награде нису искључиво мотивисана награду од милион долара. Уместо тога, многи учесници такође чинило да уживају у интелектуални изазов и заједницу која се развила око проблема (Thompson 2008) , осећања да ће многи истраживачи могу да разумем.
Је Нетфлик награда је класичан примјер отвореног позива. Нетфлик постављено питање са специфичним циљем (предвиђање филма ратингс) и затражили решења из многих људи. Нетфлик је у стању да процени све ове решења, јер су лакше за верификацију него стварати, и на крају Нетфлик изабрао најбоље решење. Следеће, ја ћу ти показати како се то исти приступ се користи у биологији и законом.