നെറ്റ്ഫിക്സ് സമ്മാനം ആളുകൾ ഇഷ്ടപ്പെടുന്നത് ചെയ്യുന്ന സിനിമകൾ പ്രവചിക്കാൻ തുറന്ന കോൾ ഉപയോഗിക്കുന്നു.
ഏറ്റവും പരിചയമുള്ള ഓപ്പൺ കോൾ പ്രോജക്ട് നെറ്റ്ഫ്ലിക്സ് പ്രൈസ് ആണ്. നെറ്റ്ഫ്ലിക്സ് ഒരു സിനിമാ വാടകവീട്ടൽ കമ്പനിയാണ്, 2000 ൽ അത് ഉപഭോക്താക്കൾക്ക് സിനിമ ശുപാർശ ചെയ്യുന്ന ഒരു സിനെമാച്ച് എന്ന സേവനം ആരംഭിച്ചു. ഉദാഹരണത്തിന്, നിങ്ങൾ സ്റ്റാർ വാർസ് , എമ്പയർ സ്ട്രൈക്കുകൾ ബാക്ക് എന്നിവയെ ഇഷ്ടപ്പെട്ടുവെന്നും തുടർന്ന് ജെഡിയുടെ റിട്ടേൺ കാണാൻ നിങ്ങൾ ശുപാർശ ചെയ്യുമെന്നും സിനിമാച്ച് കണ്ടേക്കാം. തുടക്കത്തിൽ, സിനിമാച്ച് മോശമായി പ്രവർത്തിച്ചു. എന്നാൽ, നിരവധി വർഷങ്ങൾക്കകം, ഉപഭോക്താക്കൾ ആസ്വദിക്കുന്ന ചിത്രങ്ങൾ ഏതൊക്കെയെന്ന് പ്രവചിക്കാനുള്ള ശേഷി തുടർന്നുകൊണ്ടിരുന്നു. 2006 ആയപ്പോഴേക്കും സിനിമാച്ചെയ്നിലെ പുരോഗതിക്ക് വിധേയമായി. നെറ്റ്ഫ്ലിക്സിലെ ഗവേഷകർ ചിന്തിക്കാൻ കഴിയുന്ന എല്ലാ കാര്യങ്ങളും പരീക്ഷിച്ചു. പക്ഷേ, അതേ സമയം തന്നെ, അവരുടെ സംവിധാനത്തെ മെച്ചപ്പെടുത്താൻ സഹായിക്കുന്ന മറ്റ് ആശയങ്ങളുണ്ടെന്ന് അവർ സംശയിച്ചു. അങ്ങനെ, ആ സമയത്ത്, ഒരു സമൂലമായ പരിഹാരം, ഒരു തുറന്ന കോൾ.
നെറ്റ്ഫ്ലിക്സ് പുരസ്കാരം അവസാനത്തെ വിജയകരമായത്, തുറന്ന കോൾ എങ്ങനെ രൂപകൽപ്പന ചെയ്തിരുന്നു, സാമൂഹ്യ ഗവേഷണത്തിനായി ഓപ്പൺ കോളുകൾ എങ്ങനെ ഉപയോഗിക്കാമെന്നതിനുള്ള പ്രധാന പാഠങ്ങൾ ഈ രൂപകൽപനയിൽ ഉണ്ട്. നെറ്റ്ഫ്ലിക്സ് ആശയങ്ങൾക്കായി ഒരു നിർദ്ദിഷ്ട അഭ്യർത്ഥന നൽകിയിരുന്നില്ല. ആദ്യം അവർ തുറന്ന കോൾ പരിഗണിക്കുമ്പോൾ എത്രപേർ ഭാവന ചെയ്യുന്നു. മറിച്ച്, ഒരു ലളിതമായ മൂല്യനിർണ്ണയ രീതി ഉപയോഗിച്ച് നെറ്റ്ഫ്ലക്സിന് വ്യക്തമായ പ്രശ്നം ഉണ്ടായിരുന്നു: 3 മില്യൺ ഫിലിം റേറ്റിംഗ് കണക്കാക്കാൻ 100 മില്യൺ മൂവി റേറ്റിംഗുകൾ ഉപയോഗിക്കുന്നതിന് അവർ ജനങ്ങളെ വെല്ലുവിളിച്ചു (ഉപയോക്താക്കൾ സൃഷ്ടിച്ച റേറ്റിംഗുകൾ പക്ഷേ നെറ്റ്ഫ്ലിക്സ് റിലീസ് ചെയ്തിട്ടില്ല). ഒരു അൽഗോരിതം സൃഷ്ടിക്കുന്ന ആദ്യത്തെ വ്യക്തി സിനിമാച്ചിനേക്കാൾ 10 ശതമാനം നല്ലതാണ് 3 ദശലക്ഷം റേറ്റിംഗ് ഔട്ട്ലെറ്റുകൾ ഒരു ദശലക്ഷം ഡോളർ നേടുമെന്ന് പ്രവചിക്കുന്നു. നിർണയിക്കപ്പെട്ട റേറ്റിംഗുകൾ താരതമ്യേന മെച്ചപ്പെട്ട രീതിയിൽ വിലയിരുത്തുന്നതിന് ഇത് വളരെ ലളിതവും ലളിതവുമാണ് - അതായത്, നെറ്റ്ഫ്ലിക്സ് സമ്മാനം ജനറേറ്റുചെയ്യുന്നതിനേക്കാൾ എളുപ്പത്തിൽ പരിശോധിക്കാവുന്ന വിധത്തിൽ രൂപപ്പെടുത്തിയത്; തുറന്ന കോളിന് അനുയോജ്യമായ ഒരു പ്രശ്നത്തിലേക്ക് സിനിമാച്ച് മെച്ചപ്പെടുത്തുന്നതിനുള്ള വെല്ലുവിളി അത് മാറ്റി.
2006 ഒക്ടോബറിൽ ഏതാണ്ട് 500,000 ഉപഭോക്താക്കളിൽ നിന്നുമുള്ള 100 ദശലക്ഷം മൂവി റേറ്റിംഗുകൾ അടങ്ങിയ ഒരു ഡാറ്റാസെറ്റിനെ Netflix പുറത്തിറക്കി (ഈ വിവരശേഖരത്തിന്റെ സ്വകാര്യതാ പ്രത്യാഘാതങ്ങൾ ആറാം അദ്ധ്യായത്തിൽ നമ്മൾ പരിഗണിക്കും). 20,000 മൂവികൾ വഴി ഏതാണ്ട് 500,000 ഉപഭോക്താക്കൾ ഉള്ള ഒരു വലിയ മെട്രിക്സ് ആയി നെറ്റ്ഫ്ലിക്സ് ഡാറ്റ രൂപവത്കരിക്കാനാകും. ഈ മെട്രിക്സിൽ, ഒന്നിൽ നിന്ന് അഞ്ച് നക്ഷത്രങ്ങൾ (പട്ടിക 5.2) വരെ 100 മില്ല്യൺ റേറ്റിംഗുകൾ ഉണ്ടായിരുന്നു. 3 ദശലക്ഷം കൈവശം വച്ചിരിക്കുന്ന റേറ്റിംഗുകൾ പ്രവചിക്കാൻ മാട്രിക്സിലെ നിരീക്ഷിച്ച വിവരങ്ങൾ ഉപയോഗിക്കുക എന്നതാണ് വെല്ലുവിളി.
മൂവി 1 | മൂവി 2 | മൂവി 3 | ... | മൂവി 20,000 | |
---|---|---|---|---|---|
ഉപഭോക്താവ് 1 | 2 | 5 | ... | ? | |
ഉപഭോക്താവ് 2 | 2 | ? | ... | 3 | |
ഉപഭോക്താവ് 3 | ? | 2 | ... | ||
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) | \(\vdots\) | |
ഉപഭോക്താവ് 500,000 | ? | 2 | ... | 1 |
ലോകമെമ്പാടുമുള്ള ഗവേഷകർക്കും ഹാക്കർമാർക്കും വെല്ലുവിളി ഉയർത്താൻ കഴിഞ്ഞു. 2008 ആയപ്പോഴേക്കും ഇത് 30,000-ത്തിലധികം പേർ പ്രവർത്തിക്കുന്നു (Thompson 2008) . മത്സരത്തിനിടയിൽ, നെറ്റ്ഫ്ലിക്സിന് ഏകദേശം 5,000 ടീമുകളിലായി (Netflix 2009) നിന്നും 40,000-ത്തിലധികം പരിഹാര പരിഹാരങ്ങൾ ലഭിച്ചു. വ്യക്തമായും, ഈ നിർദ്ദിഷ്ട പരിഹാരങ്ങളെ നെറ്റ്ഫിക്സിന് വായിക്കാനും മനസ്സിലാക്കാനും കഴിഞ്ഞില്ല. എന്നിരുന്നാലും, എല്ലാ കാര്യങ്ങളും ശരിയായി പ്രവർത്തിച്ചു, കാരണം പരിഹാരങ്ങൾ എളുപ്പത്തിൽ പരിശോധിക്കാൻ കഴിഞ്ഞു. നെഫ്ഫിക്സിനെ കമ്പ്യൂട്ടർ കണക്കുകൂട്ടിയ നിലവാരമുള്ള മാനദണ്ഡങ്ങൾ ഉപയോഗിച്ച് മുൻകൂട്ടി നിശ്ചയിച്ചിട്ടുള്ള മെട്രിക് ഉപയോഗിച്ച് റേഡിയോ കണക്കുകൾ താരതമ്യപ്പെടുത്താൻ കഴിയും. (ഉപയോഗിച്ച മെട്രിക്ക് ശരാശരി സ്ക്വയർ ചെയ്ത തെറ്റുകൾ). എല്ലാവർക്കുമുള്ള പരിഹാരങ്ങൾ നേടുന്നതിന് നെറ്റ്ഫ്ലിക്സിനെ സഹായിക്കുന്ന പരിഹാരങ്ങളെ പെട്ടെന്ന് മൂല്യനിർണ്ണയം ചെയ്യുന്നതിനുള്ള കഴിവാണ് അത്. കാരണം, ചില ആശയവിനിമയങ്ങളിൽ നിന്ന് നല്ല ആശയങ്ങൾ വന്നതാണ് കാരണം. യഥാർത്ഥത്തിൽ, മുൻകൂർ അനുഭവം സിനിമ (Bell, Koren, and Volinsky 2010) സംവിധാനം (Bell, Koren, and Volinsky 2010) നിർമിച്ച മൂന്നു ഗവേഷകരുടെ സംഘം വിജയികളായ പരിഹാരം സമർപ്പിച്ചു.
നെറ്റ്ഫ്ലിക്സ് സമ്മാനം ഒരു മനോഹരമായ വശം അത് പരിഹരിച്ച എല്ലാ നിർദ്ദിഷ്ട പരിഹാരങ്ങൾ പ്രാപ്തമാക്കി എന്നതാണ്. അതായത്, അവരുടെ പ്രവചിച്ച റേറ്റിംഗുകൾ അപ്ലോഡുചെയ്തപ്പോൾ, അവരുടെ അക്കാദമിക് ക്രെഡൻഷ്യലുകൾ, അവരുടെ പ്രായം, റേസിംഗ്, ലിംഗഭേദം, ലൈംഗിക ആഭിമുഖ്യം അല്ലെങ്കിൽ എന്തിനെയെങ്കിലും അവർ അപ്ലോഡ് ചെയ്യേണ്ടതില്ല. സ്റ്റാൻഫോർഡിൽ നിന്നുള്ള ഒരു പ്രശസ്ത പ്രൊഫസറുടെ പ്രവചനങ്ങൾ കൃത്യമായി കണക്കാക്കപ്പെട്ടിരുന്നു. നിർഭാഗ്യവശാൽ, മിക്ക സോഷ്യൽ ഗവേഷണങ്ങളിലും ഇത് സത്യമല്ല. അതായത്, മിക്ക സോഷ്യൽ ഗവേഷണങ്ങളിലും വിലയിരുത്തൽ വളരെ സമയം ചെലവഴിക്കുന്നതും ഭാഗികമായി ഉൾവത്കരിക്കപ്പെടുന്നതുമാണ്. അതിനാൽ, മിക്ക ഗവേഷണ ആശയങ്ങളും ഗൌരവമായി വിലയിരുത്തപ്പെടാത്തവയാണ്, ആശയങ്ങൾ വിലയിരുത്തുമ്പോൾ, ആശയങ്ങളുടെ സ്രഷ്ടാവിൽ നിന്ന് ആ മൂല്യനിർണ്ണയത്തെ മറികടക്കാൻ പ്രയാസമാണ്. മറ്റൊരു വശത്ത് കോൾ പ്രോജക്റ്റുകൾക്ക് എളുപ്പവും ലളിതവുമായ വിലയിരുത്തൽ ഉണ്ട്, അതിനാൽ അവർ മറച്ചുവെച്ച ആശയങ്ങൾ കണ്ടെത്താൻ കഴിയും.
ഉദാഹരണത്തിന്, നെറ്റ്ഫ്ലിക്സ് പ്രൈസ് സമയത്ത് ഒരു ഘട്ടത്തിൽ, സൈമൺ ഫുങ്ക് എന്ന സ്ക്രീൻഷോയിൽ ഒരാൾ ഒരു ബ്ലോഗിൽ ഒരു സിംഗിൾ മൂല്യ വികാസത്തെ അടിസ്ഥാനമാക്കിയുള്ള ഒരു പരിഹാരമാണ് അവതരിപ്പിച്ചത്, ലീനിയർ ബീജഗണിതമായ ഒരു സമീപനം മറ്റ് പങ്കാളികളിൽ മുമ്പ് ഉപയോഗിക്കാതിരുന്നതാണ്. ഫങ്ക് ബ്ലോഗ് പോസ്റ്റ് ഒരേ സമയം സാങ്കേതികമായും വിചിത്രപരമായും അനൌദ്യോഗികമായിരുന്നു. ഈ ബ്ലോഗ് പോസ്റ്റ് ഒരു നല്ല പരിഹാരത്തെ വിശദീകരിക്കുമോ, അതോ ഒരു സമയ മാലിന്യമാണോ? ഒരു തുറന്ന കോൾ പദ്ധതിയുടെ പുറത്ത്, പരിഹാരം ഗുരുതരമായ വിലയിരുത്തലുകളിൽ ഉൾപ്പെട്ടിരിക്കാൻ ഇടയില്ല. സൈമൺ ഫുങ്ക് മിടുക്കിൽ പ്രൊഫസർ ആയിരുന്നില്ല. അക്കാലത്ത്, ന്യൂസിലാന്റ് (Piatetsky 2007) ഒരു സോഫ്റ്റ് വെയർ ഡെവലപ്പർ ആയിരുന്നു. ഈ ആശയം Netflix ൽ ഒരു എഞ്ചിനീയർക്ക് അയച്ചുകൊടുത്താൽ, തീർച്ചയായും അത് തീർച്ചയായും വായിക്കപ്പെടുകയില്ലായിരുന്നു.
ഭാഗ്യവശാൽ, മൂല്യനിർണ്ണയ മാനദണ്ഡങ്ങൾ പ്രയോഗിക്കാൻ വളരെ എളുപ്പവും എളുപ്പവുമാണെന്നതിനാൽ, അദ്ദേഹത്തിന്റെ പ്രവചനങ്ങൾ വിലയിരുത്തുമ്പോൾ, അത് അദ്ദേഹത്തിന്റെ സമീപനം വളരെ ശക്തമാണെന്ന് വ്യക്തമായിരുന്നു: അദ്ദേഹം മത്സരത്തിൽ നാലാം സ്ഥാനത്തേക്ക് പിന്തള്ളപ്പെട്ടു, മറ്റ് ടീമുകൾ ഇതിനകം തന്നെ ഉണ്ടായിരുന്നു പ്രശ്നം മാസങ്ങളിൽ പ്രവർത്തിക്കുന്നു. ഒടുവിൽ, അദ്ദേഹത്തിന്റെ സമീപനത്തിന്റെ ഭാഗങ്ങൾ മിക്കവാറും എല്ലാ ഗുരുതരമായ എതിരാളികളാലും ഉപയോഗിച്ചു (Bell, Koren, and Volinsky 2010) .
സിംഫൺ ഫങ്ക് തന്റെ ബ്ലോഗിലൂടെ ഒരു രഹസ്യ കുറിപ്പ് എഴുതാൻ തീരുമാനിച്ചു. അത് രഹസ്യം സൂക്ഷിക്കുന്നതിനു പകരം, നെറ്റ്ഫ്ലിക്സ് പുരസ്കാരത്തിലെ പല പങ്കാളികളും മില്ലി-ഡോളർ സമ്മാനം കൊണ്ട് മാത്രം പ്രേരിതമായിരുന്നില്ല. മറിച്ച്, നിരവധി പരിപാടികൾ, ബുദ്ധിമുട്ടുള്ള വെല്ലുവിളി നേരിട്ടതും സമൂഹം (Thompson 2008) വികസിച്ചുവന്നതും, പല ഗവേഷകർക്കും മനസിലാക്കാൻ കഴിയുമെന്ന് തോന്നുന്ന വികാരങ്ങൾ പോലും അനുഭവിക്കുന്നതായി തോന്നി.
നെറ്റ്ഫ്ലിക്സ് പ്രൈസ് ഒരു ഓപ്പൺ കോളിന്റെ ക്ലാസിക് ഉദാഹരണമാണ്. നെറ്റ്ഫ്ലിക്സിന് ഒരു പ്രത്യേക ലക്ഷ്യം (സിനിമ റേറ്റിംഗ് പ്രവചിക്കുന്നു), ധാരാളം ആളുകളിൽ നിന്നുള്ള അഭ്യർത്ഥനകളാണ് ഉള്ളത്. നെറ്റ്ഫ്ലിക്സിന് ഈ എല്ലാ പരിഹാരങ്ങളും വിലയിരുത്താൻ കഴിഞ്ഞു, കാരണം അവർ സൃഷ്ടിക്കുന്നതിനേക്കാളും കൂടുതൽ എളുപ്പത്തിൽ പരിശോധിക്കാൻ കഴിഞ്ഞു. അടുത്തത്, ബയോളജിയിലും നിയമത്തിലും ഒരു ദശലക്ഷം ഡോളർ സമ്മാനം ഇല്ലാത്തത് എങ്ങനെ ഉപയോഗിക്കാമെന്ന് ഞാൻ കാണിച്ചുതരാം.