Tbassir tal-futur huwa diffiċli, iżda tbassir tal-preżenti huwa aktar faċli.
It-tieni istrateġija ewlenija użata mir-riċerkaturi ma data ta 'osservazzjoni qed tbassar. Tbassir tal-futur huwa notorjament diffiċli, iżda jista 'jkun oerhört importanti għal dawk li jfasslu d-deċiżjonijiet, kemm jekk jaħdmu f'kumpaniji jew gvernijiet.
Kleinberg et al. (2015) toffri żewġ stejjer li jiċċaraw l-importanza ta 'tbassir għal ċerti problemi ta' politika. Immaġina policy maker waħda, jien ser sejħa Anna tagħha, li qed tiffaċċja nixfa u għandhom jiddeċiedu jekk li tikri shaman biex jagħmlu żfin xita biex jiżdied iċ-ċans ta 'xita. maker Ieħor politika, jien ser jsejjaħħlu Bob, għandu jiddeċiedi jekk għandux jieħu umbrella biex jaħdmu biex tevita li jkollok imxarrab fuq il-mod dar. Kemm Anna u Bob tista 'tagħmel deċiżjoni aħjar jekk dawn jifhmu temp, iżda dawn jeħtieġu li jkunu jafu affarijiet differenti. Anna jeħtieġ li jifhmu jekk il-żfin xita kawżi xita. Bob, min-naħa l-oħra, ma teħtieġx li wieħed jifhem xejn dwar kawżalità; hu biss jeħtieġ previżjoni preċiża. Riċerkaturi Soċjali spiss jiffukaw fuq dak Kleinberg et al. (2015) sejħa "xita żfin simili" problemi-dawk politika li jiffokaw fuq kawżalità-u jinjora l-problemi ta 'politika "-umbrella bħal" li huma ffukati fuq tbassir.
Nixtieq li tiffoka, madankollu, fuq tip speċjali ta 'tbassir msejħa tbassir immedjat -a terminu derivat milli jikkombinaw "issa" u "tbassir." Pjuttost milli tbassir tal-futur immedjati, nowcasting tentattivi biex wieħed ibassar il-preżent (Choi and Varian 2012) . Fi kliem ieħor immedjati, nowcasting juża metodi tat-tbassir għall-problemi ta 'kejl. Bħala tali, din għandha tkun partikolarment utli għall-gvernijiet li jeħtieġu miżuri f'waqthom u preċiżi dwar pajjiżhom. Tbassir immedjat tista 'tiġi murija aktar ċar bl-eżempju ta' Google Flu Xejriet.
Immaġina li inti tħossok daqsxejn taħt il-temp hekk inti tip "rimedji influwenza" fis-search engine, jirċievu paġna ta 'links bi tweġiba, u mbagħad segwi wieħed minnhom biex webpage utli. Issa immaġina din l-attività li kellha barra mill-perspettiva tal-search engine. Kull mument, miljuni ta 'mistoqsijiet huma jaslu minn madwar id-dinja, u dan il-fluss ta' 'mistoqsijiet dak Battelle (2006) talbet l-"database ta' l-intenzjonijiet" - jipprovdi tieqa kontinwament aġġornata fil-kuxjenza globali kollettiva. Madankollu, tidwir dan il-fluss ta 'informazzjoni fi kejl tal-prevalenza tal-influwenza huwa diffiċli. Sempliċiment jingħaddu l-għadd ta 'mistoqsijiet għal "rimedji influwenza" ma jista' jaħdem tajjeb. Mhux kulħadd li għandu l-tfittxijiet influwenza għall rimedji influwenza u mhux kulħadd li searchers għall rimedji influwenza għandu l-influwenza.
Il-trick importanti u għaqlija wara Google Influwenza Xejriet kien li jduru problema kejl fis-problema tbassir. Il-Ċentri Istati Uniti għall-Kontroll tal-Mard u Prevenzjoni (CDC) għandu sistema ta 'monitoraġġ influwenza li tiġbor informazzjoni mill-tobba madwar il-pajjiż. Madankollu, problema waħda ma 'din is-sistema CDC hija li hemm nuqqas ta' rappurtar ta 'ġimgħatejn; il-ħin li jieħu għall-informazzjoni li jaslu minn tobba li jiġu mnaddfa, pproċessati, u ppubblikati. Iżda, meta tkun qed tittratta epedemija fil-bidu, l-uffiċċji tas-saħħa pubblika ma tridx tkun taf kif l-influwenza kemm kien hemm ġimgħatejn ilu; huma jridu jkunu jafu kif l-influwenza kemm hemm dritt issa. Fil-fatt, f'ħafna sorsi tradizzjonali oħra ta 'dejta soċjali, hemm lakuni bejn mewġ ta' ġbir ta 'data u intervalli ta' rappurtar. Ħafna sorsi ta 'data kbar, min-naħa l-oħra, huma dejjem fuq (Sezzjoni 2.3.1.2).
Għalhekk, Jeremy Ginsberg u l-kollegi (2009) ipprova li wieħed ibassar id-data influwenza CDC mid-data tat-tiftix Google. Dan huwa eżempju ta ' "tbassir tal-preżenti" għaliex ir-riċerkaturi kienu qegħdin jippruvaw biex jitkejjel kemm influwenza kemm issa hemm mill-tbassir dejta futura mill-CDC, id-data fil-futur li qed kejl tal-preżenti. Bl-użu tat-tagħlim magna, huma mfittxija permezz 50 miljun termini ta 'tiftix differenti biex tara liema huma l-aktar tbassir tad-dejta influwenza CDC. Fl-aħħarnett, huma sabu sett ta '45 mistoqsijiet differenti li dehru li huma l-aktar tbassir, u r-riżultati kienu pjuttost tajba: dawn jistgħu jużaw id-data tat-tiftix biex wieħed ibassar id-data CDC. Ibbażat parzjalment fuq id-dokument, li ġie ppubblikat fil-Natura, Google Flu Xejriet sar spiss ripetut storja ta 'suċċess dwar il-qawwa ta' data kbar.
Hemm żewġ caveats importanti għal dan is-suċċess apparenti, madankollu, u ftehim ta 'dawn caveats tgħinek tevalwa u tagħmel tbassir u tbassir immedjat. L-ewwel, il-prestazzjoni ta 'Google Flu Tendenzi kien attwalment mhux ħafna aħjar minn mudell sempliċi li tistma l-ammont ta' influwenza bbażata fuq estrapolazzjoni lineari mir-żewġ miżuri l-aktar reċenti tal-prevalenza influwenza (Goel et al. 2010) . U, fuq xi perjodi ta 'żmien Google Flu Xejriet kien attwalment agħar minn dan l-approċċ sempliċi (Lazer et al. 2014) . Fi kliem ieħor, Google Flu Xejriet bid-data kollha tagħha, it-tagħlim magna, u informatika qawwija ma drammatiku imorru aħjar minn sempliċi u eħfef biex jiftiehem heuristic. Dan jissuġġerixxi li meta tkun qed tevalwa kwalunkwe tbassir jew nowcast huwa importanti li tqabbel kontra linja ta 'bażi.
It-tieni twiddiba importanti dwar Google Flu Xejriet hija li l-kapaċità tagħha li wieħed ibassar id-data influwenza CDC kien suxxettibbli għal falliment għal żmien qasir u tmermir fit-tul minħabba l-drift u li jistgħu jfixklu algorithmic. Pereżempju, matul il-2009 tifqigħa Ħnieżer Flu Google Flu Xejriet drammatiku żżejjed stmat l-ammont ta 'l-influwenza, probabbilment għaliex in-nies għandhom tendenza li jibdlu l-imġiba tfittxija tagħhom bi tweġiba għall-biża mifruxa ta' pandemija globali (Cook et al. 2011; Olson et al. 2013) . Flimkien ma 'dawn il-problemi ta' terminu qasir, il-prestazzjoni gradwalment imħassra maż-żmien. Dijanjosi ir-raġunijiet għal din id-tħassir fit-tul huma diffiċli għaliex l-algoritmi tfittxija Google huma proprjetarji, iżda jidher li fl-2011 Google għamel bidliet li jissuġġerixxu termini ta 'tiftix relatati meta n-nies tfittxija għal sintomi bħal "deni" u "sogħla" (jidher ukoll li din il-karatteristika ma tkunx aktar attiva). Iż-żieda din il-karatteristika hija ħaġa totalment raġonevoli biex tagħmel jekk inti tmexxija ta 'negozju search engine, u kellha l-effett li jiġġenera aktar tfittxijiet relatati mas-saħħa. Dan kien probabbilment suċċess għan-negozju, iżda kkawża Google Influwenza Trends għall-prevalenza influwenza-istima fuq (Lazer et al. 2014) .
Fortunatament, dawn il-problemi bil-Google Flu Xejriet huma fixable. Fil-fatt, billi jintużaw metodi aktar bir-reqqa, Lazer et al. (2014) u Yang, Santillana, and Kou (2015) kienu kapaċi jiksbu riżultati aħjar. Miexi 'l quddiem, nistenna li l-istudji tbassir immedjat li jikkombinaw data kbar mal riċerkatur miġbura-data li jgħaqqdu Readymades Duchamp stil bil Michaelangelo stil Custommades-jħallu dawk li jfasslu l-politika biex jipproduċu kejl aktar malajr u aktar preċiż tal-preżent u t-tbassir tal-futur.