Tbassir tal-futur huwa diffiċli, iżda tbassir tal-preżenti huwa aktar faċli.
It-tieni riċerkaturi prinċipali ta 'l-istrateġija jistgħu jużaw id-data ta' l-osservazzjoni hija tbassir . It-tbassir dwar il-ġejjieni mhuwiex diffiċli ħafna, u forsi għal din ir-raġuni, il-previżjoni mhijiex parti kbira mir-riċerka soċjali (għalkemm hija parti żgħira u importanti tad-demografija, l-ekonomija, l-epidemjoloġija u x-xjenza politika). Hawnhekk, madankollu, nixtieq niffoka fuq tip speċjali ta 'tbassir imsejjaħ nowcasting - terminu li ġej minn taħlita ta' "issa" u "tbassir." Minflok tbassir tal-ġejjieni, attentati issa qed jippruvaw jużaw ideat minn tbassir biex ikejlu l-istat attwali tad-dinja; hija tipprova "tbassar il-preżent" (Choi and Varian 2012) . Nowcasting għandu l-potenzjal li jkun partikolarment utli għall-gvernijiet u l-kumpaniji li jeħtieġu miżuri f'waqthom u eżatti tad-dinja.
Sostenn wieħed fejn il-ħtieġa għal kejl preċiż u f'waqtu hija ċara ħafna hija l-epidemjoloġija. Ikkunsidra l-każ ta 'l-influwenza ("l-influwenza"). Kull sena, l-epidemiji ta 'l-influwenza staġjonali jikkawżaw miljuni ta' mard u mijiet ta 'eluf ta' mwiet madwar id-dinja. Barra minn hekk, kull sena, hemm il-possibbiltà li tista 'toħroġ forma ġdida ta' influwenza li tista 'toqtol miljuni. It-tifqigħa ta 'l-influwenza ta' l-1918, per eżempju, hija stmata li qatlet bejn 50 u 100 miljun ruħ (Morens and Fauci 2007) . Minħabba l-ħtieġa li jiġu ssorveljati u li potenzjalment jirrispondu għat-tifqigħat ta 'l-influwenza, il-gvernijiet madwar id-dinja ħolqu sistemi ta' sorveljanza ta 'l-influwenza. Pereżempju, iċ-Ċentri tal-Istati Uniti għall-Kontroll u l-Prevenzjoni tal-Mard (CDC) regolarment u b'mod sistematiku jiġbru informazzjoni minn tobba magħżula bir-reqqa madwar il-pajjiż. Għalkemm din is-sistema tipproduċi dejta ta 'kwalità għolja, għandha dewmien ta' rappurtar. Jiġifieri, minħabba ż-żmien li tieħu biex id-dejta li tasal mit-tobba titnaddaf, tiġi pproċessata u ppubblikata, is-sistema CDC tirrilaxxa stimi ta 'kemm influwenza kien hemm ġimgħatejn ilu. Iżda, meta timmaniġġja epidemija emerġenti, l-uffiċjali tas-saħħa pubblika ma jridux ikunu jafu kemm influwenza kien hemm ġimgħatejn ilu; iridu jkunu jafu kemm hemm influwenza issa.
Fl-istess ħin li s-CDC qed jiġbor dejta biex issegwi l-influwenza, Google qed jiġbor ukoll id-dejta dwar il-prevalenza tal-influwenza, għalkemm f'forma pjuttost differenti. Nies minn madwar id-dinja kontinwament qed jibagħtu mistoqsijiet lil Google, u xi wħud minn dawn il-mistoqsijiet - bħal "rimedji tal-influwenza" u "sintomi tal-influwenza" - jindikaw li l-persuna li tagħmel il-mistoqsija għandha l-influwenza. Iżda, billi tuża dawn il-mistoqsijiet ta 'tiftix biex tevalwa l-prevalenza ta' l-influwenza hija delikata: mhux kulħadd li għandu l-influwenza jagħmel tiftixa relatata ma 'l-influwenza, u mhux kull tiftixa relatata ma' l-influwenza hija minn xi ħadd li għandu l-influwenza.
Jeremy Ginsberg u tim ta 'kollegi (2009) , uħud fil-Google u xi wħud f'CDC, kellhom l-idea importanti u għaqlija li jgħaqqdu dawn iż-żewġ sorsi tad-dejta. Bejn wieħed u ieħor, permezz ta 'tip ta' alchemy statistiku, ir-riċerkaturi kkombinaw id-dejta tat-tfittxija rapida u mhux preċiża bid-dejta kajmana u preċiża tas-CDC sabiex jipproduċu kejl mgħaġġel u preċiż tal-prevalenza tal-influwenza. Mod ieħor biex wieħed jaħseb dwarha hu li użaw id-dejta tat-tiftix biex iħaffu d-data CDC.
B'mod aktar speċifiku, bl-użu ta 'data mill-2003 sa l-2007, Ginsberg u l-kollegi stmaw ir-relazzjoni bejn il-prevalenza ta' l-influwenza fid-data CDC u l-volum tat-tfittxija għal 50 miljun terminu distinti. Minn dan il-proċess, li kien kompletament immexxi mid-dejta u ma kienx jeħtieġ għarfien mediku speċjalizzat, ir-riċerkaturi sabu sett ta '45 mistoqsija differenti li dehru li kienu l-iktar prevedibbli tad-dejta tal-prevalenza ta' l-influwenza CDC. Imbagħad, bl-użu tar-relazzjonijiet li tgħallmu mid-data 2003-2007, Ginsberg u l-kollegi ttestjaw il-mudell tagħhom matul l-istaġun ta 'influwenza 2007-2008. Huma sabu li l-proċeduri tagħhom jistgħu tabilħaqq jagħmlu todaycasts utli u preċiżi (figura 2.6). Dawn ir-riżultati ġew ippubblikati fin- Natura u ngħataw kopertura tal-istampa adoring. Dan il-proġett, li kien imsejjaħ Google Flu Trends, sar parabella ripetuta ta 'spiss dwar il-poter ta' dejta kbira biex tinbidel id-dinja.
Madankollu, din l-istorja ta 'suċċess apparenti eventwalment inbidlet għal imbarazzament. Maż-żmien, ir-riċerkaturi skoprew żewġ limitazzjonijiet importanti li jagħmlu Google Flu Trends inqas impressjonanti milli fil-bidu deher. L-ewwelnett, il-prestazzjoni ta 'Google Flu Trends kienet attwalment mhux ħafna aħjar minn dik ta' mudell sempliċi li jistma l-ammont ta 'influwenza bbażat fuq estrapolazzjoni lineari miż-żewġ kejl l-aktar reċenti ta' prevalenza ta 'influwenza (Goel et al. 2010) . U, fuq xi perjodi ta 'żmien, Google Flu Trends kienet tassew agħar minn dan l-approċċ sempliċi (Lazer et al. 2014) . Fi kliem ieħor, Google Flu Trends bid-dejta kollha tagħha, it-tagħlim tal-magni u l-komputazzjoni qawwija ma qabżux b'mod drammatiku eteroġenu sempliċi u aktar faċli biex jinftiehem. Dan jissuġġerixxi li meta tiġi evalwata kwalunkwe tbassir jew issa, huwa importanti li wieħed iqabbel mal-linja bażi.
It-tieni twegiba importanti dwar Google Flu Trends hija li l-kapaċità tagħha li tbassar id-dejta dwar l-influwenza CDC kienet suxxettibbli għal falliment fuq medda qasira ta 'żmien u t-taħsir fit-tul minħabba t-tifrix u l- konfużjoni algoritmika . Per eżempju, matul it-tifqigħa tal-influwenza tal-Ħnieżer 2009 Google Flu Trends estimament stmat iżżejjed l-ammont ta 'influwenza, probabbilment minħabba li n-nies għandhom it-tendenza li jibdlu l-imġieba tagħhom fit-tiftix bi tweġiba għal biża mifruxa ta' pandemija globali (Cook et al. 2011; Olson et al. 2013) . Minbarra dawn il-problemi fuq medda qasira ta 'żmien, il-prestazzjoni ddeterjorat b'mod gradwali matul iż-żmien. Id-dijanjosi tar-raġunijiet għal din it-taħsir fit-tul huma diffiċli minħabba li l-algoritmi ta 'tfittxija ta' Google huma proprjetarji, iżda jidher li fl-2011 Google bdiet tissuġġerixxi termini ta 'tfittxija relatati meta n-nies ifittxu sintomi ta' influwenza bħal "deni" u "sogħla" din il-karatteristika m'għadhiex attiva). Iż-żieda ta 'din il-karatteristika hija ħaġa totalment raġjonevoli li tagħmel jekk inti tmexxi magna ta' riċerka, iżda din il-bidla algoritmika kellha l-effett li tiġġenera aktar tiftix relatat mas-saħħa li kkawża li Google Flu Trends jevalwa l-prevalenza tal-influwenza (Lazer et al. 2014) .
Dawn iż-żewġ twissijiet jikkumplikaw sforzi futuri ta 'issa, iżda dawn ma jaħarquhomx. Fil-fatt, billi tuża metodi aktar bir-reqqa, Lazer et al. (2014) u Yang, Santillana, and Kou (2015) setgħu jevitaw dawn iż-żewġ problemi. Naħseb li studji li għadhom għaddejjin li jgħaqqdu sorsi kbar ta 'data ma' data miġbura mir-riċerkatur se jippermettu lill-kumpaniji u lill-gvernijiet biex joħolqu estimi aktar f'waqthom u preċiżi billi essenzjalment iħaffu kull kejl li jsir ripetutament matul iż-żmien b'xi dewmien. Proġetti li għadhom għaddejjin bħall-Google Flu Trends juru wkoll x'jista 'jiġri jekk sorsi ta' data kbar jingħaqdu ma 'data aktar tradizzjonali li nħolqot għall-finijiet ta' riċerka. Meta wieħed jaħseb fuq l-analoġija ta 'l-arti tal-kapitolu 1, issa t-tixrid għandu l-potenzjal li jikkombina readymades stil ta' Duchamp ma 'strutturi ta' stil Michelangelo sabiex jipprovdi lil dawk li jieħdu d-deċiżjonijiet b'ħeffa aktar preċiża u f'waqtha tal-preżent u tbassir tal-futur qarib.