2.4.2 Pagpanagna ug nowcasting

Pagtagna sa umaabot lisod, apan pagtagna sa karon mao ang mas sayon.

Ang ikaduha nga nag-unang nga pamaagi nga gigamit sa mga tigdukiduki sa obserbar data ang pagtagna. Ang pagtagna sa umaabot gibantog lisud, apan kini mahimong mahinungdanon kaayo nga alang sa desisyon makers, kon sila pagtrabaho sa kompaniya o mga gobyerno.

Kleinberg et al. (2015) nagtanyag sa duha ka mga sugilanon nga sa pagpatin-aw sa kamahinungdanon sa forecasting alang sa pipila ka mga problema sa palisiya. Hunahunaa ang usa ka palisiya magbubuhat, ako motawag sa iyang Ana, nga mao ang nag-atubang sa usa ka hulaw ug kinahanglan mohukom kon suhol sa usa ka shaman sa pagbuhat sa usa ka ulan sayaw aron sa pagdugang sa higayon sa ulan. Laing palisiya magbubuhat, ako motawag kaniya nga Bob, kinahanglan modesisyon kon sa pagkuha sa usa ka payong sa pagtrabaho sa paglikay sa pagkuha basa sa dalan sa balay. Ang duha si Anna ug Bob makahimo sa usa ka mas maayo nga desisyon kon makasabut sila sa panahon, apan sila kinahanglan nga masayud sa lain-laing mga butang. Anna kinahanglan nga makasabut kon sa ulan sayaw hinungdan sa ulan. Bob, sa laing bahin, dili kinahanglan nga pagsabut sa bisan unsa nga butang mahitungod sa causality; siya nagkinahanglan lang sa usa ka tukma nga forecast. Social tigdukiduki sagad focus sa unsay Kleinberg et al. (2015) pagtawag "ulan sayaw-sama sa" mga problema-ang mga palisiya nga focus sa causality-ug dili magtagad sa mga problema sa palisiya "payong-sama sa" nga naka-focus sa forecasting.

Gusto ko sa pag-focus, Apan, sa usa ka espesyal nga matang sa pagpanagna sa gitawag nowcasting ka termino nga gikuha gikan sa paghiusa "karon" ug "forecasting." Imbes pagtagna sa umaabot, nowcasting pagsulay sa pagtagna sa karon (Choi and Varian 2012) . Sa laing mga pulong, nowcasting naggamit forecasting nga mga pamaagi sa mga problema sa pagsukod. Sa ingon, kini kinahanglan nga ilabi na mapuslanon sa mga gobyerno nga nagkinahanglan tukma sa panahon ug tukmang mga lakang sa ilang mga nasud. Nowcasting mahimong gihulagway nga labing tin-aw uban sa sa panig-ingnan sa Google trangkaso Trends.

Handurawa nga ikaw mibati nga ang usa ka gamay sa ilalum sa panahon mao nga type kaninyo "flu tambal" ngadto sa usa ka search engine, makadawat og usa ka pahina sa mga links sa tubag, ug dayon mosunod ang usa kanila ngadto sa usa ka makatabang nga webpage. Karon handurawa kini nga kalihokan nga nanaghoni gikan sa panglantaw sa sa search engine. Ang matag higayon, minilyon sa mga pangutana sa mga abot gikan sa tibuok kalibutan, ug kini nga sapa sa mga pangutana-unsa Battelle (2006) nga gitawag nga "database sa tuyo" - naghatag og usa ka kanunay updated bintana ngadto sa kolektibo global panimuot. Apan, milingi kini nga sapa sa impormasyon ngadto sa usa ka sukod sa sa pagkaylap sa mga flu lisud. Yanong pag-ihap sa gidaghanon sa mga pangutana alang sa "tambal flu" dili pagtrabaho pag-ayo. Dili ang tanan nga may mga pagpangita flu alang sa flu tambal ug dili ang tanan nga mga tigsiksik sa flu tambal adunay flu.

Ang importante ug tawong utokan lansis sa luyo sa Google flu Trends mao ang sa pagpabalik sa usa ka problema sukod ngadto sa usa ka problema sa pagpanagna. Ang US Centers for Disease Control ug Prevention (CDC) adunay usa ka trangkaso monitoring nga sistema nga mikolekta impormasyon gikan sa doktor sa tibuok nasud. Apan, ang usa ka problema sa niini nga CDC nga sistema mao ang adunay usa ka duha ka semana nga pagreport lag; sa panahon nga kini nagkinahanglan alang sa mga data pag-abot gikan sa mga doktor nga gilimpyohan, proseso, ug gipatik. Apan, sa dihang pagdumala sa usa ka pagpakita, paggutla epidemya, mga opisina sa panglawas sa publiko dili gusto nga masayud kon sa unsang paagi sa daghan nga influenza may duha ka semana na ang milabay; sila gusto nga masayud kon sa unsang paagi sa daghan nga influenza adunay karon. Sa pagkatinuod, sa daghang uban pang mga tradisyonal nga mga tinubdan sa sosyal nga mga data, adunay kal-ang tali balud sa koleksyon data ug sa pagreport sa lags. Labing dako nga tinubdan sa data, sa laing bahin, mao ang kanunay nga-sa (Seksyon 2.3.1.2).

Busa, Jeremy Ginsberg ug kaubanan (2009) misulay sa pagtagna sa mga data CDC flu gikan sa mga data sa Google search. Kini mao ang usa ka panig-ingnan sa "pagtagna sa karon" tungod kay ang mga tigdukiduki naningkamot sa pagsukod kon sa unsang paagi sa daghan nga flu adunay karon pinaagi sa pagtagna sa umaabot nga data gikan sa CDC, sa umaabot nga data nga pagsukod sa karon. Pinaagi sa paggamit sa makina sa pagkat-on, sila nangita pinaagi sa 50 ka milyon nga lain-laing mga termino search sa pagtan-aw nga mao ang labing matagnaong sa mga data CDC flu. Sa katapusan, hingkaplagan nila ang usa ka hugpong sa mga 45 ka lain-laing mga pangutana nga daw labing abanteng, ug ang mga resulta na maayo: sila makagamit sa mga data sa search sa pagtagna sa mga data sa CDC. Base sa bahin sa niini nga papel, nga gipatik sa Kinaiyahan, Google flu Trends nahimong usa ka kanunay nga gibalikbalik nga istorya kalampusan mahitungod sa gahum sa mga dagkong mga data.

Adunay duha ka importante nga caveats niining dayag nga kalamposan, bisan pa niana, ug ang pagsabut niini nga mga caveats makatabang kanimo sa pagtimbang-timbang ug sa pagbuhat sa forecasting ug nowcasting. Una, ang pasundayag sa Google flu Trends sa pagkatinuod dili daghan nga mas maayo pa kay sa usa ka yano nga modelo nga nagbanabana ang kantidad sa flu base sa usa ka linear extrapolation gikan sa duha ka labing bag-o nga sukod sa flu prevalence (Goel et al. 2010) . Ug, sa ibabaw sa pipila ka mga yugto sa panahon sa Google flu Trends sa pagkatinuod mas grabe pa kay sa niining yano nga pamaagi (Lazer et al. 2014) . Sa laing mga pulong, Google flu Trends uban sa tanan nga mga data niini, makina sa pagkat-on, ug ang gamhanan nga Computing wala mahinuklugong Nalabwan sa usa ka yano ug mas sayon ​​nga makasabut sa heuristic. Kini nagsugyot nga sa diha nga pagtimbang-timbang sa bisan unsa nga forecast o nowcast kini mao ang importante nga itandi batok sa usa ka baseline.

Ang ikaduha nga mahinungdanon nga caveat mahitungod sa Google flu Trends mao nga ang iyang abilidad sa pagtagna sa mga data CDC flu nga prone sa mubo-term kapakyasan ug long-term nga pagkadunot tungod sa maanod ug algorithmic pagsupak. Kay sa panig-ingnan, sa panahon sa 2009 Swine Flu outbreak Google flu Trends mahinuklugong sa-gibana-bana nga sa kantidad sa mga influenza, tingali tungod kay ang mga tawo tambong sa pag-usab sa ilang kinaiya search sa tubag sa kaylap nga kahadlok sa usa ka global nga tibuok-kalibotang epidemya (Cook et al. 2011; Olson et al. 2013) . Dugang pa niini nga mga short-term nga mga problema, ang performance sa hinay-hinay decayed sa panahon. Pagdayagnos sa mga rason alang niini nga taas nga termino pagkadunot lisod tungod kay ang mga algorithms search sa Google ang mga proprietary, apan kini makita nga sa 2011 Google naghimo mga kausaban nga mosugyot nga may kalabutan sa gipangita nga mga pulong sa diha nga sa pagpangita sa mga tawo alang sa mga mga simtoma sama sa "hilanat" ug "ubo" (kini usab daw nga kini nga bahin mao ang dili na aktibo). Dugang kini nga bahin mao ang usa ka hingpit nga makatarunganon nga butang nga buhaton kon ikaw nga nagdagan sa usa ka search engine sa negosyo, ug kini may epekto sa pagmugna sa dugang nga mga pagpangita sa panglawas nga may kalabutan. Kini mao tingali ang usa ka kalampusan alang sa negosyo, apan kini ang hinungdan sa Google flu Trends sa ibabaw sa-banabana flu prevalence (Lazer et al. 2014) .

Maayo na lang, kini nga mga problema sa Google flu Trends mga fixable. Sa pagkatinuod, sa paggamit sa mas mabinantayon mga pamaagi, Lazer et al. (2014) ug Yang, Santillana, and Kou (2015) makahimo sa pagkuha mas maayo nga mga resulta. Adto sa unahan, ako nga nga ang nowcasting mga pagtuon nga combine dagko nga impormasyon uban sa tigdukiduki nga nakolekta sa data-nga combine Duchamp-estilo Readymades uban sa Michaelangelo-estilo Custommades-makahimo policy makers sa pagmugna mas paspas ug mas tukmang sukod sa karon ug mga panagna sa umaabot.