2.4.2 Forecasting û nowcasting

Encama pêşerojê de pir zehmet e, lê encama ku niha hêsantir e.

Stratejiya sereke ya duyem bi daneya observational bikaranîn ji aliyê lêkolînerên forecasting heye. Encama pêşerojê de dihatin zehmet e, lê dikare bibe ew qasî ji bo kadroyên girîng e, ka ew li şîrketên an hikûmetên kar.

Kleinberg et al. (2015) pêşkêş dike du çîrokên ku zelal li ser girîngiya forecasting ji bo pirsgirêkên siyaseta hin. Imagine yek siyaseta maker, ez ê Anna xwe, ku rû ye heyamekê û divê biryarê bide ka bi kirêkirina shaman to do a dance baranê ji bo zêdekirina derfeta ji baranê re dibêjin. Din siyaseta maker, ez ê gazî wî Bob, divê biryara xwe sivanek ji bo xebatê, ji bo ku diçe şil li ser rêya malê. Herdu Anna û Bob dikarin biryareke rastir bide. Eger ew fêm hewayê, di heman demê de divê zanibin tiştên cûda ne. Anna, divê bizane ka dance baranê de dibe sedema baranê. Bob, li aliyekî din jî, ne ji bo fahmkirina li ser sedemîtiyê hewce ne; ew çawa lazim an Weather rast peydake. Lêkolînerên civakî de gelek caran li ser tiştê ku bala Kleinberg et al. (2015) re dibêjin "baran dance-wek" siyaseta pirsgirêkên-ew kesên ku li ser hûr sedemîtiyê-û ji nedîtîve pirsgirêkên siyaseta "sîwana-like" ku li ser forecasting sekinîn.

Ez dixwazim ku bala xwe bide, lê belê, li ser cûreyeke taybet yên forecasting bi navê nowcasting -a term ji yekbûneke "niha" û Navdêr "forecasting." Li şûna ku encama pêşerojê de, nowcasting hewldanên ji bo pêşbînîkirin, ku niha (Choi and Varian 2012) . Bi gotineke din, nowcasting zimên rêbazên forecasting ji bo pirsgirêkên yên amerîkayê. Ji ber vê jî, divê bi taybetî jî ji bo hikûmetên ku pêwîstî bi tedbîrên di wextê xwe û rasteqîne li ser welatên wan dê kêrhatî be. Nowcasting dikare bê herî zelal bi mînaka Trends Flu Kêşanê nîşan dida.

Bifikirin ku hûn bi hest hinekî di bin hewayê da ku tu kes: "remedies Înfluenzeya" nav a search engine, a page of girêdan bistînin di bersiva, û paşê jî li pey yek ji wan ji bo malpera alîkar. Niha em xeyal vê çalakiya ku ji perspektîfa search engine de lîstin. Her gavê de, bi milyonan ji pirsên bi şebeqê ji seranserî cîhanê, û ev stream of pirsên-çi Battelle (2006) bi navê hatiye ew "heye ji niyeta" - lapereyek tim ewe nav hişmendiya kolektîv global pêşkêş dike. Lê belê, bi şûn de ev stream of information nav pîvanê, ji berfirebûna ji grîp zehmet e. Simply h'esab up hejmara nimran ji bo "remedies Înfluenzeya" bibe baş bixebitin ne. her kesî ne ku lêgerînê grîpê ji bo çareserîyên grîp û bi her kesê ku searchers ji bo çareserîyên Înfluenzeya grîp.

The trick girîng û bi qurnazî pişt Trends Flu Google bû ku vegerin a pirsgirêka pîvana nav a pirsgirêka forecasting. Navendên Amerîka ji bo Control û Pêşîlêgirtina Nexweşîya (CDC) heye an pergala şopandina grîpa ku agahî ji doktoran li seranserê welêt berhev dike. Lê belê, yek pirsgirêk bi vê sîstemê CDC e e a lag raporên du hefteya li wir; wê demê de wê ji bo welat de ji bijîşkan digire ji bo were paqijkirin, derskirin, û weşandin. Lê belê, dema ku hilgirtina epîdemîk holê, daireyên tendurustiyê naxwazin bi dizanin çiqas grîpê bû ku berî du hefteyan li wê derê; ew dixwazin bizanin ka çiqas grîpê ye a niha heye. Di rastiyê de, di gelek din çavkaniyên kevneşop ên data civakî, ne deman de di navbera pêlan ji berhevkirina daneyên û yekser piştî rapor hene. Gelek çavkaniyên daneyan mezin, li aliyekî din jî, her tim li ser-(Beþ 2.3.1.2).

Ji ber vê yekê, Jeremy Ginsberg û hevalên (2009) xwest ku pêşbînî li welat Înfluenzeya CDC ji welat Google search. Ev mînaka "encama vê" ji ber ku lêkolîneran hewl didin ji bo pîvandinê çiqas grîpê ye, niha ji aliyê encama daneya pêşerojê ji CDC'ê, welat pêşerojê ku pîvana ku niha li wir e. Bikaranîna fêrbûna machine, ew bi 50 milyon termên lêgerînê cuda lêgerînê de ji bo dîtina ku pêşdîtinê gelek daneyên Înfluenzeya CDC in. Di dawiyê de, ew dît û set ji 45 pirsên cuda cuda ku xuya bibe pêşdîtinê herî, û encamên pir baş bûn: ew nikaribû welat lêgerînê ya ku pêşbînî li ser daneyên CDC'ê bi kar tînin. Bingeha li beşek li ser vê rojnameyê, ku li Nature hate weşandin, Trends Flu Google an çîrokeke serkeftinê gelek caran dubare kir li ser hêza Daneyên mezin bû.

li wê derê du caveats girîng ji bo vê serkeftî, lê belê, û famkirina van caveats ê alîkarîya we dinirxînin û çi forecasting û nowcasting. Yekem, performansê ji Trends Flu Google di rastiyê de gelek çêtir modela sade ku texmîn dike ku miqdara Înfluenzeya li ser şibandinê bi dîmenan ji du pîvanan herî dawî ji berfirebûna persîvê ne bû (Goel et al. 2010) . Û, li ser hinek demên Google Trends Flu di rastiyê de xerabtir ji vê nêzîkatiya hêsan bû (Lazer et al. 2014) . Bi gotineke din, Trends Flu Google bi hemû daneyên xwe, fêrbûna machine, û computing bi hêz kir dramatîk outperform ne karekî sade û hêsan fêm heuristic. Ev pêşniyar dike ku dema ku nirxandin û ti Weather an nowcast girîng e to compare dijî binikî.

The Şiyarî duyem ya girîng li ser Trends Flu Google e ku kapasîteya wê ya ku pêşbînî li welat Înfluenzeya CDC janên têkçûna demeke kurt û rizîbûnê, demeke dirêj ji ber ku ji drift û çirr algorithmic bû. Ji bo nimûne, di dema 2009 sedemę Înfluenzeya Berazan a Trends Flu Google dramatîk li ser-texmînkirin ku miqdara grîpê, guman heye ji ber ku mirov ji bo biguhêrin, lêgerîna li bersiva tirs berfireh yên çinin global (Cook et al. 2011; Olson et al. 2013) . Li gel van pirsgirêkan demeke kurt de, performansa hêdî hêdî bi demê riziya. Destnîşankirina sedemên ji bo vê rizîbûnê, demeke dirêj in zehmet ji ber ku ji algorîtmayan Google search bixwedî in, lê wisa dixuye ku di sala 2011 de Google guhartinên ku dê termên lêgerînê related pêşniyar kirin dema ku mirov ji bo lêgerîna nîşaneyên wek "agir" û "kuxik" (ew jî xuya ku vê funksîyonê e êdî çalak). Zêdekirin vê funksîyonê tiştekî bi temamî maqûl to do, eger tu bi bez bi bazirganiyê search engine e, û ew bandora bi afrandina searches related tenduristiyê zêdetir bû. Ev dibe serkeftineke ji bo bazirganiyê bû, lê ew ji ber Trends Flu Google li ser-texmîna berfirebûna persîvê (Lazer et al. 2014) .

Başe, van pirsgirêkan bi Trends Flu Google fixable in. Di rastiyê de, bi bikaranîna rêbazên baldartir, Lazer et al. (2014) û Yang, Santillana, and Kou (2015) , xwe bi encamên baştir bûn. Diçin bi pêş de, ez hêvî dikim ku xebatên nowcasting ku êlêmêntên Daneyên mezin bi lêkolîner welat-ku êlêmêntên Readymades Duchamp-style bi Michaelangelo-style Custommades-ê siyaseta çalak ji bo hilberîna zûtir zêdetir û rasteqîne û pîvandina ji niha û pêşdîtinên pêşerojê de hatin komkirin.