Գուշակում ապագան դժվար է, բայց գուշակում ներկան ավելի հեշտ է.
Երկրորդ հիմնական ռազմավարության հետազոտողները կարող են օգտագործել դիտողական տվյալների կանխատեսումը : Ապագայի մասին կանխատեսումների կատարումը դժվար է, եւ թերեւս այդ պատճառով, կանխատեսումը ներկայումս սոցիալական հետազոտության մեծ մաս չէ (թեեւ դա ժողովրդագրության, տնտեսագիտության, էպիդեմիոլոգիայի եւ քաղաքական գիտության փոքր եւ կարեւոր մաս է): Այստեղ, սակայն, ես կցանկանայի կենտրոնանալ այնպիսի հատուկ կանխատեսման վրա , որն այժմ կոչվում է «ժամանակ» եւ «կանխատեսում»: Սա նշանակում է, որ ապագան կանխատեսելու փոխարեն, ներկա իրավիճակը չափելու կանխատեսումներից գաղափարներ օգտագործելու փորձեր են արվում: աշխարհի; այն փորձում է «կանխատեսել ներկայիս» (Choi and Varian 2012) : Nowcasting- ը ներուժ ունի հատկապես օգտակար կառավարությունների եւ ընկերությունների համար, որոնք պահանջում են ժամանակին եւ ճշգրիտ միջոցներ աշխարհին:
Մի վայր, որտեղ ժամանակին եւ ճշգրիտ չափման անհրաժեշտությունը շատ հստակ է epidemiology. Դիտարկենք գրիպի («գրիպի») դեպքը: Ամեն տարի սեզոնային գրիպի համաճարակները ամբողջ աշխարհում միլիոնավոր հիվանդություններ եւ հարյուր հազարավոր մահվան պատճառ են դառնում: Բացի այդ, յուրաքանչյուր տարի հնարավոր է, որ գրիպի վեպի ձեւը կարող է առաջանալ, որը կվնասեր միլիոնավոր մարդկանց: 1918 թ. Գրիպի տարածվածությունը, օրինակ, գնահատվում է 50-100 միլիոն մարդկանց միջեւ (Morens and Fauci 2007) : Անհրաժեշտության դեպքում, գրիպի բռնկումների կանխարգելման եւ պոտենցիալ արձագանքման անհրաժեշտության պատճառով ամբողջ աշխարհում կառավարությունները ստեղծել են գրիպի հսկողության համակարգեր: Օրինակ, ԱՄՆ-ի Հիվանդությունների վերահսկման եւ կանխարգելման կենտրոնները (CDC) պարբերաբար եւ պարբերաբար տեղեկատվություն են հավաքում հանրապետության ուշադիր ընտրված բժիշկներից: Թեեւ այս համակարգը արտադրում է բարձրորակ տվյալներ, այն ունի հաշվետվություն: Այսինքն, բժիշկների կողմից մաքրվելու, մշակման եւ հրատարակման համար պահանջվող ժամանակի պատճառով CDC համակարգը հրապարակել է երկու շաբաթ առաջ գրիպի գրիպի գնահատականները: Սակայն, երբ առաջանում է համաճարակ, հանրային առողջապահության պաշտոնյաները չեն ուզում իմանալ, թե որքանով է գրիպը երկու շաբաթ առաջ: նրանք ուզում են իմանալ, թե որքանով է այնտեղ առկա գրիպը:
Միեւնույն ժամանակ, CDC- ն հավաքում է տվյալներ գրպանում հետեւելու համար, Google- ը նաեւ հավաքում է գրիպի տարածման մասին տվյալներ, թեեւ բոլորովին այլ ձեւով: Աշխարհում մարդիկ անընդհատ հարցումներ են ուղարկում Google- ին, եւ այդ հարցումներից ոմանք, օրինակ `« գրիպի դեմ միջոցներ »եւ« գրիպի ախտանշանները », ամենաբարձրն են, որ հարցումը կատարող անձը գրիպ ունի: Սակայն, օգտագործելով այս որոնման հարցումները, կանխատեսելու գրիպի տարածվածությունը խրթին է. Ոչ բոլորը, ովքեր գրիպ ունեն, գրիպի հետ կապված որոնումներ են կատարում, եւ ոչ թե գրիպի հետ կապված ցանկացած հետազոտություն է, ով գրիպ ունի:
Ջերեմի Գինսբերգը եւ գործընկերների խումբը (2009) , Ոմանք Google- ում եւ ոմանք CDC- ում, ունեցել են կարեւոր եւ խելացի գաղափար, համատեղելու այս երկու տվյալների աղբյուրները: Կոպիտ, մի տեսակ վիճակագրական ալիքի միջոցով, հետազոտողները արագ եւ անճշգրտ որոնման տվյալները համադրեցին դանդաղ եւ ճշգրիտ CDC- ի տվյալների հետ `գրիպի տարածման արագ եւ ճշգրիտ չափումներ կատարելու համար: Այս մասին մտածելու եւս մեկ եղանակն այն է, որ նրանք օգտագործում են որոնման տվյալները `արագացնելու CDC- ի տվյալները:
Ավելի կոնկրետ, օգտագործելով 2003-2007 թվականների տվյալները, Գինսբերգը եւ գործընկերները գնահատել են CDC- ի տվյալների գրիպի տարածվածության եւ 50 մլն տարբեր տերմինների որոնման ծավալների միջեւ հարաբերությունները: Այս գործընթացից, որը լիովին տվյալների վրա հիմնված էր եւ չի պահանջում մասնագիտացված բժշկական գիտելիքներ, հետազոտողները հայտնաբերել են 45 տարբեր հարցումների շարք, որոնք կարծես թե ամենից շատ կանխատեսելի են CDC գրիպի տարածման տվյալները: Այնուհետեւ, օգտագործելով հարաբերությունները, որոնք նրանք սովորեցին 2003-2007 թվականներից, Գինսբերգը եւ գործընկերները 2007-2008թթ. Գրիպի շրջանում փորձեցին իրենց մոդելը: Նրանք պարզեցին, որ իրենց ընթացակարգերը կարող են իսկապես օգտակար եւ ճշգրիտ կատարվել (figure 2.6): Այս արդյունքները հրապարակվել են Բնության մեջ եւ ստացել են մամուլում հովանավորություն: Այս ծրագիրը, որը կոչվում էր «Google Flu Trends», դարձավ աշխարհը փոխելու մեծ տվյալների ուժի մասին հաճախակի կրկնվող առակ:
Այնուամենայնիվ, այս ակնհայտ հաջողության պատմությունը, ի վերջո, դարձավ խայտառակություն: Ժամանակի ընթացքում հետազոտողները հայտնաբերել են երկու կարեւոր սահմանափակումներ, որոնք Google Flu Trends- ը ավելի տպավորիչ են դարձնում, քան նախապես հայտնվելը: Նախ, Google Flu Trends- ի կատարումը, փաստորեն, ոչ այնքան լավն էր, որքան պարզ մոդելը, որը գնահատեց գրիպի գրիպի վրա (Goel et al. 2010) տարածվածության վերջին երկու չափումներից գծային արտահոսքի հիման վրա (Goel et al. 2010) : Եվ որոշ ժամանակահատվածներում Google Flu Trends- ը իրականում ավելի վատ էր, քան այս պարզ մոտեցումը (Lazer et al. 2014) : Այլ խոսքերով, Google- ի Flu Trends- ը, իր բոլոր տվյալները, մեքենայական ուսումը եւ հզոր համակարգիչները, կտրուկ գերազանցում էին պարզ եւ հեշտ հասկանալի էվոլիստական: Սա ենթադրում է, որ ցանկացած կանխատեսում կամ ներկայումս գնահատելիս կարեւոր է համեմատել բազային գծի հետ:
Google- ի Flu Trends- ի վերաբերյալ երկրորդ կարեւոր նախազգուշացումը այն է, որ CDC- ի գրիպի կանխատեսումը կանխորոշելու ունակությունը կարճաժամկետ ձախողման եւ երկարատեւ քայքայման հետեւանք է, քանի որ կախված եւ ալգորիթմային խառնաշփոթից : Օրինակ, 2009 թ. Խոզագրիպի շրջանում Google Flu Trends- ը զգալիորեն գերագնահատեց գրիպի քանակությունը, հավանաբար այն պատճառով, որ մարդիկ հակված են փոխել իրենց որոնողական վարքը `ի պատասխան համաշխարհային պանդեմիայի տարածված վախի (Cook et al. 2011; Olson et al. 2013) . Բացի այս կարճաժամկետ խնդիրներից, կատարումը ժամանակի ընթացքում աստիճանաբար քայքայվել է: Այս երկարատեւ անկման պատճառները ախտորոշելը դժվար է, քանի որ Google- ի որոնման ալգորիթմները գույքային են, բայց պարզվում է, որ 2011 թվականին Google- ը սկսեց առաջարկել համապատասխան որոնման պայմաններ, երբ մարդիկ «ջերմություն» եւ «հազ» գրիպի ախտանիշներ են փնտրում (տես նաեւ այս հատկությունը այլեւս ակտիվ չէ): Այս առանձնահատկությունն ընդգրկելը լիովին ողջամիտ է, եթե դուք աշխատում եք որոնման համակարգում, սակայն այս ալգորիթմական փոփոխությունը ազդեցություն է ունեցել առողջության հետ կապված որոնումների վրա, որոնք առաջացրել են Google Flu Trends- ը գերագնահատելու գրիպի տարածվածությունը (Lazer et al. 2014) :
Այս երկու խոչընդոտները բարդացնում են ապագայի ջանքերը, սակայն դրանք չեն տուժի: Փաստորեն, ավելի զգույշ եղանակներով օգտագործելով, Lazer et al. (2014) Եւ Yang, Santillana, and Kou (2015) կարողացան խուսափել այս երկու խնդիրներից: Առաջ գալով, ես ակնկալում եմ, որ հետազոտական ուսումնասիրությունները, որոնք միավորում են մեծ տվյալների աղբյուրները հետազոտող հավաքագրված տվյալների հետ, հնարավորություն կտան ընկերություններին եւ կառավարություններին ավելի ժամանակական եւ ավելի ճշգրիտ գնահատականներ ստեղծել, ըստ էության, արագացնելով ցանկացած չափման, որը ժամանակի ընթացքում կրկնվում է որոշակի ուշացումով: Ներկայիս ծրագրերը, ինչպիսիք են «Google Flu Trends» - ը, ցույց են տալիս, թե ինչ կարող է տեղի ունենալ, եթե մեծ տվյալների աղբյուրները համադրվեն ավելի ավանդական տվյալների հետ, որոնք ստեղծվել են հետազոտության նպատակներով: Մտածելով 1-ին գլուխ գեղարվեստական նմանատիպ մտածողության հետ, ներկայումս ունի դյույբալուի ոճով պատրաստված պատրաստուկները միկելելելելոյի ոճով պահվածների հետ միասին ներգրավելու հնարավորություն, որոշումներ կայացնողներին ներկայացնել ավելի մոտ ժամանակներում եւ ավելի ճշգրիտ չափումներ `ներկա եւ մոտ ապագայի կանխատեսումներով: