2.4.2 આગાહી અને nowcasting

ભવિષ્યમાં આગાહી મુશ્કેલ છે, પરંતુ હાજર આગાહી સરળ છે.

બીજા મુખ્ય નિરીક્ષણ માહિતી સાથે સંશોધકો દ્વારા ઉપયોગમાં વ્યૂહરચના આગાહી છે. ભવિષ્યમાં આગાહી નામચીન મુશ્કેલ છે, પરંતુ તે નિર્ણય ઉત્પાદકો માટે અતિ મહત્વનું હોઈ શકે છે, શું તેઓ કંપનીઓ અથવા સરકારો કામ કરે છે.

Kleinberg et al. (2015) બે વાર્તાઓ છે કે ચોક્કસ નીતિ સમસ્યાઓ માટે આગાહી મહત્વ સ્પષ્ટ તક આપે છે. એક નીતિ નિર્માતા કલ્પના, હું તેના અન્ના, જે દુકાળ સામનો કરી રહી છે અને નક્કી કરવું જ પડશે એક શામન ભાડે કે શું વરસાદની શક્યતા વધારવા માટે વરસાદ ડાન્સ કરવા માટે કહી શકશો. અન્ય નીતિ નિર્માતા, હું તેને બોબ કહી શકશો, નક્કી કરવું જ પડશે એક છત્ર લેવાની છે કે કેમ તે જે રીતે ઘર પર ભીનું મેળવવામાં ટાળવા માટે કામ કરવા માટે. જો તેઓ હવામાન સમજી બંને અન્ના અને બોબ એક સારી નિર્ણય કરી શકો છો, પરંતુ તેઓ અલગ અલગ વસ્તુઓ જાણવાની જરૂર છે. અન્ના સમજવા માટે વરસાદ ડાન્સ વરસાદ માટેનું કારણ બને છે કે કેમ જરૂર છે. બોબ, પ્રશ્નની બીજી બાજુએ, કાર્યકારણ વિશે કશું સમજવા માટે જરૂર નથી; તે માત્ર એક ચોક્કસ આગાહી કરવાની જરૂર છે. સામાજિક સંશોધકો વારંવાર શું પર ધ્યાન કેન્દ્રિત Kleinberg et al. (2015) "વરસાદ ડાન્સ જેવા" નીતિ સમસ્યાઓ-તે કે કાર્યકારણ પર ધ્યાન કેન્દ્રિત કે આગાહી પર ધ્યાન કેન્દ્રિત કર્યું છે "છત્ર જેવા" નીતિ સમસ્યાઓ અવગણો પર ફોન કરો.

હું હાજર આગાહી પ્રયાસો nowcasting, ધ્યાન કેન્દ્રિત કરવા માટે, જો કે, આગાહી કહેવાય nowcasting એક ખાસ પ્રકારની -A શબ્દ સંયોજન "હવે" અને માંથી તારવેલી પર માંગો છો "આગાહી." ભવિષ્યમાં આગાહી બદલે (Choi and Varian 2012) . અન્ય શબ્દોમાં, nowcasting માપ સમસ્યાઓ માટે આગાહી પદ્ધતિઓ વાપરે છે. જેમ કે, તે ખાસ કરીને સરકારો જે તેમના દેશોમાં વિશે સમયસર અને ચોક્કસ પગલાં જરૂરી ઉપયોગી પ્રયત્ન કરીશું. Nowcasting Google ફ્લૂ પ્રવાહો ઉદાહરણ સાથે સૌથી વધુ સ્પષ્ટ રીતે સ્પષ્ટ કરી શકાય છે.

કલ્પના કરો કે તમે હવામાન હેઠળ થોડી જેથી તમે શોધ એન્જિન માં લખો "ફલૂ ઉપાયો" લાગણી છે, પ્રતિભાવ કડીઓ પાનું પ્રાપ્ત છે, અને પછી એક મદદરૂપ વેબપેજ માટે તેમને એક અનુસરો. હવે કલ્પના આ પ્રવૃત્તિ શોધ એન્જિન પરિપ્રેક્ષ્ય માંથી બહાર રમવામાં આવે છે. દરેક ક્ષણ, પ્રશ્નો લાખો વિશ્વભરના પહોંચ્યા છે, અને પ્રશ્નો શું આ પ્રવાહમાં Battelle (2006) "ઇરાદા ડેટાબેઝ" કહેવાય છે - સામૂહિક વૈશ્વિક સભાનતા માં સતત સુધારાયેલ વિન્ડો પૂરી પાડે છે. જો કે, ફલૂ ફેલાવો એક માપ માં માહિતી આ પ્રવાહમાં દેવાનો મુશ્કેલ છે. ફક્ત "ફલૂ ઉપાયો" માટે ક્વેરીઝ સંખ્યા સુધી ગણાય સારી રીતે કામ કરી શકે છે. દરેક વ્યક્તિને જે ફલૂ ઉપચાર માટે ફલૂ શોધ અને દરેક જણ જે ફલૂ ઉપચાર માટે શોધકર્તાઓ ફલૂ ધરાવે છે.

Google ફ્લૂ પ્રવાહો પાછળ મહત્વનું અને હોંશિયાર યુક્તિ આગાહી સમસ્યા એક માપ સમસ્યા ચાલુ હતી. રોગ નિયંત્રણ અને નિવારણ માટે કેન્દ્રો (સીડીસી) એક ઈન્ફલ્યુએન્ઝા મોનીટરીંગ સિસ્ટમ છે કે જે સમગ્ર દેશમાં ડોકટરો પાસેથી માહિતી ભેગો છે. જો કે, આ સીડીસી સિસ્ટમ સાથે એક સમસ્યા બે સપ્તાહ અહેવાલ લેગ છે; તે સમય અને તે માહિતી ડોક્ટરો પાસેથી પહોંચ્યા માટે લે છે, સાફ કરી શકાય છે પ્રક્રિયા, અને પ્રકાશિત. પરંતુ, જ્યારે ઊભરતાં રોગચાળો સંભાળવા, જાહેર આરોગ્ય ઓફિસો નથી કેટલી ખબર ઈન્ફલ્યુએન્ઝા બે અઠવાડિયા પહેલા થયું હતું માંગો છો; તેઓ જાણતા કરવા માંગો છો કેટલી ઈન્ફલ્યુએન્ઝા છે હમણાં. હકીકતમાં, સામાજિક માહિતી અન્ય ઘણા પરંપરાગત સ્ત્રોતોમાં, ત્યાં ડેટા સંગ્રહ મોજા અને રિપોર્ટિંગ ક્ષતિઓ વચ્ચે ગાબડા હોય છે. સૌથી મોટા માહિતી સ્ત્રોત, બીજી બાજુ, હંમેશા (વિભાગ 2.3.1.2) છે.

તેથી, જેરેમી ગિન્સબર્ગ અને સહકર્મીઓ (2009) Google શોધ માહિતી સીડીસી ફલૂ માહિતી આગાહી પ્રયાસ કર્યો હતો. આ "હાજર આગાહી" કારણ કે સંશોધકો માપવા સીડીસી ભવિષ્યના માહિતી કે હાજર માપવા છે ભવિષ્યના માહિતી આગાહી દ્વારા હવે છે કેટલી ફલૂ ત્યાં પ્રયાસ કરી રહ્યા હતા એક ઉદાહરણ છે. મશીન શિક્ષણ મદદથી, તેઓ 50 મિલિયન વિવિધ શોધ શબ્દો મારફતે શોધી જે સીડીસી ફલૂ માહિતી મોટા ભાગના આગાહીયુક્ત છે તે જોવા માટે. આખરે, તેઓ છે કે મોટા ભાગના આગાહીયુક્ત હોઈ લાગતું 45 અલગ અલગ પ્રશ્નો સમૂહ જોવા મળે છે, અને પરિણામો ખૂબ સારી હતી: તેઓ સીડીસી માહિતી આગાહી શોધ ડેટાનો ઉપયોગ કરી શકે છે. આ કાગળ, જે કુદરત માં પ્રકાશિત કરવામાં આવી હતી પર આધારિત, ગૂગલ ફ્લૂ પ્રવાહો મોટા માહિતી શક્તિ વિશે એક ઘણી વખત પુનરાવર્તન સફળતા વાર્તા બની હતી.

બે મહત્વપૂર્ણ ચેતવણીઓ, આ સ્પષ્ટ સફળતા માટે છે, જોકે, અને આ ચેતવણીઓ સમજ તમે મૂલ્યાંકન મદદ અને આગાહી અને nowcasting કરશે. પ્રથમ, Google ફ્લૂ પ્રવાહો કામગીરી ખરેખર એક સરળ મોડલ કે બે ફલૂ ફેલાવો સૌથી તાજેતરનું માપ એક રેખીય એક્સ્ટ્રાપોલેશન પર આધારિત ફલૂ જથ્થો અંદાજ કરતાં ખૂબ સારી હતી (Goel et al. 2010) . અને, કેટલાક સમય ગાળા ઉપર Google ફ્લૂ પ્રવાહો ખરેખર આ સરળ અભિગમ કરતાં વધુ ખરાબ હતી (Lazer et al. 2014) . બીજા શબ્દોમાં કહીએ તો, તેના તમામ માહિતી, મશીન લર્નિંગ, અને શક્તિશાળી કમ્પ્યુટિંગ સાથે Google ફ્લૂ પ્રવાહો નાટકીય સંશોધનાત્મક સમજવા માટે એક સરળ અને સરળ પાછળ ન હતી. આ સૂચવે છે કે તે એક આધારરેખા સામે તુલના કરવા માટે મહત્વપૂર્ણ છે જ્યારે કોઇ આગાહી nowcast મૂલ્યાંકન અથવા.

Google ફ્લૂ પ્રવાહો વિશે બીજા મહત્વપૂર્ણ ચેતવણી છે કે સીડીસી ફલૂ માહિતી આગાહી કરવાની ક્ષમતા ટૂંકા ગાળાના નિષ્ફળતા અને લક્ષ્ય અને ગાણિતિક સંકીર્ણ કારણે લાંબા ગાળાની સડો ભરેલું હતું. ઉદાહરણ તરીકે, 2009 સ્વાઈન ફલૂ વાવર Google ફ્લૂ પ્રવાહો દરમિયાન નાટકીય ઈન્ફલ્યુએન્ઝા રકમ વધારે અંદાજ, કદાચ કારણ કે લોકો વૈશ્વિક રોગચાળો વ્યાપક ભય જવાબમાં તેમના શોધ વર્તન બદલવા માટે હોય છે (Cook et al. 2011; Olson et al. 2013) . આ ટૂંકા ગાળાની સમસ્યાઓ માટે વધુમાં, પ્રભાવ ધીમે ધીમે સમય પર સડેલું. આ લાંબા ગાળાની સડો માટે કારણો નિદાન મુશ્કેલ છે કારણ કે Google શોધ ગાણિતીક નિયમો માલિકીનું છે, પરંતુ તે દેખાય છે જ્યારે લોકો "તાવ" અને "ઉધરસ" જેવા લક્ષણો માટે શોધ કે 2011 માં Google બદલાવો કે જે સંબંધિત શોધ શબ્દો સૂચવે કરશે (તે પણ લાગે છે આ લક્ષણ લાંબા સમય સુધી સક્રિય છે). આ લક્ષણ ઉમેરી તમે શોધ એન્જિન બિઝનેસ ચલાવી રહ્યા હોય તો શું કરવું એક તદ્દન વાજબી વસ્તુ છે, અને તે વધુ આરોગ્ય સંબંધિત શોધ પેદા અસર હતી. આ કદાચ બિઝનેસ માટે એક સફળતા મળી હતી, પરંતુ તે Google ફ્લૂ પ્રવાહો પર અંદાજ ફલૂ ફેલાવો કારણે (Lazer et al. 2014) .

સદનસીબે, ગૂગલ ફ્લૂ પ્રવાહો સાથે આ સમસ્યા fixable છે. હકીકતમાં, વધુ સાવચેત પદ્ધતિઓ વાપરી રહ્યા હોય, Lazer et al. (2014) અને Yang, Santillana, and Kou (2015) સારા પરિણામો મેળવવા માટે સમર્થ હતા. આગળ જતાં, હું અપેક્ષા કે nowcasting અભ્યાસ કે સંશોધક સાથે મોટા માહિતી ભેગા માહિતી કે Michaelangelo-શૈલી સાથે ડચમ્પ-શૈલી Readymades ભેગા Custommades કરશે નીતિ ઘડવૈયાઓ સક્રિય હાજર ઝડપી અને વધુ ચોક્કસ માપ અને ભવિષ્યમાં અનુમાનો પેદા કરવા માટે એકત્ર કરી હતી.