مستقبل Predicting ڏکي آهي، پر موجوده predicting آسان آهي.
ٻيو مکيه observational ڊيٽا سان گڏ تحقيق جي استعمال حڪمت عملي forecasting آهي. مستقبل Predicting notoriously ڏکيو آهي، پر ان جو فيصلو ڪندڙن لاء incredibly اهم ٿي سگهي ٿو، ڇا اهي ڪمپنيون يا حڪومتن ۾ ڪم.
Kleinberg et al. (2015) ۾ ٻه ڳالهيون ته ڪجهه پاليسي مسئلا لاء forecasting جي اهميت ڪرڻا پوندا مليو آهي. هڪ پاليسي ساز، تصور، مون کيس انا، جيڪو هڪ ڏڪار کي منهن ڏيڻو آهي سڏيندا ويندس ۽ فيصلو هجڻ ضروري آهي مينهن جو موقعو اضافو ڪرڻ لاء هڪ مينهن ناچ ڪندا هڪ شمن مزور ت. ٻي پاليسي ساز، مون کيس باب سڏ سين، فيصلو هجڻ ضروري آهي هڪ ڇٽي وٺي ت جي واٽ جي گهر تي آلو ملڻ کان بچڻ لاء ڪم ڪرڻ. جيڪڏھن موسم کي سمجهڻ ٻئي أنا ۽ باب هڪ بهتر فيصلو ڪر ڪري سگهو ٿا، پر اهي مختلف شين کي معلوم ڪرڻ جي ضرورت آهي. انا سمجهڻ جي مينهن ناچ مينهن جو ازالو ت رکي ٿو. باب، ٻئي هٿ تي، causality جي باري ۾ ڪجهه به سمجهه ۾ ڪرڻ جي ضرورت نه رکندو آھي. هن چيو ته صرف هڪ صحيح اڳڪٿي رکي ٿو. سماجي تحقيق اڪثر جيڪي تي زور Kleinberg et al. (2015) "مينهن ناچ-وانگر" پاليسي مسئلا-سي ته تي زور سڏ causality-۽ ته forecasting تي روشني وڌي رهيا آهن "ڇٽي نما" جي پاليسي پريشاني کي نظرانداز ڪري.
مون کي ڌيان ڏيڻ لاء، بهرحال، nowcasting دادو مدت گڏي "هاڻي" مان نڪتل آهي ۽ سڏيو ويندو forecasting جي هڪ خاص قسم تي پسند لڳي "forecasting." جي ڀيٽ ۾ بلڪه مستقبل predicting، موجوده گوئي ڪرڻ جي ڪوشش nowcasting (Choi and Varian 2012) . ٻين لفظن ۾، nowcasting ماپ جا مسئلا لاء forecasting طريقا استعمال ڪري ٿي. جيئن جيئن، ان کي خاص طور تي حڪومتن کي سندن ملڪن جي باري ۾ بروقت ۽ صحيح اپاء وٺڻ جي ضرورت لاء مفيد هجڻ گهرجي. Nowcasting گوگل فلو لاڙا جي مثال سان سڀ کان واضح illustrated ڪري سگهجي ٿو.
تصور آهي ته توهان جي موسم هيٺ سا آمهون سامهون آهن پوء اوھان کي هڪ سرچ انجڻ ۾ "فلو شڪايتن" لکندو، جي جواب ۾ جوڙي جي هڪ صفحي تي ملي ٿي، ۽ ان کان پوء هڪ مددگار ويب صفحو کي انهن مان هڪ جي پٺيان. هاڻي تصور هن سرگرمي جي ڳولا انجڻ جي ڪانه کان ٻاهر کيڏي پئي وڃي. هر گھڙي، سوال جي لکن جي دنيا جي آس پاس کان ٺاهيون ويون آهن، ۽ سوال کڻي-ڇا جو هيء وهڪرو Battelle (2006) جي "ارادن جي ڊيٽابيس" سڏيو ڪري ڇڏيو - جي اجتماعي عالمي شعور ۾ هڪ مسلسل تبديل دري مهيا ڪري. تنهن هوندي به، جي فلو جي گهڻيون جي ماپ ۾ معلومات جي هن ندي جو رخ ڏکيو آهي. بس "فلو شڪايتن" چڱي ڪم نه وٺن لاء سوال جو تعداد مٿي ڳڻپ. هر نه جيڪو فلو شڪايتن ۽ هر نه جيڪو searchers لاء فلو ڳولھا ڪئي آهي فلو سڌاري لاء فلو آهي.
گوگل فلو لاڙا جي پويان سنڌ جي اهم ۽ ماھر چال هڪ forecasting مسئلو ۾ هڪ ماپ مسئلو توبه ڪرڻ هو. بيماري تي ڪنٽرول ۽ بچاء لاء آمريڪا جي مرڪز (سي ڊي) هڪ انفلوئنزا نگراني نظام آهي ته ملڪ جي چوڌاري ڊاڪٽرن کان معلومات گڏ ڪئي آهي. تنهن هوندي به، هن ڊي سي نظام سان هڪ مسئلو هڪ ٻه هفتي رپورٽنگ (Phenomenon) نه آهي؛ هن وقت ان لاء ڊيٽا ڊاڪٽرن کان ٺاهيون ويون، جي تعظيم ڪجي ٿي عمل، ۽ شايع ڪري وٺندو. پر، جڏهن هڪ الطريق جي پوئواري منظم، عوام جي صحت جي آفيسون نه ڄاڻندا گهڻا انفلوئنزا اتي ٻه هفتا اڳ هو چاهي ٿو؛ اھي ڄاڻڻ جو حق هاڻي آهي گهڻا انفلوئنزا نه چاهيو. حقيقت ۾، سماجي ڊيٽا جي ڪيترن ئي ٻين روايتي ذريعن ۾، اتي جي انگن اکرن کي گڏ ڪرڻ جي موج ۽ رپورٽنگ lags جي وچ ۾ خال آهي. سڀ کان وڏي انگن اکرن کان هٽي ڪري، ٻئي هٿ تي، هميشه-تي (سيڪشن 2.3.1.2) آھن.
تنهن ڪري، Jeremy Ginsberg ۽ ساٿيو (2009) جي گوگل ڳولا جي انگن اکرن کان ڊي سي فلو ڊيٽا گوئي ڪرڻ جي ڪوشش ڪئي. هيء "جي موجوده predicting" ڇو ته هن جي تحقيق جو اندازو ڪرڻ جي ڊي سي، مستقبل جي ڊيٽا ته موجوده جريب آهي مان مستقبل جي ڊيٽا predicting جي هاڻي آهي گهڻا فلو اتي جي ڪوشش ڪري رهيا هئا جو هڪ مثال آهي. مشين سکيا استعمال، اهي 50 لک مختلف تلاش جي اصطلاحن ذريعي ڳولها ڪئي جنهن جي ڊي سي فلو ڊيٽا جي سڀ کان predictive آهن ڏسڻ لاء. آخرڪار، اهي 45 مختلف سوال آهي ته سڀ کان predictive ٿي رهيو جو هڪ سيٽ نه ملي، ۽ نتيجن کي ڪافي سٺا هئا: اهي ئي ڊي سي جي انگن اکرن گوئي جي ڳولا ڊيٽا استعمال ڪري سگهي ٿو. هيء مقالو، جنهن جي قدرت ۾ شايع ڪيو ويو حصي تي مبني آهن، گوگل فلو لاڙا وڏي ڊيٽا جي طاقت جي باري ۾ هڪ عام بار بار ڪاميابي ڪهاڻي ٿيو.
نه هن ۾ وجھندو آھي ڪاميابي لاء ٻه اهم caveats آهن، تنهن هوندي به، ۽ انهن caveats سمجهه ۾ اوھان کي ويجهڙائيء ۾ مدد ۽ forecasting ۽ nowcasting ڪرايو ويندو. پهريون، جي گوگل فلو لاڙا اهڙو نه هو هڪ سادي ماڊل ته فلو جي رقم جي ٻن فلو گهڻيون جو سڀ کان تازو ماپون مان هڪ سڌر extrapolation جي بنياد تي ڪاٿي جي ڀيٽ ۾ گهڻو بهتر ڪارڪردگي (Goel et al. 2010) . ۽، ڪجهه وقت دورن تي گوگل فلو لاڙا اصل ۾ هن سادي اچڻ کان بدتر هو (Lazer et al. 2014) . ٻين لفظن ۾، پنهنجي سڀ ڊيٽا، مشين سکيا، ۽ طاقتور ڪمپيوٽنگ سان گوگل فلو لاڙا dramatically هڪ سادي ۽ heuristic کي سمجهڻ لاء آسان outperform نه ڪيو. هن مشورو ڏيندو آهي ته جڏهن ڪنهن به اڳڪٿي ڪٿڻ يا ان nowcast هڪ بيس جي خلاف compare ڪرڻ لاء اهم آهي.
گوگل فلو لاڙا جي باري ۾ هن جو ٻيو اهم caveat ته ڊي سي فلو ڊيٽا گوئي کي ان جي صلاحيت drift ۽ algorithmic confounding جي ڇاڪاڻ ته مختصر-مدت ناڪامي ۽ ڊگهي-مدت مقدر بڇڙا ٿي ويو آهي. مثال جي طور تي، جو 2009 ع ذريعي سوائن فلو ڪڏهن وبا گوگل فلو لاڙا دوران dramatically تي-اندازي مطابق انفلوئنزا جي رقم، شايد ڇاڪاڻ ته ماڻهن کي هڪ عالمي pandemic جي وڏي پئماني تي خوف جي جواب ۾ سندن ڳولا رويي کي تبديل ڪرڻ لاء توکان موڪلائين تڏھن (Cook et al. 2011; Olson et al. 2013) . انهن مختصر-مدت پريشاني کي ان کان سواء، هن جي ڪارڪردگي جتان وقت جي حوالي سان ڀتا. هن ڊگهي مدت جو مقدر لاء سبب Diagnosing ڏکيو ڇو ته گوگل سرچ algorithms Proprietary آهن، پر اهو ظاهر ٿئي ٿو ته 2011 ع ۾ گوگل تبديليون جڏهن ماڻهو "بخار" ۽ "کنگهه" وانگر علامت لاء ڳولا ته لاڳاپيل تلاش جي اصطلاحن جو مشورو ڪري ڇڏي ڪيو (ان کي به لڳي ته هن مضمون ۾ سرگرم هاڻي ڪو به آهي). هن مضمون ۾ شامل ڪندي توهان هڪ سرچ انجڻ جو ڪاروبار هلائي رهيا آهن ته ائين ڪرڻ هڪ بالڪل مناسب شيء آهي، ۽ ان کان وڌيڪ جي صحت سان لاڳاپيل ڳولا generating جو اثر پيو. شايد هيء هن جو ڪاروبار لاء هڪ ڪاميابي هئي، پر ان کان مٿي-اندازي فلو گهڻيون لاء گوگل فلو لاڙا سبب (Lazer et al. 2014) .
خوشقسمتي، گوگل فلو لاڙا سان اهي مسئلا fixable آهن. حقيقت ۾، وڌيڪ محتاط طريقا استعمال ڪري، Lazer et al. (2014) ۽ Yang, Santillana, and Kou (2015) بهتر نتيجن حاصل ڪرڻ جي قابل هئا. جا شوقين، مون کي اميد آهي ته nowcasting پڙهائي ته محقق سان وڏي ڊيٽا گڏ Michaelangelo-انداز سان ڊيٽا-ته Duchamp طرز Readymades تڏهن گڏ پاليسي جوڙيندڙن Custommades-ڪندو فعال موجوده ۽ مستقبل جي پيشن گوئي جي تيز ۽ وڌيڪ صحيح ماپون پيدا ڪرڻ.