مستقبل Predicting ڏکي آهي، پر موجوده predicting آسان آهي.
ٻيو مکيه حڪمت عملي تحقيق observational ڊيٽا سان استعمال ڪري سگهو ٿا forecasting آهي. اندازو لڳاتار مستقبل ۾ مشڪلات آهي، ۽ شايد انهي سبب لاء، پروسيسنگ هاڻي في الحال سماجي تحقيق جو وڏو حصو نه آهي (جيتوڻيڪ اهو ڊيموگرافڪ، اقتصاديات، ايپڊيمولوجي ۽ سياسي سائنس) جو هڪ ننڍڙو ۽ اهم حصو آهي. هتي ئي، مان، خاص قسم جي اڳڪٿي جي تاريخ تي ڌيان ڏيڻ چاهيندو آهي، "هاڻي" ۽ "اڳڪٿي جي پيشڪش" مان نڪرڻ کان پوء، "مستقبل" جي ڀيٽ ۾ نڪتل آهي. دنيا جو؛ اهو "سازش پيش ڪيو" (Choi and Varian 2012) . نوڪر سازي کي امڪاني طور تي خاص طور تي حڪومتي ۽ ڪمپنين لاء مفيد ثابت ٿيندو جيڪو دنيا جي بروقت ۽ صحيح قدمن جي ضرورت آهي.
هڪ سيٽنگ جتي جتي بروقت ۽ صحيح پيمائش لاء گهربل آهي ايجادميولوجي تمام صاف آهي. انفلوئنزا جي معاملي تي غور ڪريو ("فلو"). هر سال، موسمي انفلوئنزا اسپيڊڪس دنيا جي لکن جي بيماري ۽ هزارين موت جي موت جو سبب بڻن ٿا. ان کان علاوه هر سال، امڪان اهو آهي ته هڪ انفلوئنزا جو روپ ظاهر ڪري سگهي ٿو ته لکن کي ماريندو. مثال طور، 1918 انفلوئنزا اثر، اندازي مطابق 50 ۽ 100 ملين ماڻهن جي وچ ۾ قتل ڪيو ويو آهي (Morens and Fauci 2007) . ڇو ته ٽريڪ ڏيڻ ۽ امڪاني طور تي انفلوئنزا جا اثر انداز ڪرڻ جي ضرورت آهي، دنيا جي چوڌاري حڪومتن انفلوئنزا نگراني نظام ٺاهي چڪا آهن. مثال طور، امريڪا مرڪز مريض ڪنٽرول ۽ روڪڻ لاء (سي ڊي سي) باقاعده طور تي ۽ ملڪ جي ڀرسان احتياط ٿيل ڊاڪٽرن کان منظم طور تي معلومات گڏ ڪن ٿا. جيتوڻيڪ هن نظام کي اعلي معيار جي ڊيٽا پيدا ڪري ٿي، ان ۾ هڪ رپورٽ جي گنجائش آهي. اهو ئي وقت آهي، ڇاڪاڻ ته ڊاڪٽرن کي صاف ڪرڻ، پروسيس ڪرڻ ۽ شايع ٿيڻ واري ڊيٽا کان وٺي ڊيٽا وٺندو آهي، سي ڊي سي سسٽم تقريبن ٻه هفتي اڳ ۾ ڪيترو فلو جو تخمينو ڇڏيندو آهي. پر، هڪ بيماري واري ايذائميڪ کي هٿي ملي، عام صحت جي عملدارن کي اهو نه ڄاڻڻ چاهي ٿو ته ٻه هفتي اڳ ڪيترو انفلوئنزا هو؛ انهن کي اهو ڄاڻڻ چاهيندو آهي ته هاڻي اتي ڪيترو انفلوئنزا موجود آهي.
ساڳي ئي وقت ۾ سي ڊي سي انفلوئنزا جي ٽريڪ ڪرڻ لاء ڊيٽا گڏ ڪري رهي آهي، گوگل انفلوئنزا جي باري ۾ ڊيٽا گڏ ڪري رهي آهي، جيتوڻيڪ هڪ ڪافي صورت ۾. سڄي دنيا مان ماڻهو مسلسل Google ڏانهن سوالون موڪلي رهيا آهن، ۽ انهن مان ڪجهه سوالن جهڙوڪ "فلو علاج" ۽ "فلو علامات" مان ظاهر ڪري ٿو ته اهو شخص انهي سوال کي فلو ڪيو آهي. پر، انهن ڳولا جي سوالن کي استعمال ڪندي فلو جي تڪليف جو اندازو لڳائڻ تمام ضروري آهي: هر هڪ فلو نه آهي جيڪو فلو سان لاڳاپيل ڳولا ڪري ٿو، ۽ هر فلو لاڳاپيل ڳولا نه آهي ان مان فلو آهي.
جريمي گينبربر ۽ هڪ ٽيم جي ڀائيوارن (2009) ، گوگل ۽ ڪجهه سي ڊي سي ۾ ڪجهه، انهن ٻن ڊيٽا ذريعن کي گڏ ڪرڻ لاء اهم ۽ چوري وارو خيال هو. بالڪل، هڪ قسم جي شمارياتي ماهر ذريعي، محققن کي فاسٽ ۽ غلط ڳولا واري ڊيٽا کي سست ۽ درست سي ڊي ڊيٽا سان گڏ انفلوئنزا جي تڪڙو تڪڙو ۽ درست انداز پيدا ڪرڻ لاء گڏوگڏ. انهي بابت سوچڻ لاء هڪ ٻيو طريقو اهو آهي ته اهي سي ڊي سي جي ڊيٽا کي تيز ڪرڻ لاء ڳولا واري ڊيٽا استعمال ڪندا آهن.
خاص طور تي، 2003 کان 2007 ء تائين ڊيٽا استعمال ڪندي، Ginsberg اور همکاران نے CDC डेटा मा इन्फ्लूएंजा की प्रचलन और 50 मिलियन مختلف شرطن کے لئے تلاش کے حجم کے درمیان تعلق کا अनुमान. هن عمل کان، مڪمل طور تي ڊيٽا جي هٿ هيٺ هو ۽ خاص طبي ڄاڻ جي ضرورت نه هوندي هئي، محقق 45 مختلف سوالات جو هڪ سيٽ مليو، جيڪا سي ڊي سي فلو جي تڪليف واري ڊيٽا جو سڀ کان وڏو پيش ڪيو وڃي. ان کان پوء، 2003-2007 جي انگن اکرن کان انهي رشتي جو استعمال ڪيو، گينبربر ۽ ان جي ڀائيوارن نے 2007-2008 انفلوئنزا موسم دوران ان جي نمونائن کي آزمائيو. هنن اهو معلوم ڪيو ته انهن جي طريقيڪار يقيني طور تي مفيد ۽ صحيح پوسٽ ٺاهيندي هجي (نمبر 2.6). اهي نتيجا طبيعي ۾ شايع ڪيا ويا ۽ وصول ڪندڙ پريس ڪوريج حاصل ڪيون ويون. اهو منصوبو جنهن کي گوگل فلو رجحان سڏيو ويندو هو، دنيا کي تبديل ڪرڻ لاء وڏي انگن جي طاقت بابت اڪثر بار بار تعريف ڪئي وئي.
بهرحال، اها پڌري ڪاميابي ڪهاڻي آخرڪار شرمندگي بدلجي. ڪجهه وقت کان پوء، محقق ٻن اهم حدن کي دريافت ڪيو جيڪي گوگل فلو رجحانات انهي کان گهٽ اثرائتي طور تي ظاهر ٿينديون آهن. پهريون، گوگل فلو رجحان جي ڪارڪردگي اصل سادي نموني جي ڀيٽ ۾ گهڻو بهتر نه هو، جنهن جي ٻن تازي پيماني جي فلج جي تڪليف (Goel et al. 2010) بنيادن تي ليولر ڀڃڻ جي بنياد تي فلو جي مقدار جو اندازو لڳايو ويو آهي. ۽، ڪجهه وقت جي مدي دوران، گوگل فلو رجحان هن سادي نقطي نظر کان بلڪل بدترين هئي (Lazer et al. 2014) . ٻين لفظن ۾، گوگل فلو رجحان ان جي سڀني ڊيٽا، مشين سکڻ، ۽ طاقتور ڪمپيوٽنگ سان ڳاڙھي واري طريقي سان آسان ۽ آسان سمجهي نه سگهندي. هن جو مشورو ڏنو ويو آهي ته جڏهن ڪنهن به پيشڪش جي مقابلي ۾ ڪنهن به پيچيدگي يا هاڻ ڪاسٽ ڪرڻ جو جائزو وٺڻو پوندو.
گوگل فلو رجحان بابت ٻئي اهم انتباہ اهو آهي ته ڊي سي سي فلو جي ڊيٽا جي پيشڪش ڪرڻ جي صلاحيت بيهڻ ۽ الورگيتمڪ ڪائونڊ جي سبب ڊگهي مدت جي ناڪامي ۽ ڊگهي مدت تائين مبتلا هئي. مثال طور، 2009 ۾ سوائن فلائيٽ جي دوران Google فلو رجحانات انفلوئنزا جي مقدار کي ڊرامائي طور تي غالبا، غالبا ڇاڪاڻ ته ماڻهن عالمي گلوبل جي وسيع خوف جي جواب ۾ پنهنجي ڳولا جي رويي کي تبديل ڪن ٿا (Cook et al. 2011; Olson et al. 2013) . انهن ننڍن وڏن مسئلن جي باوجود، ڪارڪردگي سان ڀيٽ ۾ ڪجهه دير سان لکي ٿو. هن ڊگهي عرصي وارو فيصلي جي سببن جو ڪارڻ ڏکيو آهي ڇاڪاڻ ته گوگل سرچ الورگيتس مالدار آهن، پر اهو ظاهر ٿئي ٿو ته 2011 ۾ گوگل لاڳاپيل ڳولا جي اصطلاحن جو مشورو ڏيڻ شروع ڪيو جڏهن ماڻهو فلو علامات جي ڳولا وانگر "بخار" ۽ "کبو" ھي مضمون ھاڻ فعال نه آھي). هن مضمون کي شامل ڪرڻ لاء جيڪڏهن هڪ ڳولا انجڻ هلائي رهيا آهيو ته هڪ مڪمل معقول شيء آهي، پر هي الگورتھمڪ تبديلي تبديلي وڌيڪ صحت سان لاڳاپيل ڳولها پيدا ڪرڻ جو اثر پئي ڪيو جنهن جي نتيجي ۾ گوگل فلو رجحان کي وڌايو فلور جي تڪليف (Lazer et al. 2014) .
اهي ٻه ٻرندڙ مستقبل مستقبل جي اباڻين ڪوششون پيون وڃن، پر اهي کين بدنام نه ڪندا آهن. حقيقت ۾، وڌيڪ محتاط طريقن جي استعمال ڪندي، Lazer et al. (2014) ۽ Yang, Santillana, and Kou (2015) انهن ٻن مسئلن کان بچڻ کان قاصر هئا. اڳتي وڌڻ تي، آئون هاڻ ايسٽننگ اڀياس جي تحقيق ڪندڙ وڏن انگن اکرن کي گڏ ڪرڻ سان گڏ گڏ ڪيل ڊيٽا ڪمپنين ۽ حڪومتن کي ڪجهه وقت جي ڀيٽ ۾ بار بار سان گڏ وقت جي تيز رفتار جي رفتار سان وڌيڪ بروقت ۽ وڌيڪ صحيح اندازن ٺاهڻ جي قابل ڪري سگهندا. جئين ته هلاڪ ڪيل منصوبن جهڙوڪ گوگل فلو رجحانات پڻ ڏيکاري ٿي ڏيکاري ٿو جيڪڏهن وڏي ڊيٽا وسيلن سان گڏ گڏيل روايتي ڊيٽا جيڪي تحقيق جي مقصدن لاء پيدا ڪيون ويون آهن. باب 1 جي مطابق مطابق آرٽيڪل تي سوچڻ، هاڻي ويجهي مستقبل جي موجوده ۽ اڳڪٿي جي وڌيڪ بروقت ۽ وڌيڪ صحيح انداز سان فيصلو ڪرڻ جي لاء مشڪين طرز طرز جي ترتيب سان گڏ ڊچپپ طرز طريقي سان پڙهائي ٺاهي سگھي ٿو.