مستقبل کی پیشن گوئی بہت مشکل ہے، لیکن موجودہ پیشن گوئی آسان ہے.
پریکشتاتمک ڈیٹا کے ساتھ محققین کی طرف سے استعمال کیا جاتا ہے دوسری اہم حکمت عملی آرائی نہیں ہے. مستقبل کی پیشن گوئی کے بدنام مشکل ہے، لیکن وہ کمپنیوں یا حکومتوں میں کام چاہے، فیصلہ سازوں کے لئے ناقابل یقین حد اہم ہو سکتا ہے.
Kleinberg et al. (2015) بعض کی پالیسی مسائل کے لئے پیشن گوئی کی اہمیت کو واضح کیا کہ دونوں کہانیاں پیش کرتا ہے. ایک پالیسی بنانے والے ذرا تصور کریں، میں نے اس کی انا، خشک سالی کا سامنا کرنا پڑ رہا ہے اور فیصلہ کرنا ہوگا بارش کے امکانات کو بڑھانے کے لئے ایک بارش رقص کرنا ایک جادوگر کی خدمات حاصل کرنے کے لئے چاہے جو بلاتا ہوں. ایک اور پالیسی کو بنانے والا، میں نے اس باب میں فون کرتا ہوں، فیصلہ کرنا ہوگا گھر کے راستے میں بھیگ رہی سے بچنے کے لئے کام کرنے کے لئے ایک چھتری لینے کے لئے چاہے. وہ موسم سمجھ تو انا اور باب دونوں ایک بہتر فیصلہ کر سکتے ہیں، لیکن وہ مختلف چیزوں کو جاننے کی ضرورت. انا بارش رقص بارش کا سبب بنتا ہے کہ آیا کو سمجھنے کی ضرورت ہے. باب، دوسری طرف، حادثے کے بارے میں کچھ سمجھنے کی ضرورت نہیں ہے؛ وہ صرف ایک درست پیشن گوئی کی ضرورت ہے. سماجی محققین اکثر ہے پر توجہ مرکوز Kleinberg et al. (2015) "بارش رقص کی طرح" پالیسی کے مسائل-ان لوگوں پر توجہ مرکوز حادثے-اور "چھتری نما" پالیسی کے مسائل کی پیشن گوئی پر توجہ مرکوز کر رہے ہیں کہ نظر انداز کو فون.
میں موجود پیشن گوئی کرنے کی کوششوں nowcasting، موسمیاتی پیش گوئی نامی nowcasting کی ایک خاص قسم -A اصطلاح "اب" کو ملا اور سے حاصل کردہ پر تاہم، توجہ مرکوز کرنے، چاہتے "پیشن گوئی." بلکہ مستقبل کی پیشن گوئی کے مقابلے میں (Choi and Varian 2012) . دوسرے الفاظ میں، nowcasting پیمائش کے مسائل کے لئے پیشن گوئی طریقوں کا استعمال. مثلا، یہ حکومتیں اپنے ملکوں کے بارے میں بروقت اور درست اقدامات کی ضرورت ہوتی ہے جو خاص طور پر مفید ہونا چاہئے. Nowcasting گوگل فلو رجحانات کی مثال کے ساتھ سب سے واضح طور پر سچتر جا سکتا ہے.
ذرا تصور کریں تو آپ کو ایک کی تلاش کے انجن میں "فلو سے علاج" ٹائپ آپ کو موسم کے تحت تھوڑا سا محسوس کر رہے ہیں کہ، اس کے جواب میں لنکس کی ایک صفحے موصول، اور پھر ایک مفید ویب صفحے پر ان میں سے ایک کی پیروی. ابھی اس کی سرگرمیوں کی تلاش کے انجن کے نقطہ نظر سے باہر ادا ہونے کا تصور. ہر پل، کے سوالات کے لاکھوں دنیا بھر سے پہنچ رہے ہیں، اور سوالات کیا کے اس ندی Battelle (2006) "نیک نیتی کے ڈیٹا بیس" کہا گیا ہے - اجتماعی عالمی ضمیر میں ایک مسلسل اپ ڈیٹ ونڈو فراہم کرتا ہے. تاہم، فلو کی کوریج کی ایک پیمائش میں معلومات کے اس ندی کا رخ مشکل ہے. بس "فلو سے علاج" کے لئے سوالات کی تعداد تک گنتی اچھی طرح کام نہیں کر سکتے. ہر کسی کو نہیں فلو علاج کے لئے فلو تلاشیوں اور ہر کوئی فلو علاج کے لئے تلاش فلو ہے جو ہے جو.
گوگل فلو رجحانات کے پیچھے اہم اور ہوشیار ٹرک ایک پیشن گوئی کے مسئلہ میں ایک پیمائش مسئلہ باری تھی. بیماریوں کے کنٹرول اور روک تھام کے امریکی مراکز (سی ڈی سی) ملک بھر میں ڈاکٹروں کی طرف سے معلومات جمع کرتا ہے کہ ایک انفلوئنزا کی نگرانی کے نظام ہے. تاہم، یہ سی ڈی سی کے نظام کے ساتھ ایک مسئلہ ایک دو ہفتے رپورٹنگ وقفہ نہیں ہے؛ وقت یہ ڈاکٹروں سے پہنچنے کے اعداد و شمار کے لئے لیتا ہے، صاف کیا جائے عملدرآمد، اور شائع. لیکن، ایک ابھرتی ہوئی مہاماری سے نمٹنے جب، عوامی صحت کے دفاتر نہیں جانتے کتنا انفلوئنزا دو ہفتے قبل ہوئی تھی کرنا چاہتا؛ وہ جاننا چاہتے ہیں کتنا انفلوئنزا ابھی وہاں ہے. سچ تو یہ ہے، سماجی اعداد و شمار کے بہت سے دیگر روایتی ذرائع میں، ڈیٹا جمع کرنے کی لہروں اور رپورٹنگ lags کے درمیان فرق موجود ہیں. سب سے بڑا ڈیٹا کے ذرائع، دوسری طرف، ہمیشہ پر (دفعہ 2.3.1.2) ہیں.
لہذا، جیریمی عناصر ہیں اور ان کے ساتھیوں (2009) گوگل کے تلاش کے اعداد و شمار سے CDC فلو کے اعداد و شمار کی پیشن گوئی کرنے کی کوشش کی. یہ "موجودہ پیشن گوئی" محققین کتنا فلو CDC، مستقبل اعداد و شمار پیش کی پیمائش کی جاتی ہے کہ کی طرف سے مستقبل کے اعداد و شمار کی پیشن گوئی کی طرف سے اب نہیں ہے پیمائش کرنے کے لئے کی کوشش کر رہے تھے کیونکہ ایک مثال ہے. مشین لرننگ کا استعمال کرتے ہوئے، وہ CDC فلو کے اعداد و شمار کے سب سے زیادہ امکانات ہیں جس کو دیکھنے کے لئے 50 ملین مختلف تلاش کی اصطلاحات کے ذریعے تلاش. آخر میں، وہ سب سے زیادہ امکانات لگ رہا تھا کہ 45 مختلف سوالات کا ایک سیٹ پر پایا ہے اور نتائج بہت اچھے تھے: وہ CDC کے اعداد و شمار کی پیشن گوئی کرنے کی تلاش کے اعداد و شمار کا استعمال کرسکتے ہیں. اس کاغذ، جس میں نیچر میں شائع کیا گیا تھا پر حصہ میں کی بنیاد پر، گوگل فلو رجحانات بڑی ڈیٹا کی طاقت کے بارے میں ایک اکثر بار بار کامیابی کی کہانی بن گیا.
نہیں، تاہم، یہ ظاہر کامیابی کے لئے دو اہم caveats کے ہیں، اور ان caveats کے سمجھنے تمہیں اندازہ اور میں مدد ملے گی کی پیشن گوئی اور nowcasting کرتے. سب سے پہلے، گوگل فلو رجحانات کی کارکردگی اصل فلو ویاپتتا کی دو سب سے حالیہ پیمائش سے ایک لکیری extrapolation کی بنیاد پر فلو کی رقم کا اندازہ ہے کہ ایک سادہ ماڈل کے مقابلے میں نہیں بہت بہتر تھا (Goel et al. 2010) . اور، بعض اوقات کا دورانیہ زیادہ گوگل فلو رجحانات اس سادہ نقطہ نظر سے اصل بدتر تھا (Lazer et al. 2014) . دوسرے الفاظ میں، اس کے تمام اعداد و شمار، مشین لرننگ، اور طاقتور کمپیوٹنگ ساتھ گوگل فلو رجحانات ڈرامائی طور انکشافی کو سمجھنے کے لئے ایک سادہ اور آسان آؤٹ پرفارم نہیں کیا. یہ ہے کہ کسی بھی پیشگوئی جائزہ یا nowcast جب یہ ایک بنیادی خلاف موازنہ کرنا اہم ہے سے پتہ چلتا ہے.
گوگل فلو رجحانات کے بارے میں دوسری اہم انتباہ CDC فلو کے اعداد و شمار کی پیشن گوئی کرنے کی صلاحیت مختصر مدت کی ناکامی اور اس وجہ سے بڑھے اور پر algorithmic confounding کے طویل المیعاد کشی کا شکار تھا. مثال کے طور پر، 2009 میں سوائن فلو پھیلنے گوگل فلو رجحانات کے دوران ڈرامائی طور پر انفلوئنزا کی رقم سے زیادہ کا تخمینہ لگایا گیا، لوگ ایک عالمی مہاماری کی بڑے پیمانے پر خوف کے جواب میں ان کی تلاش کے رویے کو تبدیل کرنے کی کوشش کرتے ہیں شاید اس لئے کہ (Cook et al. 2011; Olson et al. 2013) . ان مختصر مدتی مسائل کے علاوہ، کارکردگی آہستہ آہستہ وقت کے ساتھ ساتھ کمزور ہورہی. اس طویل مدتی کشی کے لئے وجوہات کی تشخیص مشکل ہے گوگل کے تلاش کے الگورتھم ملکیتی ہیں کیونکہ، لیکن یہ لوگ "بخار" اور "کھانسی" جیسی علامات کے لئے تلاش جب 2011 ء میں گوگل متعلقہ تلاش کی اصطلاحات تجویز کرے گا کہ تبدیلیاں کی کہ ظاہر ہوتا ہے (یہ بھی لگتے اس خصوصیت کو مزید فعال نہیں ہے). اس خصوصیت کو شامل کرنے سے آپ کو ایک کی تلاش کے انجن کے کاروبار چلا رہے ہیں تو ایسا کرنے کا ایک بالکل معقول بات ہے، اور یہ زیادہ صحت سے متعلقہ تلاش کے حصول کے اثر پڑا. شاید کاروبار کے لئے ایک کامیابی تھی، لیکن یہ زیادہ تخمینہ فلو ویاپتتا کرنے کے لئے گوگل فلو رجحانات کی وجہ سے (Lazer et al. 2014) .
خوش قسمتی سے، گوگل فلو کے رجحانات کے ساتھ ان مسائل fixable ہیں. سچ تو یہ ہے، زیادہ محتاط طریقے استعمال، Lazer et al. (2014) اور Yang, Santillana, and Kou (2015) بہتر نتائج حاصل کرنے کے قابل تھے. آگے بڑھتے ہوئے، میں محقق ساتھ بڑے ڈیٹا جمع ہے کہ nowcasting سٹڈیز ڈیٹا کہ مائیکل طرز ساتھ Duchamp طرز Readymades یکجا Custommades-گی اور حال کے تیز اور زیادہ درست پیمائش مستقبل کی پیشن گوئی پیدا کرنے کے پالیسی سازوں کو چالو جمع کیا ہے کہ توقع.