مستقبل کی پیشن گوئی بہت مشکل ہے، لیکن موجودہ پیشن گوئی آسان ہے.
دوسرا اہم حکمت عملی محققین مشاہداتی اعداد و شمار کے ساتھ استعمال کر سکتے ہیں پیش گوئی . مستقبل کے بارے میں اندازہ لگانا بدنام مشکل ہے، اور شاید اس وجہ سے، پیشن گوئی اس وقت سماجی تحقیق کا بڑا حصہ نہیں ہے (اگرچہ یہ ڈیموگراف، معاشیات، ایپیڈیمولوجی اور سیاسی سائنس کا ایک چھوٹا سا اور اہم حصہ ہے) نہیں ہے. یہاں تک کہ، یہاں تک کہ، میں خاص نوعیت کی پیش گوئی پر توجہ مرکوز کرنا چاہوں گا جس میں ابھرتے ہوئے کہا جاتا ہے- "اب" اور "پیشن گوئی" کے مشترکہ اصطلاح سے حاصل کردہ اصطلاح پر توجہ مرکوز کرنا چاہتا ہے. مستقبل کی پیشن گوئی کے بجائے، موجودہ ریاست کی پیمائش کے لئے پیش گوئی کرنے سے متعلق نظریات کو استعمال کرنے کے بجائے، دنیا کا یہ "موجودہ" کی پیش گوئی کرنے کی کوشش کرتا ہے (Choi and Varian 2012) . نیویارکنگ حکومتوں اور کمپنیاں جو خاص طور پر دنیا کے بروقت اور درست اقدامات کی ضرورت ہوتی ہے کے لئے خاص طور پر مفید ہوسکتی ہے.
ایک ترتیب جہاں بروقت اور درست پیمائش کی ضرورت بہت واضح ہے ایپیڈیمولوجی ہے. انفلوئنزا کیس ("فلو") پر غور کریں. ہر سال، موسمی انفلوینزا ایڈیڈکس لاکھوں بیماریوں اور دنیا بھر میں سینکڑوں ہزار موت کی وجہ سے. اس کے علاوہ، ہر سال، امکان ہے کہ انفلوینزا کے ایک ناول کی شکل ابھر کر سامنے آئے گی جو لاکھوں افراد کو قتل کرے گی. مثال کے طور پر، 1918 انفلوئنزا کے پھیلنے کا اندازہ 50 اور 100 ملین افراد (Morens and Fauci 2007) درمیان ہونے کا (Morens and Fauci 2007) . ٹریک کرنے اور ممکنہ طور پر انفلوئنزا کے پھیلنے کا جواب دینے کی وجہ سے، دنیا بھر میں حکومتوں نے انفلوئنزا کی نگرانی کے نظام کو پیدا کیا ہے. مثال کے طور پر، بیماری کنٹرول اور روک تھام کے لئے امریکی مرکز باقاعدگی سے ملک بھر میں احتیاط سے منتخب ڈاکٹروں سے معلومات منظم کرتے ہیں. اگرچہ یہ نظام اعلی معیار کے اعداد و شمار کی پیداوار کرتا ہے، اس میں ایک رپورٹنگ کی رکاوٹ ہے. یہی وجہ ہے کہ اس وقت سے ڈاکٹروں کو صاف کرنے، عمل کرنے اور شائع ہونے والے اعداد و شمار کے لۓ وقت لگتا ہے کیونکہ، سی ڈی سی کے نظام کا تخمینہ جاری ہے کہ یہ دو ہفتے قبل موجود تھا. لیکن جب، ایک ابھرتی ہوئی مہلک کو سنبھالنے کے بعد، عوامی صحت کے حکام کو یہ نہیں جاننا چاہئے کہ یہ دو ہفتے قبل کتنے انفلوئنزا تھا؛ وہ یہ جاننا چاہتے ہیں کہ اب تک کتنا انفلوئنزا ہے.
اسی وقت جب سی ڈی سی انفلوئنزا کو ٹریک کرنے کے لئے اعداد و شمار جمع کررہا ہے تو، Google انفلوئنزا کی موجودگی کے بارے میں معلومات جمع کر رہا ہے، اگرچہ اس میں کافی مختلف شکل ہے. دنیا بھر میں لوگ مسلسل Google کو سوالات بھیج رہے ہیں، اور ان میں سے بعض سوالات جیسے "فلو کے علاج" اور "فلو علامات" - یہ واضح ہوتا ہے کہ سوال میں فرد کو فلو ہے. لیکن، ان تلاش کے سوالات کا استعمال کرتے ہوئے فلو کی موجودگی کا اندازہ مشکل ہے: کوئی بھی نہیں جو فلو سے متعلق ہے، فلو سے متعلق تلاش کرتا ہے، اور ہر فلو سے متعلق تلاش نہیں ہے جو کوئی فلو ہے.
جیریمی Ginsberg اور ساتھیوں کے ایک ٹیم (2009) ، گوگل میں کچھ اور سی ڈی سی میں، ان دو اعداد و شمار ذرائع کو یکجا کرنے کے لئے اہم اور چیلنج خیال تھا. کسی قسم کی شماریاتی کیمیا کے ذریعہ، محققین نے انفلوئنزا پھیلاؤ کی تیز رفتار اور درست پیمانے پر پیدا کرنے کے لئے سست اور درست سی ڈی سی کے اعداد و شمار کے ساتھ تیز اور غلط تلاش کے اعداد و شمار کو یکجا کیا. اس کے بارے میں سوچنے کا ایک اور طریقہ یہ ہے کہ وہ سی ڈی سی کے اعداد و شمار کو تیز کرنے کے لئے تلاش کے اعداد و شمار کا استعمال کرتے ہیں.
2003 سے 2007 تک اعداد و شمار کا استعمال کرتے ہوئے، خاص طور پر، Ginsberg اور ساتھیوں نے سی ڈی سی کے اعداد و شمار اور 50 ملین مختلف شرائط کے لئے تلاش حجم کے انفیکشنزا کے درمیان تعلقات کا اندازہ لگایا. اس عمل سے، جو مکمل طور پر ڈیٹا پر مبنی تھا اور خاص طبی علم کی ضرورت نہیں تھی، محققین نے 45 مختلف سوالات کا ایک مجموعہ پایا جس میں سی ڈی سی فلو کی بازیابی کے اعداد و شمار کا سب سے زیادہ امکان تھا. پھر، 2003-2007 کے اعداد و شمار سے متعلق تعلقات کا استعمال کرتے ہوئے، Ginsberg اور ساتھیوں نے 2007-2008 انفلوینزا موسم کے دوران اپنے ماڈل کا تجربہ کیا. انہوں نے محسوس کیا کہ ان کے طریقہ کار کو یقینی طور پر مفید اور درست اوسط (اعداد و شمار 2.6) بنا سکتے ہیں. یہ نتائج فطرت میں شائع کیے گئے تھے اور ان پر قبضہ کر رہے ہیں. یہ منصوبہ جس کو Google Flu رجحان کہا گیا تھا، دنیا کو تبدیل کرنے کے لئے بڑے اعداد و شمار کی طاقت کے بارے میں اکثر بار بار قابل بن گیا.
تاہم، یہ واضح کامیابی کی کہانی آخر میں شرمندہ ہوگئی. وقت کے ساتھ، محققین نے دو اہم حدود کو دریافت کیا جو گوگل فلو رجحانات کو ابتدائی طور پر شائع ہونے سے کم متاثر کن بناتا ہے. سب سے پہلے، گوگل فلو رجحانات کی کارکردگی ایک آسان نمونہ کے مقابلے میں بہت زیادہ بہتر نہیں تھا جس سے فلورو کی مقدار (Goel et al. 2010) دو حالیہ پیمائشوں سے لکیری معائنہ کی بنیاد پر فلو کی مقدار کا اندازہ لگایا گیا تھا. اور، کچھ عرصے تک، Google Flu رجحان واقعی اس سادہ نقطہ نظر (Lazer et al. 2014) سے بدتر تھا. دوسرے الفاظ میں، گوگل فلو رجحانات اس کے تمام اعداد و شمار، مشینی سیکھنے، اور طاقتور کمپیوٹنگ کے ساتھ ڈرامائی طور پر سمجھنے کے لئے آسان اور آسان آسان سمجھنے کے ساتھ نہیں تھے. اس سے پتہ چلتا ہے کہ کسی بھی پیشن گوئی یا ابھرتی ہوئی کا جائزہ لینے کے بعد، یہ ایک بنیادی لائن کے خلاف موازنہ کرنا ضروری ہے.
Google Flu رجحانات کے بارے میں دوسرا اہم انتباہ یہ ہے کہ سی ڈی سی فلو ڈیٹا کی پیشکش کرنے کی صلاحیت بڑھی اور الگورتھممک بگاڑنے کی وجہ سے مختصر مدت کی ناکامی اور طویل عرصے سے طویل عرصہ تک مہیا کی گئی تھی. مثال کے طور پر، 2009 کے سوائن فلو کے پھیلنے کے دوران، Google Flu رجحانات نے انفلوئنزا کی مقدار کو زیادہ سے زیادہ اندازہ کیا، شاید اس وجہ سے کہ لوگوں کو گلوبل پنڈیمک کے وسیع خوف کے جواب میں اپنے تلاش کے رویے میں تبدیل کرنا پڑتا ہے (Cook et al. 2011; Olson et al. 2013) . ان مختصر مدت کے مسائل کے علاوہ، کارکردگی آہستہ آہستہ وقت کے ساتھ ختم ہو گیا. اس طویل المیعاد کابینہ کی وجوہات کی تشخیص مشکل ہے کیونکہ گوگل کی تلاش الگورتھم ملکیتی ہیں، لیکن یہ ظاہر ہوتا ہے کہ 2011 میں گوگل نے متعلقہ تلاش کے شرائط کا مشورہ دیا جب لوگ فلو علامات جیسے "بخار" اور "کھانسی" تلاش کرتے ہیں (یہ بھی لگتا ہے کہ یہ خصوصیت فعال نہیں ہے). اس خصوصیت کو شامل کرنے کے لئے ایک مناسب چیز یہ ہے کہ اگر آپ سرچ انجن چل رہے ہو، لیکن یہ الگورتھمک تبدیلی سے زیادہ صحت سے متعلقہ تلاشات پیدا کرنے کا اثر تھا جس میں گوگل فلو رجحانات کی وجہ سے فلو کی شدت کو زیادہ سے زیادہ کرنے کا سبب بنتا ہے (Lazer et al. 2014) .
یہ دو caveats مستقبل کی ابھرتی ہوئی کوششوں کو پیچیدہ ہے، لیکن وہ ان پر عذاب نہیں کرتے. حقیقت میں، زیادہ محتاط طریقوں کا استعمال کرتے ہوئے، Lazer et al. (2014) اور Yang, Santillana, and Kou (2015) ان دو مسائل سے بچنے کے قابل تھے. آگے بڑھنے میں، مجھے امید ہے کہ ابھرتے ہوئے مطالعہ جو محققین کے ساتھ بڑے اعداد و شمار کے ساتھ مل کر بڑے اعداد و شمار کو جمع کر سکیں گے، کمپنیوں اور حکومتوں کو یہ یقینی بنائے گی کہ کسی بھی پیمانے پر کسی بھی پیمائش کو تیز کرنے میں بنیادی طور پر زیادہ پیمانے پر تیز رفتار اور زیادہ درست تخمینہ پیدا ہوجائے. گوگل فلو رجحانات جیسے ابھرتے ہوئے منصوبوں کو یہ بھی پتہ چلتا ہے کہ اگر بڑے اعداد و شمار کا ذریعہ تحقیق کے مقاصد کے لئے تخلیق شدہ روایتی اعداد و شمار کے ساتھ مل کر کیا جاتا ہے تو کیا ہوسکتا ہے. باب 1 کے آرٹ کی تعدد میں سوچنے کے بعد، ابکاسٹنگ کے پاس مائیکلینجیلو طرز طرز عمل کے ساتھ Duchamp سٹائل ریڈی میڈڈ کو یکجا کرنے کی صلاحیت ہے تاکہ قریب مستقبل کے موجودہ اور پیش گوئی کے زیادہ بروقت اور زیادہ درست پیمائش کے ساتھ فیصلہ ساز بنانے کے لئے.