ভবিষ্যতে পূর্বাভাসের কঠিন, কিন্তু বর্তমান পূর্বাভাসের সহজ.
দ্বিতীয় প্রধান কৌশল গবেষক পর্যবেক্ষণ তথ্য সঙ্গে ভবিষ্যদ্বাণী ব্যবহার করতে পারেন। ভবিষ্যতের ভবিষ্যত সম্পর্কে অনুমান করা খুবই কুখ্যাতিজনক, এবং সম্ভবত এই কারণে, পূর্বাভাস বর্তমানে সামাজিক গবেষণা একটি বড় অংশ নয় (যদিও এটি জনসংখ্যাতত্ত্ব, অর্থনীতি, মহাকর্ষবিদ্যা এবং রাজনৈতিক বিজ্ঞান একটি ছোট এবং গুরুত্বপূর্ণ অংশ)। এখানে, যাইহোক, আমি " এক্ষেত্রে " এবং "পূর্বাভাস" মিশ্রিত একটি নির্দিষ্ট ধরনের ভবিষ্যতের পূর্বাভাসের উপর ফোকাস করতে চাই। ভবিষ্যতের পূর্বাভাসের পরিবর্তে, বর্তমান অবস্থা পরিমাপের জন্য ধারণাগুলি থেকে ধারণাগুলি ব্যবহার করার জন্য এখনকে সম্প্রসারিত করার প্রচেষ্টাগুলি বিশ্বের; এটা "বর্তমান ভবিষ্যদ্বাণী" (Choi and Varian 2012) । Nowcasting বিশেষ করে সরকার ও কোম্পানীর জন্য উপযোগী হতে পারে যা বিশ্বের সময়মতো এবং যথাযথ পদক্ষেপের প্রয়োজন।
এক সেটিং যেখানে সময়মত এবং সঠিক পরিমাপের প্রয়োজন খুব স্পষ্ট হয় মহামারীবিদ্যা। ইনফ্লুয়েঞ্জা ("ফ্লু") এর ক্ষেত্রে বিবেচনা করুন। প্রতিবছর, মৌসুমি ইনফ্লুয়েঞ্জা মহামারী বিশ্বের কোটি কোটি অসুস্থতা এবং শত শত মৃত্যুর কারণ উপরন্তু, প্রতি বছর, একটি সম্ভাবনা আছে যে একটি উপসর্গ ইনফ্লুয়েঞ্জা গঠন হতে পারে যে লক্ষ লক্ষ বধ করবে। উদাহরণস্বরূপ, 1918 সালের ইনফ্লুয়েঞ্জা প্রাদুর্ভাব, প্রায় 50 থেকে 100 মিলিয়ন লোকের (Morens and Fauci 2007) মধ্যে নিহত হওয়ার কথা। কারণ ট্র্যাক প্রয়োজন এবং সম্ভাব্য ইনফ্লুয়েঞ্জা প্রাদুর্ভাব প্রতিক্রিয়া, সারা বিশ্বের সরকার ইনফ্লুয়েঞ্জা নজরদারি সিস্টেম তৈরি করেছেন উদাহরণস্বরূপ, ইউএস সেন্টার ফর ডিজিজ কন্ট্রোল অ্যান্ড প্রিভেনশন (সিডিসি) নিয়মিত এবং নিয়মিতভাবে দেশের প্রায় সাবধানে নির্বাচিত ডাক্তারদের কাছ থেকে তথ্য সংগ্রহ করে। যদিও এই সিস্টেমটি উচ্চ মানের ডেটা উত্পাদন করে, এটি একটি রিপোর্টিং ল্যাগ আছে। যেহেতু এটি ডাক্তারদের থেকে পরিষ্কার করা, প্রক্রিয়াকরণ এবং প্রকাশ করা ডেটার জন্য এটি সময় লাগে, তখন সিডিসি সিস্টেমে অনুমান করা হয় যে দুই সপ্তাহ আগে কতো ফ্লু ছিল। কিন্তু, একটি উর্ধমুখী মহামারী পরিচালনার সময়, পাবলিক হেলথ অফিসার জানতে চান না যে দুই সপ্তাহ আগে কতটা ইনফ্লুয়েঞ্জা ছিল; তারা জানতে চান যে এখন কতটা ইনফ্লুয়েঞ্জা আছে।
একই সময়ে সিডিসি ইনফ্লুয়েঞ্জা ট্র্যাক করতে তথ্য সংগ্রহ করছে, গুগল এমনকি বিভিন্ন ধরনের ইনফ্লুয়েঞ্জা প্রাদুর্ভাব সম্পর্কে তথ্য সংগ্রহ করছে। সারা পৃথিবীর লোকরা ক্রমাগত Google- এ প্রশ্নগুলি পাঠাচ্ছে এবং এই কয়েকটি প্রশ্নের - যেমন "ফ্লু রেমিডিসিস" এবং "ফ্লু লক্ষণগুলি" -ইটি ইঙ্গিত দেয় যে, প্রশ্নকারী ব্যক্তিটি ফ্লুতে আছেন কিন্তু, ফ্লু'র প্রাদুর্ভাবের জন্য এই অনুসন্ধান ক্যোয়ারীগুলি ব্যবহার করা খুবই জটিল। ফ্লুতে থাকা প্রত্যেকেরই ফ্লু-সম্পর্কিত অনুসন্ধান করে না এবং ফ্লু-এর সাথে সম্পর্কিত অনুসন্ধানের ফ্লুর কোনও ব্যক্তির থেকে নয়।
জেরেমি গিসবার্গ এবং সহকর্মীদের একটি দল (2009) , কিছু গুগল এবং সিডিসিতে কিছু, এই দুইটি ডাটা উৎসের সাথে একত্রিত করার জন্য গুরুত্বপূর্ণ এবং চূড়ান্ত ধারণা ছিল। মোটামুটিভাবে, পরিসংখ্যানগত রসায়নবিষয়ক মাধ্যমে, গবেষকরা ইনফ্লুয়েঞ্জা প্রাদুর্ভাবের দ্রুত এবং সঠিক পরিমাপ উত্পাদন করার জন্য ধীর এবং সঠিক সিডিসি ডেটা দিয়ে দ্রুত এবং ভুল অনুসন্ধান ডেটা মিলিয়েছেন। এটি সম্পর্কে আরেকটি উপায় হল সিডিসি ডেটা দ্রুতগতির জন্য অনুসন্ধানের তথ্য ব্যবহার করে।
আরো বিশেষভাবে, ২003 থেকে 2007 পর্যন্ত তথ্য ব্যবহার করে, গিবসবার্গ এবং সহকর্মীরা সিডিসি ডেটাতে ইনফ্লুয়েঞ্জার প্রাদুর্ভাব এবং 50 মিলিয়নের স্বতন্ত্র পদগুলির অনুসন্ধান ভলিউমের সম্পর্কের আনুমানিক আনুমানিক। এই প্রক্রিয়া থেকে, যা সম্পূর্ণভাবে তথ্য-চালিত এবং বিশেষজ্ঞ চিকিৎসা জ্ঞান প্রয়োজন ছিল না, গবেষকরা একটি সেট পাওয়া 45 বিভিন্ন প্রশ্ন সিডি সি ফ্লু প্রবণতা তথ্য সবচেয়ে ভবিষ্যদ্বাণীপূর্ণ বলে মনে হয়। তারপর, যেসব সম্পর্ক তারা 2003-2007 তথ্য থেকে শিখেছে সেগুলি ব্যবহার করে, গিন্সবার্গ এবং সহকর্মীরা ২00২-২008ের ইনফ্লুয়েঞ্জা সিজনের সময় তাদের মডেল পরীক্ষা করেছিল। তারা তাদের পদ্ধতি সত্যিই দরকারী এবং সঠিক nowcasts (চিত্র 2.6) করতে পারে যে পাওয়া যায় নি। এই ফলাফল প্রকৃতিতে প্রকাশিত এবং সংবাদ কভারেজ adoring প্রাপ্তি। এই প্রজেক্টটি-যা গুগল ফ্লু ট্রেন্ডস নামে পরিচিত ছিল- বিশ্বকে পরিবর্তন করার জন্য বড় বড় তথ্য পাওয়ার একটি প্রায়ই-পুনরাবৃত্তিগত দৃষ্টান্ত।
যাইহোক, এই আপাত সাফল্যের গল্প অবশেষে একটি বিব্রত পরিণত পরিণত। সময়ের সাথে সাথে, গবেষকরা আবিষ্কারের দুটি গুরুত্বপূর্ণ সীমাবদ্ধতাগুলি আবিষ্কার করেছিলেন যা Google ফ্লু ট্রেন্ডগুলিকে প্রাথমিকভাবে দেখা থেকে তুলনায় কম চিত্তাকর্ষক করে তোলে। প্রথমত, ফ্লু ট্র্যাভেলসগুলির কার্যক্ষমতা আসলে একটি সহজ মডেলের তুলনায় অনেক বেশি ভালো ছিল না যা ফ্লু প্রলেজেন (Goel et al. 2010) এর দুটি অতি সাম্প্রতিক পরিমাপের একটি রৈখিক এক্সপ্রপ্প্ল্পনের উপর ভিত্তি করে ফ্লু পরিমাণ নির্ধারণ করে। এবং, কিছু সময়ের মধ্যে, গুগল ফ্লু ট্রেন্ডস আসলে এই সহজ পদ্ধতির তুলনায় খারাপ ছিল (Lazer et al. 2014) । অন্য কথায়, গুগল ফ্লু ট্রেন্ডস সব তার ডেটা, মেশিন লার্নিং এবং শক্তিশালী কম্পিউটিং সঙ্গে নাটকীয়ভাবে একটি সহজ এবং সহজ-বোঝে পরিমার্জনকারী outperform না এটি প্রস্তাব দেয় যে যখন কোনো পূর্বাভাস বা সম্প্রচারের মূল্যায়ন করা হয়, তখন এটি একটি বেসলাইনের তুলনায় গুরুত্বপূর্ণ।
গুগল ফ্লু ট্রেন্ডস সম্পর্কে দ্বিতীয় গুরুত্বপূর্ণ সাবধানতা হল সিডিসি ফ্লু ডেটার পূর্বাভাসের ক্ষমতাটি ড্রিফট এবং অ্যালগরিডামিক সংহতির কারণে স্বল্পমেয়াদী ব্যর্থতা এবং দীর্ঘমেয়াদী ক্ষয়ক্ষতির প্রবণতা ছিল। উদাহরণস্বরূপ, ২009 সালের সোয়াইন ফ্লু প্রাদুর্ভাবের সময় ফ্লু ট্র্যাভেলসগুলি নাটকীয়ভাবে ইনফ্লুয়েঞ্জার পরিমাণ অনুপস্থিতি করেছিল, কারণ সম্ভবত বিশ্বজনীন মহামারী (Cook et al. 2011; Olson et al. 2013) এর ব্যাপক ভীতির প্রতিক্রিয়ায় তাদের অনুসন্ধানের আচরণ পরিবর্তন করতে থাকে (Cook et al. 2011; Olson et al. 2013) । এই স্বল্পমেয়াদী সমস্যা ছাড়াও, কর্মক্ষমতা ধীরে ধীরে সময় ক্ষয়প্রাপ্ত। এই দীর্ঘমেয়াদী ক্ষয় কারণ কারণ নির্ণয় করা কঠিন কারণ গুগল অনুসন্ধান অ্যালগরিদম মালিকানাধীন হয়, কিন্তু এটা 2011 সালে Google "ফ্লু" এবং "কাশি" মত ফ্লু উপসর্গ (এটি মনে হয় এই বৈশিষ্ট্যটি আর সক্রিয় নয়)। এই বৈশিষ্ট্যটি যুক্ত করা একটি সম্পূর্ণ যুক্তিসঙ্গত বিষয়, যদি আপনি কোনও সার্চ ইঞ্জিন চালাচ্ছেন, তবে এই অ্যালগরিদমিক পরিবর্তনটি আরও স্বাস্থ্য সম্পর্কিত অনুসন্ধান তৈরির প্রভাব ফেলেছে যা ফ্লু প্রবেশন (Lazer et al. 2014) কে অবাঞ্ছিত করার জন্য Google ফ্লু ট্রেন্ডগুলি করেছে।
এই দুই caveats ভবিষ্যতে nowcasting প্রচেষ্টার জটিল, কিন্তু তারা তাদের doom না। আসলে, আরো যত্নশীল পদ্ধতি ব্যবহার করে, Lazer et al. (2014) এবং Yang, Santillana, and Kou (2015) এই দুটি সমস্যা এড়াতে সক্ষম ছিল। এগিয়ে যাওয়া, আমি আশা করি যে গবেষকরা-সংগৃহীত ডেটার সাথে বড় তথ্য উত্সগুলিকে একত্রিত করে যে সম্প্রসারিত গবেষণাগুলি করা হয়েছে, কোম্পানিগুলি এবং সরকারগুলি যথাযথভাবে যথাযথ সময়সীমার এবং আরো নির্ভুল অনুমান তৈরি করতে সক্ষম হবে যেগুলি কিছুটা সময়ের সাথে সাথে বার বার বজায় রাখা হয়। গুগল ফ্লু ট্রেন্ডসের মতো এখনকার সম্প্রচারের প্রকল্পগুলি দেখায় যে যদি বড় তথ্য সূত্র গবেষণাগুলির জন্য তৈরি করা হয় এমন আরও ঐতিহ্যগত ডেটা দিয়ে মিলিত হয় তবে কী ঘটতে পারে? অধ্যায় 1 শিল্প সাদৃশ্য ফিরে চিন্তা, nowcasting নিকটবর্তী ভবিষ্যতের বর্তমান এবং পূর্বাভাসের আরো সময় এবং আরো সঠিক পরিমাপ সঙ্গে সিদ্ধান্ত প্রস্তুতকারকদের প্রদান করার জন্য Michelangelo- শৈলী custommades সঙ্গে Duchamp- শৈলী readymades একত্রিত করার সম্ভাবনা রয়েছে।