Kelajakni bashorat qiyin, lekin sovg'a taxmin osondir.
Ikkinchi asosiy strategiya tadqiqotchilari kuzatuv ma'lumotlari yordamida taxmin qilishlari mumkin. Kelajak haqida taxmin qilish juda qiyin va ehtimol shu sababli prognozlash hozirgi vaqtda ijtimoiy tadqiqotning katta qismi (demografiya, iqtisod, epidemiologiya va siyosatshunoslikning kichik va muhim qismi bo'lsa-da). Biroq, bu erda men hozirgi holatini o'lchash uchun prognoz g'oyalarni foydalanish urinishlar nowcasting, "hozir" birlashtirgan va "prognoz." O'rniga kelajagini taxmin olingan -a muddatli nowcasting deb nomlangan Prognozlashtirish maxsus turdagi haqida o'ylash uchun istardim Dunyo bo'yicha; u "hozirgi (Choi and Varian 2012) oldindan aytib berishga" harakat qiladi (Choi and Varian 2012) . Hozirgi kunda dunyo miqyosida o'z vaqtida va aniq choralarini talab qiladigan hukumatlar va kompaniyalar uchun foydali bo'lishi mumkin.
Vaqti-vaqti bilan aniq o'lchovga muhtoj bo'lgan vaziyatlardan biri epidemiologiya. Gripp («gripp») holatini ko'rib chiqing. Har yili mavsumiy yuqumli epidemiyalar millionlab kasalliklar va yuz minglab o'limlarni butun dunyoga olib keladi. Bundan tashqari, har yili millionlab odamlarni o'ldiradigan yangi grippning shakllanishi ehtimoli mavjud. Misol uchun, 1918 yilgi gripp epidemiyasi 50-100 million odamni o'ldirgan (Morens and Fauci 2007) . Gripp epidemiyalarini kuzatib borish va potentsiallarga qarshi turish zarurligi tufayli butun dunyo hukumatlari yuqumli kasalliklarni nazorat qilish tizimini yaratdilar. Misol uchun, AQSh Kasalliklarni bartaraf etish va oldini olish markazlari (CDC) muntazam va muntazam ravishda mamlakat bo'ylab tanlab olingan shifokorlar ma'lumotlarini to'playdi. Ushbu tizim yuqori sifatli ma'lumotlar ishlab chiqsa-da, u hisobotning kechiktirilishiga ega. Ya'ni shifokorlardan olingan ma'lumotlarni tozalash, qayta ishlash va nashr qilish uchun zarur bo'lgan vaqtni hisobga olgan holda, CDC tizimi ikki hafta oldin qancha gripp mavjudligini taxmin qilmoqda. Biroq, rivojlanayotgan epidemiyani davolashda sog'liqni saqlash xodimlari ikki hafta oldin qancha gripp mavjudligini bilishni xohlamaydilar; ular hozirgi kunda qancha gripp mavjudligini bilishni istashadi.
Shu bilan birga, CDC grippni kuzatish uchun ma'lumotlarni to'playdi, Google juda ko'p turli xil shakllarda bo'lsa-da, gripp tarqalishi haqida ma'lumot to'playdi. Dunyo bo'ylab odamlar doimiy ravishda so'rovlarni Googlega yuboradilar va so'rovlarning ayrimlarini "grippga qarshi vositalar" va "gripp belgilari" kabi savollarga javob berishadi. Ammo, gripp tarqalishini baholash uchun ushbu qidiruv so'rovlarini ishlatish juda qiyin: grippga chalingan har bir odam grippga bog'liq bo'lmagan tergovni amalga oshirmaydi, va gripp bilan bog'liq har qanday tekshiruv grippga chalingan odamdan emas.
Jeremy Ginsberg va uning hamkasblari jamoasi (2009) , ba'zilari Google va ba'zilari CDC da bu ikki ma'lumot manbasini birlashtirish bo'yicha muhim va aqlli g'oya bor edi. Tadqiqotchilar tez-tez va noto'g'ri qidiruv ma'lumotlarini yuqumli kasalliklar tarqalishining tez va aniq o'lchovlarini yaratish uchun asta-sekin va aniq CDC ma'lumotlari bilan birlashtirgan. Bu haqda o'ylashning yana bir yo'li CDC ma'lumotlarini tezlashtirish uchun qidiruv ma'lumotlarini ishlatishdir.
Keyinchalik, 2003 yildan 2007 yilgacha bo'lgan ma'lumotlar yordamida Ginsberg va uning hamkasblari CDC ma'lumotlaridagi yuqumli kasalliklarning tarqalishi va qidirish hajmini 50 mln. Tadqiqotchilar CDC grippi tarqalish ma'lumotlarini eng ko'p taxmin qiladigan 45 xil so'rovlar to'plamini topdilar va ular to'liq ma'lumotga asoslangan va ixtisoslashgan tibbiy bilimlarni talab qilmaydigan bu jarayondan boshlab. Keyinchalik, 2003-2007 yillar ma'lumotlaridan o'rgangan munosabatlardan foydalanib, Ginsberg va uning hamkasblari 2007-2008 yuqumli kasalliklar mavsumida ularning modelini sinab ko'rdilar. Ular o'zlarining protseduralari haqiqatan ham foydali va to'g'ri kelishi mumkinligini aniqladilar (2.6-chizma). Ushbu natijalar " Tabiat" jurnalida nashr etildi va matbuotga bosim o'tkazildi. "Google Flu Trends" deb nomlangan ushbu loyiha dunyoni o'zgartirish uchun katta ma'lumotlarning kuchi haqida tez-tez takrorlangan masalga aylandi.
Biroq, bu aniq muvaffaqiyat hikoyasi oxirida xijolatga aylandi. Vaqt o'tishi bilan tadqiqotchilar Google Flu Trendsni dastlab paydo bo'lganidan ko'ra kamroq ta'sir o'tkazadigan ikkita muhim cheklovni topdilar. Birinchidan, Google Flu Trendsning ishlashi aslida gripp tarqalishining oxirgi ikki o'lchovidan lineer ekstrapolyatsiyaga asoslangan gripp miqdorini hisoblaydigan oddiy modellardan ko'ra yaxshiroq emas edi (Goel et al. 2010) . Va, Google Grippi tendentsiyalari biroz vaqt mobaynida ushbu sodda yondoshuvdan ko'ra yomonroq edi (Lazer et al. 2014) . Boshqa so'z bilan aytganda, Google Flu Trends barcha ma'lumotlar, kompyuterni o'rganish va kuchli hisoblash bilan sodda va oson tushunilgan tarjimai holdan ancha ustunlik qilmadi. Bu shuni anglatadiki, har qanday prognozni yoki hozirgi holatni baholashda dastlabki holatga solishtirish muhimdir.
Google Gripp tendentsiyalari haqida, ikkinchi muhim ogohlantirish CDC grippi ma'lumotlarni bashorat qilish qobiliyati qisqa muddatli etishmovchiligi va, chunki shavq va algoritmik karıştırıcı omil uzoq muddatli parchalanish moyil edi, deb. Masalan, 2009 yilgi Dominion grippi epidemiyasida Google Flu Trends global pandemiya tarqalishidan qo'rqib, odamlarning qidirish harakatlarini o'zgartirishi ehtimoldan yiroq bo'lganligi sababli, gripp miqdorini keskin oshirib yubordi (Cook et al. 2011; Olson et al. 2013) . Ushbu qisqa muddatli muammolar bilan bir qatorda, vaqt o'tishi bilan ishlash asta-sekin pasayib ketdi. Ushbu uzoq muddatli parchalanishning sabablarini aniqlash qiyin, chunki Google qidiruv algoritmlari xususiydir, ammo 2011 yilda odamlar "isitma" va "yo'tal" kabi gripp belgilari izlaganida Google qidirishga oid so'zlarni taklif qila boshlagan ko'rinadi (shuningdek, bu xususiyat endi faol emas). Ushbu xususiyatni qo'shish qidiruv mexanizmi ishlayotganingizda bajarishingiz mumkin bo'lgan juda to'g'ri ishdir, ammo bu algoritmik o'zgarishlar Google Gripp Trendsiga gripp tarqalishini (Lazer et al. 2014) haddan tashqari oshirib yuborishga olib keladigan ko'proq sog'liq bilan bog'liq qidiruvlarni yaratishga ta'sir ko'rsatdi.
Ushbu ikki ogohlantirish kelajakdagi harakatlarni murakkablashtiradi, biroq ularni yo'qotmaydi. Aslida, yanada ehtiyotkorlikdagi usullar yordamida, Lazer et al. (2014) va Yang, Santillana, and Kou (2015) bu ikki muammolardan qochish imkoniga ega bo'ldilar. Ilgari kelajakda men katta ma'lumot manbalarini tadqiqotchilar tomonidan to'plangan ma'lumotlar bilan birlashtirgan tadqiqotlarni kompaniyalari va hukumatlarga vaqt o'tishi bilan bir nechta kechikishlar bilan qayta-qayta takrorlanadigan har qanday o'lchovni tezlashtirish orqali o'z vaqtida va aniqroq hisob-kitoblarni yaratishga imkon berishini kutmoqdaman. "Google Flu Trends" kabi hozirgi loyihalar, katta ma'lumot manbalari tadqiqot maqsadlari uchun yaratilgan an'anaviy ma'lumotlarga birlashganda nima bo'lishi mumkinligini ham ko'rsatadi. 1-bobning badiiy qiyosiga qaytib, bugungi kunda Duchamp uslubidagi tayyorgarliklarni Mikelanjelo uslubidagi treyderlar bilan birlashtirib, qaror qabul qiluvchilarga hozirgi vaqtda o'z vaqtida va aniqroq o'lchovlari va kelajakdagi bashoratlari bilan yordam berishga imkon beradi.