Kelajakni bashorat qiyin, lekin sovg'a taxmin osondir.
Kuzatish ma'lumotlari bilan tadqiqotchilar tomonidan ishlatilgan, ikkinchi asosiy strategiyasi prognoz qilingan. kelajagini taxmin juda mushkul, lekin ular kompaniya yoki hukumatlari ishlash bo'lsin u, qaror qabul qiluvchilar uchun nihoyatda muhim bo'lishi mumkin.
Kleinberg et al. (2015) muayyan siyosat muammolar uchun prognozlash muhimligini aniqlab ikki hikoyalar taklif etadi. Bir siyosati yaratuvchisi tasavvur, men bir qurg'oqchilik oldida turgan va yomg'ir imkoniyat oshirish uchun yomg'ir raqs qilish uchun somon ishga qaror kerak, uning Anna, deb atayman. Yana bir siyosat maker, men uyga yo'lda ho'l oldini olish uchun, ishlash uchun soyabon olish qaror kerak, Bob unga qo'ng'iroq qilaman. ular ob-havo tushunish, agar Anna va Bob har ikki yaxshiroq qaror mumkin, lekin ular turli narsalarni bilish kerak. Anna yomg'ir raqs yomg'ir sabab yo'qligini tushunish kerak. Bob, boshqa tomondan, nedensellik haqida hech narsa tushunish kerak emas; U faqat aniq prognoz kerak. Ijtimoiy tadqiqotchilar ko'pincha nima haqida o'ylash Kleinberg et al. (2015) , «yomg'ir raqs kabi" siyosati muammolarni-ana haqida o'ylash nedensellik-va prognozlash bilan band "soyabon kabi" siyosati muammolarni e'tiborsizlik deb chaqiradi.
Men "hozir" birlashtirgan va olingan -a muddatli prognozlash deb nomlangan nowcasting maxsus turiga Biroq, e'tibor qilmoqchiman "prognozlash." Balki kelajakka bashorat ko'ra, sovg'a bashorat qilish urinishlar nowcasting (Choi and Varian 2012) . Boshqa so'zlar bilan aytganda, nowcasting o'lchov muammolar uchun prognozlashtirish usullaridan foydalanadi. kabi, u o'z mamlakatlarida haqida o'z vaqtida va aniq chora-tadbirlarni talab hukumatlarga ayniqsa foydali bo'lishi kerak. Nowcasting Google Gripp Trends misolida bilan eng aniq ko'rsatilgan bo'lishi mumkin.
Agar bir qidiruvi ichiga "grippi vositalarni" yozing, shuning uchun siz havo ostida bir oz his, deb tasavvur qiling-a, javoban ishoratlar bir sahifa olish, keyin esa bir foydali veb-sahifasiga ulardan biri amal. Endi bu faoliyat qidiruvi nuqtai nazaridan olib o'ynadi etilmoqda tasavvur. Har lahza, so'rovlar millionlab butun dunyo bo'ylab kelgan va so'rovlardan-nima, bu oqim Battelle (2006) , "niyat ma'lumotlar bazasi" chaqirdi - kollektiv global ongi bir doimiy yangilanib oynasini beradi. Biroq, grippi tarqalgani bir o'lchov ichiga axborot, bu oqim o'girib qiyin. Oddiygina "grippi himoya vositalaridan" uchun so'rovlar soni sanab yaxshi ishlamasligi mumkin. gripp dori vositalari uchun qidirish grippi ega grippi grippi himoya vositalaridan uchun qidiruv va hamma mavjud emas har kim.
Google Gripp Trends ortida muhim va aqlli trick bir prognozlash muammosi bir o'lchov muammoni o'girib edi. Kasalliklarni nazorat qilish va oldini olish uchun AQSh markazlari (CDC) mamlakat bo'ylab shifokorlarga ma'lumot to'playdigan bir gripp monitoring tizimi mavjud. Shu bilan birga, bu CDC tizimi bilan bir muammo bir-ikki hafta hisobot lag bor hisoblanadi; Bu shifokorlar kelgan ma'lumotlar uchun vaqt, tozalanadi qayta va chop qilinadi. bir rivojlanayotgan epidemiya ushlaganda Lekin, sog'liqni saqlash idoralari ikki hafta oldin bor edi qancha gripp bilish istamayman; hozir u erda qancha gripp ular bilishni istayman. Aslida, ijtimoiy ma'lumotlar boshqa ko'plab an'anaviy manbalarda, ma'lumotlar yig'ish to'lqinlar va hisobot demabmidim o'rtasida bo'shliqlar bor. Eng katta ma'lumot manbalari, boshqa tomondan, har doim-kuni (bo'lim 2.3.1.2) bor.
Shuning uchun, Jeremy Ginsberg va hamkasblari (2009) Google qidiruv ma'lumotlar CDC grippi ma'lumotlarni oldindan urindi. Bu tadqiqotchilar sovg'a o'lchash bo'ladi CDC, bo'lg'usi ma'lumotlar bo'lajak ma'lumotlarni oldindan hozir bor qancha grippi o'lchash uchun harakat edi, chunki "hozirgi bashorat" namunasidir. mashina o'rganish foydalanish, ular CDC grippi ma'lumotlar eng bashoratli bo'lgan ko'rish uchun 50 million xil qidirish so'zlari orqali tintuv. Oxir oqibatda, ular eng bashoratli tuyulardi 45 xil so'rovlar majmuini ko'rdi va natijalar ancha yaxshi edi: ular CDC ma'lumotlarni bashorat qilish qidiruv ma'lumotlarni foydalanishingiz mumkin. Tabiat chop etilgan bu qog'oz, qisman asoslangan, Google Gripp Trends katta ma'lumotlar kuchi haqida tez-tez takrorlanadi muvaffaqiyat hikoyasi bo'ldi.
U erda ikki muhim zaif nuqta Biroq, bu zohiriy muvaffaqiyatga bor, va bu so'zini tushunish Agar baholash yordam va prognozlash va nowcasting qilamiz. Birinchidan, Google Gripp Trends ishlash aslida grippi tarqalishi ikki eng so'nggi o'lchov bir chiziqli ekstrapolyatsiya asosida gripp miqdorini oddiy modeli balki juda yaxshi edi (Goel et al. 2010) . Va, ba'zi vaqt davomida Google Gripp Trends bu oddiy yondashuv nisbatan aslida yomon edi (Lazer et al. 2014) . Boshqa so'zlar bilan aytganda, uning barcha ma'lumotlar, mashinasozlik ta'lim va kuchli kompyuter bilan Google Gripp Trends keskin buluşsalı tushunish oddiy va oson yanada yaxshi ishlash bermadi. Bu har qanday prognoz baholash yoki nowcast qachon u boshlang'ich qarshi solishtirish uchun muhim ahamiyatga ega ekanligini ko'rsatadi.
Google Gripp avzalliklari ikkinchi muhim ogohlantirish CDC grippi ma'lumotlarni bashorat qilish, uning qobiliyati qisqa muddatli etishmovchiligi va, chunki shavq va algoritmik karıştırıcı omil uzoq muddatli parchalanish moyil edi, deb. Misol uchun, 2009 cho'chqa grippi epidemiyasining Google Gripp Trends davomida keskin odamlar global epidemiyasining keng qo'rqib javoban o'z qidiruv xatti o'zgartirish istagi, ehtimol, chunki, gripp miqdorini ustidan-taxmin (Cook et al. 2011; Olson et al. 2013) . Bu qisqa muddatli muammolarni tashqari, ishlashi asta-sekin vaqt davomida chirigandan. Bu uzoq muddatli parchalanish sabablari diagnostika Google qidirish algoritmlarni mulkiy, chunki qiyin, lekin u (u ham ko'rinadi odamlar "isitma" va "yo'tal" kabi belgilari uchun qidiruv 2011-yilda Google bilan bog'liq qidiruv shartlarini taklif qilaman o'zgarishlar qilgan ko'rinadi bu xususiyat) endi faol ekanligini. Bu xususiyatni yursangiz, bir qidiruvi ish bilan ishlayotgan bo'lsangiz, albatta, butunlay oqilona narsa, va u ko'proq sog'liqni saqlash bilan bog'liq vaziyat qo'ng'iroqlari yaratish ta'siri bor edi. Bu, ehtimol, biznes uchun bir muvaffaqiyat edi, lekin u orqali-smeta grippi tarqalishi uchun Google Gripp yo'nalishlari sabab (Lazer et al. 2014) .
Yaxshiyamki, Google Gripp yo'nalishlari bilan bu muammolar ta'mirlash mumkin bo'ladi. Aslida, ko'proq ehtiyotkorlik usullari yordamida, Lazer et al. (2014) va Yang, Santillana, and Kou (2015) yaxshiroq natijalarga erishdik. oldinga borib, men tadqiqotchi bilan katta ma'lumotlar birlashtirish nowcasting tadqiqotlar ma'lumotlarini-Michaelangelo-uslubi bilan Duchamp-style Readymades birlashtirish Custommades-qiladi tezroq va aniqroq bugungi o'lchov va kelajak bashorat ishlab chiqarish siyosatini imkon to'plangan, deb kutadi.