2.4.2 мэдээ, nowcasting

Ирээдүйг урьдчилан таамаглахад хэцүү байдаг, гэхдээ бэлэг таамаглахад хялбар байдаг.

Ажиглалтын мэдээлэл судлаачид ашигладаг хоёр дахь гол стратеги таамаглал байна. ирээдүйг таамаглахад зартай хэцүү байдаг, гэхдээ тэдгээр нь компани, засгийн газар ажиллах эсэх нь, шийдвэр гаргагчид нь итгэмээргүй чухал ач холбогдолтой байх болно.

Kleinberg et al. (2015) бодлого тодорхой асуудлуудыг урьдчилан ач холбогдлыг тодруулах хоёр түүх санал болгож байна. Нэг бодлого үйлдвэрлэгч төсөөлөөд үз дээ, би түүний Анна нь ган гачиг тулгарч байгаа бөгөөд бороо боломжийг нэмэгдүүлэх нь бороо бүжиг хийх нь бөө ажилд авах эсэхийг шийдэх ёстой гэж нэрлэж болно. Өөр нэг бодлого нь үйлдвэрлэгч, би түүнийг Боб, гэртээ харих замдаа нойтон авах зайлсхийхийн тулд ажиллах шүхэр авах эсэхийг шийдэх ёстой гэж нэрлэж болно. Тэд цаг агаар ойлгох бол Анна болон Боб Аль аль нь илүү сайн шийдвэр гаргаж чадна, гэхдээ тэдгээр нь өөр өөр зүйлийг мэдэж байх хэрэгтэй. Анна бороо бүжгийн бороо шалтгаан байгаа эсэхийг ойлгох хэрэгтэй. Боб, нөгөө талаас, учир шалтгааны талаар юу ч ойлгох хэрэгтэй байх; Тэр зүгээр л үнэн зөв таамаглал хэрэгтэй. Нийгмийн судлаачид ихэвчлэн юу анхаарах Kleinberg et al. (2015) "бороо бүжгийн шиг" бодлогын асуудлыг тэд анхаарлаа хандуулах гэсэн учир шалтгааны-, урьдчилан анхаарч байна "шүхэр шиг" бодлогын асуудлыг тоохгүй гэж нэрлэдэг.

Би бэлэг урьдчилан таамаглах оролдлого nowcasting, -a цаг "одоо" хослуулах болон олсон nowcasting гэж нэрлэдэг урьдчилан таамаглах нь тусгай төрлийн дээр Гэсэн хэдий ч, анхаарах хүсч байна "таамаглал". Харин ирээдүйг таамаглахад илүү (Choi and Varian 2012) . Өөрөөр хэлбэл, nowcasting хэмжилтийн асуудлыг урьдчилсан арга хэрэглэдэг. Ийм учраас, энэ нь тэдний улс орнуудын талаар цаг тухайд нь, үнэн зөв арга хэмжээ шаардаж Засгийн газар нь ялангуяа ашигтай байх ёстой. Nowcasting Google Ханиад чиг хандлага Жишээ нь хамгийн тодорхой харуулсан болно.

Хэрэв та бичиж болохоор хайлтын систем рүү "томуу арга хэмжээг" Хэрэв та цаг агаарын дор жаахан мэдэрч байна гэж төсөөлөөд үз дээ, хариу холбоосууд хуудсыг хүлээн авч, дараа нь тус цахим хуудас тэдний нэг нь дага. Одоо энэ үйл ажиллагаа нь хайлтын систем нь талаас гарч тоглож байна гээд төсөөл дөө. Мөч бүр асуулгуудад сая сая дэлхийн өнцөг булан бүрээс ирж байгаа бөгөөд асуулгын-зүйлээ энэ гол Battelle (2006) "зорилт мэдээллийн сан" гэж нэрлэдэг байна - нь байнга шинэчилж цонх хамтын дэлхийн ухамсрын болгон олгодог. Гэсэн хэдий ч, томуугийн тархалт нь хэмжилтийн руу мэдээллийг энэ урсгалыг эргэж хэцүү байдаг. Зүгээр л "Ханиадны учирсан гэм хорыг арилгах" гэсэн хүсэлтэд тоог хүртэл тоолох сайн ажиллахгүй байж болох юм. Ханиадны арга нь эрж ханиад байна томуу арга нь томуу хайлт, хүн бүр чадахгүй байна Хүн бүр.

Google-ийн Ханиад чиг хандлага ард чухал, ухаалаг арга заль нь урьдчилсан асуудал болгон хэмжилтийн асуудлыг эргэж байсан юм. Өвчнийг хянах, урьдчилан сэргийлэх АНУ-ын төв (CDC) улс орон даяар эмч нарын мэдээллийг цуглуулж томуугийн хяналтын тогтолцоог байна. Гэсэн хэдий ч, энэ CDC систем нь нэг асуудал нь хоёр долоо хоногийн тайлангийн зөрүү байдаг юм; хугацаа эмч нар ирж байгаа өгөгдлийг авдаг, цэвэрлэж байх боловсруулж, нийтэлсэн байна. Харин хөгжиж буй тархалтыг харьцах үед, олон нийтийн эрүүл мэндийн байгууллагууд ямар их томуугийн хоёр долоо хоногийн өмнө гарч байсан юм мэдэхийг хүсэхгүй байна, Тэд одоо байгаа хэд томуугийн мэдэхийг хүсч байна. Үнэн хэрэгтээ, нийгмийн мэдээллийн бусад олон уламжлалт эх үүсвэр тэнд мэдээлэл цуглуулах давалгаа, тайлагнах хожимдол хоёрын хооронд ялгаа байна. Хамгийн том мэдээллийн эх үүсвэр, нөгөө талаас, (Section 2.3.1.2) ямагт дээр байдаг.

Тиймээс, Жереми Ginsberg болон түүний хамтрагчид (2009) Google-ийн хайлтын өгөгдлөөс CDC томуугийн мэдээллийг урьдчилан оролдов. Энэ нь "одоогийн таамаглахад" судлаачид CDC, ирээдүйн тоо одоогийн хэмжих нь ирээдүйн мэдээллийг урьдчилан таамаглахад одоо байгаа хэд томуу хэмжих гэж оролдож байсан тул нэг жишээ юм. машин суралцах ашиглах, тэд CDC томуугийн мэдээллийн хамгийн таамнал байдаг нь харахын тулд 50 сая өөр өөр хайлтын хувьд дамжуулан хайлт. Эцэст нь, тэд хамгийн урьдчилан таамаглах байх шиг санагдав 45 өөр өөр асуулгын багц олж, үр дүн нь маш сайн байсан: тэд CDC мэдээллийг урьдчилан хайлтын мэдээллийг ашиглаж болох юм. Энэ цаас, Байгаль онд хэвлэгдсэн дээр хэсэгт үндэслэн, Google Ханиад чиг хандлагуудыг танилцуулах нь том мэдээллийн эрх мэдлийн тухай олонтаа давтагддаг амжилтын түүх болсон.

Тэнд гэхдээ энэ нь илэрхий амжилтанд хоёр чухал анхааруулгын болой, мөн эдгээрийн анхааруулгын ойлгоход та үнэлэх туслах мэдээ, nowcasting хийх болно. Нэгдүгээрт, Google Ханиад чиг хандлага гүйцэтгэлийн томуугийн тархалт хоёр хамгийн сүүлийн үеийн хэмжилтийн нь шугаман экстраполяци дээр суурилсан томуугийн хэмжээг тооцоолсон нь энгийн загвараас-ээс илүү үнэн байсан (Goel et al. 2010) . Тэгээд хэсэг хугацааны туршид Google Ханиад чиг хандлагуудыг танилцуулах нь энэ энгийн аргыг бодвол үнэхээр муу байсан (Lazer et al. 2014) . Өөрөөр хэлбэл, түүний бүх мэдээлэл, машин суралцах, хүчирхэг компьютерийн бүхий Google Ханиад чиг хандлага эрс Сэтгэн олох ойлгоход энгийн, хялбар хавьгүй илүү юм. Энэ нь ямар ч таамаглал үнэлэх, эсвэл nowcast үед энэ нь суурь эсрэг харьцуулах нь чухал юм гэдгийг харуулж байна.

Google Ханиад чиг хандлага-ий хоёр дахь чухал Анхаарах зүйл CDC томуугийн мэдээллийг урьдчилан таамаглах чадвар богино хугацааны алдаа, учир нь шилжилтийн болон алгоритмын confounding урт хугацааны задрал хандлагатай байсан байгаа юм. Жишээ нь, 2009 оны Гахайн томуугийн дэгдэлт Google Ханиад чиг хандлага үед эрс томуу хэмжээ, хэт үнэлсэн хүмүүс дэлхий нийтийн цартахлын өргөн тархсан айдас хариуд нь тэдний хайлтын ажиллагааг өөрчлөх хандлагатай байдаг учраас магадгүй (Cook et al. 2011; Olson et al. 2013) . Эдгээр богино хугацааны асуудал гадна, гүйцэтгэл аажмаар удаан хугацаанд хуучирч муудсан. Энэ нь урт хугацааны задралын шалтгааныг оношлоход төвөгтэй байдаг Google-ийн хайлтын алгоритм өмчийн учраас, гэхдээ энэ нь (энэ нь бас шиг санагддаг хүмүүс "халуурах" болон "ханиад" гэх мэт шинж тэмдэг хайж байхдаа 2011 онд Google-ийн холбоотой хайлтын нэр томъёо санал болгож байна өөрчлөлт хийсэн нь харагдаж байна энэ онцлог нь ямар ч цаашид идэвхтэй байгааг). энэ боломжийг нэмэх Хэрэв та хайлтын бизнес ажиллуулж байгаа бол үүнийг хийх бүрэн үндэслэлтэй зүйл байдаг бөгөөд энэ нь илүү их эрүүл мэндийн холбогдолтой хайлт бий нөлөө үзүүлсэн. Энэ нь магадгүй бизнес нь амжилттай байсан боловч энэ нь хэт тооцоогоор томуугийн тархалт нь Google-ийн Ханиад чиг хандлага үүссэн (Lazer et al. 2014) .

Аз болоход, Google Ханиад чиг хандлага нь эдгээр асуудал fixable байна. Үнэн хэрэгтээ илүү болгоомжтой аргаар, Lazer et al. (2014) болон Yang, Santillana, and Kou (2015) илүү сайн үр дүнг авч чадсан юм. Цаашид би судлаач нь том мэдээллийг нэгтгэх nowcasting судалгаа мэдээллийг-Michaelangelo загварын хамт Duchamp загварын Readymades хослуулан Custommades-болно бэлэг нь илүү хурдан, зөв ​​хэмжилт болон ирээдүйн таамаглал гаргаж бодлого боловсруулагч боломжийг цуглуулсан гэж бодож байна.