د راتلونکې وړاندوینه ستونزمنه ده، خو د اوسني وړاندوینه ده اسانه.
دویمه ستراتیژیکې څیړونکي کولی شي د مشاهدو معلوماتو سره کار واخیستل شي اټکل کیږي . د راتلونکي په اړه اټکلونه بدنامۍ دي، او شاید د دې دلیل لپاره، پیشنګګی اوس مهال د ټولنیزو څیړنو لویه برخه نه ده (سره له دې چې دا د ډیموکراسۍ، اقتصاد، ایډیډیمولوژي او سیاسي علومو یوه کوچنۍ او مهمه برخه ده). په هرصورت، زه غواړم د ځانګړو ډولونو وړاندیز کولو په اړه چې اوسنی توکی یې یادونه کوي تمرکز کوي - "اوسني" او "اټکل" راټولولو څخه اخیستل شوي اصطالح د اوسني حالت اټکل سره، د راتلونکې اټکل کولو په پرتله، د اوسني حالت اندازه کولو لپاره د اټکلونو څخه د نظرونو کارولو هڅو هڅه کوي. د نړۍ نړۍ دا هڅه کوي چې "اوسني" اټکل وکړي " (Choi and Varian 2012) . نوټ کول کول ممکن د حکومت او شرکتونو لپاره ګټور وي چې د نړۍ وخت په وخت او سم ګامونو ته اړتیا لري.
یو ترتیب چېرته چې په وخت او سمه پیمانه اړتیا ډیره روښانه ده ایپیډیمولوژي ده. د انفلوینزا قضیه وګورئ ("فلو"). هر کال، موسمي انفلوینزا اپیډیمیکونه په میلیونونو ناروغیو او په ټوله نړۍ کې په سلګونه زرو وژنو لامل ګرځي. سربېره پردې، هر کال، داسې امکان شته چې د انفلوینزا یو ناڅاپي بڼه رامینځ ته کړي چې دا به میلیونونه وګړي ووژني. د 1918 انفلوینزا خپریدنه، د بیلګې په توګه، اټکل کیږي چې د 50 څخه تر 100 میلیونو خلکو ترمنځ وژل شوي (Morens and Fauci 2007) . د تعقیبولو او د انفلوینزا په ناروغیو کې احتمالي غبرګونونو له امله، په ټوله نړۍ کې حکومتونه د انفلوینزا د نظارت سیسټمونه رامینځ ته کړي. د بیلګې په توګه، د ناروغۍ کنترول او مخنیوی لپاره د متحده ایاالتو مرکزونه) CDC (په منظمه توګه او په منظم ډول معلومات د هیواد په کچه په پام سره ټاکل شوي ډاکټرانو راټولوي. که څه هم دا سیسټم د لوړ کیفیت ډاټا تولیدوي، دا د راپور ورکولو محدودیت لري. دا د هغه وخت له امله چې د ډاکټرانو پاکول، پروسس شوي او خپاره شوي معلومات راټولوي، د CDC سیسټم اټکل کوي چې دوه اوونۍ دمخه څومره فلو څومره وه. مګر، کله چې د را منځ ته شوي اپیډیمیک اداره کول وي، عامې روغتیا چارواکي نه غواړي چې دوه اونۍ دمخه په دې پوه شي چې څومره اففاینزا؛ دوی غواړی پوهیږی چی اوس اوس څومره اففاینزا شتون لری.
په ورته وخت کې چې د ټولنې پراختیايي شورا د انفلونزا د پیژندلو لپاره معلومات راغونډوي، ګوګل هم د انفلوینزا د خپریدو په اړه معلومات راغونډوي، که څه هم په بیلابیل ډول کې. د نړۍ شاوخوا خلک په دوامداره توګه د ګوګل پوښتنو ته لیږل کیږي، او ځینې پوښتنې لکه "د فلو درملنه" او "د فلو روږدو" - په ګوته کوي چې هغه څوک چې د پوښتنې کولو فلو لري. مګر، د دې پلټنې پوښتنو کارولو لپاره د فلو د خپریدو اټکل ستونزمن دی: هر څوک چې فلو فلو پورې تړلې پلټنه نه کوي، او د هر فلو پورې اړوند پلټنه د هغه چا څخه ده چې فلوس لري.
Jeremy Ginsberg او د همکارانو یو ټیم (2009) ، په ګوګل کې او ځینې یې په CDC کې، دا دوه ارقامو سرچینو سره یوځای کولو لپاره مهم او چټک نظر درلود. په بشپړه توګه، د یو ډول احصایوي کیمیا له الرې، څیړونکو د انفلوینزا خپریدو چټک او درست اندازې تولید لپاره د CDC سست او درست معلوماتو سره د چټکو او غلط پلټنو ډاټا سره یوځای کړې. د دې په اړه فکر کولو بله لاره دا ده چې دوی د CDC ډاټا تیزولو لپاره د پلټنې معلومات کارولي.
په ځانګړې توګه، د 2003 څخه تر 2007 پورې ډاټا کارولو، Ginsberg او همکارانو اټکل کړی چې د CDC په ډاټا کې د انفلوینزا خپریدلو او د 50 میلیونو بیلابیلو شرایطو لپاره د پلټنې حجم تر مینځ. د دې پروسې څخه، کوم چې په بشپړه توګه ډاټا لخوا کارول شوي و او د ځانګړي روغتیا پوهې ته اړتیا نه درلوده، څیړونکو 45 بیلابیلو پوښتنو وموندله چې د CDC د فلو د زیاتو معلوماتو خورا اټکل کیده. بیا، د 2003-2007 ډاټا څخه زده کړل شویو اړیکو کارولو، Ginsberg او همکارانو خپل ماډل د 2007-2008 انفلونزا په موسم کې آزموینه وکړه. دوی وموندل چې د دوی طرزالعملونه ممکن واقعا ګټور او سمه ورځینې بڼه) 2.6 شمیره (. دا پایلې په فطرت کې خپاره شوي او د اعلان کولو مطبوعاتي پوښښ یې ترلاسه کړ. دا پروژه - چې د ګوګل فلو رجحان په نوم یادیږي - د نړۍ بدلون لپاره د لوی معلوماتو د واک په اړه د ډیری بار بار مثال و.
په هرصورت، دا ښکاره بریالیتوب کیسه په پایله کې له شرم سره مخامخ شوه. د وخت په تېرېدو، څیړونکو دوه مهم محدودیتونه وموندل چې د Google Flu رجحانات یې د پیل په پرتله لږ اغیزمن کوي. لومړی، د Google فلو رجحاناتو فعالیت په اصل کې د ساده ساده ماډل څخه ډیر ښه نه و چې اټکل یې د فلو رابرسیره کولو په اساس د فلو د خپریدو دوه وروستیو اندازه (Goel et al. 2010) . او، په ځینو وختونو کې، د Google فلو رجحانات د دې ساده تګلارې څخه بدتر وو (Lazer et al. 2014) . په بل عبارت، د ګوګل فلو رجحانات د ټولو معلوماتو، ماشین زده کړه، او پیاوړ کمپیوټری سره په ساده توګه د پوهې ساده او اسانه نه پوهیږي. دا وړاندیز کوي چې کله د کومې پیښې یا ابانیست ارزونه وشي، نو دا مهمه ده چې د اساساتو په مقابل کې مقایسه شي.
د ګوګل انفلونزا جریانونه په اړه د مهم دوهم داري ده چې د خپل توان وړاندوینه کلی د والګي د معلوماتو له بلايټ د لنډې مودې د ناکامۍ او اوږد مهاله ځکه د ګردله او د الگوريتم confounding ورستيدل وه. د بیلګې په توګه، د 2009 د سوین د سیلاب ځپلو په جریان کې د Google فلو رجحانات په انفراسینیک ډول د انفلوینزا اندازه خورا کمه کړې، احتمال لري ځکه چې خلک د نړیوال فامیمیک پراخه ډار (Cook et al. 2011; Olson et al. 2013) ویره کې د دوی د پلټنې چلند بدلوي (Cook et al. 2011; Olson et al. 2013) . د دې لنډ مهاله ستونزو سربیره، فعالیت په تدريجي ډول د وخت په تېرېدو سره خراب شوی. د دې اوږدې مودې لپاره د ویلو تشخیص ستونزمن دي ځکه چې د ګوګل لټون الورجیتم مالکیت لري، مګر داسې ښکاري چې په 2011 کې ګوګل په ګوته کولو سره د لټون د شرایطو وړاندیز پیل کړ کله چې خلک د فلو علاماتو لکه "بخار" او "ټوخی" لپاره لټون کوي (داسې ښکاري چې دا خصوصیت نور فعال نه دی). د دې ځانګړتیاوو زیاتول یو مناسب کار دی که تاسو د پلټنې انجن چلولی شئ، مګر دا الورجیتمک بدلون د نورو روغتیا اړوند پلټنو پیدا کولو اغیزه درلوده چې المل یې د Google فلو رجحان المل شوی د فلو د خپریدو کچه (Lazer et al. 2014) .
دا دوه سایټونه د راتلونکو تاریخي هڅو پیچلول دي، مګر دوی دوی ویره نلري. په واقعیت کې، د ال زیاتو احتیاطي میتودونو په کارولو سره، Lazer et al. (2014) او Yang, Santillana, and Kou (2015) وکوالی شول د دې دوو ستونزو څخه مخنیوی وکړي. زه غواړم چې د تاریخي مطالعاتو تمرکز وکړم چې د څیړونکو سره لوی معلومات سرچینې راټولوي - راټول شوي ډاټا به شرکتونو او حکومتونو ته وړتیا ورکړي چې په ډیر وخت کې د ځینو وختونو سره په تکرار سره د هرې کچې اندازه کولو سره نور وختونه او نور درست اټکلونه رامینځ ته کړي. د نوبل کانفرانس پروژې لکه د گوگل فلو رجحانات دا هم ښیي چې که څه هم واقع شي که چیرې د ډیټا ډیټا سرچینې د ډیرو رواجوي معلوماتو سره یوځای شي چې د څیړنې موخې لپاره رامینځ ته شوي. د 1 برخې په څیر د آرټ سره فکر کول، اوسنی کول د ډیچینډ طرزالعمل ډیزاینډیزونو سره یوځای د میشلینګیلو طرزالعملونو سره سره د پریکړې نیونکي چمتو کولو لپاره نږدې نږدې راتلونکې او وړاندیزونو کې د وخت په وخت او ډیر درست انداز سره چمتو کولو لپاره.