2.4.2 ප්රක්ශේපණය සහ nowcasting

අනාගතය ගැන අනාවැකි පල දුෂ්කර වේ, නමුත් වර්තමාන අනාවැකි පල පහසු ය.

නිරීක්ෂණ දත්ත සමඟ පර්යේෂකයන් විසින් භාවිතා කරන දෙවැනි ප්රධාන උපාය ප්රක්ෂේපනය වේ. අනාගතය ගැන අනාවැකි පල අපහසු වේ, නමුත් එය ඔවුන් සමාගම් හෝ ආණ්ඩු වැඩ යන්න, තීරණ ගන්නන් සඳහා ඇදහිය නොහැකි තරම් වැදගත් විය හැක.

Kleinberg et al. (2015) ඇතැම් ප්රතිපත්ති ගැටලු සඳහා අනාවැකි පළ කිරීමේ වැදගත්කම පැහැදිලි බව එහි මහල් දෙකක් ඉදිරිපත් කරයි. මම නියඟය මුහුණ දී සිටින ඇගේ ඇනා, කතා කරන්නම් හා වර්ෂාව අවස්ථාව වැඩි කිරීම සඳහා වැසි නැටුම් සඳහා ඔබට කළ හැකි යකැදුරා බඳවා ගැනීමට ද යන්න තීරණය කළ යුතුයි, එක් ප්රතිපත්තිය නිෂ්පාදක සිතන්න. තවත් ප්රතිපත්ති මට්ටමේ, මම බොබ් ඔහුට කතා කරන්නම්, ගෙදර යන ගමන් තෙත් වීම වළක්වාගැනීම සඳහා වැඩ කිරීමට කුඩයක් රැගෙන යන්න තීරණය කළ යුතුය. ඔවුන් කාලගුණය තේරුම් නම් ඇනා සහ බොබ් දෙකම වඩාත් හොඳ තීරණ ගන්න පුළුවන්, නමුත් ඔවුන් විවිධ දේ දැන ගැනීමට අවශ්ය වේ. ඇනා වැසි නැටුම් වැසි හේතු යන්න අවබෝධ කරගත යුතුය. බොබ්, අනිත් අතට, causality ගැන කිසිම දෙයක් තේරුම් ගැනීමට අවශ්ය නැත; ඔහු හුදෙක් නිවැරදි අනාවැකි යුතුය. සමාජ පර්යේෂකයන් බොහෝ විට දෙය පිළිබඳව දැඩි අවධානය යොමු Kleinberg et al. (2015) "වැසි නැටුම් වැනි" ප්රතිපත්තිය ප්රශ්න-අය මත අවධානය යොමු කරන කතා causality-හා පුෙරෝකථන අවධානය යොමු කරන බව "කුඩ වැනි" ප්රතිපත්තිය ප්රශ්න නොසලකා හරින්න.

මම සහ "දැන්" ඒකාබද්ධ ව්යුත්පන්න nowcasting -a කාලීන ලෙස පුරෝකථනය කිරීම සඳහා විශේෂ ආකාරයේ මත, කෙසේ වෙතත්, අවධානය යොමු කිරීමට කැමතියි "ප්රක්ෂේපනය." ඒ වෙනුවට වඩා අනාගතය ගැන අනාවැකි පල, වත්මන් අනාවැකි කිරීමට උත්සාහ nowcasting (Choi and Varian 2012) . වෙනත් වචන වලින් කිවහොත්, nowcasting මිනුම් ගැටලු සඳහා ප්රක්ශේපණ ක්රම භාවිතා කරයි. වැනි, එය ඔවුන්ගේ රටවල් කාලෝචිත හා නිවැරදි පියවර අවශ්ය වූ ආණ්ඩු විශේෂයෙන් ප්රයෝජනවත් විය යුතුය. Nowcasting ගූගල් උණ ප්රවණතා ආදර්ශය සමග වඩාත් පැහැදිලිව නිදර්ශනය කළ හැක.

ඔබ "උණ පිළියම්" සෙවීම් ඇන්ජින් තුළට ඇතුළු නිසා කාලගුණය යටතේ ටිකක් දැනෙන්නේ කියා සිතන්න, ප්රතිචාර සබැඳි පිටු ලබා, පසුව ප්රයෝජනවත් වෙබ්පිටුවක් ඔවුන්ගෙන් එක් කෙනෙක් අනුගමනය කරන්න. දැන් මෙම ක්රියාකාරකම සෙවීම් ඇන්ජිම ඉදිරිදර්ශනය සිට සිදුවෙමින් සිතන්න. සෑම මොහොතකම, විමසුම් මිලියන ලොව පුරා සිට පැමිණෙන අතර, විමසුම්-දේ මේ ඇළෙන් ඇත Battelle (2006) මෙම "අභිප්රායන් දත්ත සමුදාය" ඉල්ලා ඇත - සාමූහික ගෝලීය දැනුවත්කමකින් බවට නිරන්තරයෙන් යාවත්කාලීන කවුළුව සපයයි. කෙසේ වෙතත්, උණ පැතිරීම මැනීමේ බවට තොරතුරු මේ ඇළෙන් හැරෙමින් අපහසු වේ. හුදෙක් "උණ පිළියම්" හොඳින් වැඩ නොහැකි විය සඳහා විමසුම් සංඛ්යාව දක්වා ගණන්. උණ පිළියම් සඳහා උණ පිළියම් නොව සෑම දෙනාම searchers සඳහා උණ සෙවුම් ඇති සෑම කෙනෙක්ම උණ ඇත.

ගූගල් උණ ප්රවණතා පිටුපස වැදගත් හා දක්ෂ උපක්රමය වූ ප්රක්ශේපණ ප්රශ්නයක් බවට මිනුම් ප්රශ්නය හැරී විය. රෝග පාලන හා නිවාරණ සඳහා වූ එක්සත් ජනපද මධ්යස්ථාන (CDC) රට පුරා වෛද්යවරු තොරතුරු එකතු කරන ඇතිවූ ඉන්ෆ්ලුවෙන්සා අධීක්ෂණ ක්රමයක් ඇත. කෙසේ වෙතත්, මෙම CDC පද්ධතිය සමග ඇති එකම ප්රශ්නය සති දෙකක කාල පමාවක් වාර්තා පවතී ය; වෛද්යවරුන් පැමිණෙන දත්ත, පිරිසිදු කිරීම සඳහා කිරීමට සකස්කරන ලද, සහ ප්රකාශයට ඇති කාලය ගත වේ. එහෙත්, නැගී එන වසංගත හැසිරවීමේ විට, මහජන සෞඛ්ය කාර්යාල මීට සති දෙකකට පමණ පෙර කොපමණ ඉන්ෆ්ලුවෙන්සා විය දැන ගැනීමට අවශ්ය නැත; ඔවුන් කොපමණ ඉන්ෆ්ලුවෙන්සා දැන් පවතින දැනගන්න. ඇත්ත වශයෙන්ම, සමාජ බොහෝ දත්ත වෙනත් සම්ප්රදායික ආරංචි මාර්ග, දත්ත රැස් කිරීමේ තරංග හා වාර්තා lags අතර හිඩැස් ඇත. බොහෝ විශාල දත්ත මූලාශ්රයන්, අනිත් අතට, සෑම විටම-මත (2.3.1.2 වගන්තිය) වේ.

ඒ නිසා, ජෙරමි ගින්ස්බර්ග් හා සගයන් (2009) Google සෙවුම් දත්ත අඩවි නොමිළේ ස්ථාපනය උණ දත්ත පුරෝකථනය කිරීමට උත්සාහ කළා. මෙම "වර්තමාන අනාවැකි පල" කොපමණ උණ අඩවි නොමිළේ ස්ථාපනය, වත්මන් මනින බව අනාගත දත්ත අනාගත දත්ත අනාවැකි පල විසින් දැන් ඇති මැනීම සඳහා පර්යේෂකයන් උත්සාහ නිසා උදාහරණයකි. යන්ත්රය ඉගෙනුම් භාවිතා කරමින්, ඔවුන් අඩවි නොමිළේ ස්ථාපනය උණ දත්ත බොහෝ අනාවැකි වන දකින්න විවිධ සෙවුම් පද මිලියන 50 ක් හරහා සොයා ගියා. අවසානයේ, ඔවුන් බොහෝ අනාවැකි විය බවක් බව විවිධ විමසුම් 45 කට්ටලයක් සොයා, හා ප්රතිඵල ඉතා හොඳයි: ඔවුන් CDC දත්ත පුරෝකථනය කිරීමට සෙවුම් දත්ත භාවිතා කිරීමට ඔබට හැකිය. නේචර්ස් දී ප්රකාශයට පත් කරන ලදී මෙම කඩදාසි, මත කොටසක් පදනම්ව, Google උණ ප්රවණතා විශාල දත්ත බලය ගැන බොහෝ විට නැවත නැවතත් සාර්ථකත්වය කතාව බවට පත් විය.

කෙසේ වෙතත්, මෙය පැහැදිලි සාර්ථකත්වය සඳහා වැදගත් caveats දෙකක් ඇත, සහ මෙම caveats තේරුම් ඔබ තක්සේරුවට උදව් හා පුරෝකථනය කිරීම සහ nowcasting කරනු ඇත. පළමුව, ගූගල් උණ ප්රවණතා ඇත්තටම උණ පැතිරීම වඩාත් මෑතක දෙකක් රේඛීය ඉරණම් මත පදනම් උණ ඇති මුදල ෙකොපමණද ඇස්තමේන්තු බව සරල ආකෘතියක් වඩා බෙහෙවින් යහපත් වූයේ නැත කාර්ය සාධනය (Goel et al. 2010) . ඒ වගේම, යම් කාලයක් කාලයක් පුරා ගූගල් උණ ප්රවණතා මෙම සරල ප්රවේශය වඩා නරක සත්ය වශයෙන්ම (Lazer et al. 2014) . වෙනත් වචන වලින් කිවහොත්, එහි සියලු දත්ත, යන්ත්ර ඉගෙනුම්, හා බලවත් පරිගණක සමඟ Google උණ ප්රවණතා නාටකාකාර ලෙස සරල හා කලපුවේ කිලෝමීටරයක් ​​තේරුම් ගැනීමට පහසු අපට හැකිවූයේ නැත. මෙම කිසිදු අනාවැකි ඇගයීමට ලක් හෝ එය nowcast විට ගැන්මට එරෙහිව සන්සන්දනය කිරීම වැදගත් බව යෝජනා කරයි.

ගූගල් උණ ප්රවණතා ගැන දෙවැනි වැදගත් වරනයක් අඩවි නොමිළේ ස්ථාපනය උණ දත්ත පුරෝකථනය කිරීමට එහි ඇති හැකියාව නිසා මාරුව Algorithmic පුදුමයට කෙටි කාලීන අසාර්ථකත්වය හා දිගු කාලීන ක්ෂය පෙලඹෙති වූ බවයි. උදාහරණයක් ලෙස, 2009 සූකර උණ පුපුරා ගූගල් උණ ප්රවණතා නාටකාකාර ලෙස ඉන්ෆ්ලුවෙන්සා අධික ලෙස ඇස්තමේන්තු කළ මුදල ජනතාව ගෝලීය වසංගතයේ පැතිර බිය ප්රතිචාර ඔවුන්ගේ සෙවුම් හැසිරීම වෙනස් කිරීමට නැඹුරු නිසා වෙන්න තුළ, (Cook et al. 2011; Olson et al. 2013) . මෙම කෙටි කාලීන ගැටලු වලට අමතරව, කාර්ය සාධනය ක්රමයෙන් කාලයත් දිරාපත් වූ හ. Google සෙවුම් ඇල්ගොරිතම හිමිකාර නිසා මෙම දිගු කාලීන ක්ෂය කිරීමට හේතු හඳුනාගැනීම දුෂ්කර වේ, නමුත් එය 2011 දී ගූගල් (එය ද පෙනේ ජනතාව "උණ" හා "කැස්ස" වැනි රෝග ලක්ෂණ සොයන විට අදාළ සෙවුම් පද යෝජනා කරන බව වෙනස්කම් සිදු බව පෙනී යයි මෙම අංගය තවදුරටත් සක්රීය) ඒ. මෙම අංගය එකතු කරමින් ඔබ සෙවුම් යන්ත්රය ව්යාපාර පවත්වාගෙන නම් කරන්න මුළුමනින්ම සාධාරණ දෙයක් වන අතර, එය වඩා සෞඛ්යය සම්බන්ධ සෙවුම් ඇති කිරීමේ බලපෑමක් වුණා. මෙය බොහෝ විට ව්යාපාර සඳහා සාර්ථක විය, නමුත් එය අධික ලෙස ඇස්තමේන්තු උණ ව්යාප්තිය සඳහා Google උණ ප්රවණතා හේතුවෙන් (Lazer et al. 2014) .

එහෙත් වාසනාවකට මෙන්, ගූගල් උණ ප්රවණතා සමඟ මෙම ගැටලු නිසා එතැන ය. ඇත්ත වශයෙන්ම, වඩාත් සැලකිලිමත් වූ ක්රමවේදයන් මගින් Lazer et al. (2014) සහ Yang, Santillana, and Kou (2015) වඩා හොඳ ප්රතිඵල ලබා ගැනීමට හැකි විය. ඉදිරියට, මම පර්යේෂකයෙකු සමග විශාල දත්ත ඒකාබද්ධ බව nowcasting අධ්යයන මයිකල්ඇන්ජලෝ රටාවකට දත්ත-බව Duchamp පන්නයේ Readymades ඒකාබද්ධ එකතු වෙයි කියා බලාපොරොත්තු Custommades-ඇත, අනාගත, වර්තමාන අනාවැකි වඩා වේගයෙන් හා වඩා නිවැරදි මිනුම් නිෂ්පාදනය කිරීමට ප්රතිපත්ති සම්පාදකයන්ට අවස්ථාවක් ඇතිකරනු.