எதிர்காலத்தையும் கடினமாக உள்ளது, ஆனால் தற்போது கணிக்க எளிதாக உள்ளது.
உற்றுநோக்கல் தரவு ஆராய்ச்சியாளர்கள் பயன்படுத்தப்படும் இரண்டாவது முக்கிய உத்தி கணிக்கும் உள்ளது. எதிர்காலத்தையும் படுபயங்கர கடினம், ஆனால் அவர்கள் நிறுவனங்கள் அல்லது அரசாங்கங்கள் வேலை என்பதை அது, முடிவை தயாரிப்பாளர்கள் நம்பமுடியாத முக்கியமான இருக்க முடியும்.
Kleinberg et al. (2015) , சில கொள்கை பிரச்சினைகளுக்கு முன்னறிவிப்பு முக்கியத்துவம் தெளிவுபடுத்த என்று இரண்டு கதைகள் வழங்குகிறது. ஒரு கொள்கை தயாரிப்பாளர் கற்பனை, நான் ஒரு வறட்சி எதிர்கொள்ளும் மற்றும் மழை வாய்ப்பு அதிகரிக்க ஒரு மழை நடனம் செய்ய ஒரு மத குருவாகவும் அமர்த்த என்பதை தீர்மானிக்க வேண்டும் யார் அண்ணா, அழைக்கிறேன். மற்றொரு கொள்கை தயாரிப்பாளர், நான் அவரை பாப், வீட்டிற்கு செல்லும் வழியில் நனையும் தவிர்க்க வேலை ஒரு குடை எடுத்து என்பதை தீர்மானிக்க வேண்டும் அழைக்கிறேன். அவர்கள் வானிலை புரிந்து என்றால் அண்ணா மற்றும் பாப் இருவரும் ஒரு நல்ல முடிவை எடுக்க முடியும், ஆனால் அவர்கள் பல்வேறு விஷயங்களை தெரிந்து கொள்ள வேண்டும். அண்ணா மழை நடனம் மழை காரணமாக என்பதை புரிந்து கொள்ள வேண்டும். பாப், மறுபுறம், காரணகாரிய பற்றி எதுவும் புரிந்து கொள்ள வேண்டும் என அவசியமில்லை; அவர் தான் ஒரு துல்லியமான கணிப்பு தேவை. சமூக ஆராய்ச்சியாளர்களும் என்ன கவனம் செலுத்த Kleinberg et al. (2015) "மழை நடனம் போன்று" கொள்கை பிரச்சினைகள்-அந்த கவனம் காரணகாரிய-மற்றும் முன்னறிவிப்பு கவனம் என்று "குடை போன்ற" கொள்கை பிரச்சினைகளை தவிர்க்க என்று அழைக்க.
நான் தற்போது கணிக்க முயற்சிகள் nowcasting, nowcasting என்று முன்னறிவிப்பு ஒரு சிறப்பு வகையான --இந்த சொல் "இப்போது" இணைந்த மற்றும் பெறப்பட்ட, இருப்பினும், கவனம் செலுத்த விரும்புகிறேன் "முன்னறிவிப்பு." மாறாக எதிர்காலத்தையும் விட (Choi and Varian 2012) . வேறு வார்த்தைகளில் கூறுவதானால், nowcasting அளவீட்டு பிரச்சினைகளுக்கு எதிர்வுகூறல் முறைகளில் பயன்படுத்துகிறது. எனினும், அது தங்கள் நாடுகளில் பற்றி சரியான நேரத்தில் மற்றும் துல்லியமான நடவடிக்கைகளை தேவைப்படும் அரசாங்கங்களிடத்தே குறிப்பாக பயனுள்ளதாக இருக்க வேண்டும். Nowcasting கூகிள் காய்ச்சல் போக்குகள் உதாரணமாக கொண்டு மிகவும் தெளிவாக விளக்கலாம்.
எனவே நீங்கள் ஒரு தேடு பொறியை ஒரு "காய்ச்சல் வைத்தியம்" தட்டச்சு நீங்கள் வானிலை கீழ் ஒரு பிட் சரியில்லை என்று கற்பனை, பதில் இணைப்புகள் ஒரு பக்கம் பெறும், பின்னர் ஒரு பயனுள்ளதாக வலைப்பக்கத்தை அவற்றில் ஒன்று பின்பற்ற. இப்போது கற்பனை இந்த நடவடிக்கை தேடுபொறி பார்வையில் இருந்து வெளியே விளையாடி வருகிறது. ஒவ்வொரு விநாடியும் கேள்விகளுக்கு மில்லியன் உலகம் முழுவதும் இருந்து வந்து, மற்றும் கேள்விகளுக்கு என்ன இந்த ஸ்ட்ரீம் Battelle (2006) "நோக்கங்கள் பற்றிய தகவல்" என்று அழைப்பு விடுத்து - கூட்டு உலக உணர்வு ஒரு தொடர்ந்து மேம்படுத்தப்பட்டு வாயிலை வழங்குகிறது. எனினும், காய்ச்சல் நிலவுவதன் அளவீடு ஒரு தகவல் இந்த ஸ்ட்ரீம் திருப்பு கடினம். வெறுமனே "காய்ச்சல் வைத்தியம்" க்கான கேள்விகள் எண்ணிக்கை வரை எண்ணி நன்றாக வேலை இல்லை என்று. காய்ச்சல் வைத்தியம் காய்ச்சல் தேடல்கள் மற்றும் அனைவருக்கும் யார் காய்ச்சல் வைத்தியம் searchers காய்ச்சல் உள்ளது யார் அனைவருக்கும்.
கூகிள் காய்ச்சல் போக்குகள் பின்னால் முக்கியமான மற்றும் தந்திரோபாயமே ஒரு முன்னறிவிப்பு பிரச்சனை ஒரு அளவீடு பிரச்சனை திரும்ப இருந்தது. நோய் கட்டுப்பாடு மற்றும் தடுப்பு மையங்கள் (சிடிசி) நாடு முழுவதும் டாக்டர்கள் தகவலை சேகரிக்கிறது காய்ச்சலில் கண்காணிப்பு அமைப்பு உள்ளது. எனினும், இந்த சிடிசி அமைப்பு ஒரு பிரச்சனை ஒரு இரண்டு வாரம் அறிக்கை பின்னடைவு இல்லை உள்ளது; அது மருத்துவர்கள் இருந்து வரும் தரவு எடுக்கும் நேரம், சுத்தம் செய்ய வேண்டும் பதப்படுத்தப்பட்ட, மற்றும் வெளியிட்டது. ஆனால், ஒரு வளர்ந்து வரும் தொற்றுநோய் கையாளும் போது, பொது சுகாதார அலுவலகங்கள் இரண்டு வாரங்களுக்கு முன்பு இருந்தது மிகவும் காய்ச்சல் என்பதை தெரிந்து கொள்ள வேண்டும் வேண்டாம்; மிகவும் காய்ச்சல் எப்படி இப்போது உள்ளது அவர்கள் தெரிந்து கொள்ள வேண்டும். உண்மையில் சமூக தரவு பல பாரம்பரிய ஆதாரங்கள், அங்கு தரவு சேகரிப்பு அலைகள் மற்றும் அறிக்கை பின்தங்கியும் இடையில் இடைவெளியை உள்ளன. மிக பெரிய தரவு மூலங்கள், மறுபுறம், எப்போதும் (பிரிவு 2.3.1.2) உள்ளன.
எனவே, ஜெர்மி கின்ஸ்பெர்க் மற்றும் சக (2009) Google தேடல் தரவைப் இருந்து சிடிசி காய்ச்சல் தரவு கணிக்க முயற்சி. இந்த ஆராய்ச்சியாளர்கள் சிடிசி, எதிர்கால தரவு தற்போதைய அளவிடும் என்று இருந்து எதிர்கால தரவு கணிக்கும் மூலம் இப்போது இல்லை மிகவும் காய்ச்சல் என்பதை அளவிட முயற்சி ஏனெனில் "தற்போதைய கணிக்கும்" ஒரு உதாரணம் ஆகும். இயந்திர கற்றல் பயன்படுத்தி, அவர்கள் சிடிசி காய்ச்சல் தரவு மிகவும் முன்னறிவிக்கும் என்பதைக் காண 50 மில்லியன் வெவ்வேறு தேடல் சொற்கள் மூலம் தேடியது. இறுதியில், அவர்கள் மிகவும் முன்னறிவிக்கும் தோன்றியது என்று 45 வெவ்வேறு கேள்விகளுக்கு ஒரு தொகுப்பு கண்டு, முடிவுகள் நன்றாக இருந்தன: அவை சிடிசி தரவு கணிக்க தேடல் தரவு பயன்படுத்த முடியும். இது இயற்கை வெளியிடப்பட்ட இந்த காகித, ஒரு பகுதியை அடிப்படையாகக், கூகுள் காய்ச்சல் போக்குகள் பெரிய தரவு சக்தி பற்றி ஒரு பலமுறை வெற்றி கதை மாறியது.
எனினும், இந்த வெளிப்படையான வெற்றிகள் இரண்டு முக்கியமான எனும் தற்கால, மற்றும் இத்தகைய அறிவுறுத்தல்களை புரிந்து நீங்கள் மதிப்பிட உதவும் மற்றும் கணிப்பு மற்றும் nowcasting செய்வேன். முதல், கூகிள் காய்ச்சல் போக்குகள் செயல்திறன் உண்மையில் காய்ச்சல் நோய் இரண்டு மிக சமீபத்திய அளவீடுகள் ஒரு நேர்கோட்டு எக்ட்ராபோலேஷன் அடிப்படையில் காய்ச்சல் அளவு மதிப்பிட்டுள்ளது என்று ஒரு எளிமையான மாதிரி விட மிகவும் சிறப்பாக இருந்தது (Goel et al. 2010) . மற்றும், சில காலத்துக்கு கூகிள் காய்ச்சல் போக்குகள் இந்த எளிமையான அணுகுமுறை விட உண்மையில் மோசமாக இருந்தது (Lazer et al. 2014) . வேறு வார்த்தைகளில் கூறுவதானால், அதன் அனைத்து தரவு, இயந்திர கற்றல், மற்றும் சக்திவாய்ந்த கணினி மூலம் Google காய்ச்சல் போக்குகள் வியத்தகு பட்டறிவு புரிந்து கொள்ள ஒரு எளிய மற்றும் எளிதாக சிறப்பாக இல்லை. இந்த எந்த முன்அறிவிப்பு மதிப்பிடுதல் அல்லது nowcast போது அது ஒரு அடிப்படை எதிராக ஒப்பிட்டு முக்கியம் என்று கூறுகிறார்.
கூகிள் காய்ச்சல் போக்குகள் பற்றி இரண்டாவது முக்கியமான எச்சரிக்கையை சிடிசி காய்ச்சல் தரவு கணிக்க அதன் திறனை குறுகிய கால தோல்வி மற்றும் ஏனெனில் சறுக்கல் மற்றும் படிமுறையியல் குழப்பமான நீண்ட கால சிதைவு வாய்ப்புகள் என்று உள்ளது. உதாரணமாக, 2009 பன்றிக் காய்ச்சல் பரவல் கூகிள் காய்ச்சல் போக்குகள் மிக அதிகமாக காய்ச்சல் அளவு, அதிகமாக மதிப்பிடப்பட்டுள்ளது மக்கள் ஒரு உலகளாவிய தொற்று என்ற பரவலான அச்சம் பதில் தங்கள் தேடல் நடத்தை மாற்ற முனைகின்றன ஒருவேளை ஏனெனில் (Cook et al. 2011; Olson et al. 2013) . இந்த குறுகிய கால பிரச்சினைகள் கூடுதலாக, செயல்திறன் படிப்படியாக காலப்போக்கில் அழுகிவிடும். கூகுள் தேடல் வழிமுறைகள் தனியுரிம ஏனெனில் இந்த நீண்ட கால சிதைவு காரணங்கள் கண்டறிவதற்கு கடினம், ஆனால் அது (இது போல் 2011 ல் மக்கள் "காய்ச்சல்" மற்றும் "இருமல்" போன்ற அறிகுறிகள் தேடும் போது கூகிள் தொடர்பான தேடல் சொற்கள் பரிந்துரைக்கும் என்று மாற்றங்களை செய்து என்று தோன்றுகிறது இனி இந்த அம்சம் செயல்படும் என்று). இந்த அம்சத்தை சேர்த்து நீங்கள் ஒரு தேடல் இயந்திரத்தின் வணிக இயங்கும் என்றால் என்ன செய்ய வேண்டும் ஒரு முற்றிலும் நியாயமான விஷயம், மற்றும் அது இன்னும் சுகாதார தொடர்புடைய தேடல்கள் உருவாக்கும் நிலையை அடைந்தது. இது அநேகமாக வணிக ஒரு வெற்றியாகும், ஆனால் அது அதிகமாக மதிப்பீடு காய்ச்சல் பரவலாக கூகிள் காய்ச்சல் போக்குகள் காரணமாக (Lazer et al. 2014) .
அதிர்ஷ்டவசமாக, Google Flu Trends மூலம் இந்த பிரச்சினைகள் தீர்மானிக்கலாம். உண்மையில், இன்னும் கவனமாக முறைகளை பயன்படுத்தி, Lazer et al. (2014) மற்றும் Yang, Santillana, and Kou (2015) சிறந்த முடிவுகளை பெற முடிந்தது. முன்னோக்கி செல்லும், நான் ஆராய்ச்சியாளர் பெரிய தரவு இணைப்பது என்று nowcasting ஆய்வுகள் தரவு என்று மைக்கேல்ஏஞ்சலோ பாணியில் டுசாம்ப் பாணி Readymades இணைக்க Custommades-வேண்டும் தற்போதைய வேகம் மற்றும் துல்லியமான அளவீடுகள் மற்றும் எதிர்கால கணிப்புகள் தயாரிக்க கொள்கை வகுப்பாளர்கள் செயல்படுத்த சேகரிக்கப்பட்ட என்று எதிர்பார்க்கிறோம்.