எதிர்காலத்தையும் கடினமாக உள்ளது, ஆனால் தற்போது கணிக்க எளிதாக உள்ளது.
இரண்டாவது பிரதான மூலோபாய ஆராய்ச்சியாளர்கள் கண்காணிப்பு தரவுடன் பயன்படுத்தலாம் என கணிக்கப்படுகிறது . எதிர்காலத்தைப் பற்றி யூகங்களை உருவாக்குவது மிகவும் கடினமானதாகும், ஒருவேளை அந்த காரணத்திற்காக, தற்போது சமூக ஆராய்ச்சி (இது மக்கள்தொகை, பொருளாதாரம், நோய் மற்றும் அரசியல் விஞ்ஞானத்தின் ஒரு சிறிய மற்றும் முக்கியமான பகுதியாக இருந்தாலும்) கணிப்பீடு அல்ல. எவ்வாறெனினும், இங்கே " காசோலை " மற்றும் "முன்கணிப்பு" ஆகியவற்றை இணைப்பதில் இருந்து பெறப்பட்ட ஒரு காலவரிசைக்குரிய ஒரு குறிப்பிட்ட வகை முன்னறிவிப்பு மீது நான் கவனம் செலுத்த விரும்புகிறேன். எதிர்காலத்தை முன்னறிவிப்பதைப் போல, உலகின்; அது "தற்போதைய (Choi and Varian 2012) " (Choi and Varian 2012) முயற்சிக்கிறது. உலகின் சரியான மற்றும் துல்லியமான நடவடிக்கைகள் தேவைப்படும் அரசாங்கங்களுக்கும் நிறுவனங்களுக்கும் குறிப்பாக Nowcasting பயனுள்ளதாக இருக்கும்.
காலநிலை மற்றும் துல்லியமான அளவீட்டுத் தேவை என்பது மிகவும் தெளிவாக இருக்கும் ஒரு அமைப்பு எபிடிமியாலஜி ஆகும். காய்ச்சல் ("காய்ச்சல்") விஷயத்தை கவனியுங்கள். ஒவ்வொரு ஆண்டும், பருவகால காய்ச்சல் தொற்று நோய் மில்லியன் கணக்கான நோய்களுக்கும் உலகெங்கிலும் நூறாயிரக்கணக்கான மரணங்கள் ஏற்படுகிறது. மேலும், ஒவ்வொரு ஆண்டும், காய்ச்சல் ஒரு நாவல் வடிவம் மில்லியன் கணக்கான கொல்ல வேண்டும் என்று ஒரு வாய்ப்பு உள்ளது. எடுத்துக்காட்டாக, 1918 இன் காய்ச்சல் வெடிப்பு 50 முதல் 100 மில்லியன் மக்களுக்கு (Morens and Fauci 2007) கொல்லப்பட்டதாக மதிப்பிடப்பட்டுள்ளது. காய்ச்சல் வலிப்பு நோயைக் கண்டறிதல் மற்றும் திறன் ஆகியவற்றின் காரணமாக, உலகெங்கிலும் உள்ள அரசாங்கங்கள் காய்ச்சல் கண்காணிப்பு அமைப்புகளை உருவாக்கியுள்ளன. எடுத்துக்காட்டாக, நோய் கட்டுப்பாடு மற்றும் தடுப்புக்கான அமெரிக்க மையங்கள் (CDC) நாட்டைச் சுற்றியுள்ள கவனமாக தேர்ந்தெடுக்கப்பட்ட டாக்டர்களிடமிருந்து தவறாமல் முறையாகவும் முறையாகவும் சேகரிக்கப்படுகின்றன. இந்த அமைப்பு உயர்தர தரவை தயாரிக்கின்ற போதிலும், இது ஒரு புகலிடமாக உள்ளது. இது, மருத்துவர்கள் டாக்டர்களிடமிருந்து வந்த தரவரிசைகளை சுத்தப்படுத்தி, பதப்படுத்தி, வெளியிட வேண்டும் என்பதால், சி.டி.சி அமைப்பு, இரண்டு வாரங்களுக்கு முன்பு எவ்வளவு காய்ச்சல் ஏற்பட்டது என்பதை மதிப்பீடு செய்கிறது. ஆனால், ஒரு வளர்ந்து வரும் தொற்றுநோயை கையாளும் போது, இரண்டு வாரங்களுக்கு முன்னர் எத்தனை காய்ச்சல் ஏற்பட்டது என்பதை பொது சுகாதார அதிகாரிகள் தெரிந்து கொள்ள விரும்பவில்லை; அவர்கள் இப்பொழுது எத்தனை காய்ச்சல் உள்ளனர் என்று தெரிந்து கொள்ள வேண்டும்.
அதே நேரத்தில் CDC காய்ச்சலைக் கண்டறிய தரவு சேகரிக்கிறது, கூகுள் மேலும் காய்ச்சல் பாதிப்பு பற்றிய தரவு சேகரிக்கிறது, மிகவும் வேறுபட்ட வடிவத்தில் இருப்பினும். உலகெங்கிலும் உள்ள மக்கள் தொடர்ந்து கூகிள் வினாக்களை அனுப்புகிறார்கள், மேலும் இந்த கேள்விகளில் சில, "காய்ச்சல் மருந்துகள்" மற்றும் "காய்ச்சல் அறிகுறிகள்" போன்றவை - கேள்வி எழும் நபருக்கு காய்ச்சல் இருப்பதைக் குறிக்கிறது. ஆனால், இந்த தேடல் வினவல்களை காய்ச்சல் நோய்க்கான மதிப்பீட்டைப் பயன்படுத்துவது தந்திரமானது: காய்ச்சல் கொண்ட அனைவருக்கும் ஒரு காய்ச்சல் தொடர்பான தேடலை ஏற்படுத்துவதில்லை, மேலும் ஒவ்வொரு காய்ச்சல் தொடர்பான காய்ச்சலும் காய்ச்சலால் பாதிக்கப்படவில்லை.
ஜெர்மி கின்ஸ்பெர்க் மற்றும் சக ஊழியர்களின் குழு (2009) , சிலர் கூகிள் மற்றும் சி.டி.சி. இல் சிலர் இந்த இரு தரவு மூலங்களை இணைக்க முக்கியமான மற்றும் புத்திசாலி யோசனை கொண்டிருந்தனர். புள்ளிவிவர ரசவாதம் மூலம், ஆராய்ச்சியாளர்கள், மெதுவான மற்றும் துல்லியமான சி.டி.சி தரவுடன் வேகமாக மற்றும் தவறான தேடல் தரவை ஒருங்கிணைத்து, காய்ச்சல் நோய்த்தாக்கத்தின் துரித மற்றும் துல்லியமான அளவை தயாரிப்பதற்காக. அதைப் பற்றி சிந்திக்க இன்னொரு வழி, அவர்கள் சிடிசி தரவை விரைவாக தேட, தேடல் தரவைப் பயன்படுத்துகிறார்கள்.
மேலும் குறிப்பாக, 2003 முதல் 2007 வரை தரவுகளைப் பயன்படுத்தி, கின்ஸ்பெர்க் மற்றும் சக ஊழியர்கள் சி.டி.சி தரவு மற்றும் காய்ச்சல் பாதிப்புக்கு இடையேயான உறவு 50 மில்லியனுக்கு மாறுபட்ட விதிமுறைகளை மதிப்பிட்டுள்ளனர். இந்த செயல்முறையில் இருந்து முற்றிலும் தரவு இயக்கப்படும் மற்றும் சிறப்பு மருத்துவ அறிவைப் பெறவில்லை, ஆராய்ச்சியாளர்கள் குறுந்தகவல் காய்ச்சல் நோய்க்கான தரவுகளை மிகவும் முன்னறிவிக்கும் 45 வெவ்வேறு கேள்விகளைக் கண்டறிந்துள்ளனர். பின்னர், 2003-2007 தரவுகளிலிருந்து அவர்கள் கற்றுக்கொண்ட உறவுகளைப் பயன்படுத்தி, 2007-2008 காய்ச்சல் பருவத்தில் ஜின்ஸ்பெர்க் மற்றும் சக மாதிரிகள் மாதிரியை சோதனை செய்தனர். அவர்கள் நடைமுறை உண்மையில் பயனுள்ள மற்றும் துல்லியமான nowcasts செய்ய முடியும் என்று கண்டுபிடிக்கப்பட்டது (எண்ணிக்கை 2.6). இந்த முடிவுகள் நேச்சர் பத்திரிகையில் பிரசுரிக்கப்பட்டன, மேலும் பத்திரிகை கவரேஜைப் பெற்றுக் கொண்டன. Google Flu Trends என்று அழைக்கப்பட்ட இந்த திட்டம்-உலகத்தை மாற்றுவதற்கான பெரிய தரவுகளின் ஆற்றல் பற்றி அடிக்கடி மீண்டும் மீண்டும் இயற்றப்பட்டது.
எனினும், இந்த தெளிவான வெற்றி கதை இறுதியில் ஒரு சங்கடம் மாறியது. காலப்போக்கில், ஆராய்ச்சியாளர்கள் இரண்டு முக்கிய வரம்புகளை கண்டுபிடித்தனர், அவை Google Flu Trends ஆரம்பத்தில் தோன்றியதை விட குறைவாக ஈர்க்கக்கூடியவை. முதலாவதாக, ஃப்ளூ ட்ரெண்ட்ஸின் செயல்திறன் உண்மையில் மிகவும் எளிமையானது அல்ல, இது ஒரு மிகச் சாதாரண மாதிரியாக இருக்கவில்லை, இது மிகவும் சமீபத்தில் இரண்டு காய்ச்சல் நோய்த்தாக்கம் (Goel et al. 2010) இலிருந்து ஒரு நேர்கோட்டு மதிப்பீட்டின் அடிப்படையில் காய்ச்சல் அளவை மதிப்பிடுகிறது. மற்றும், சில நேரங்களில், Google Flu Trends இந்த எளிய அணுகுமுறை விட உண்மையில் மோசமாக இருந்தது (Lazer et al. 2014) . வேறு வார்த்தைகளில் கூறுவதானால், Google Flu Trends அதன் தரவு, இயந்திர கற்றல், மற்றும் சக்தி வாய்ந்த கணிப்பொறி ஆகியவை எளிமையான மற்றும் எளிதான புரிந்துகொள்ளுதல் சிக்கலானதாக இல்லை. இது எந்த முன்னறிவிப்பு அல்லது இன்றைய காலகட்டத்தை மதிப்பிடும் போது, ஒரு அடிப்படைக்கு எதிராக ஒப்பிட முக்கியம் என்று இது கூறுகிறது.
Google Flu Trends பற்றிய இரண்டாவது முக்கிய எச்சரிக்கையானது, CDC காய்ச்சல் தரவைக் கணிப்பதற்கான திறன், குறுகிய கால தோல்வி மற்றும் நீண்ட கால சிதைவு ஆகியவற்றால் பாதிக்கப்பட்டு, சறுக்கல் மற்றும் படிமுறை குழப்பம் காரணமாக ஏற்பட்டது. உதாரணமாக, 2009 ஆம் ஆண்டு பன்றி காய்ச்சல் திடீரென்று கூகுள் ஃப்ளோ டிரெண்ட்ஸ் வியத்தகு அளவில் பாதிப்புக்குள்ளான அளவிற்கு கணிசமான அளவுக்கு அதிகமாக மதிப்பீடு செய்துள்ளது, ஏனெனில் மக்கள் உலகளாவிய தொற்றுநோய்க்கான (Cook et al. 2011; Olson et al. 2013) . இந்த குறுகிய கால பிரச்சினைகள் தவிர, செயல்திறன் படிப்படியாக காலப்போக்கில் சிதைந்தது. Google தேடல் வழிமுறைகள் தனியுரிமவை என்பதால் இந்த நீண்ட கால சிதைவுக்கான காரணங்களைக் கண்டறிவது சிக்கலானது, ஆனால் 2011 ஆம் ஆண்டில் "காய்ச்சல்" மற்றும் "இருமல்" போன்ற காய்ச்சல் அறிகுறிகளை மக்கள் தேடும் போது, இந்த அம்சம் இனி செயலில் இல்லை). இந்த அம்சத்தை சேர்ப்பது, ஒரு தேடு பொறியை இயக்கும் பட்சத்தில் செய்ய மிகவும் நியாயமான விஷயம், ஆனால் இந்த வழிமுறை மாற்றம் Google ஃபிளூ ட்ரெண்ட்ஸ் காய்ச்சல் நோய்க்கு மிகைப்படுத்தி அதிகரித்தது (Lazer et al. 2014) காரணமாக அதிக உடல்நல தொடர்பான தேடல்களை உருவாக்கும் விளைவைக் கொண்டிருந்தது.
இந்த இரண்டு எச்சரிக்கைகள் எதிர்காலத்தை எதிர்கொள்ளும் முயற்சிகள் சிக்கலைத் தீர்த்துக் கொள்கின்றன, ஆனால் அவர்கள் அதைச் செய்யவில்லை. உண்மையில், இன்னும் கவனமாக முறைகள் பயன்படுத்தி, Lazer et al. (2014) மற்றும் Yang, Santillana, and Kou (2015) இந்த இரண்டு பிரச்சினைகளை தவிர்க்க முடிந்தது. முன்னோக்கி செல்லும், ஆய்வாளர் சேகரிக்கப்பட்ட தரவரிசைகளில் பெரிய தரவு ஆதாரங்களை இணைக்கும் ஆய்வுகள், குறிப்பிட்ட கால அளவிலும், துல்லியமான மதிப்பீடாகவும், சில நேரங்களில் மீண்டும் மீண்டும் எடுக்கும் அளவீட்டு அளவை விரைவாக அதிகரிப்பதன் மூலம், நிறுவனங்களையும் அரசாங்கங்களையும் அதிக நேரத்திற்குரிய மற்றும் துல்லியமான மதிப்பீட்டை உருவாக்க உதவும் என்று நான் எதிர்பார்க்கிறேன். Google Flu Trends போன்ற Nowcasting திட்டங்கள் மேலும் பெரிய தரவு மூலங்கள் ஆராய்ச்சி நோக்கங்களுக்காக உருவாக்கப்பட்ட மிகவும் பாரம்பரிய தரவு இணைந்து இருந்தால் என்ன நடக்கும் காட்ட. தற்சமயம் 1-ஆம் அத்தியாயத்தின் கலை ஒப்புமைக்கு மீண்டும் நினைத்துக்கொள்வது, தற்காலிக எதிர்காலத்தின் தற்போதைய மற்றும் கணிப்புகளின் சரியான நேரத்தையும், துல்லியமான அளவீடுகளையும் முடிவு செய்யும் தயாரிப்பாளர்களுக்கு வழங்குவதற்காக, மைக்கேலேஞ்சலோ-பாணியிலான custommades உடன் Duchamp-style readymades ஐ ஒருங்கிணைக்க சாத்தியம் உள்ளது.