நடவடிக்கைகள்

விசை:

  • சிரமம் பட்டம்: எளிதாக எளிதாக , நடுத்தர நடுத்தர , கடின கடின , மிகவும் கடினமாக மிகவும் கடினமாக
  • கணித தேவை ( கணித தேவை )
  • கோடிங் தேவைப்படுகிறது ( கோடிங் தேவைப்படுகிறது )
  • தரவு சேகரிப்பு ( தரவு சேகரிப்பு )
  • எனக்கு பிடித்தவைகள் ( எனக்கு பிடித்த )
  1. [ நடுத்தர , எனக்கு பிடித்த ] அல்காரிதமிக் குழப்பமான Google Flu Trends மூலம் ஒரு சிக்கல் இருந்தது. மூலம் காகித படிக்க Lazer et al. (2014) , மற்றும் Google ஒரு பொறியாளராக சிக்கலை விளக்கும் மற்றும் பிரச்சனை சரி எப்படி ஒரு யோசனை வழங்கி ஒரு குறுகிய, தெளிவான மின்னஞ்சல் எழுத.

  2. [ நடுத்தர ] Bollen, Mao, and Zeng (2011) ட்விட்டர் இருந்து தரவு பங்குச் சந்தை கணிக்க பயன்படுத்த முடியும் என்று கூறுகிறார். இந்த கண்டுபிடிப்பு ஒரு ஹெட்ஜ் நிதி-Derwent மூலதன ட்விட்டர் இருந்து சேகரிக்கப்பட்ட தரவுகளின் அடிப்படையில் பங்குச் சந்தையில் முதலீடு சந்தைகள்-க்கு உருவாக வழிவகுத்தது (Jordan 2010) . என்ன ஆதாரம் என்று நிதி உங்கள் பணத்தை வைத்து முன் பார்க்க வேண்டும்?

  3. [ எளிதாக ] சில பொது சுகாதார வழக்கறிஞர்கள் புகைபிடித்தல் ஒரு பயனுள்ள உதவி மின் சிகரெட் ஆலங்கட்டி மழை போது, மற்றவர்கள் போன்ற நிகோடின் உயர் மட்டங்களில் அபாயங்கள், எச்சரிக்கும். ஒரு ஆராய்ச்சியாளர் இ-சிகரெட் தொடர்பான ட்விட்டர் சேகரிக்கும் மற்றும் உணர்வு ஆய்வு நடத்துவதன் மூலம் இ-சிகரெட் நோக்கி பொதுமக்கள் கருத்தை படிக்க முடிவு என்று கற்பனை.

    1. நீங்கள் இந்த ஆய்வில் பற்றி மிகவும் கவலை என்று மூன்று பாகுபாடுகளை என்ன?
    2. Clark et al. (2016) போன்ற ஒரு ஆய்வு இயங்கின. முதல், அவர்கள் டிசம்பர் 2014 ஜனவரி முதல் 2012 e-சிகரெட்-தொடர்புடைய முக்கிய வார்த்தைகளை பயன்படுத்தப்படும் என்று நெருக்கமான ஆய்வு மீது 850,000 ட்வீட் சேகரிக்கப்பட்ட, அவர்கள் (அதாவது, மனிதர்கள் பொருட்களால்) இந்த ட்வீட் பல தானியங்கி என்று உணர்ந்து இந்த தானியங்கி ட்வீட் பல அடிப்படையிலேயே விளம்பரங்களில். அவர்கள் கரிம ட்வீட் இருந்து தானியங்கி ட்வீட் பிரிக்க ஒரு மனித கண்டறிதல் நெறிமுறை உருவாக்கப்பட்டது. இந்த மனித கண்டறி அல்காரிதம் அவர்கள் ட்வீட் 80% தானியங்கி என்று கண்டறியப்பட்டது பயன்படுத்தி. இந்த கண்டுபிடிப்பு பகுதியாக (அ) உங்கள் பதில் மாறுகிறது?
    3. அவர்கள் கரிம மற்றும் தானியங்கி ட்வீட் உணர்வை ஒப்பிடும் போது அவர்கள் தானியங்கி ட்வீட் கரிம ட்வீட் (6.17 எதிராக 5.84) விட நேர்மறையான இருக்கும் என்று கண்டுபிடிக்கப்பட்டுள்ளது. இந்த கண்டுபிடிப்பு (ஆ) உங்கள் பதில் மாறுகிறது?
  4. [ எளிதாக ] நவம்பர் 2009 இல், ட்விட்டர் கேள்வி ட்வீட் பெட்டியில் இருந்து "நீங்கள் என்ன செய்கிறீர்கள்?" மாற்றம் "என்ன நடக்கிறது?" (Https://blog.twitter.com/2009/whats-happening).

    1. எப்படி நீங்கள் கேட்கும் மாற்றம் யார் ட்வீட் மற்றும் / அல்லது அவர்கள் ட்வீட் என்ன பாதிக்கும் என்று நீங்கள் நினைக்கிறீர்கள்?
    2. நீங்கள் கேட்கும் விரும்பும் எந்த ஒரு ஆராய்ச்சி திட்டம் பெயர் "நீங்கள் என்ன செய்கிறீர்கள்?" என்று விளக்குங்கள்.
    3. நீங்கள் கேட்கும் விரும்பும் எந்த ஒரு ஆராய்ச்சி திட்டம் பெயர் "என்ன நடக்கிறது?" என்று விளக்குங்கள்.
  5. [ நடுத்தர ] Kwak et al. (2010) அவர்கள் ட்விட்டர் தகவல்களை ஒரு புதிய நடுத்தர ஒரு விட பகிர்ந்து போன்ற உதவுகிறது என்று முடித்தார் இந்த ஆய்வின் அடிப்படையில், 41.7 மில்லியன் பயனர் விவரங்கள், 1.47 பில்லியன் சமூக உறவுகள், 4262 ஏற்ற தலைப்புகள், மற்றும் ஜூன் 6 மற்றும் ஜூன் 31 ஆம் இடையே 106 மில்லியன் ட்வீட், 2009 பகுப்பாய்வு சமூக வலைத்தளம்.

    1. Kwak மற்றும் பலர் கண்டுபிடித்து பரிசீலித்து, ஆராய்ச்சி என்ன வகை நீங்கள் ட்விட்டர் தரவு செய்ய வேண்டும்? நீங்கள் ட்விட்டர் தரவு ஆராய்ச்சி என்ன வகை செய்ய முடியாது? ஏன்?
    2. 2010 இல், ட்விட்டர் சேர்க்கப்பட்டது ஒரு பயனர் ஏற்ப பரிந்துரை செய்யும் சேவை பின்பற்ற யார். மூன்று பரிந்துரைகளை முக்கிய பக்கம் ஒரு நேரத்தில் காட்டப்படுகின்றன. பரிந்துரைகள் அடிக்கடி ", நண்பர்கள்-ன்-நண்பர்கள்" ஒரு இருந்து வருபவர்கள் மற்றும் பரஸ்பர தொடர்புகளும் பரிந்துரை காட்டப்படும். பயனர்கள் பரிந்துரைகளை ஒரு புதிய தொகுப்பை பார்க்க அல்லது பரிந்துரைகளை ஒரு நீண்ட பட்டியலை ஒரு பக்கம் பார்க்க புதுப்பித்து கொள்ளலாம். நீங்கள் இந்த புதிய வசதியை பகுதியாக ஒரு உங்கள் பதில் மாற்ற என்று நினைக்கிறீர்களா)? ஏன் அல்லது ஏன் இல்லை?
    3. Su, Sharma, and Goel (2016) சேவையில் பின்பற்ற யார் விளைவை மதிப்பாய்வு புகழ் ஸ்பெக்ட்ரம் முழுவதும் பயனர்கள் பரிந்துரைகளை பயனடைந்தனர் போது, மிகவும் பிரபலமான பயனர்கள் சராசரியை விட கணிசமாக மிகவும் இலாபம் என்று கண்டறியப்பட்டது. இந்த கண்டுபிடிப்பு பகுதியாக ஆ உங்கள் பதில் மாறலாம்)? ஏன் அல்லது ஏன் இல்லை?
  6. [ எளிதாக ] "Retweets" அடிக்கடி செல்வாக்கு அளவிட பயன்படுத்தப்படுகிறது மற்றும் ட்விட்டர் செல்வாக்கு பரவியது. ஆரம்பத்தில், பயனர்கள் நகலெடுக்க மற்றும் அவர்கள் விரும்பிய ட்வீட் ஒட்டவும், அவன் / அவள் கைப்பிடி கொண்ட மூல ஆசிரியர் குறிக்க, மற்றும் கைமுறையாக ஒரு மறு ட்வீட் செய்க என்று குறிக்க ட்வீட் முன் "ஆர்டி" தட்டச்சு இருந்தது. அதன்பின், 2009 இல் ட்விட்டர் ஒரு "மறு ட்வீட்" பொத்தானை சேர்க்க. ஜூன் 2016 இல், ட்விட்டர் பயனர்கள் (https://twitter.com/twitter/status/742749353689780224) அவர்களின் சொந்த tweets மறு ட்வீட் சாத்தியமாக்கியது. இந்த மாற்றங்களை நீங்கள் உங்கள் ஆராய்ச்சியில் 'எண்ண "பயன்படுத்த எப்படி பாதிக்கும் வேண்டும் என்று நினைக்கிறீர்களா? ஏன் அல்லது ஏன் இல்லை?

  7. [ நடுத்தர , தரவு சேகரிப்பு , கோடிங் தேவைப்படுகிறது ] Michel et al. (2011) புத்தகங்கள் இவை பெரும்பாலும் இக்கோப்பை கூகிள் முயற்சி இருந்து வரும் ஒரு கார்பஸ் கட்டப்பட்டது. இது 2009 ஆம் ஆண்டு வெளியிடப்பட்ட மற்றும் 5 மில்லியன் டிஜிட்ட்டைஸ் புத்தகங்கள் மீது கொண்டிருந்தது கார்பஸ், முதல் பதிப்பு பயன்படுத்தி, ஆய்வாளர்கள் மொழியியல் மாற்றங்கள், பண்பாட்டு போக்குகள் விசாரிக்க வார்த்தை பயன்பாடு அதிர்வெண் ஆய்வு. விரைவில் கூகிள் புத்தகங்கள் கார்பஸ் ஆராய்ச்சியாளர்கள் ஒரு பிரபலமான தரவு மூல மாறியது, மற்றும் தகவல் களஞ்சியத்தை 2 வது பதிப்பு 2012 ஆம் ஆண்டு வெளியிடப்பட்டது.

    எனினும், Pechenick, Danforth, and Dodds (2015) ஆராய்ச்சியாளர்கள் முழுமையாக பரந்த முடிவுகளை எடுப்பது, அதை பயன்படுத்தி முன் கார்பஸ் மாதிரி செயல்முறை குணாதிசயம் வேண்டும் என்று எச்சரித்தார். முக்கிய பிரச்சினை கார்பஸ் ஒவ்வொரு புத்தகத்தின் ஒரு கொண்ட, நூலகம் போன்ற உள்ளது. இதன் விளைவாக, ஒரு தனிப்பட்ட, சுறுசுறுப்பான எழுத்தாளர் கவனத்திற்குரிய கூகிள் புத்தகங்கள் அகராதியின் ஒரு புதிய வாக்கியங்களை நுழைக்க முடியும். மேலும், அறிவியல் நூல்கள் 1900 முழுவதும் கார்பஸ் ஒரு பெருகிய திறன் நிறைந்த பகுதியை ஆவார்கள். கூடுதலாக, ஆங்கிலம் ஃபிக்ஷன் தரவுகளும், Pechenick மற்றும் பலர் இரண்டு பதிப்புகள் ஒப்பிடுவதன் மூலம். போதிய வடிகட்டி முதல் பதிப்பை தயாரிக்கும் பயன்படுத்தப்படும் என்று ஆதாரங்களும். நடவடிக்கை தேவை அனைத்து தகவல்களும் இங்கே கிடைக்கும்: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html

    1. மிஷேல் மற்றும் பலர். அசல் தாளில் (2011) , அவர்கள், ஆங்கிலம் தரவுத் தொகுதியின் 1 வது பதிப்பு பயன்படுத்தப்படும் ஆண்டுகள் "1880" பயன்பாடு அதிர்வெண் தொகுக்கப்படும், "1912" மற்றும் "1973", மற்றும் நாம் "என்று முடித்தார் ஒவ்வொரு வருடமும் வேகமாக எங்கள் பழையதை மறந்து "(படம். 3A, மைக்கேல் மற்றும் பலர்.). 1 பயன்படுத்தி) கார்பஸ், ஆங்கிலம் தரவுத்தொகுப்பின் (படம். 3A, மைக்கேல் மற்றும் பலர் அதே 1 வது பதிப்பு அதே plot பெருக்கும்.)
    2. இப்போது 1 வது பதிப்பு, ஆங்கிலம் அறிவியல் தரவுத்தொகுப்பின் அதே சதி பெருக்கும்.
    3. இப்போது கார்பஸ், ஆங்கிலம் தரவுத்தொகுப்பின் 2 வது பதிப்பு அதே plot பெருக்கும்.
    4. இறுதியாக, 2 வது பதிப்பு, ஆங்கிலம் அறிவியல் தரவுத்தொகுப்பின் அதே சதி பெருக்கும்.
    5. இந்த நான்கு அடுக்கு இடையே வேறுபாடுகள் மற்றும் ஒற்றுமைகள் விவரியுங்கள். நீங்கள் அனுசரிக்கப்பட்டது போக்கு மிஷேல் மற்றும் பலர். அசல் விளக்கம் ஏற்றுக்கொள்கிறீர்களா? (குறிப்பு: இ) மற்றும் ஈ) Pechenick மற்றும் பலர் படம் 16 அதே இருக்க வேண்டும்).
    6. இப்போது நீங்கள் பல்வேறு கூகிள் புத்தகங்கள் கார்பொராவைத் பயன்படுத்தி இந்த ஒரு கண்டுபிடிப்பு எதிரொலிக்கும் என்று, மைக்கேல் மற்றும் பலர். அசல் காகித வழங்கினார் மற்றொரு மொழியியல் மாற்றம் அல்லது கலாச்சார நிகழ்வுகள் தேர்வு. நீங்கள் Pechenick மற்றும் பலர் வழங்கப்படுகிறது வரம்புகள் வெளிச்சத்தில் அவர்களின் விளக்கம் ஒத்துக்கொள்கிறேன்.? உங்கள் வாதம் வலுவான செய்ய, மேலே அமைக்க தரவு வெவ்வேறு பதிப்புகளைப் பயன்படுத்தி அதே வரைபடம் பெருக்கும் முயற்சி.
  8. [ மிகவும் கடினமாக , தரவு சேகரிப்பு , கோடிங் தேவைப்படுகிறது , எனக்கு பிடித்த ] Penney (2016) ஜூன் 2013 இல், NSA / பட்டகம் கண்காணிப்பு (அதாவது, ஸ்னோவ்டென்) பற்றி பரவலாக விளம்பரம் ஒரு கூர்மையான மற்றும் திடீர் தனியுரிமை கவலைகள் உயர்த்த என்று தலைப்புகளில் விக்கிப்பீடியா கட்டுரைகள் போக்குவரத்து குறைவு தொடர்புடையதாக உள்ளது என்பதை ஆராய்கிறது. அப்படியானால், நடத்தை இந்த மாற்றம் பாரிய கண்காணிப்பு விளைவாக ஒரு உறையவைக்கும் விளைவு இசைவானதாக இருக்க வேண்டும். அணுகுமுறை Penney (2016) சில நேரங்களில் ஒரு தடங்கலான நேரம் தொடர் வடிவமைப்பு அழைக்கப்படுகிறது மற்றும் உற்றுநோக்கல் தரவு (பிரிவு 2.4.3) இருந்து சோதனைகள் நிறைக்கும் பற்றி ம் அதிகாரத்தில் அணுகுமுறைகள் தொடர்பான.

    தலைப்பு குறிச்சொற்களை தேர்வு செய்ய, பென்னி கண்காணிப்பு மற்றும் சமூக ஊடக கண்காணிப்பு உள்நாட்டு பாதுகாப்பு அமெரிக்க துறை பயன்படுத்தப்படும் பட்டியலில் குறிப்பிடப்படுகிறது. மு.க.ஸ்டாலின் உறுதி பட்டியலில் பிரச்சினைகளை, அதாவது "சுகாதார கவலை," "உள்கட்டமைப்பு பாதுகாப்பு," மற்றும் "பயங்கரவாத. ஒரு எல்லை ஒரு குறிப்பிட்ட தேடல் சொற்கள் வகைப்படுத்துகிறது பயங்கரவாதம்" (அட்டவணை 8 பார்க்க "ஆய்வு குழு, பென்னி நாற்பத்து எட்டு வார்த்தைகளின் தொடர்பான பயன்படுத்தப்படும்" பின் இணைப்பு). பின்னர் அவர் விக்கிபீடியா கட்டுரை பார்வை எண்ணிக்கைகள் ஒரு முப்பத்தி இரண்டு மாத காலத்தில் தொடர்புடைய நாற்பத்து எட்டு விக்கிப்பீடியா கட்டுரைகள் ஒரு மாத அடிப்படையில், 2014 ஆகஸ்ட் இறுதியில் 2012 ஜனவரி தொடக்கத்தில் இருந்து அவரது வாதம் வலுப்படுத்த ஒருங்கிணைக்கப்பட்ட, அவர் பல ஒப்பீடு உருவாக்கப்பட்ட பிற தலைப்புகளில் கட்டுரை காட்சிகள் கண்காணிப்பு குழுக்கள்.

    இப்போது, நீங்கள் பெருக்கும் மற்றும் நீட்டிக்க போகிறோம் Penney (2016) . நீங்கள் இந்த நடவடிக்கை தேவை என்று அனைத்து மூல தரவு விக்கிப்பீடியா (https://dumps.wikimedia.org/other/pagecounts-raw/) இருந்து கிடைக்கும். அல்லது நீங்கள் ஆர் தொகுப்பு wikipediatrend இருந்து பெற முடியும் (Meissner and Team 2016) . நீங்கள் எழுத அப் உங்கள் பதில்களை போது, நீங்கள் பயன்படுத்தப்படும் இது தரவு மூல நினைவில் கொள்க. (குறிப்பு: இந்த அதே செயல்பாடு அத்தியாயம் 6 தோன்றும்)

    1. படிக்க Penney (2016) மற்றும் "பயங்கரவாத" -தொடர்பான முன் பக்கங்களில் மற்றும் ஸ்னோவ்டென் வெளிப்படுத்தப்பட்ட பின்னர் பக்கம் காட்சிகள் காட்டுகிறது படம் 2 பெருக்கும். கண்டுபிடிப்புகள் விளக்குவது.
    2. அடுத்து, மு.க.ஸ்டாலின் உறுதி பட்டியலில் இருந்து "துறையினர் மற்றும் ஏனைய முகவர்களின்" கீழ் வகைப்படுத்தப்பட்டுள்ளன முக்கிய வார்த்தைகளை பயன்படுத்தி ஒரு ஒப்பீட்டுமானியும் குழு ஆய்வு குழு ( "பயங்கரவாதம்" -தொடர்பான கட்டுரைகள்) ஒப்பிடுகின்ற படம் 4A, பெருக்கும் (பின் இணைப்பு அட்டவணை 10 பார்க்க). கண்டுபிடிப்புகள் விளக்குவது.
    3. பகுதி B) நீங்கள் ஒரு ஒப்பீட்டுமானியும் குழு ஆய்வு குழு ஒப்பிடுகையில். "உள்கட்டமைப்பு பாதுகாப்பு" -தொடர்பான கட்டுரைகள் (பின் இணைப்பு அட்டவணை 11) மற்றும் பிரபலமான விக்கிப்பீடியாவில் (பின் இணைப்பு அட்டவணை 12): பென்னி, வேறு இரண்டு ஒப்பீட்டுமானியும் குழுக்கள் ஒப்பிடும்போது. ஒரு மாற்று ஒப்பீட்டுமானியும் குழு கொண்டு வர, மற்றும் பகுதி ஆ இருந்து கண்டுபிடிப்புகள்) ஒப்பீட்டுமானியும் குழு உங்கள் தேர்வு உணர்திறன் உள்ளது என்றால் சோதிக்க. ஒப்பீட்டுமானியும் குழு எந்த தேர்வு மிகவும் அர்த்தமுள்ளதாக? ஏன்?
    4. ஆசிரியர் "பயங்கரவாதம்" தொடர்பான வார்த்தைகளின் அமெரிக்க அரசாங்கம் அதன் ஆன்லைன் கண்காணிப்பு நடைமுறைகள் ஒரு முக்கியமான வாதங்களை பயங்கரவாதத்தை மேற்கோள் காட்டியது ஏனெனில் விக்கிப்பீடியா கட்டுரைகள் தேர்வு பயன்படுத்தப்பட்டன என்று கூறினார். இந்த 48 "பயங்கரவாதம்" -தொடர்பான முக்கிய வார்த்தைகள் ஒரு காசோலை என, Penney (2016) மேலும் MTurk ஒரு கணக்கெடுப்பு அரசு சிக்கல், தனியுரிமை உணர், மற்றும் தவிர்ப்பு அடிப்படையில் வார்த்தைகளின் ஒவ்வொரு மதிப்பிடவும் பதிலளித்தவர்களில் கேட்டு நடத்தப்படும் (பின் இணைப்பு அட்டவணை 7 மற்றும் 8). MTurk கணக்கெடுப்பு பெருக்கும் மற்றும் உங்கள் முடிவுகளை ஒப்பிட்டு.
    5. பகுதி டி முடிவுகளை) மற்றும் கட்டுரையின் உங்கள் வாசிப்பு அடிப்படையில், நீங்கள் ஆய்வு குழு தலைப்பு முக்கிய வார்த்தைகள் ஆசிரியரின் தேர்வு ஏற்கிறீர்களா? ஏன் அல்லது ஏன் இல்லை? இல்லை என்றால், நீங்கள் அதற்கு பதிலாக என்ன கருத்து தெரிவிக்கிறார்கள்?
  9. [ எளிதாக ] Efrati (2016) அறிக்கைகள், ரகசிய தகவல் அடிப்படையில், "மொத்த பகிர்வு" பேஸ்புக் ஆண்டு முழுவதும் சுமார் 5.5% ஆண்டு குறைந்துள்ளது "அசல் ஒளிபரப்பை பகிர்வு" போது கீழே வருடத்திற்கும் மேலாக 21% ஆண்டு என்றும். இந்த சரிவு 30 வயதுக்கும் கீழ் பேஸ்புக் பயனர்களின் கொண்டு தீவிரமாக இருந்தது. அறிக்கை இரண்டு காரணிகள் சரிவு காரணமாக. ஒரு "நண்பர்கள்" மக்கள் பேஸ்புக் வேண்டும் எண்ணிக்கை வளர்ச்சி ஆகும். வேறு சில பகிர்தல் செயல்பாடு செய்தி மற்றும் இதுபோன்ற SnapChat போன்ற போட்டியாளர்களின் மாற்றப்பட்டுவிட்டது என்று உள்ளது. இந்த அறிக்கை அசல் பதிவுகள் மேலும் முக்கிய செய்ய என்று செய்திகள் ஊட்டம் வழிமுறை கிறுக்கல்கள், அதே போல் பல ஆண்டுகளுக்கு முன்பு "திஸ் டே" அசல் பதிவுகள் பயனர்கள் கால நினைவூட்டல்கள் உட்பட பல தந்திரோபாயங்கள் பேஸ்புக் பகிர்வு அதிகரிக்க முயற்சி செய்தேன், தெரியவந்தது. இந்த கண்டுபிடிப்புகள் ஒரு தரவு ஆதாரமாக பேஸ்புக் பயன்படுத்த விரும்பும் ஆராய்ச்சியாளர்கள் என்ன தாக்கங்களை, ஏதாவது, இருக்கிறது?

  10. [ நடுத்தர ] Tumasjan et al. (2010) ஒரு அரசியல் கட்சி சொல்லுவதற்கு ட்வீட் விகிதம், கட்சி 2009 ல் ஜேர்மன் நாடாளுமன்ற தேர்தலில் பெற்ற வாக்குகள் (படம் 2.9) விகிதம் பொருந்தும் பதிவாகும். வேறு வார்த்தைகளில் கூறுவதானால், அதை நீங்கள் தேர்தல் கணிக்க ட்விட்டர் பயன்படுத்த முடியும் என்று தோன்றியது. அது பெரிய தரவு பொதுவான ஆதாரமாக ஒரு மதிப்புமிக்க பயன்படுத்த பரிந்துரைக்கிறோம் தோன்றியது, ஏனெனில் இந்த ஆய்வு அறிக்கை வெளியிடப்பட்ட நேரத்தில் அது மிகவும் அற்புதமான கருதப்பட்டது.

    பெரிய தரவு மோசமான அம்சங்கள் கொடுக்கப்பட்ட, எனினும், நீங்கள் உடனடியாக இந்த விளைவாக சந்தேகம் இருக்க வேண்டும். 2009 இல் ட்விட்டர் ஜேர்மனியர்கள் மிகவும் ஒரு அல்லாத குழுவின் பிரதிநிதி, மற்றும் ஒரு கட்சி ஆதரவாளர்கள் அடிக்கடி அரசியலில் பற்றி ட்வீட் வேண்டும். இவ்வாறாக, நீங்கள் கற்பனை செய்ய முடியும் என்று அனைத்து பாகுபாடுகளை எப்படியோ வெளியே இரத்து செய்யப்படும் என்று ஆச்சரியம் இருக்கிறது. உண்மையில், முடிவுகளை Tumasjan et al. (2010) உண்மை என்று கூட நல்ல மாறிவிட்டார். தங்கள் தாளில், Tumasjan et al. (2010) கிரிஸ்துவர் ஜனநாயக (CDU) கிரிஸ்துவர் சமூக ஜனநாயக கட்சி (CSU) சமூக ஜனநாயகக் கட்சி, (FDP), இடது (Die Linke), மற்றும் பசுமைக் கட்சி (க்ருன்): ஆறு அரசியல் கட்சிகள் கருதப்படுகிறது. எனினும், அந்த நேரத்தில் குறிப்பிடப்பட்டுள்ளது ஜேர்மனிய அரசியல் Twitter இல் கட்சி Pirate கட்சி (Piraten), இணைய அரசாங்க விதிகள் போராடும் ஒரு கட்சி இருந்தது. Pirate கட்சி ஆய்வில் சேர்க்கப்படவில்லை போது, ட்விட்டர் குறிப்பிடுகிறார் தேர்தல் முடிவுகள் (படம் 2.9) ஒரு பயங்கரமான கணிக்கப்பட்டது ஆகிறது (Jungherr, Jürgens, and Schoen 2012) .

    படம் 2.9: ட்விட்டர் குறிப்பிடுகிறார் 2009 ஜேர்மன் தேர்தல் முடிவுகளை கணிக்க தோன்றும் (Tumasjan மற்றும் பலர் 2010.), ஆனால் இந்த முடிவை சில ஒருதலைப்பட்சமாக, நியாயமற்ற தேர்வுகள் (Jungherr, Jurgens, மற்றும் ஸ்கோவன் 2012) சார்ந்தது மாறிவிடும்.

    படம் 2.9: ட்விட்டர் குறிப்பிடுகிறார் 2009 ஜேர்மன் தேர்தல் முடிவுகளை கணிக்க தோன்றும் (Tumasjan et al. 2010) , ஆனால் இந்த முடிவை சில ஒருதலைப்பட்சமாக, நியாயமற்ற தேர்வுகள் சார்ந்தது மாறிவிடும் (Jungherr, Jürgens, and Schoen 2012) .

    அதனைத் தொடர்ந்து, உலகம் முழுவதும் மற்ற ஆராய்ச்சியாளர்கள் பயன்படுத்தப்படும் ஆர்வலராக முறைகள்-போன்ற நேர்மறை மற்றும் எதிர்மறை இடையே வேறுபடுத்தி உணர்வை பகுப்பாய்வு பயன்படுத்தி தேர்தலில் பல்வேறு வகையான பல்வேறு கணிக்க ட்விட்டர் தரவு திறனை மேம்படுத்தும் பொருட்டு அரசியல் கட்சிகளின் குறிப்பிடுகிறார் (Gayo-Avello 2013; Jungherr 2015, Ch. 7.) . இங்கே எப்படி Huberty (2015) தேர்தல் முடிவுகளைக் கணிப்பது இந்த முயற்சிகளின் முடிவை சுருக்கமாக:

    "உண்மை முன்னோக்கு தேர்தல் முன்னறிவிப்பு கோரிக்கைகளை உள்ளாகி போது சமூக ஊடக அடிப்படையில் அனைத்து அறியப்பட்ட எதிர்வுகூறல் முறைகளில் தவறிவிட்டன. இந்த தோல்விகள் மாறாக முறைகளில் அல்லது அல்காரிதம் சிரமங்களை விட சமூக ஊடக அடிப்படை பண்புகள், காரணமாக தோன்றும். சுருக்கமாக, சமூக ஊடக இல்லை, மற்றும் அநேகமாக நடக்காது, ஒரு நிலையான, நடுநிலையான, பிரதிநிதி வாக்காளர்களில் படம் வைக்கிறேன்; மற்றும் சமூக ஊடக வசதிக்காக மாதிரிகள் இந்த பிரச்சினைகள் இந்த இடுகை பிழைத்திருத்தம் போதுமான தரவை இல்லை. "

    வழிவகுக்கும் என்று ஆராய்ச்சி சில படிக்க Huberty (2015) என்ற முடிவுக்கு, மற்றும் ஒரு அரசியல் வேட்பாளர் ட்விட்டர் முன்அறிவிப்பு தேர்தலில் பயன்படுத்த வேண்டும் என்றால் எப்படி விவரிக்கும் ஒரு பக்கம் மெமோ எழுத.

  11. [ நடுத்தர ] ஒரு சமூகவியலாளர் மற்றும் ஒரு வரலாற்று இடையே என்ன வேறுபாடு உள்ளது? Goldthorpe படி (1991) , ஒரு சமூகவியலாளர் மற்றும் ஒரு வரலாற்று இடையே உள்ள முக்கிய வேறுபாடு தரவு சேகரிப்பு மீது கட்டுப்பாடு உள்ளது. வரலாற்றாசிரியர்கள் சமூகவியல் குறிப்பிட்ட நோக்கங்களுக்காக தங்கள் தரவு சேகரிப்பு தையல்காரர் முடியும் அதேசமயம் பீடத்தில் பயன்படுத்த வேண்டிய கட்டாயத்தில் இருக்கும். படிக்க Goldthorpe (1991) . எப்படி சமூகவியல் மற்றும் வரலாறு இடையே உள்ள வேறுபாடு Custommades மற்றும் Readymades யோசனை தொடர்புடையது?

  12. [ கடின ] முந்தைய கேள்வி மீது கட்டமைத்து, Goldthorpe (1991) நிக்கி ஹார்ட் இதில் அடங்கும் முக்கிய மறுமொழிகளை பல, ஈர்த்தது (1994) செய்த தரவு தையல்காரர் Goldthorpe பக்தியை சவால் என்று. தையல்காரர் தரவு சாத்தியமான வரம்புகள் தெளிவுபடுத்த, ஹார்ட் செழிப்பான பணியாளர் திட்டம், சமூக வர்க்கம் மற்றும் வாக்களிக்கும் இடையிலான உறவு 1960 களின் நடுப்பகுதியில் Goldthorpe மற்றும் சக நடத்தப்பட்டது என்று அளவிட ஒரு பெரிய ஆய்வு விவரித்தார். ஒரு வடிவமைக்கப்பட்டுள்ளது காணப்படும் தரவு மீது தரவு ஆதரவான ஒரு அறிஞர் இருந்து எதிர்பார்க்க முடியும், வசதி படைத்தவர்களும் பணியாளர் திட்ட வாழ்க்கைத் தரத்தைப் பொறுத்து ஒரு காலத்தில் சமூக வர்க்கம் எதிர்காலம் பற்றி ஒரு சமீபத்தில் முன்மொழியப்பட்ட கோட்பாடு உரையாற்ற போவதாக இருந்தது என்று தகவல்கள் சேகரிக்கப்பட்டன. ஆனால், Goldthorpe மற்றும் சக எப்படியோ பெண்கள் வாக்களிக்கும் முறை பற்றிய தகவல்களை சேகரிக்க "மறந்துவிட்டேன்". இங்கே நிக்கி ஹார்ட் எப்படி (1994) முழு அத்தியாயம் சுருக்க்கங்கள்-:

    ". . . அது இந்த தரவுத்தொகுப்பின் பெண் அனுபவம் ஒதுக்கித் ஒரு paradigmatic தர்க்கம் சிறைவைக்கப்பட்டார் 'தையல்காரர் செய்யப்பட்ட' ஏனெனில் பெண்கள் புறக்கணிக்கப்பட்ட முடிவுக்கு தவிர்க்க கடினம் [ஆகும்]. ஆண் ஆக்கிரமிப்புகள் என வர்க்க நனவு நடவடிக்கை ஒரு தத்துவார்த்த பார்வை இயக்கப்படுகிறது. . . , Goldthorpe மற்றும் அவரது சக ஊட்டி மற்றும் போதுமான சரியான சோதனை அவற்றை வெளிப்படுத்த பதிலாக தங்கள் சொந்த தத்துவார்த்த ஊகங்கள் பேணி இது அனுபவ சான்றுகளுடன் ஒரு தொகுப்பு கட்டப்பட்டது. "

    ஹார்ட் தொடர்ந்தார்:

    "செழிப்பான பணியாளர் திட்ட அனுபவ கண்டுபிடிப்புகள் அவர்கள் அடுக்காக அரசியல் மற்றும் பொருள் வாழ்க்கை செயல்முறைகள் தெரிவிக்க விட எங்களுக்கு நூற்றாண்டின் மத்தியில் சமூகவியல் masculinist மதிப்புகள் பற்றி இன்னும் சொல்லுங்கள்."

    நீங்கள் தையல்காரர் தரவு சேகரிப்பு அது கட்டப்பட்ட தரவு சேகரிப்பான் பாகுபாடுகளை எங்கே மற்ற உதாரணங்கள் யோசிக்க முடியும்? இந்த படிமுறையியல் குழப்பமான எப்படி ஒப்பிட்டு? என்ன தாக்கங்களை இந்த ஆராய்ச்சியாளர்கள் Readymades பயன்படுத்த வேண்டும் போது மற்றும் அவர்கள் Custommades பயன்படுத்த வேண்டும் போது வேண்டும்?

  13. [ நடுத்தர ] இந்த அத்தியாயத்தில், நான் நிறுவனங்கள் அரசாங்கங்கள், உருவாக்கப்பட்ட நிர்வாக பதிவுகளை ஆராய்ச்சியாளர்கள் ஆராய்ச்சியாளர்கள் மூலம் சேகரிக்கப்பட்ட தரவு முரண்பாடாக. சில மக்கள் இந்த நிர்வாக பதிவுகளை அவர்கள் மாறாக இது "தரவு, காணப்படும்" அழைப்பு "வடிவமைக்கப்பட்டுள்ளது தரவு." இது நிர்வாக பதிவுகள் ஆராய்ச்சியாளர்கள் காணப்படுகின்றன என்று உண்மை, ஆனால் அவர்கள் மிகவும் வடிவமைக்கப்பட்டுள்ளது. உதாரணமாக, நவீன தொழில்நுட்ப நிறுவனங்கள் சேகரிக்க மற்றும் அவர்களின் தரவு தேர்வுசெய்வார்கள் நேரம் பெருமளவிலான மற்றும் வளங்கள் செலவிட. இதனால், இந்த நிர்வாக ஆவணங்கள் காணப்படவில்லை இரண்டு மற்றும் வடிவமைக்கப்பட்டுள்ளது, அது உங்கள் முன்னோக்கு (படம் 2.10) பொறுத்தது.

    படம் 2.10: படம் ஒரு வாத்து மற்றும் ஒரு முயல் ஆகும்; என்ன நீங்கள் பார்க்க உங்கள் முன்னோக்கு பொறுத்தது. அரசு மற்றும் வணிக நிர்வாக பதிவுகள் காணப்படும் மற்றும் வடிவமைக்கப்பட்டுள்ளது; என்ன நீங்கள் பார்க்க உங்கள் முன்னோக்கு பொறுத்தது. உதாரணமாக, ஒரு செல் போன் நிறுவனம் மூலம் சேகரிக்கப்பட்ட அழைப்பு தரவு பதிவுகளை ஒரு ஆய்வாளர் பார்வையில் இருந்து தரவு காணப்படுகின்றன. ஆனால், இந்த துல்லியமான அதே பதிவுகளை போன் நிறுவனம் பில்லிங் துறை வேலை யாரோ தரவு முன்னோக்கு வடிவமைக்கப்பட்டுள்ளது. ஆதாரம்: விக்கிமீடியா காமன்ஸ்

    படம் 2.10: படம் ஒரு வாத்து மற்றும் ஒரு முயல் ஆகும்; என்ன நீங்கள் பார்க்க உங்கள் முன்னோக்கு பொறுத்தது. அரசு மற்றும் வணிக நிர்வாக பதிவுகள் காணப்படும் மற்றும் வடிவமைக்கப்பட்டுள்ளது; என்ன நீங்கள் பார்க்க உங்கள் முன்னோக்கு பொறுத்தது. உதாரணமாக, ஒரு செல் போன் நிறுவனம் மூலம் சேகரிக்கப்பட்ட அழைப்பு தரவு பதிவுகளை ஒரு ஆய்வாளர் பார்வையில் இருந்து தரவு காணப்படுகின்றன. ஆனால், இந்த துல்லியமான அதே பதிவுகளை போன் நிறுவனம் பில்லிங் துறை வேலை யாரோ தரவு முன்னோக்கு வடிவமைக்கப்பட்டுள்ளது. ஆதாரம்: விக்கிமீடியா காமன்ஸ்

    அதை பார்த்து அங்கு ஆராய்ச்சி என்று தரவு மூல பயன்படுத்தும் போது காணப்படும் மற்றும் வடிவமைக்கப்பட்டுள்ளது உதவியாக இருக்கும் இரண்டு என தரவு மூல ஒரு உதாரணம் வழங்கவும்.

  14. [ எளிதாக ] ஒரு சிந்தனை கட்டுரையில், கிரிஸ்துவர் Sandvig மற்றும் Eszter Hargittai (2015) டிஜிட்டல் அமைப்பு "கருவி" அல்லது எங்கே டிஜிட்டல் ஆராய்ச்சி, இரண்டு வகையான ஆய்வு முதல் வகையான ஒரு உதாரணம் ஆகும் விவரிக்க "ஆய்வின் நோக்கம்." எங்கே பெங்க்த்சன் மற்றும் சக (2011) 2010 ல் ஹைட்டியில் நிலநடுக்கத்திற்கு பிறகு இடம்பெயர்வு கண்காணிக்க மொபைல் போன் தரவு பயன்படுத்தப்படும் இரண்டாவது வகையான ஒரு எடுத்துக்காட்டாக எங்கே ஜென்சன் (2007) கேரளா முழுவதும் மொபைல் போன்கள் அறிமுகம், இந்தியா மீன் சந்தை செயல்பாட்டை பாதிக்கப்படும் என்பதை ஆய்வுகள். இது டிஜிட்டல் தரவு மூலங்கள் பயன்படுத்தி ஆய்வுகள் அவர்கள் தரவு மூல அதே வகையான பயன்படுத்தி கூட மிகவும் வெவ்வேறு இலக்குகளை முடியும் என்பதை தெளிவுபடுத்துகிறது ஏனெனில் நான் இந்த உதவிகரமாக. ஒரு கருவியாக ஒரு டிஜிட்டல் முறையை பயன்படுத்த வேண்டும் என்று இரண்டு மற்றும் ஆய்வு ஒரு பொருள் ஒரு டிஜிட்டல் முறையை பயன்படுத்த வேண்டும் என்று இரண்டு: மேலும் இந்த வேறுபாட்டை தெளிவுபடுத்தும் பொருட்டு, நீங்கள் பார்த்த அந்த நான்கு ஆய்வுகள் விவரிக்க. நீங்கள் விரும்பினால் நீங்கள் இந்த பகுதியிலிருந்து உதாரணங்கள் பயன்படுத்தலாம்.