പ്രവർത്തനങ്ങൾ

  • പ്രയാസത്തിന്റെ ഡിഗ്രി: എളുപ്പമാണ് എളുപ്പമാണ് , മീഡിയം ഇടത്തരം , കഠിനമായി കഠിനമായി , വളരെ ബുദ്ധിമുട്ടാണ് വളരെ കഠിനമാണ്
  • കണക്ക് ആവശ്യമാണ് കണക്ക് ആവശ്യമാണ് )
  • കോഡിംഗ് ആവശ്യമാണ് ( കോഡിംഗ് ആവശ്യമാണ് )
  • ഡാറ്റ ശേഖരണം ( ഡാറ്റ ശേഖരണം )
  • എന്റെ പ്രിയപ്പെട്ടവ എനിക്ക് പ്രിയപ്പെട്ടവ )
  1. [ ഇടത്തരം , എനിക്ക് പ്രിയപ്പെട്ടവ ] ഗൂഗിൾ ഫ്ലൂ ട്രെൻഡ് ഉപയോഗിച്ച് ഒരു പ്രശ്നമായിരുന്നു അൽഗോരിത്മിക്കൽ ആശയവിനിമയം. Lazer et al. (2014) , Google- ലെ ഒരു എഞ്ചിനീയർക്ക് ഒരു ഹ്രസ്വവും വ്യക്തവുമായ ഇമെയിൽ എഴുതുകയും അത് പ്രശ്നം എങ്ങനെ പരിഹരിക്കാമെന്ന് ആശയം അവതരിപ്പിക്കുകയും ചെയ്യുന്നു.

  2. [ ഇടത്തരം സ്റ്റോൺ മാർക്കറ്റ് പ്രവചിക്കാൻ ട്വിറ്ററിൽ നിന്നുള്ള വിവരങ്ങൾ ഉപയോഗിക്കാൻ കഴിയുമെന്ന് Bollen, Mao, and Zeng (2011) അവകാശപ്പെടുന്നു. ഈ കണ്ടെത്തൽ ഒരു ഹെഡ്ജ് ഫണ്ട്-ഡേർവ്ന്റ് ക്യാപിറ്റൽ മാർക്കറ്റുകൾ സൃഷ്ടിക്കാൻ കാരണമായി-ട്വിറ്റർ (Jordan 2010) ശേഖരിച്ച ഡാറ്റ അടിസ്ഥാനമാക്കി സ്റ്റോക്ക് മാർക്കറ്റിൽ നിക്ഷേപിക്കാൻ ഇടയാക്കി. ആ ഫണ്ടിൽ നിങ്ങളുടെ പണം നിക്ഷേപിക്കുന്നതിന് മുമ്പ് നിങ്ങൾ എന്തൊക്കെ തെളിവുകൾ കാണണം?

  3. [ എളുപ്പമാണ് ചില പൊതുജനാരോഗ്യ വക്താക്കൾ ഇ-സിഗരറ്റ് പുകവലിക്കുന്നതിനുള്ള ഒരു ഫലപ്രദമായ പരിഹാരം പരിഗണിക്കുമ്പോൾ, ഉയർന്ന നിക്കോട്ടിൻ ഉയർന്ന സാധ്യതകളെക്കുറിച്ച് മറ്റുള്ളവർ മുന്നറിയിപ്പു നൽകുന്നു. ഇ-സിഗററ്റ്-ബന്ധപ്പെട്ട ട്വിറ്റർ പോസ്റ്റുകൾ ശേഖരിച്ച് സെറ്റിമെന്റ് വിശകലനം നടത്തുന്നതിലൂടെ ഇ-സിഗററ്റ് ജനങ്ങളുടെ അഭിപ്രായം പഠിക്കാൻ ഒരു ഗവേഷകൻ തീരുമാനിക്കുന്നു.

    1. ഈ പഠനത്തിൽ നിങ്ങൾക്ക് ഏറ്റവും വിഷമം തോന്നുന്ന മൂന്നു സാധ്യതകൾ എന്തെല്ലാമാണ്?
    2. Clark et al. (2016) ഇത്തരമൊരു പഠനം നടത്തി. ആദ്യം, അവർ 850,000 ട്വീറ്റുകൾ ശേഖരിച്ചു, ഇ-സിഗരറ്റ് സംബന്ധിയായ കീവേഡുകൾ 2012 ജനുവരി മുതൽ ഡിസംബർ 2014 വരെ ഉപയോഗിച്ചു. കൂടുതൽ സൂക്ഷ്മ പരിശോധന നടത്തിയപ്പോൾ, ഈ ട്വീറ്റുകളിൽ പലതും ഓട്ടോമേറ്റഡ് (അതായത് മനുഷ്യർ ഉൽപ്പാദിപ്പിക്കുന്നില്ല) യായിരുന്നു, ഈ ഓട്ടോമേറ്റഡ് ട്വീറ്റുകളിൽ മിക്കവയും പരസ്യങ്ങൾ. ഓർഗാനിക് ട്വീറ്റുകളിൽ നിന്ന് ഓട്ടോമേറ്റഡ് ട്വീറ്റുകൾ വേർതിരിക്കുന്നതിന് അവർ ഒരു മാനുഷിക കണ്ടുപിടിക്കൽ അൽഗോരിതം വികസിപ്പിച്ചെടുത്തു. ഈ മനുഷ്യ തിരിച്ചറിയൽ അൽഗോരിതം ഉപയോഗിച്ച് 80% ട്വീറ്റുകൾ ഓട്ടോമേറ്റഡ് ചെയ്തതായി അവർ കണ്ടെത്തി. ഈ ഉത്തരം, (a) ഭാഗത്തിന് നിങ്ങളുടെ ഉത്തരത്തെ മാറ്റുന്നുണ്ടോ?
    3. അവർ ഓർഗാനിക്, ഓട്ടോമേറ്റഡ് ട്വീറ്റുകളുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ, ഓട്ടോമാറ്റിക് ട്വീറ്റുകൾ ജൈവ ട്വീറ്റുകൾ എന്നതിനേക്കാൾ കൂടുതൽ നല്ലതാണെന്ന് അവർ കണ്ടെത്തി. (6.17 മുതൽ 5.84 വരെ). (ബി) ഈ ഉത്തരം നിങ്ങളുടെ ഉത്തരം മാറ്റുന്നുണ്ടോ?
  4. [ എളുപ്പമാണ് ] 2009 നവംബറിൽ ട്വിറ്റർ ബോക്സിൽ ട്വിറ്റ് ബോക്സിനെ "നിങ്ങൾ എന്താണ് ചെയ്യുന്നത്" എന്ന ചോദ്യത്തിന് "എന്താണ് സംഭവിക്കുന്നത്?" (Https://blog.twitter.com/2009/what-happening) എന്നതിനെ മാറ്റി.

    1. ട്വീറ്റുകൾ കൂടാതെ / അല്ലെങ്കിൽ അവർ ട്വീറ്റ് ചെയ്യുന്നതിനെ പ്രോംപ്റ്റിൽ മാറ്റം എങ്ങനെ ബാധിക്കുമെന്ന് നിങ്ങൾ കരുതുന്നു?
    2. പ്രോംപ്റ്റ് നിങ്ങൾ ആഗ്രഹിക്കുന്ന ഒരു ഗവേഷണ പ്രോജക്ടിൽ "നിങ്ങൾ എന്താണ് ചെയ്യുന്നത്?" എന്ന് വിശദീകരിക്കുക. എന്തുകൊണ്ട് വിശദീകരിക്കുക.
    3. പ്രോംപ്റ്റ് നിങ്ങൾ ആഗ്രഹിക്കുന്ന ഒരു ഗവേഷണപദ്ധതിക്ക് എന്താണ് "എന്താണ് സംഭവിക്കുന്നത്?" എന്ന് വിശദീകരിക്കുക. എന്തുകൊണ്ട് വിശദീകരിക്കുക.
  5. [ എളുപ്പമാണ് ] "Retweets" ട്വിറ്ററിൽ സ്വാധീനവും സ്വാധീനവും കണക്കാക്കാൻ പലപ്പോഴും ഉപയോഗിക്കാറുണ്ട്. തുടക്കത്തിൽ, ഉപയോക്താക്കൾക്ക് ഇഷ്ടപ്പെട്ട ട്വീറ്റ് പകർത്തി ഒട്ടിക്കുകയും, യഥാർത്ഥ രചയിതാവിനെ അവന്റെ / അവളുടെ ഹാൻഡിൽ ടാഗ് ചെയ്യുകയും, "RT" ടൈപ്പുചെയ്യുന്നതിന് മുമ്പുതന്നെ അത് ട്വിറ്ററിലാണെന്ന് സൂചിപ്പിക്കുകയും ചെയ്യുകയായിരുന്നു. പിന്നീട്, 2009 ൽ, ട്വിറ്റർ ഒരു "റിട്ടേഡ്" ബട്ടൺ ചേർത്തു. 2016 ജൂണിൽ ട്വിറ്റർ ഉപയോക്താക്കൾക്ക് ട്വീറ്റ് ചെയ്യാം. നിങ്ങളുടെ ഗവേഷണത്തിലെ "retweets" എങ്ങനെയാണ് നിങ്ങൾ ഈ മാറ്റങ്ങൾ ബാധിക്കേണ്ടത് എന്ന് നിങ്ങൾ കരുതുന്നുണ്ടോ? എന്തുകൊണ്ട് അല്ലെങ്കിൽ എന്തുകൊണ്ട്?

  6. [ വളരെ കഠിനമാണ് , ഡാറ്റ ശേഖരണം , കോഡിംഗ് ആവശ്യമാണ് , എനിക്ക് പ്രിയപ്പെട്ടവ ദീർഘമായ സാംസ്കാരിക പ്രവണതകളെ തിരിച്ചറിയുന്നതിനായി മിഷേലും സഹപ്രവർത്തകരും (2011) അഞ്ചുലക്ഷത്തിലധികം ഡിജിറ്റൽ പുസ്തകങ്ങളുടെ ഉള്ളടക്കം വിശകലനം ചെയ്തു. അവർ ഉപയോഗിച്ച ഡാറ്റ ഇപ്പോൾ Google NGrams ഡാറ്റാഗതം ആയി പുറത്തിറങ്ങിയിരിക്കുന്നു, അതിനാൽ ചില പ്രവർത്തനങ്ങളുടെ പകർപ്പെടുക്കുകയും വിപുലീകരിക്കുകയും ചെയ്യുന്നതിനായി ഞങ്ങൾക്ക് ഡാറ്റ ഉപയോഗപ്പെടുത്താം.

    പേപ്പറിൽ വന്ന പല ഫലങ്ങളിലൊന്ന്, വേഗത്തിലും വേഗത്തിലും ഞങ്ങൾ മറക്കുന്നുവെന്നതാണ് മിഷേലും സഹപ്രവർത്തകരും വാദിച്ചത്. ഓരോ വർഷവും 1883 നും 1875 നും ഇടയിൽ 1883 ൽ പ്രസിദ്ധീകരിച്ച 1 ഗ്രാം അനുപാതത്തിൽ "1883" എന്ന് ഒരു പ്രത്യേക വർഷത്തിൽ അവർ പറയുകയുണ്ടായി. ആ അനുപാതത്തിൽ ആ വർഷം നടന്ന സംഭവങ്ങളുടെ താത്പര്യത്തിന്റെ ഒരു അളവുകോലാണെന്ന് അവർ വ്യാഖ്യാനിച്ചു. 3 ആം വയസ്സിൽ 1883, 1910, 1950 എന്നീ മൂന്നു വർഷങ്ങൾ അവർ ഉപയോഗത്തിലിരുന്ന പായ്ക്കറ്റുകൾ അവതരിപ്പിച്ചു. ഈ മൂന്ന് വർഷങ്ങൾ പൊതുവായുള്ള വ്യത്യാസങ്ങൾ പങ്കുവയ്ക്കുന്നു: ആ വർഷത്തിന് മുമ്പ് ചെറിയ ഉപയോഗം, പിന്നെ ഒരു പിണക്കം, പിന്നെ ശോഷണം. അടുത്ത വർഷം, ഓരോ വർഷവും ശോഷണനിരക്ക് കണക്കാക്കാൻ, 1875 മുതൽ 1975 വരെ മിഷേലും സഹപ്രവർത്തകരും ഓരോ വർഷവും "അർധജീവിതം" കണക്കുകൂട്ടുന്നു. അവരുടെ കണക്ക് 3 എ (ഇൻസെറ്റ്) ൽ, വർഷം കുറയുന്നു, ഇതിനർത്ഥം കഴിഞ്ഞ വേഗത്തിലും വേഗതയിലും ഞങ്ങൾ മറക്കുന്നതിനെ സൂചിപ്പിക്കുന്നതാണെന്ന് അവർ വാദിച്ചു. അവർ ഇംഗ്ലീഷ് ഭാഷയിലെ കോർപ്പസിനുള്ള പതിപ്പ് 1 ഉപയോഗിച്ചു, എന്നാൽ പിന്നീട് ഗൂഗിൾ കോർപ്പസ്സിന്റെ രണ്ടാമത്തെ പതിപ്പ് പുറത്തിറക്കി. നിങ്ങൾ കോഡിംഗ് ആരംഭിക്കുന്നതിന് മുമ്പ് ചോദ്യത്തിന്റെ എല്ലാ ഭാഗങ്ങളും വായിക്കുക.

    ഈ പ്രവർത്തനം നിങ്ങൾക്ക് വീണ്ടും ഉപയോഗിക്കാവുന്ന കോഡ് എഴുത്ത്, ഫലങ്ങൾ വ്യാഖ്യാനിക്കൽ, ഡാറ്റ വൈറ്റ്ലിംഗ് (മോശമായ ഫയലുകളുമൊത്ത് ജോലിചെയ്യുന്നു, നഷ്ടമായ ഡാറ്റ കൈകാര്യം ചെയ്യൽ പോലുള്ളവ) പരിശീലിപ്പിക്കും. സമ്പന്നവും രസകരവുമായ ഡാറ്റാസീറ്റിനൊപ്പം പ്രവർത്തിപ്പിക്കാനും പ്രവർത്തിക്കാനും ഈ പ്രവർത്തനം സഹായിക്കും.

    1. Google Books NGram Viewer വെബ്സൈറ്റിൽ നിന്നുള്ള റോ ഡാറ്റ നേടുക. പ്രത്യേകമായി, നിങ്ങൾ ഇംഗ്ലീഷ് ഭാഷയിലെ corpus ന്റെ 2 പതിപ്പ് ഉപയോഗിക്കേണ്ടതാണ്, അത് ജൂലൈ 1, 2012 ൽ പുറത്തിറങ്ങി. അൺcompressed, ഈ ഫയൽ 1.4GB ആണ്.

    2. Michel et al. (2011) ലെൽഫിലെ 3a ന്റെ പ്രധാന ഭാഗം റിഫ്രയിക്കുക Michel et al. (2011) . ഈ സംഖ്യ പുനഃസൃഷ്ടിക്കുന്നതിന്, നിങ്ങൾക്ക് രണ്ട് ഫയലുകൾ ആവശ്യമാണ്: നിങ്ങൾ (")" "മൊത്ത എണ്ണം" "അനുപാതങ്ങളായി മാറ്റാൻ ഉപയോഗിക്കുന്ന" "മൊത്ത കണക്കെടുക്കുക" എന്ന ഭാഗത്തിൽ ഡൌൺലോഡ് ചെയ്ത ഒന്ന്. മൊത്തം എണ്ണത്തിന്റെ ഫയൽ ഒരു ഘടനയുണ്ടെന്നത് ശ്രദ്ധിക്കുക. അത് വായിക്കാൻ അൽപം ബുദ്ധിമുട്ടുണ്ടാക്കിയേക്കാം. എൻഗ്രാം ഡാറ്റയുടെ പതിപ്പ് 2 ന് Michel et al. (2011) ഹെഡിലും അവതരിപ്പിച്ചിരിക്കുന്ന അതേ ഫലങ്ങൾ നൽകുന്നു Michel et al. (2011) , പതിപ്പ് 1 ഡാറ്റയെ അടിസ്ഥാനമാക്കിയുള്ളവയാണോ?

    3. NGram വ്യൂവറിൽ സൃഷ്ടിച്ച ഗ്രാഫിൽ നിന്നും നിങ്ങളുടെ ഗ്രാഫ് പരിശോധിക്കുക.

    4. Figure 3a (പ്രധാന ചിത്രാ \(y\) റിഫ്രയിക്കുക, എന്നാൽ \(y\) -axis എന്നത് റോ കട്ട് റൗണ്ട് ആയിരിക്കൂ \(y\) സൂചികയുടെ തോത് അല്ല).

    5. (B) ഉം (d) ഉം തമ്മിലുള്ള വ്യത്യാസം മൈക്കിൾ ഫലങ്ങളുടെ ഏതെങ്കിലും ഫലങ്ങളെ പുനരവതരിപ്പിക്കാൻ നിങ്ങളെ പ്രേരിപ്പിക്കുന്നുണ്ടോ? (2011). എന്തുകൊണ്ട് അല്ലെങ്കിൽ എന്തുകൊണ്ട്?

    6. ഇപ്പോൾ, പരാമർശങ്ങളുടെ അനുപാതം ഉപയോഗിച്ച്, ചിത്രം 3a എന്ന ഇൻസെറ്റ് പകർത്തുക. അതായത്, 1875 നും 1975 നും ഇടക്ക് ഓരോ വർഷവും ആ വർഷത്തിന്റെ അർധജീവിതം കണക്കുകൂട്ടുക. അർഹതയുടെ അനുപാതം അനുപാതത്തിന്റെ അനുപാതത്തിന്റെ പകുതിയിൽ എത്തിപ്പെടുന്നതിനു മുമ്പുള്ള വർഷങ്ങളുടെ എണ്ണമായിരിക്കും അർദ്ധ ജീവിതം. അത് Michel et al. (2011) കൂടുതൽ പ്രാധാന്യമർഹിക്കുന്ന കാര്യം ഒന്നിലധികം ലൈംഗികതയെ -ഉപഭോക്താക്കളായ ഭാഗം III.6- നെ പിന്തുണയ്ക്കാൻ സഹായിക്കുന്നു. എന്നാൽ, ഈ രണ്ട് സമീപനങ്ങളും സമാനമായ ഫലങ്ങൾ ഉണ്ടാക്കുന്നു എന്ന് അവർ അവകാശപ്പെടുന്നു. NGram ഡാറ്റയുടെ 2 പതിപ്പിനാണോ Michel et al. (2011) ലെലൊസിൽ നൽകിയിട്ടുള്ളവയ്ക്ക് സമാന ഫലങ്ങൾ നൽകുന്നു Michel et al. (2011) , പതിപ്പ് 1 ഡാറ്റയെ അടിസ്ഥാനമാക്കിയുള്ളവയാണോ? (സൂചന: അത് ചെയ്യാതിരുന്നാൽ അദ്ഭുതപ്പെടരുത്.)

    7. വർഷങ്ങളോളം പ്രത്യേകിച്ച് വേഗതയേറിയതോ പ്രത്യേകിച്ച് സാവധാനം മറന്നുപോയതോ ആയ വർഷങ്ങളോളം വർഷങ്ങളോളം ഉണ്ടായിരുന്നോ? ആ പാറ്റേൺ സാധ്യമായ കാരണങ്ങൾ വിശദമായി ഊഹിക്കുക.

    8. ഇപ്പോൾ ചൈനീസ്, ഫ്രഞ്ച്, ജർമൻ, ഹീബ്രു, ഇറ്റാലിയൻ, റഷ്യൻ, സ്പാനിഷ് എന്നിവയിൽ NGrams ഡാറ്റയുടെ പതിപ്പ് 2 ന് ഈ ഫലം പകർത്തുക.

    9. എല്ലാ ഭാഷകളിലുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ, വർഷങ്ങളോളം പ്രത്യേകിച്ചും വേഗതയേറിയതോ പ്രത്യേകിച്ച് സാവധാനം മറന്നുപോയതോ ആയ അതിരുകവിഞ്ഞ വർഷങ്ങളോളം ഉണ്ടായിരുന്നോ? ആ പാറ്റേൺ നിർണായക കാരണങ്ങളെക്കുറിച്ച് ചിന്തിക്കുക.

  7. [ വളരെ കഠിനമാണ് , ഡാറ്റ ശേഖരണം , കോഡിംഗ് ആവശ്യമാണ് , എനിക്ക് പ്രിയപ്പെട്ടവ 2013 ജൂണിൽ NSA / PRISM നിരീക്ഷണം (അതായത് സ്നോഡൻ വെളിപ്പെടുത്തലുകൾ) സംബന്ധിച്ച വ്യാപകമായ പ്രചരണത്തെക്കുറിച്ച് സ്വകാര്യത സംബന്ധിച്ച ആശങ്കകൾ ഉയർത്തുന്ന വിഷയങ്ങളെക്കുറിച്ച് വിക്കിപീഡിയ ലേഖനങ്ങളിലേക്ക് ട്രാഫിക്കിനെ കുറച്ചുകൂടി കൃത്യമായ ബന്ധമുണ്ടോ എന്ന് Penney (2016) പര്യവേക്ഷണം ചെയ്തു. അങ്ങനെയാണെങ്കിൽ, പെരുമാറ്റത്തിലെ ഈ മാറ്റം ബഹുജന നിരീക്ഷണത്തിന്റെ ഫലമായി ഒരു ചില്ലിംഗ് പ്രഭാവം തന്നെ ആയിരിക്കും. Penney (2016) സമീപനത്തെ ഒരു തടസ്സപ്പെടുത്തിയ സമയ പരമ്പര രൂപകൽപ്പനയായിട്ടാണ് കണക്കാക്കുന്നത്. ഇത് വിഭാഗം 2.4.3 ൽ വിവരിച്ചിരിക്കുന്ന സമീപനങ്ങളുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു.

    വിഷയം കീവേഡുകൾ തിരഞ്ഞെടുക്കാൻ, പെന്നി സോഷ്യൽ മീഡിയ ട്രാക്ക് ചെയ്യുന്നതിനും നിരീക്ഷിക്കുന്നതിനും യുഎസ് ഡിപ്പാർട്ട്മെന്റ് ഓഫ് ഹോംലാൻഡ് സെക്യൂരിറ്റി ഉപയോഗിച്ച ലിസ്റ്റ് അനുസരിച്ചാണ്. ഡിഎച്ച്എസ് പട്ടിക ചില തിരയൽ വിഷയങ്ങളെ തരം തിരിച്ചിട്ടുണ്ട്, അതായത് "ആരോഗ്യ ആശങ്ക," "അടിസ്ഥാന സെക്യൂരിറ്റി," "തീവ്രവാദം" എന്നിവയാണ്. "പഠനഗ്രൂപ്പ്" എന്ന പേരിൽ "ഭീകരതയുമായി ബന്ധപ്പെട്ട 48" കീവേഡുകൾ ഉപയോഗിച്ചു (അനുബന്ധം പട്ടിക 8 കാണുക) ). 2012 ജനുവരി അവസാനം മുതൽ 2014 ആഗസ്ത് വരെയുള്ള കാലയളവിൽ അദ്ദേഹം ഒരു 32 മാസത്തെ കാലഘട്ടത്തിൽ 48 വിക്കിപീഡിയ ലേഖനങ്ങൾക്കായി പ്രതിമാസ അടിസ്ഥാനമാക്കിയുള്ള വിക്കിപീഡിയ ലേഖനത്തിന്റെ കണക്കെടുപ്പ് നടത്തി. അദ്ദേഹത്തിന്റെ വാദം ശക്തിപ്പെടുത്താൻ അദ്ദേഹം നിരവധി ട്രാക്കിംഗ് ഗ്രൂപ്പുകളും മറ്റ് വിഷയങ്ങൾ സംബന്ധിച്ച ലേഖന കാഴ്ചകൾ.

    ഇപ്പോൾ, നിങ്ങൾ Penney (2016) പകർത്തുകയും വിപുലീകരിക്കുകയും ചെയ്യും. ഈ പ്രവർത്തനത്തിന് ആവശ്യമുള്ള എല്ലാ അസംസ്കൃത വിവരങ്ങളും വിക്കിപീഡിയയിൽ ലഭ്യമാണ്. അല്ലെങ്കിൽ നിങ്ങൾക്ക് ഇത് ആർ പാക്കേജ് വിൽകിപിഡിയേറ്റഡ് (Meissner and R Core Team 2016) . നിങ്ങളുടെ പ്രതികരണങ്ങൾ എഴുതുകയാണെങ്കിൽ, നിങ്ങൾ ഉപയോഗിച്ച ഡാറ്റ സ്രോതസ്സ് ശ്രദ്ധിക്കുക. (ഇത് സമാനമായ പ്രവൃത്തി 6-ാം അദ്ധ്യായത്തിൽ കാണുന്നുണ്ട് എന്ന് ശ്രദ്ധിക്കുക) വിവരശേഖരത്തിൽ നിങ്ങൾ പ്രവർത്തിക്കുന്നു, വലിയ ഡാറ്റാ സ്രോതസ്സുകളിൽ പ്രകൃതിപരമായ പരീക്ഷണങ്ങളെക്കുറിച്ച് ചിന്തിക്കുകയും ചെയ്യും. ഭാവി പദ്ധതികൾക്കായി നിങ്ങൾക്ക് രസകരമായ ഒരു ഡാറ്റാ ഉറവിടവുമായി ഇത് നിങ്ങളെ സഹായിക്കുന്നു.

    1. സ്നോഡന്റെ വെളിപ്പെടുത്തലിനു മുമ്പും ശേഷവും "ഭീകരവാദം" എന്ന താളുകളുടെ പേജുകൾ കാണിക്കുന്ന Penney (2016) വായിക്കുക. കണ്ടെത്തലുകൾ വ്യാഖ്യാനിക്കുക.
    2. അടുത്തതായി, ഡിഎച്ച്എസ് പട്ടികയിൽ നിന്നും "ഡിഎച്ച്എസ് & മറ്റ് ഏജൻസികൾ" എന്ന വിഭാഗത്തിൽ തരം തിരിച്ചിരിക്കുന്ന ഒരു ഗവേഷക സംഘവുമായി താരതമ്യപ്പെടുത്തൽ ഗ്രൂപ്പുമായി ("തീവ്രവാദം" - അനുബന്ധ ലേഖനങ്ങൾ ഉൾക്കൊള്ളുന്ന ചിത്രം 4 എ) പ്രതിഫലിപ്പിക്കുന്നു (അനുബന്ധം പട്ടിക 10 ഉം അടിക്കുറിപ്പ് 139 ഉം കാണുക). കണ്ടെത്തലുകൾ വ്യാഖ്യാനിക്കുക.
    3. (ബി) നിങ്ങൾ ഒരു താരതമ്യ ഗ്രൂപ്പുമായി പഠനം ഗ്രൂപ്പുമായി താരതമ്യം ചെയ്തു. പെന്നി സമാനമായ മറ്റ് താരതമ്യ കൂട്ടായ്മകളുമായി താരതമ്യപ്പെടുത്തി: "ഇൻഫ്രാസ്ട്രക്ചർ സെക്യൂരിറ്റി" അനുബന്ധ ലേഖനങ്ങൾ (അനുബന്ധം 11), പ്രശസ്തമായ വിക്കിപീഡിയ താളുകൾ (അനുബന്ധം പട്ടിക 12). ഒരു ഒരുകൂട്ടം താരതമ്യ ഗ്രൂപ്പുമായി മുന്നോട്ടുവരൂ, ഭാഗം (ബി) നിന്നുള്ള കണ്ടെത്തലുകൾ നിങ്ങളുടെ താരതമ്യ ഗ്രൂപ്പിന്റെ പരിഗണനയിൽ ഉണ്ടോ എന്ന് പരിശോധിക്കുക. ഏത് ചോയ്സ് പ്രയോജനകരമാണ്? എന്തുകൊണ്ട്?
    4. "ഭീകരതയുമായി ബന്ധപ്പെട്ട" കീവേഡുകൾ വിക്കിപീഡിയ ലേഖനങ്ങളെ തിരഞ്ഞെടുക്കുന്നതിനാണ് ഉപയോഗിച്ചതെന്ന് പെന്നി പ്രസ്താവിച്ചു. കാരണം, ഓൺലൈൻ ഗവൺമെന്റിന്റെ ഓൺലൈൻ നിരീക്ഷണങ്ങൾക്ക് ഒരു പ്രധാന ന്യായീകരണമായി യുഎസ് ഗവൺമെന്റ് ഭീകരവാദത്തെ ഉദ്ധരിച്ചു. 48 "ഭീകരത" -യുക്തമായ കീവേഡുകളുടെ ഒരു പരിശോധന എന്ന നിലയിൽ, Penney (2016) , MTK- ൽ സർവ്വേ നടത്തിയത് സർഗാത്മകത, സ്വകാര്യത-സെൻസിറ്റീവ്, ഒഴിവാക്കൽ (അനുബന്ധം പട്ടിക 7-ഉം 8-ഉം ). MTurk- ൽ സർവേയിൽ പ്രതിഫലിച്ച് നിങ്ങളുടെ ഫലങ്ങൾ താരതമ്യം ചെയ്യുക.
    5. ഭാഗം (ഡി), ലേഖനത്തിൽ നിങ്ങൾ വായിച്ച ഫലങ്ങൾ അടിസ്ഥാനമാക്കി, പഠനഗ്രൂപ്പിൽ പെന്നി തിരഞ്ഞെടുത്ത വിഷയം ഉപയോഗിച്ച് നിങ്ങൾ സമ്മതിക്കുന്നുണ്ടോ? എന്തുകൊണ്ട് അല്ലെങ്കിൽ എന്തുകൊണ്ട്? ഇല്ലെങ്കിൽ, പകരം എന്താണ് നിങ്ങൾ നിർദ്ദേശിക്കുക?
  8. [ എളുപ്പമാണ് ഫേസ്ബുക്കിൽ മൊത്തം പങ്കാളിത്തം 5.5 ശതമാനം കുറഞ്ഞുവെന്നും "ഒറിജിനൽ ബ്രോഡ്കാറ്റ് ഷെയർ" 21 വർഷത്തിൽ Efrati (2016) റിപ്പോർട്ട് ചെയ്തു. ഫേസ്ബുക്ക് ഉപയോക്താക്കൾക്ക് 30 വയസ്സിന് താഴെയുള്ള അസുഖം ഈ തിരിച്ചടിക്കുണ്ടായിരുന്നു. രണ്ട് ഘടകങ്ങളെ തളർത്തി. ഫേസ് ബുക്കിൽ "സുഹൃത്തുക്കൾ" എന്ന ആളുകളുടെ എണ്ണത്തിൽ ഒന്ന് വളർച്ചയാണ്. രണ്ടാമതായി, ചില പങ്കുവയ്ക്കൽ പ്രവർത്തനം സ്നാപ്ചാറ്റ് പോലുള്ള മെസ്സേജിംഗിലേക്കും മത്സരാർത്ഥികളിലേക്കും മാറ്റിയിരിക്കുന്നു. യഥാർത്ഥ പോസ്റ്റുകൾ കൂടുതൽ പ്രാധാന്യമർഹിക്കുന്ന ന്യൂസ് ഫീഡിംഗ് അൽഗോരിതം ട്വീക്കുകൾ അടക്കമുള്ള നിരവധി തന്ത്രങ്ങൾ ഫെയ്സ്ബുക്കിനുണ്ടായിരുന്നുവെന്നും റിപ്പോർട്ടിൽ പറയുന്നു. "ഓൺ ദിസ് ഡേ" എന്ന ഫീച്ചർ പ്രസിദ്ധീകരിച്ച ആദ്യ കുറിപ്പുകളും. ഫേസ്ബുക്ക് ഡാറ്റ സ്രോതായി ഉപയോഗിക്കാൻ ആഗ്രഹിക്കുന്ന ഗവേഷകരുടെ കാര്യത്തിൽ എന്തെല്ലാം പ്രത്യാഘാതങ്ങൾ ഉണ്ടാകുന്നു?

  9. [ ഇടത്തരം ഒരു സാമൂഹ്യശാസ്ത്രജ്ഞനും ചരിത്രകാരനും തമ്മിലുള്ള വ്യത്യാസമെന്താണ്? ഗോൾത്രൂർപ്പ് (1991) അനുസരിച്ച്, പ്രധാന വ്യത്യാസം ഡാറ്റ ശേഖരണത്തെ നിയന്ത്രിക്കുന്നതാണ്. ചരിത്രകാരന്മാർക്ക് അവശിഷ്ടങ്ങൾ ഉപയോഗിക്കാൻ നിർബന്ധിതരാകുന്നു, എന്നാൽ സാമൂഹിക ശാസ്ത്രജ്ഞർ അവരുടെ വിവര ശേഖരണം പ്രത്യേക ആവശ്യങ്ങൾക്കായി കൂട്ടിച്ചേർക്കാൻ കഴിയും. വായിക്കുക Goldthorpe (1991) . സാമൂഹ്യശാസ്ത്രവും ചരിത്രവും തമ്മിലുള്ള അഭിപ്രായവ്യത്യാസം എങ്ങനെ?

  10. [ കഠിനമായി ] ഇത് മുമ്പത്തെ ക്വാസിറ്റണിൽ നിർമ്മിക്കുന്നു. Goldthorpe (1991) നിരവധി നിരുത്തരവാദപരമായ പ്രതികരണങ്ങളെ അവതരിപ്പിച്ചു. നിക്കി ഹാർട്ട് (1994) ചിത്രത്തിൽ നിന്നും ഗോൾത്രത്രോയുടെ ഭക്തിയെ ചോദ്യം ചെയ്തുകൊണ്ട് വെല്ലുവിളിച്ചു. തയ്യാർ നിർമ്മിത ഡാറ്റയുടെ പരിമിതികളെ വ്യക്തമാക്കാൻ, 1960 കളിൽ ഗോൾത്രത്രെയും സഹപ്രവർത്തകരും നടത്തിയ സാമൂഹ്യ വർഗവും വോട്ടിംഗും തമ്മിലുള്ള ബന്ധം അളക്കാൻ വലിയ സർവേ നടത്തിയതായി ഹാർട്ട് വിശദീകരിച്ചു. ലഭ്യമായ വിവരങ്ങളനുസരിച്ചുള്ള ഡിസൈൻ തയ്യാറാക്കിയ പണ്ഡിതനായ ഒരു പണ്ഡിതൻ പ്രതീക്ഷിച്ചതുപോലെ, ജീവിതനിലവാരം ഉയർത്താനുള്ള ഒരു കാലഘട്ടത്തിൽ സാമൂഹ്യ വർഗത്തിന്റെ ഭാവിയെക്കുറിച്ച് അടുത്തിടെ മുന്നോട്ടുപോവുന്ന ഒരു സിദ്ധാന്തത്തെ അഭിമുഖീകരിക്കാൻ തയ്യാറാക്കിയ വിശാലമായ തൊഴിലാളി പ്രോജക്ട് ശേഖരിച്ച ഡാറ്റ. എന്നാൽ, ഗോൾത്രത്രയും സഹപ്രവർത്തകരും സ്ത്രീകൾക്കെതിരെയുള്ള വോട്ടെടുപ്പ് സ്വഭാവത്തെക്കുറിച്ചുള്ള വിവരങ്ങൾ ശേഖരിക്കുന്നതിന് തനിയെ "മറന്നു". നിക്കി ഹാർട്ട് (1994) എങ്ങനെയാണ് ഈ എപ്പിസോഡിനെ സംഗ്രഹിച്ചത്:

    "... ഈ 'തയ്യൽ ചെയ്ത' കാരണം കാരണം സ്ത്രീകളെ ഒഴിവാക്കി എന്ന വിഷയം ഒഴിവാക്കാൻ ബുദ്ധിമുട്ടാണ്, സ്ത്രീകളുടെ അനുഭവങ്ങളെ അവഗണിക്കപ്പെടുന്ന ഒരു മാതൃകാ യുക്തിയാണ് പരിധിയില്ലാതെ ഉള്ളത്. പുരുഷ ചിന്താപാത്രങ്ങളെ പോലെ വർഗബോധവും പ്രവൃത്തിയും ഒരു സൈദ്ധാന്തിക കാഴ്ചപ്പാടിലൂടെയാണ് ... ഗോൾത്രത്രയും അദ്ദേഹത്തിന്റെ സഹപ്രവർത്തകരും ഒരു സാങ്കൽപിക തെളിവുകൾ സൃഷ്ടിച്ചു, അത് അവരുടെ തനത് സൈദ്ധാന്തിക അനുമാനങ്ങളെ പോഷിപ്പിക്കാനും, പര്യാപ്തമായ ഒരു സാധുതയുള്ള പരീക്ഷണത്തിലേക്ക് തുറന്നു കൊടുക്കുന്നതിനുപകരം പരിപോഷിപ്പിക്കാനും ശ്രമിച്ചു. "

    ഹാർട്ട് തുടരുന്നു:

    "സമ്പന്നമായ വർക്കർ പ്രോജക്ടിന്റെ അനുഭവവേദ്യമായ കണ്ടെത്തലുകൾ, മധ്യവർഗത്തിലെ സാമൂഹ്യശാസ്ത്രത്തിന്റെ മൂല്യങ്ങൾ, നാടകീയത, രാഷ്ട്രീയം, ഭൌതിക ജീവിതത്തിന്റെ പ്രക്രിയകൾ എന്നിവയെക്കുറിച്ച് പറയുന്നതിനേക്കാൾ കൂടുതൽ പറയുക".

    വിവരശേഖര ഡാറ്റ ശേഖരണം അതിലുള്ള ഡാറ്റാ ശേഖരത്തിന്റെ പക്ഷപാതമുള്ള മറ്റ് ഉദാഹരണങ്ങളെക്കുറിച്ച് നിങ്ങൾക്ക് ചിന്തിക്കാനാകുമോ? ഇത് അൽഗോരിത്ക് മെമ്മറിക്ക് എങ്ങനെയാണ് താരതമ്യപ്പെടുത്തുന്നത്? ഗവേഷകർ readymades ഉപയോഗിക്കുമ്പോൾ അവർ കസ്റ്റമറുകൾ ഉപയോഗിക്കുമ്പോൾ എന്ത് അർത്ഥങ്ങൾ ഉണ്ടാകും?

  11. [ ഇടത്തരം ഈ അധ്യായത്തിൽ, കമ്പനികളും സർക്കാരുകളും തയ്യാറാക്കിയ അഡ്മിനിസ്ട്രേറ്റീവ് റെക്കോർഡുകളുമായി ബന്ധപ്പെട്ട ഗവേഷകരുടെ ഗവേഷകരാണ് ഞാൻ ശേഖരിച്ചിരിക്കുന്നത്. ചില ഭരണാധികാരികൾ ഈ വിവരണങ്ങൾ "ഡാറ്റ കണ്ടെത്തി" എന്ന് വിളിക്കുന്നു, അവർ "ഡിസൈൻ ചെയ്ത ഡാറ്റ" നോട് വ്യത്യാസപ്പെട്ടിരിക്കുന്നു. അഡ്മിനിസ്ട്രേറ്റീവ് റെക്കോർഡുകൾ ഗവേഷകർ കണ്ടെത്തിയിരിക്കുന്നു എന്നതു ശരിതന്നെ. ഉദാഹരണത്തിന്, ആധുനിക ടെക്ക് കമ്പനികൾ അവരുടെ ഡാറ്റ ശേഖരിക്കാനും ക്യുറേറ്റുചെയ്യാനും വളരെ കഠിനമായി പ്രവർത്തിക്കുന്നു. അങ്ങനെ, ഈ ഭരണരേഖകൾ കണ്ടെത്താനും രൂപകൽപ്പന ചെയ്യാനും കഴിയും, അത് നിങ്ങളുടെ വീക്ഷണത്തെ ആശ്രയിച്ചിരിക്കുന്നു (ചിത്രം 2.12).

    ചിത്രം 2.12: ചിത്രം ഒരു താറാവും മുയലും ആണ്. നിങ്ങൾ കാണുന്നവ നിങ്ങളുടെ വീക്ഷണത്തെ ആശ്രയിച്ചിരിക്കുന്നു. വലിയ ഡാറ്റാ സ്രോതസ്സുകൾ കണ്ടെടുക്കുകയും രൂപകൽപ്പന ചെയ്യുകയും ചെയ്യുന്നു; വീണ്ടും, നിങ്ങൾ കാണുന്ന കാഴ്ച നിങ്ങളുടെ കാഴ്ചപ്പാടിനെ ആശ്രയിച്ചിരിക്കുന്നു. ഉദാഹരണമായി, ഒരു മൊബൈൽ ഫോൺ കമ്പനി ശേഖരിച്ച കോൾ ഡാറ്റ റെക്കോർഡ് ഒരു ഗവേഷകന്റെ കാഴ്ചപ്പാടിൽ നിന്ന് ഡാറ്റ കണ്ടെത്തി. എന്നാൽ, ഈ കൃത്യമായ രേഖകൾ ഫോൺ കമ്പനിയുടെ ബില്ലിംഗ് വകുപ്പിൽ ജോലി ചെയ്യുന്ന ഒരാളുടെ കാഴ്ചപ്പാടിൽ രൂപകൽപ്പന ചെയ്തിട്ടുള്ളതാണ്. അവലംബം: ജനപ്രിയ ശാസ്ത്രം പ്രതിമാസം (1899) / വിക്കിമീഡിയ കോമൺസ്.

    ചിത്രം 2.12: ചിത്രം ഒരു താറാവും മുയലും ആണ്. നിങ്ങൾ കാണുന്നവ നിങ്ങളുടെ വീക്ഷണത്തെ ആശ്രയിച്ചിരിക്കുന്നു. വലിയ ഡാറ്റാ സ്രോതസ്സുകൾ കണ്ടെടുക്കുകയും രൂപകൽപ്പന ചെയ്യുകയും ചെയ്യുന്നു; വീണ്ടും, നിങ്ങൾ കാണുന്ന കാഴ്ച നിങ്ങളുടെ കാഴ്ചപ്പാടിനെ ആശ്രയിച്ചിരിക്കുന്നു. ഉദാഹരണമായി, ഒരു മൊബൈൽ ഫോൺ കമ്പനി ശേഖരിച്ച കോൾ ഡാറ്റ റെക്കോർഡ് ഒരു ഗവേഷകന്റെ കാഴ്ചപ്പാടിൽ നിന്ന് ഡാറ്റ കണ്ടെത്തി. എന്നാൽ, ഈ കൃത്യമായ രേഖകൾ ഫോൺ കമ്പനിയുടെ ബില്ലിംഗ് വകുപ്പിൽ ജോലി ചെയ്യുന്ന ഒരാളുടെ കാഴ്ചപ്പാടിൽ രൂപകൽപ്പന ചെയ്തിട്ടുള്ളതാണ്. അവലംബം: ജനപ്രിയ ശാസ്ത്രം പ്രതിമാസം (1899) / വിക്കിമീഡിയ കോമൺസ് .

    ഡാറ്റ ഉറവിടത്തിന്റെ ഒരു ഉദാഹരണം നൽകുക, ഒപ്പം അത് കണ്ടെത്തിയതും ഗവേഷണത്തിനായി ആ ഡാറ്റാ ഉറവിടം ഉപയോഗിക്കുമ്പോൾ രൂപകൽപ്പന ചെയ്തതും സഹായകരമാണ്.

  12. [ എളുപ്പമാണ് ഡിജിറ്റൽ സമ്പ്രദായം ഒരു "ഉപകരണമോ" "പഠനോപാധിയാണോ" എന്നതിനെ അടിസ്ഥാനമാക്കിയുള്ള ഒരു വിശാലമായ വിഭാഗത്തിൽ ക്രിസ്റ്റ്യൻ സാൻഡ്വിഗും എസ്സ്റ്റെർ ഹർഗിത്തിയും (2015) ഡിജിറ്റൽ ഗവേഷണം വിഭജിച്ചു. ബെന്ഗ്ത്ഷൊന് സഹപ്രവർത്തകരും നടത്തിയ ഒരു ഉപകരണം-ആണ് (2011) 2010-ൽ ഹെയ്ത്തി ഭൂകമ്പം രണ്ടാം തരത്തിലുള്ള-എവിടെ സിസ്റ്റം പഠനം-ആണ് കുത്തൊഴിക്കില് നടത്തിയ ഒരു വസ്തു ആണ് ഒരു ഉദാഹരണം ശേഷം മൈഗ്രേഷൻ ട്രാക്കുചെയ്യുന്നതിന് മൊബൈൽ ഫോൺ ഡാറ്റ ഉപയോഗിച്ച് ന് (2007) കേരളത്തിൽ മൊബൈലുകളുടെ ആമുഖം എങ്ങനെ, മത്സ്യത്തിന്റെ വിപണിയുടെ പ്രവർത്തനത്തെ ഇന്ത്യ സ്വാധീനിച്ചു. ഡിജിറ്റൽ ഡാറ്റാ ഉറവിടങ്ങൾ ഉപയോഗിച്ച് പഠനങ്ങൾ വ്യക്തമാക്കുന്നത് കാരണം ഈ വ്യത്യാസം സഹായകരമാണെന്ന് ഞാൻ മനസ്സിലാക്കുന്നു, അവർ അതേ ഡാറ്റ ഡാറ്റാ സ്രോതസ്സുകൾ ഉപയോഗിക്കുകയാണെങ്കിൽ പോലും വ്യത്യസ്തമായ ലക്ഷ്യങ്ങൾ ഉണ്ടാകും. ഈ വേർതിരിവ് കൂടുതൽ വ്യക്തമാക്കുന്നതിന്, നിങ്ങൾ കണ്ട നാല് പഠനങ്ങളെക്കുറിച്ച് വിവരിക്കുന്നുണ്ട്: ഒരു ഡിജിറ്റൽ സംവിധാനം ഒരു ഉപകരണമായും രണ്ട് ഡിജിറ്റൽ സംവിധാനത്തെ ഒരു വസ്തുവായി പഠിക്കുന്ന രണ്ട് ഉപകരണങ്ങളെയും ഉപയോഗിക്കുന്നു. നിങ്ങൾക്ക് ആവശ്യമെങ്കിൽ ഈ അധ്യായത്തിൽ നിന്നുള്ള ഉദാഹരണങ്ങൾ ഉപയോഗിക്കാം.