પ્રવૃત્તિઓ

કી:

  • મુશ્કેલી ડિગ્રી: સરળ સરળ , મધ્યમ મધ્યમ , હાર્ડ હાર્ડ , ખૂબ જ હાર્ડ ખૂબ જ હાર્ડ
  • ગણિત માટે જરૂરી છે ( ગણિત માટે જરૂરી છે )
  • જરૂરી કોડિંગ ( કોડિંગ જરૂરી )
  • માહિતી સંગ્રહ ( માહિતી સંગ્રહ )
  • મારા ફેવરિટ ( મારુ મનપસન્દ )
  1. [ મધ્યમ , મારુ મનપસન્દ ] અલ્ગોરિધમિક સંકીર્ણ Google ફ્લૂ પ્રવાહો સાથે કોઈ સમસ્યા હતી. દ્વારા કાગળ વાંચી Lazer et al. (2014) , અને Google પર એક ઈજનેર સમસ્યા સમજાવીને અને કેવી રીતે સમસ્યા સુધારવા માટે એક વિચાર ઓફર ટૂંકા, સ્પષ્ટ ઇમેઇલ લખો.

  2. [ મધ્યમ ] Bollen, Mao, and Zeng (2011) દાવો કર્યો છે કે Twitter માંથી માહિતી શેરબજારમાં આગાહી કરવા માટે વાપરી શકાય. આ તારણ એક હેજ ફંડ-Derwent કેપિટલ Twitter માંથી એકત્રિત માહિતી પર આધારિત શેરબજારમાં રોકાણ માર્કેટ્સ ટુ બનાવટ તરફ દોરી (Jordan 2010) . શું પુરાવા છે કે જે તમને ફંડમાં તમારા પૈસા મૂકે તે પહેલાં જોવા માંગો છો કરશે?

  3. [ સરળ ] કેટલાક જાહેર આરોગ્ય હિમાયત કરા જ્યારે ધૂમ્રપાન છોડવું માટે અસરકારક સાધન તરીકે ઈ સિગારેટ, અન્ય, જેમ કે નિકોટિન ઉચ્ચ સ્તર સંભવિત જોખમો વિશે ચેતવે છે. કલ્પના કરો કે એક સંશોધક ઈ સિગારેટ સંબંધિત Twitter પોસ્ટ એકઠી કરે છે અને સેન્ટિમેન્ટ વિશ્લેષણ કરવા દ્વારા ઈ-સિગારેટ તરફ જાહેર અભિપ્રાય અભ્યાસ નક્કી કરે છે.

    1. ત્રણ શક્ય પક્ષપાતને કે જેને તમે આ અભ્યાસ વિશે ચિંતા છે શું છે?
    2. Clark et al. (2016) માત્ર જેમ કે એક અભ્યાસ ચાલી હતી. પ્રથમ, તેઓ 850.000 ટ્વીટ્સ કે જાન્યુઆરી 2012 થી ઇ-સિગારેટ સંબંધિત કીવર્ડ્સ ઉપયોગ ડિસેમ્બર 2014 દ્વારા નજીક નિરીક્ષણ કરવા પર એકત્રિત, તેઓ લાગ્યું કે આ ટ્વીટ્સ ઘણા ઓટોમેટેડ હતા (એટલે ​​કે, મનુષ્ય દ્વારા ઉત્પન્ન થતી નથી) અને આ સ્વયંચાલિત ટ્વીટ્સ ઘણા અનિવાર્યપણે હતા કમર્શિયલ. તેઓ કાર્બનિક ટ્વીટ્સ થી સ્વયંસંચાલિત ટ્વીટ્સ અલગ માનવ શોધ અલ્ગોરિધમનો વિકસાવી છે. આ માનવ શોધો અલ્ગોરિધમ તેઓ જાણવા મળ્યું છે કે ટ્વીટ્સ 80% સ્વયંસંચાલિત હતા મદદથી. આ તારણો ભાગ (એક) માટે તમારો જવાબ બદલવા છે?
    3. જ્યારે તેઓ કાર્બનિક અને સ્વયંસંચાલિત ટ્વીટ્સ સેન્ટિમેન્ટ સરખામણીમાં તેઓ જાણવા મળ્યું છે કે સ્વયંસંચાલિત ટ્વીટ્સ કાર્બનિક ટ્વીટ્સ (6.17 વિરુદ્ધ 5.84) કરતાં વધુ હકારાત્મક છે. આ શોધવા માટે (ખ) તમારો જવાબ બદલવા છે?
  4. [ સરળ ] નવેમ્બર 2009 માં, ટ્વિટર પ્રશ્ન ચીંચીં બોક્સમાં માંથી "શું તમે કરી રહ્યા છે?" બદલાઈ "શું થઈ રહ્યું છે?" (Https://blog.twitter.com/2009/whats-happening).

    1. તમે કેવી રીતે લાગે છે પૂછે બદલો ચીંચીં અને / અથવા તેઓ શું ચીંચીં અસર થશે?
    2. નામ એક સંશોધન પ્રોજેક્ટ છે, જેના માટે તમને પ્રોમ્પ્ટ પસંદ કરશે "શું તમે કરી રહ્યા છે?" સમજાવો કે શા માટે.
    3. નામ એક સંશોધન પ્રોજેક્ટ છે, જેના માટે તમને પ્રોમ્પ્ટ પસંદ કરશે "શું થઈ રહ્યું છે?" સમજાવો કે શા માટે.
  5. [ મધ્યમ ] Kwak et al. (2010) વિશ્લેષણ 41.7 મિલિયન વપરાશકર્તા રૂપરેખાઓ, 1.47 અબજ સામાજિક સંબંધો, 4262 ટ્રેન્ડીંગ વિષયો, અને જૂન 6 ઠ્ઠી અને જૂન 31 વચ્ચે 106 મિલિયન ટ્વીટ્સ, 2009 આ વિશ્લેષણ તેઓ એવા નિષ્કર્ષ પર આવ્યા છે કે ટ્વિટર માહિતી એક નવી માધ્યમ કરતાં શેર વધુ કામ કરે છે તેના પર આધાર રાખીને સામાજિક નેટવર્ક.

    1. કવાક એટ અલ શોધવા ધ્યાનમાં, સંશોધન તમે કયા પ્રકારનું પક્ષીએ માહિતી સાથે શું થશે? સંશોધન તમે કયા પ્રકારની પક્ષીએ માહિતી સાથે શું નથી? શા માટે?
    2. 2010 માં, ટ્વિટર ઉમેરી સેવા વપરાશકર્તાઓ અનુસાર સૂચન બનાવે કોણ અનુસરો. ત્રણ ભલામણો મુખ્ય પૃષ્ઠ પર એક સમયે બતાવવામાં આવે છે. ભલામણો મોટા ભાગે લેવામાં આવે છે "મિત્રો-ઓફ-મિત્રો," અને મ્યુચ્યુઅલ સંપર્કો પણ ભલામણ દર્શાવવામાં આવે છે. વપરાશકર્તાઓ ભલામણો એક નવો સેટ જુઓ અથવા ભલામણો લાંબા યાદી સાથે પૃષ્ઠની મુલાકાત લો તાજું કરી શકો છો. શું તમને લાગે છે કે આ નવું લક્ષણ ભાગ માટે તમારો જવાબ બદલી નાખશે)? કેમ અથવા કેમ નહીં?
    3. Su, Sharma, and Goel (2016) સેવા અનુસરવા માટે કોણ અસર મૂલ્યાંકન અને જાણવા મળ્યું છે કે લોકપ્રિયતા સ્પેક્ટ્રમ સમગ્ર વપરાશકર્તાઓ ભલામણો ફાયદો, સૌથી વધુ લોકપ્રિય વપરાશકર્તાઓ નોંધપાત્ર સરેરાશ કરતા વધુ નફો કર્યો હતો. આ તારણો ભાગ બી માટે તમારો જવાબ બદલી નથી)? કેમ અથવા કેમ નહીં?
  6. [ સરળ ] "Retweets" ઘણી વખત પ્રભાવ માપવા માટે વપરાય છે અને ટ્વિટર પર પ્રભાવ ફેલાય છે. શરૂઆતમાં, વપરાશકર્તાઓ નકલ કરવા અને ચીંચીં તેઓ ગમ્યું પેસ્ટ તેના / તેણીના હેન્ડલ સાથે મૂળ લેખક ટૅગ અને જાતે ચીંચીં પહેલા "RT" પ્રકાર સૂચવે છે કે તે એક રીટ્વીટ છે હતી. પછી, 2009 માં, Twitter પર એક "રીટ્વીટ" બટન ઉમેર્યું. જૂન 2016 માં, ટ્વિટર તે શક્ય વપરાશકર્તાઓ તેમના પોતાના ટ્વીટ્સ રીટ્વીટ (https://twitter.com/twitter/status/742749353689780224) માટે કરી હતી. તમને લાગે છે કે આ ફેરફારો અસર કરે છે કે કેવી રીતે તમે તમારા સંશોધન "retweets" ઉપયોગ કરો છો? કેમ અથવા કેમ નહીં?

  7. [ મધ્યમ , માહિતી સંગ્રહ , કોડિંગ જરૂરી ] Michel et al. (2011) એક કોર્પસ પુસ્તકો ડિજિટાઇઝ કરવા માટે Google ના પ્રયાસ થી ઊભરતાં બાંધકામ. કોર્પસ છે, જે 2009 માં પ્રકાશિત કરવામાં આવી હતી અને તેને 5 મિલિયન ડિજિટાઇઝ્ડ પુસ્તકો પર સમાયેલ પ્રથમ આવૃત્તિ વાપરી રહ્યા હોય, લેખકો ભાષાકીય ફેરફારો અને સાંસ્કૃતિક પ્રવાહો તપાસ શબ્દ વપરાશ આવૃત્તિ વિશ્લેષણ કર્યું. ટૂંક સમયમાં Google બુક્સ કોર્પસ સંશોધકો માટે એક લોકપ્રિય ડેટા સ્રોત બની હતી, અને ડેટાબેઝ 2 સંસ્કરણ 2012 માં પ્રકાશિત કરવામાં આવી હતી.

    જો કે, Pechenick, Danforth, and Dodds (2015) ચેતવણી આપી હતી કે સંશોધકો સંપૂર્ણપણે વ્યાપક તારણો ચિત્રકામ માટે તેને વાપરવા પહેલાં ભંડોળના નમૂના પ્રક્રિયા લક્ષણ કરવાની જરૂર છે. મુખ્ય મુદ્દો એ છે કે કોર્પસ, લાયબ્રેરી જેવી છે દરેક પુસ્તક એક સમાવે છે. પરિણામે, એક વ્યક્તિગત તરીકે, ફલપ્રદ લેખક નોંધનીય ગૂગલ બુક્સ લેક્સિકોન માં નવા શબ્દસમૂહો દાખલ કરવા માટે સક્ષમ છે. વધુમાં, વૈજ્ઞાનિક પાઠો 1900 દરમ્યાન કોર્પસ વધુને વધુ પાકી ભાગ રચે છે. વધુમાં, દ્વારા ઇંગલિશ ફિકશન ડેટાસેટ્સ Pechenick એટ અલ બે આવૃત્તિઓમાં સરખામણી. પુરાવા કે અપૂરતી ફિલ્ટરિંગ પ્રથમ આવૃત્તિ ઉત્પાદન ઉપયોગ કરવામાં આવ્યો હતો. પ્રવૃત્તિ માટે જરૂરી માહિતી બધા અહીં ઉપલબ્ધ છે: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html

    1. માઇકલ એટ અલ. મૂળ કાગળ માં (2011) , તેઓ ઇંગલિશ માહિતી સમૂહ ની 1 લી આવૃત્તિ માટે વપરાય છે, "1880" વર્ષ નો વપરાશ ની આવૃત્તિ ચિત્રણ, "1912" અને "1973", અને તારણ કાઢ્યું હતું કે "અમે છે આપણા ભૂતકાળની દરેક પસાર વર્ષ સાથે ઝડપી ભૂલી "(Fig. 3A, મિશેલ એટ અલ.). એ જ પ્લોટ 1 મદદથી) કોર્પસ, ઇંગલિશ dataset (Fig. 3A, મિશેલ એટ અલ તરીકે જ 1 લી આવૃત્તિ નકલ.)
    2. હવે 1 લી આવૃત્તિ, ઇંગલિશ સાહિત્ય dataset સાથે જ પ્લોટ નકલ.
    3. હવે કોર્પસ, ઇંગલિશ dataset 2 આવૃત્તિ સાથે જ પ્લોટ નકલ.
    4. છેલ્લે, 2 જી આવૃત્તિ, ઇંગલિશ સાહિત્ય dataset સાથે જ પ્લોટ નકલ.
    5. આ ચાર પ્લોટ વચ્ચે તફાવતો અને સમાનતા વર્ણવે છે. તમે અવલોકન વલણ માઇકલ એટ અલ. મૂળ અર્થઘટન સાથે સહમત છો? (સંકેત: સી) અને ડી) Pechenick એટ અલ આકૃતિ 16 તરીકે જ હોવી જોઈએ).
    6. હવે તમે વિવિધ ગૂગલ બુક્સ કોર્પોરાનો ઉપયોગ કરીને આ એક નિષ્કર્ષને નકલ છે, અન્ય ભાષાકીય ફેરફાર અથવા સાંસ્કૃતિક ઘટના માઇકલ એટ અલ. મૂળ કાગળ રજૂ પસંદ કરો. તમે Pechenick એટ અલ રજૂ મર્યાદાઓ પ્રકાશ તેમના અર્થઘટન સાથે સંમત નથી.? તમારા દલીલ મજબૂત બનાવવા માટે, આ જ ગ્રાફ ઉપર સુયોજિત માહિતી વિવિધ આવૃત્તિઓ ઉપયોગ નકલ કરવાનો પ્રયાસ કરો.
  8. [ ખૂબ જ હાર્ડ , માહિતી સંગ્રહ , કોડિંગ જરૂરી , મારુ મનપસન્દ ] Penney (2016) શોધ કે શું જૂન 2013 માં એનએસએની / પ્રિઝમ સર્વેલન્સ (એટલે કે, Snowden કેઃ) વિશે વ્યાપક પ્રચાર તીવ્ર અને અચાનક વિષયો ગોપનીયતા ચિંતા ઊભી પર વિકિપીડિયા લેખો પર ટ્રાફિક ઘટાડો સાથે સંકળાયેલ છે. જો આમ હોય, વર્તન આ ફેરફાર માસ સર્વેલન્સ પરિણામે ઠારણ અસર સાથે સુસંગત હશે. અભિગમ Penney (2016) ક્યારેક અવરોધેલ સમય શ્રેણી ડિઝાઇન કહેવામાં આવે છે અને નિરીક્ષણ માહિતી (વિભાગ 2.4.3) થી પ્રયોગો લગભગ વિશે પ્રકરણમાં અભિગમ સાથે સંબંધિત છે.

    વિષય કીવર્ડ્સ પસંદ કરવા માટે, Penney ટ્રેકિંગ અને સામાજિક મીડિયા મોનીટરીંગ માટે માતૃભૂમિ સુરક્ષા વિભાગ દ્વારા ઉપયોગમાં યાદી ઓળખવામાં આવે છે. DHS યાદી મુદ્દાઓ, એટલે કે "આરોગ્ય ચિંતા," "આંતરમાળખાકીય સુરક્ષામાં," અને "આતંકવાદ. શ્રેણી માં ચોક્કસ શોધ શબ્દો શ્રેણીબદ્ધ આતંકવાદ" (કોષ્ટક 8 જુઓ "અભ્યાસ જૂથ માટે, Penney અડતાલીસ કીવર્ડ્સ સંબંધિત ઉપયોગ" પરિશિષ્ટ). ત્યાર બાદ તેમણે એક બત્રીસ મહિનાના સમયગાળામાં અનુરૂપ અડતાલીસ વિકિપીડિયા લેખો માટે માસિક ધોરણે વિકિપીડિયાનો લેખ જુઓ ગણતરીઓ એકત્રિત, ઓગસ્ટ 2014 ના અંત જાન્યુઆરી 2012 ની શરૂઆતમાં તેના દલીલ મજબૂત કરવા માટે, તેમણે પણ અનેક સરખામણી બનાવવામાં અન્ય વિષયો પર લેખ જોવાઈ ટ્રેકિંગ દ્વારા જૂથો.

    હવે, તમે નકલ અને વિસ્તારવા માટે જતા હોય છે Penney (2016) . બધા કાચા માહિતી કે જે તમે આ પ્રવૃત્તિ માટે જરૂર પડશે વિકિપીડિયા (https://dumps.wikimedia.org/other/pagecounts-raw/) માંથી ઉપલબ્ધ છે. અથવા તમે તેને આર પેકેજ wikipediatrend માંથી મેળવી શકો છો (Meissner and Team 2016) . જ્યારે તમે લખી અપ તમારા જવાબો, કૃપા કરીને નોંધ લો કે જે માહિતી સ્ત્રોત તમે ઉપયોગ થાય છે. (નોંધ: આ જ પ્રવૃત્તિ પણ પ્રકરણ 6 દેખાય છે)

    1. વાંચો Penney (2016) અને આકૃતિ 2 જે "આતંકવાદ" સંબંધિત પહેલાં પાનાંઓ માટે અને Snowden સાક્ષાત્કાર પછી પાનું જોવાઈ બતાવે નકલ. તારણો અર્થઘટન.
    2. આગળ, ફિગ 4A, જે DHS યાદીમાંથી "DHS અને અન્ય એજન્સીઓ" હેઠળ વર્ગીકૃત કીવર્ડ્સનો ઉપયોગ કરીને એક Comparator જૂથ સાથે સ્ટડી ગ્રૂપ ( "આતંકવાદ" સંબંધિત લેખો) સરખાવે નકલ (જુઓ પરિશિષ્ટ ટેબલ 10). તારણો અર્થઘટન.
    3. ભાગ બી) જો તમે એક Comparator જૂથ અભ્યાસ જૂથ સરખામણીમાં. "ઇન્ફ્રાસ્ટ્રક્ચર સુરક્ષા" સંબંધિત લેખો (પરિશિષ્ટ ટેબલ 11) અને લોકપ્રિય વિકિપીડિયા પાનાંઓ (પરિશિષ્ટ ટેબલ 12): Penney પણ અન્ય બે Comparator જૂથો સરખામણીમાં. વૈકલ્પિક Comparator જૂથ સાથે આવે છે, અને પરીક્ષણ જો ભાગ બી પરથી તારણો) Comparator જૂથ તમારી પસંદગી માટે સંવેદનશીલ હોય છે. Comparator જૂથ જે પસંદગી સૌથી અર્થમાં બનાવે છે? શા માટે?
    4. લેખક જણાવ્યું હતું કે "આતંકવાદ" ને લગતી કીવર્ડ્સ વિકિપીડિયા લેખો પસંદ કરવા માટે કારણ કે અમેરિકી સરકાર તેના ઓનલાઇન સર્વેલન્સ પ્રયાસો માટે એક કી સમર્થન તરીકે આતંકવાદ ટાંકવામાં ઉપયોગ કરવામાં આવ્યો હતો. આ 48 "આતંકવાદ" સંબંધિત કીવર્ડ્સ તપાસો, Penney (2016) પણ ઉત્તરદાતાઓ પૂછવા સરકાર મુશ્કેલી, ગોપનીયતા-સંવેદનશીલ, અને એવોઇડન્સ દ્રષ્ટિએ કીવર્ડ્સ દરેક રેટ ભૂલી નથી MTurk પર એક સર્વે (પરિશિષ્ટ ટેબલ 7 અને 8). MTurk પર મોજણી નકલ અને તમારા પરિણામો સરખામણી કરી.
    5. ) ભાગ ડી પરિણામો અને લેખ તમારા વાંચન પર આધાર રાખીને, તમે અભ્યાસ જૂથમાં વિષય કીવર્ડ્સ લેખક પસંદગી સાથે સંમત છો? કેમ અથવા કેમ નહીં? જો ન હોય તો, શું તમે તેના બદલે સૂચવે કરશે?
  9. [ સરળ ] Efrati (2016) અહેવાલો, ગુપ્ત માહિતી પર આધારિત છે, કે "કુલ શેરિંગ" ફેસબુક પર વર્ષમાં લગભગ 5.5% વર્ષ વધારો થયો હતો, જ્યારે "મૂળ પ્રસારણ શેરિંગ" નીચે વર્ષમાં 21% વર્ષ હતું. આ ઘટાડો ઉંમર 30 વર્ષ હેઠળ ફેસબુક વપરાશકર્તાઓ સાથે ખાસ કરીને તીવ્ર હતી. અહેવાલ બે પરિબળો ઘટાડો કારણભૂત છે. એક "મિત્રો" લોકો ફેસબુક પર હોય છે સંખ્યામાં વૃદ્ધિ છે. અન્ય કેટલાક શેરિંગ પ્રવૃત્તિ મેસેજિંગ અને આવા SnapChat સ્પર્ધકોમાં ખસેડવામાં આવી છે. અહેવાલ પણ ઘણી તરકીબો ફેસબુક શેરિંગ વધારવા માટે પ્રયાસ કર્યો હતો, સમાચાર ફીડ અલ્ગોરિધમનો કે tweaks મૂળ પોસ્ટ્સ વધુ જાણીતા બનાવવા, તેમજ મૂળ પોસ્ટ્સ વપરાશકર્તાઓ ઘણા વર્ષો પહેલા "આ દિવસે" ના સામયિક રીમાઇન્ડર્સ સહિત જાહેર. શું અસરો, જો કોઈ હોય તો, આ તારણો સંશોધકો છે, જેઓ એક ડેટા સ્રોત તરીકે ફેસબુક ઉપયોગ કરવા માંગો છો નથી?

  10. [ મધ્યમ ] Tumasjan et al. (2010) અહેવાલ એક રાજકીય પક્ષ ઉલ્લેખ ટ્વીટ્સ કે પ્રમાણ મત કે પક્ષ 2009 માં જર્મન સંસદીય ચૂંટણી પ્રાપ્ત છે (આકૃતિ 2.9) પ્રમાણ સાથે મેળ ખાતી. અન્ય શબ્દોમાં, તે તમને ચૂંટણી આગાહી Twitter પર ઉપયોગ કરી શકે છે દેખાયા હતા. સમય આ અભ્યાસ પ્રકાશિત કરવામાં આવી હતી તે અત્યંત આકર્ષક માનવામાં આવતું હતું કારણ કે તે મોટા માહિતી એક સામાન્ય સ્રોત માટે એક મૂલ્યવાન ઉપયોગ સૂચવે છે તેમ લાગતું હતું.

    મોટા ડેટા ખરાબ લક્ષણો આપેલ છે, જો કે, તમે તરત જ આ પરિણામ અંગે સંશય પ્રયત્ન કરીશું. 2009 માં ટ્વિટર પર જર્મનો તદ્દન બિન પ્રતિનિધિ જૂથ હતા, અને એક પક્ષ સમર્થકો રાજકારણ વિશે વધુ વખત ચીંચીં શકે છે. આમ, તે આશ્ચર્યજનક લાગે છે કે બધા શક્ય પક્ષપાતને કે તમે કલ્પના કરી શકે છે કોઈક બહાર રદ કરશે. હકીકતમાં, પરિણામો Tumasjan et al. (2010) બહાર આવ્યું છે પણ સારી હોઈ સાચું હોય છે. તેમના પેપરમાં, Tumasjan et al. (2010) ખ્રિસ્તી ડેમોક્રેટ્સ (સીડીયુ), ખ્રિસ્તી સોશિયલ ડેમોક્રેટ્સ (સીએસયુ), બોલ Steven, ઉદારવાદીઓ (FDP), ડાબે (ડાઇ Linke), અને ગ્રીન પાર્ટી (Grune): છ રાજકીય પક્ષો ગણવામાં આવે છે. જો કે, તે સમયે Twitter પર સૌથી વધુ ઉલ્લેખ કર્યો જર્મન રાજકીય પક્ષ પાઇરેટ પાર્ટી (Piraten), એક પક્ષ સંઘર્ષ કે જે ઈન્ટરનેટ સરકારી નિયમન હતી. જ્યારે પાઇરેટ પાર્ટી વિશ્લેષણ સમાવેશ કરવામાં આવ્યો હતો, ટ્વિટર ઉલ્લેખ ચૂંટણી પરિણામો (આકૃતિ 2.9) એક ભયંકર આગાહી બની જાય છે (Jungherr, Jürgens, and Schoen 2012) .

    આકૃતિ 2.9: પક્ષીએ ઉલ્લેખ 2009 જર્મન ચૂંટણી પરિણામો આગાહી દેખાય છે (Tumasjan એટ અલ 2010.), પરંતુ આ પરિણામ બહાર વળે કેટલાક મનસ્વી અને વિનાકારણ પસંદગીઓ (Jungherr, જુર્જેન્સ, અને Schoen 2012) પર આધાર રાખે છે.

    આકૃતિ 2.9: પક્ષીએ ઉલ્લેખ 2009 જર્મન ચૂંટણી પરિણામો આગાહી દેખાય (Tumasjan et al. 2010) , પરંતુ આ પરિણામ બહાર વળે કેટલાક મનસ્વી અને વિનાકારણ પસંદગીઓ પર આધાર રાખે છે (Jungherr, Jürgens, and Schoen 2012) .

    ત્યાર બાદ, વિશ્વના અન્ય સંશોધકો માટે વપરાય છે પારખુ પદ્ધતિઓ જેમ કે સેન્ટિમેન્ટ વિશ્લેષણ મદદથી હકારાત્મક અને નકારાત્મક વચ્ચે તફાવત તરીકે ચૂંટણી વિવિધ પ્રકારના વિવિધ આગાહી પક્ષીએ માહિતી ક્ષમતા સુધારવા માટે ક્રમમાં પક્ષો-ઉલ્લેખો (Gayo-Avello 2013; Jungherr 2015, Ch. 7.) . અહીં તે કેવી રીતે Huberty (2015) સારાંશ ચૂંટણી આગાહી આ પ્રયાસો પરિણામો:

    "તમામ જાણીતા આગાહી સામાજિક મીડિયા પર આધારિત પદ્ધતિઓ જ્યારે સાચા દૂરદ્રષ્ટિવાળો ચૂંટણી આગાહી માગ આધિન નિષ્ફળ થયેલ છે. આ નિષ્ફળતા સામાજિક મીડિયા મૂળભૂત ગુણધર્મો, તેના બદલે પદ્ધતિયુક્ત અથવા ઍલ્ગરિધમ મુશ્કેલીઓ કરતાં કારણે હોઈ દેખાય છે. ટૂંકમાં, સામાજિક મીડિયા નથી, અને કદાચ ક્યારેય, સ્થિર, unbiased, પ્રતિનિધિ મતદારોના ચિત્ર આપશે; અને સામાજિક મીડિયા સગવડ નમૂનાઓ આ સમસ્યા પોસ્ટ હોક ઠીક કરવા માટે પૂરતી માહિતી અભાવ હોય છે. "

    સંશોધન તરફ દોરી કેટલાક વાંચી Huberty (2015) કે નિષ્કર્ષ, અને વર્ણન જો અને કેવી રીતે Twitter ચૂંટણી આગાહી ઉપયોગ કરવો જોઇએ રાજકીય ઉમેદવાર માટે એક પાનું મેમો લખો.

  11. [ મધ્યમ ] એક સમાજશાસ્ત્રી અને ઇતિહાસકાર વચ્ચે શું તફાવત છે? Goldthorpe અનુસાર (1991) , એક સમાજશાસ્ત્રી અને ઇતિહાસકાર વચ્ચે મુખ્ય તફાવત એ માહિતી સંગ્રહ પર નિયંત્રણ છે. ઇતિહાસકારો અવશેષ વાપરવા માટે સમાજશાસ્ત્રીઓ ચોક્કસ હેતુ માટે તેમની માહિતી સંગ્રહ દરજી કરી શકો છો, જ્યારે ફરજ પાડવામાં આવે છે. વાંચો Goldthorpe (1991) . કેવી રીતે Custommades અને Readymades વિચાર સાથે સંબંધિત સમાજશાસ્ત્ર અને ઇતિહાસ વચ્ચે શું તફાવત છે?

  12. [ હાર્ડ ] અગાઉના પ્રશ્ન પર બનાવી, Goldthorpe (1991) નિકી હાર્ટ એક સહિત જટિલ પ્રતિભાવો નંબર, દોર્યું (1994) કે Goldthorpe માતાનો નિષ્ઠા પડકારવામાં કરવામાં ડેટા દરજી. સુયોગ્ય માહિતી સંભવિત મર્યાદાઓ સ્પષ્ટ કરવા માટે, હાર્ટ ધનિક કામદાર પ્રોજેક્ટ, સામાજિક વર્ગ અને મતદાન વચ્ચે સંબંધ છે કે 1960 ના મધ્યમાં Goldthorpe અને સાથીઓ દ્વારા હાથ ધરવામાં આવી હતી માપવા માટે એક મોટી મોજણી વર્ણવ્યા અનુસાર. એક વિદ્વાન જે ડિઝાઇન મળી માહિતી પર માહિતી તરફેણ થી આશા રાખી શકે છે, સંપન્ન કામદાર પ્રોજેક્ટ માહિતી કે જેમાં વસવાટ કરો છો ધોરણો વધી એક યુગમાં સામાજિક વર્ગ ભવિષ્ય વિશે તાજેતરમાં સૂચિત સિદ્ધાંત સંબોધવા માટે તૈયાર કરવામાં આવી એકત્ર કરી હતી. પરંતુ, Goldthorpe અને સહકર્મીઓ કોઈક સ્ત્રીઓ મતદાન વર્તન વિશે માહિતી એકત્રિત કરવા માટે "ભૂલી". અહીં તે કેવી રીતે નિકી હાર્ટના (1994) સમગ્ર એપિસોડ સારાંશો:

    ". . . તે તારણ છે કે જે સ્ત્રીઓ, કારણ કે આ 'દરજી કરવામાં' dataset એક સંક્ષિપ્ત તર્ક કે જેમાં સ્ત્રી અનુભવ બાકાત દ્વારા જ મર્યાદિત હતો અવગણવામાં આવ્યા હતા ટાળવા માટે મુશ્કેલ છે []. વર્ગ ચેતના અને પુરૂષ preoccupations પગલાં એક સૈદ્ધાંતિક દ્રષ્ટિ દ્વારા સંચાલિત છે. . . , Goldthorpe અને તેમના સાથીઓ પ્રયોગમૂલક સાબિતી છે કે જે આપવામાં આવે છે અને તેમને પર્યાપ્તતા માન્ય ટેસ્ટ માટે ખુલ્લા બદલે પોતાના સૈદ્ધાંતિક ધારણાઓને સંવર્ધન સમૂહ નિર્માણ. "

    હાર્ટ ચાલુ રાખ્યું:

    "સમૃદ્ધ કામદાર પ્રોજેક્ટ પ્રયોગમૂલક તારણો અમને સદીના મધ્યભાગમાં સમાજશાસ્ત્ર masculinist કિંમતો વિશે વધુ કહી કરતાં તેઓ સ્તરીકરણ, રાજકારણ અને ભૌતિક જીવનની પ્રક્રિયાઓ જાણ."

    તમે અન્ય ઉદાહરણો છે જ્યાં બનાવાઇ માહિતી સંગ્રહ તે માં સમાયેલ માહિતી કલેક્ટર પક્ષપાતને છે વિચાર કરી શકો છો? આ કેવી રીતે ગાણિતિક સંકીર્ણ તુલના કરે છે? અસરો શું આ છે જ્યારે સંશોધકો Readymades ઉપયોગ કરવો જોઈએ માટે હોય શકે છે અને જ્યારે તેઓ Custommades ઉપયોગ કરવો જોઇએ?

  13. [ મધ્યમ ] આ પ્રકરણમાં, હું કંપનીઓ અને સરકારો દ્વારા બનાવવામાં વહીવટી રેકોર્ડ સાથે સંશોધકો માટે સંશોધકો દ્વારા એકત્રિત માહિતી વિપરિત છે. કેટલાક લોકો કહે છે આ વહીવટી રેકોર્ડ કે જે તેઓ સાથે વિરોધાભાસ "ડેટા, મળી" "ડિઝાઇન કરવામાં આવેલા ડેટા." એ વાત સાચી છે કે વહીવટી રેકોર્ડ સંશોધકો દ્વારા જોવા મળે છે, પરંતુ તેઓ પણ ખૂબ રચાયેલ છે. ઉદાહરણ તરીકે, આધુનિક ટેક કંપનીઓ ભેગી કરે છે અને તેમની માહિતી ખ્રિસ્તી દેવળના પાદરીનો મદદનીશ અને સાધનો સમય જંગી માત્રામાં વિતાવે છે. આમ, આ વહીવટી રેકોર્ડ બંને જોવા મળે છે અને તૈયાર કરવામાં આવે છે, તે ફક્ત તમારા પરિપ્રેક્ષ્ય (આકૃતિ 2.10) પર આધાર રાખે છે.

    આકૃતિ 2.10: ચિત્ર બંને એક બતક અને સસલા છે; શું તમે જોઈ તમારા પરિપ્રેક્ષ્ય પર આધાર રાખે છે. સરકાર અને બિઝનેસ વહીવટી રેકોર્ડ બંને જોવા મળે છે અને તૈયાર કરવામાં આવે છે; શું તમે જોઈ તમારા પરિપ્રેક્ષ્ય પર આધાર રાખે છે. ઉદાહરણ તરીકે, એક સેલ ફોન કંપની દ્વારા એકત્રિત કોલ ડેટા રેકોર્ડ સંશોધનકાર ના પરિપ્રેક્ષ્યમાં માહિતી મળે છે. પરંતુ, આ ચોક્કસ જ રેકોર્ડ કોઈને ફોન કંપની બિલિંગ વિભાગ માં કામ ડેટા પરિપ્રેક્ષ્ય માટે રચાયેલ છે. સોર્સ: Wikimedia Commons નો ભાગ

    આકૃતિ 2.10: ચિત્ર બંને એક બતક અને સસલા છે; શું તમે જોઈ તમારા પરિપ્રેક્ષ્ય પર આધાર રાખે છે. સરકાર અને બિઝનેસ વહીવટી રેકોર્ડ બંને જોવા મળે છે અને તૈયાર કરવામાં આવે છે; શું તમે જોઈ તમારા પરિપ્રેક્ષ્ય પર આધાર રાખે છે. ઉદાહરણ તરીકે, એક સેલ ફોન કંપની દ્વારા એકત્રિત કોલ ડેટા રેકોર્ડ સંશોધનકાર ના પરિપ્રેક્ષ્યમાં માહિતી મળે છે. પરંતુ, આ ચોક્કસ જ રેકોર્ડ કોઈને ફોન કંપની બિલિંગ વિભાગ માં કામ ડેટા પરિપ્રેક્ષ્ય માટે રચાયેલ છે. સોર્સ: Wikimedia Commons નો ભાગ

    જ્યાં તે જોઈ જ્યારે સંશોધન માટે કે ડેટા સ્રોત મદદથી બંને જોવા મળે છે અને રચાયેલ ઉપયોગી છે ડેટા સ્રોત એક ઉદાહરણ પુરું પાડે છે.

  14. [ સરળ ] એક વિચારશીલ નિબંધ, ખ્રિસ્તી Sandvig અને Eszter Hargittai (2015) ડિજિટલ સંશોધન, જ્યાં ડિજીટલ સિસ્ટમ "સાધન" અથવા બે પ્રકારના અભ્યાસ પ્રથમ પ્રકારની એક ઉદાહરણ વર્ણન "અભ્યાસ પદાર્થ છે." જ્યાં Bengtsson અને સહકર્મીઓ (2011) 2010 માં હૈતીમાં ભૂકંપ બાદ સ્થળાંતર ટ્રૅક કરવા માટે મોબાઇલ ફોન માહિતી ઉપયોગ બીજા પ્રકારની એક ઉદાહરણ છે જ્યાં જેનસન (2007) અભ્યાસ કેવી રીતે સમગ્ર કેરાલામાં મોબાઇલ ફોન પરિચય, ભારત માછલી માટે બજારમાં કામગીરી પર અસર. કારણ કે તે સ્પષ્ટતા ડિજિટલ માહિતી સ્ત્રોત મદદથી અભ્યાસ તદ્દન અલગ ગોલ પણ જો તેઓ ડેટા સ્રોત જ પ્રકારની ઉપયોગ કરી રહ્યા છો કરી શકો છો કે હું આ મદદરૂપ શોધો. બે એક સાધન તરીકે ડિજીટલ સિસ્ટમ ઉપયોગ કરે છે અને બે કે અભ્યાસ એક પદાર્થ તરીકે ડિજીટલ સિસ્ટમ વાપરો: ક્રમમાં આગળ આ તફાવત સ્પષ્ટ કરવા માટે, ચાર અભ્યાસ કે તમે જોઇ છે વર્ણવે છે. તમે આ પ્રકરણમાં ઉદાહરણો વાપરો જો તમે કરવા માંગો છો શકે છે.