કી:
[ , ] અલ્ગોરિધમિક સંકીર્ણ Google ફ્લૂ પ્રવાહો સાથે કોઈ સમસ્યા હતી. દ્વારા કાગળ વાંચી Lazer et al. (2014) , અને Google પર એક ઈજનેર સમસ્યા સમજાવીને અને કેવી રીતે સમસ્યા સુધારવા માટે એક વિચાર ઓફર ટૂંકા, સ્પષ્ટ ઇમેઇલ લખો.
[ ] Bollen, Mao, and Zeng (2011) દાવો કર્યો છે કે Twitter માંથી માહિતી શેરબજારમાં આગાહી કરવા માટે વાપરી શકાય. આ તારણ એક હેજ ફંડ-Derwent કેપિટલ Twitter માંથી એકત્રિત માહિતી પર આધારિત શેરબજારમાં રોકાણ માર્કેટ્સ ટુ બનાવટ તરફ દોરી (Jordan 2010) . શું પુરાવા છે કે જે તમને ફંડમાં તમારા પૈસા મૂકે તે પહેલાં જોવા માંગો છો કરશે?
[ ] કેટલાક જાહેર આરોગ્ય હિમાયત કરા જ્યારે ધૂમ્રપાન છોડવું માટે અસરકારક સાધન તરીકે ઈ સિગારેટ, અન્ય, જેમ કે નિકોટિન ઉચ્ચ સ્તર સંભવિત જોખમો વિશે ચેતવે છે. કલ્પના કરો કે એક સંશોધક ઈ સિગારેટ સંબંધિત Twitter પોસ્ટ એકઠી કરે છે અને સેન્ટિમેન્ટ વિશ્લેષણ કરવા દ્વારા ઈ-સિગારેટ તરફ જાહેર અભિપ્રાય અભ્યાસ નક્કી કરે છે.
[ ] નવેમ્બર 2009 માં, ટ્વિટર પ્રશ્ન ચીંચીં બોક્સમાં માંથી "શું તમે કરી રહ્યા છે?" બદલાઈ "શું થઈ રહ્યું છે?" (Https://blog.twitter.com/2009/whats-happening).
[ ] Kwak et al. (2010) વિશ્લેષણ 41.7 મિલિયન વપરાશકર્તા રૂપરેખાઓ, 1.47 અબજ સામાજિક સંબંધો, 4262 ટ્રેન્ડીંગ વિષયો, અને જૂન 6 ઠ્ઠી અને જૂન 31 વચ્ચે 106 મિલિયન ટ્વીટ્સ, 2009 આ વિશ્લેષણ તેઓ એવા નિષ્કર્ષ પર આવ્યા છે કે ટ્વિટર માહિતી એક નવી માધ્યમ કરતાં શેર વધુ કામ કરે છે તેના પર આધાર રાખીને સામાજિક નેટવર્ક.
[ ] "Retweets" ઘણી વખત પ્રભાવ માપવા માટે વપરાય છે અને ટ્વિટર પર પ્રભાવ ફેલાય છે. શરૂઆતમાં, વપરાશકર્તાઓ નકલ કરવા અને ચીંચીં તેઓ ગમ્યું પેસ્ટ તેના / તેણીના હેન્ડલ સાથે મૂળ લેખક ટૅગ અને જાતે ચીંચીં પહેલા "RT" પ્રકાર સૂચવે છે કે તે એક રીટ્વીટ છે હતી. પછી, 2009 માં, Twitter પર એક "રીટ્વીટ" બટન ઉમેર્યું. જૂન 2016 માં, ટ્વિટર તે શક્ય વપરાશકર્તાઓ તેમના પોતાના ટ્વીટ્સ રીટ્વીટ (https://twitter.com/twitter/status/742749353689780224) માટે કરી હતી. તમને લાગે છે કે આ ફેરફારો અસર કરે છે કે કેવી રીતે તમે તમારા સંશોધન "retweets" ઉપયોગ કરો છો? કેમ અથવા કેમ નહીં?
[ , , ] Michel et al. (2011) એક કોર્પસ પુસ્તકો ડિજિટાઇઝ કરવા માટે Google ના પ્રયાસ થી ઊભરતાં બાંધકામ. કોર્પસ છે, જે 2009 માં પ્રકાશિત કરવામાં આવી હતી અને તેને 5 મિલિયન ડિજિટાઇઝ્ડ પુસ્તકો પર સમાયેલ પ્રથમ આવૃત્તિ વાપરી રહ્યા હોય, લેખકો ભાષાકીય ફેરફારો અને સાંસ્કૃતિક પ્રવાહો તપાસ શબ્દ વપરાશ આવૃત્તિ વિશ્લેષણ કર્યું. ટૂંક સમયમાં Google બુક્સ કોર્પસ સંશોધકો માટે એક લોકપ્રિય ડેટા સ્રોત બની હતી, અને ડેટાબેઝ 2 સંસ્કરણ 2012 માં પ્રકાશિત કરવામાં આવી હતી.
જો કે, Pechenick, Danforth, and Dodds (2015) ચેતવણી આપી હતી કે સંશોધકો સંપૂર્ણપણે વ્યાપક તારણો ચિત્રકામ માટે તેને વાપરવા પહેલાં ભંડોળના નમૂના પ્રક્રિયા લક્ષણ કરવાની જરૂર છે. મુખ્ય મુદ્દો એ છે કે કોર્પસ, લાયબ્રેરી જેવી છે દરેક પુસ્તક એક સમાવે છે. પરિણામે, એક વ્યક્તિગત તરીકે, ફલપ્રદ લેખક નોંધનીય ગૂગલ બુક્સ લેક્સિકોન માં નવા શબ્દસમૂહો દાખલ કરવા માટે સક્ષમ છે. વધુમાં, વૈજ્ઞાનિક પાઠો 1900 દરમ્યાન કોર્પસ વધુને વધુ પાકી ભાગ રચે છે. વધુમાં, દ્વારા ઇંગલિશ ફિકશન ડેટાસેટ્સ Pechenick એટ અલ બે આવૃત્તિઓમાં સરખામણી. પુરાવા કે અપૂરતી ફિલ્ટરિંગ પ્રથમ આવૃત્તિ ઉત્પાદન ઉપયોગ કરવામાં આવ્યો હતો. પ્રવૃત્તિ માટે જરૂરી માહિતી બધા અહીં ઉપલબ્ધ છે: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
[ , , , ] Penney (2016) શોધ કે શું જૂન 2013 માં એનએસએની / પ્રિઝમ સર્વેલન્સ (એટલે કે, Snowden કેઃ) વિશે વ્યાપક પ્રચાર તીવ્ર અને અચાનક વિષયો ગોપનીયતા ચિંતા ઊભી પર વિકિપીડિયા લેખો પર ટ્રાફિક ઘટાડો સાથે સંકળાયેલ છે. જો આમ હોય, વર્તન આ ફેરફાર માસ સર્વેલન્સ પરિણામે ઠારણ અસર સાથે સુસંગત હશે. અભિગમ Penney (2016) ક્યારેક અવરોધેલ સમય શ્રેણી ડિઝાઇન કહેવામાં આવે છે અને નિરીક્ષણ માહિતી (વિભાગ 2.4.3) થી પ્રયોગો લગભગ વિશે પ્રકરણમાં અભિગમ સાથે સંબંધિત છે.
વિષય કીવર્ડ્સ પસંદ કરવા માટે, Penney ટ્રેકિંગ અને સામાજિક મીડિયા મોનીટરીંગ માટે માતૃભૂમિ સુરક્ષા વિભાગ દ્વારા ઉપયોગમાં યાદી ઓળખવામાં આવે છે. DHS યાદી મુદ્દાઓ, એટલે કે "આરોગ્ય ચિંતા," "આંતરમાળખાકીય સુરક્ષામાં," અને "આતંકવાદ. શ્રેણી માં ચોક્કસ શોધ શબ્દો શ્રેણીબદ્ધ આતંકવાદ" (કોષ્ટક 8 જુઓ "અભ્યાસ જૂથ માટે, Penney અડતાલીસ કીવર્ડ્સ સંબંધિત ઉપયોગ" પરિશિષ્ટ). ત્યાર બાદ તેમણે એક બત્રીસ મહિનાના સમયગાળામાં અનુરૂપ અડતાલીસ વિકિપીડિયા લેખો માટે માસિક ધોરણે વિકિપીડિયાનો લેખ જુઓ ગણતરીઓ એકત્રિત, ઓગસ્ટ 2014 ના અંત જાન્યુઆરી 2012 ની શરૂઆતમાં તેના દલીલ મજબૂત કરવા માટે, તેમણે પણ અનેક સરખામણી બનાવવામાં અન્ય વિષયો પર લેખ જોવાઈ ટ્રેકિંગ દ્વારા જૂથો.
હવે, તમે નકલ અને વિસ્તારવા માટે જતા હોય છે Penney (2016) . બધા કાચા માહિતી કે જે તમે આ પ્રવૃત્તિ માટે જરૂર પડશે વિકિપીડિયા (https://dumps.wikimedia.org/other/pagecounts-raw/) માંથી ઉપલબ્ધ છે. અથવા તમે તેને આર પેકેજ wikipediatrend માંથી મેળવી શકો છો (Meissner and Team 2016) . જ્યારે તમે લખી અપ તમારા જવાબો, કૃપા કરીને નોંધ લો કે જે માહિતી સ્ત્રોત તમે ઉપયોગ થાય છે. (નોંધ: આ જ પ્રવૃત્તિ પણ પ્રકરણ 6 દેખાય છે)
[ ] Efrati (2016) અહેવાલો, ગુપ્ત માહિતી પર આધારિત છે, કે "કુલ શેરિંગ" ફેસબુક પર વર્ષમાં લગભગ 5.5% વર્ષ વધારો થયો હતો, જ્યારે "મૂળ પ્રસારણ શેરિંગ" નીચે વર્ષમાં 21% વર્ષ હતું. આ ઘટાડો ઉંમર 30 વર્ષ હેઠળ ફેસબુક વપરાશકર્તાઓ સાથે ખાસ કરીને તીવ્ર હતી. અહેવાલ બે પરિબળો ઘટાડો કારણભૂત છે. એક "મિત્રો" લોકો ફેસબુક પર હોય છે સંખ્યામાં વૃદ્ધિ છે. અન્ય કેટલાક શેરિંગ પ્રવૃત્તિ મેસેજિંગ અને આવા SnapChat સ્પર્ધકોમાં ખસેડવામાં આવી છે. અહેવાલ પણ ઘણી તરકીબો ફેસબુક શેરિંગ વધારવા માટે પ્રયાસ કર્યો હતો, સમાચાર ફીડ અલ્ગોરિધમનો કે tweaks મૂળ પોસ્ટ્સ વધુ જાણીતા બનાવવા, તેમજ મૂળ પોસ્ટ્સ વપરાશકર્તાઓ ઘણા વર્ષો પહેલા "આ દિવસે" ના સામયિક રીમાઇન્ડર્સ સહિત જાહેર. શું અસરો, જો કોઈ હોય તો, આ તારણો સંશોધકો છે, જેઓ એક ડેટા સ્રોત તરીકે ફેસબુક ઉપયોગ કરવા માંગો છો નથી?
[ ] Tumasjan et al. (2010) અહેવાલ એક રાજકીય પક્ષ ઉલ્લેખ ટ્વીટ્સ કે પ્રમાણ મત કે પક્ષ 2009 માં જર્મન સંસદીય ચૂંટણી પ્રાપ્ત છે (આકૃતિ 2.9) પ્રમાણ સાથે મેળ ખાતી. અન્ય શબ્દોમાં, તે તમને ચૂંટણી આગાહી Twitter પર ઉપયોગ કરી શકે છે દેખાયા હતા. સમય આ અભ્યાસ પ્રકાશિત કરવામાં આવી હતી તે અત્યંત આકર્ષક માનવામાં આવતું હતું કારણ કે તે મોટા માહિતી એક સામાન્ય સ્રોત માટે એક મૂલ્યવાન ઉપયોગ સૂચવે છે તેમ લાગતું હતું.
મોટા ડેટા ખરાબ લક્ષણો આપેલ છે, જો કે, તમે તરત જ આ પરિણામ અંગે સંશય પ્રયત્ન કરીશું. 2009 માં ટ્વિટર પર જર્મનો તદ્દન બિન પ્રતિનિધિ જૂથ હતા, અને એક પક્ષ સમર્થકો રાજકારણ વિશે વધુ વખત ચીંચીં શકે છે. આમ, તે આશ્ચર્યજનક લાગે છે કે બધા શક્ય પક્ષપાતને કે તમે કલ્પના કરી શકે છે કોઈક બહાર રદ કરશે. હકીકતમાં, પરિણામો Tumasjan et al. (2010) બહાર આવ્યું છે પણ સારી હોઈ સાચું હોય છે. તેમના પેપરમાં, Tumasjan et al. (2010) ખ્રિસ્તી ડેમોક્રેટ્સ (સીડીયુ), ખ્રિસ્તી સોશિયલ ડેમોક્રેટ્સ (સીએસયુ), બોલ Steven, ઉદારવાદીઓ (FDP), ડાબે (ડાઇ Linke), અને ગ્રીન પાર્ટી (Grune): છ રાજકીય પક્ષો ગણવામાં આવે છે. જો કે, તે સમયે Twitter પર સૌથી વધુ ઉલ્લેખ કર્યો જર્મન રાજકીય પક્ષ પાઇરેટ પાર્ટી (Piraten), એક પક્ષ સંઘર્ષ કે જે ઈન્ટરનેટ સરકારી નિયમન હતી. જ્યારે પાઇરેટ પાર્ટી વિશ્લેષણ સમાવેશ કરવામાં આવ્યો હતો, ટ્વિટર ઉલ્લેખ ચૂંટણી પરિણામો (આકૃતિ 2.9) એક ભયંકર આગાહી બની જાય છે (Jungherr, Jürgens, and Schoen 2012) .
ત્યાર બાદ, વિશ્વના અન્ય સંશોધકો માટે વપરાય છે પારખુ પદ્ધતિઓ જેમ કે સેન્ટિમેન્ટ વિશ્લેષણ મદદથી હકારાત્મક અને નકારાત્મક વચ્ચે તફાવત તરીકે ચૂંટણી વિવિધ પ્રકારના વિવિધ આગાહી પક્ષીએ માહિતી ક્ષમતા સુધારવા માટે ક્રમમાં પક્ષો-ઉલ્લેખો (Gayo-Avello 2013; Jungherr 2015, Ch. 7.) . અહીં તે કેવી રીતે Huberty (2015) સારાંશ ચૂંટણી આગાહી આ પ્રયાસો પરિણામો:
"તમામ જાણીતા આગાહી સામાજિક મીડિયા પર આધારિત પદ્ધતિઓ જ્યારે સાચા દૂરદ્રષ્ટિવાળો ચૂંટણી આગાહી માગ આધિન નિષ્ફળ થયેલ છે. આ નિષ્ફળતા સામાજિક મીડિયા મૂળભૂત ગુણધર્મો, તેના બદલે પદ્ધતિયુક્ત અથવા ઍલ્ગરિધમ મુશ્કેલીઓ કરતાં કારણે હોઈ દેખાય છે. ટૂંકમાં, સામાજિક મીડિયા નથી, અને કદાચ ક્યારેય, સ્થિર, unbiased, પ્રતિનિધિ મતદારોના ચિત્ર આપશે; અને સામાજિક મીડિયા સગવડ નમૂનાઓ આ સમસ્યા પોસ્ટ હોક ઠીક કરવા માટે પૂરતી માહિતી અભાવ હોય છે. "
સંશોધન તરફ દોરી કેટલાક વાંચી Huberty (2015) કે નિષ્કર્ષ, અને વર્ણન જો અને કેવી રીતે Twitter ચૂંટણી આગાહી ઉપયોગ કરવો જોઇએ રાજકીય ઉમેદવાર માટે એક પાનું મેમો લખો.
[ ] એક સમાજશાસ્ત્રી અને ઇતિહાસકાર વચ્ચે શું તફાવત છે? Goldthorpe અનુસાર (1991) , એક સમાજશાસ્ત્રી અને ઇતિહાસકાર વચ્ચે મુખ્ય તફાવત એ માહિતી સંગ્રહ પર નિયંત્રણ છે. ઇતિહાસકારો અવશેષ વાપરવા માટે સમાજશાસ્ત્રીઓ ચોક્કસ હેતુ માટે તેમની માહિતી સંગ્રહ દરજી કરી શકો છો, જ્યારે ફરજ પાડવામાં આવે છે. વાંચો Goldthorpe (1991) . કેવી રીતે Custommades અને Readymades વિચાર સાથે સંબંધિત સમાજશાસ્ત્ર અને ઇતિહાસ વચ્ચે શું તફાવત છે?
[ ] અગાઉના પ્રશ્ન પર બનાવી, Goldthorpe (1991) નિકી હાર્ટ એક સહિત જટિલ પ્રતિભાવો નંબર, દોર્યું (1994) કે Goldthorpe માતાનો નિષ્ઠા પડકારવામાં કરવામાં ડેટા દરજી. સુયોગ્ય માહિતી સંભવિત મર્યાદાઓ સ્પષ્ટ કરવા માટે, હાર્ટ ધનિક કામદાર પ્રોજેક્ટ, સામાજિક વર્ગ અને મતદાન વચ્ચે સંબંધ છે કે 1960 ના મધ્યમાં Goldthorpe અને સાથીઓ દ્વારા હાથ ધરવામાં આવી હતી માપવા માટે એક મોટી મોજણી વર્ણવ્યા અનુસાર. એક વિદ્વાન જે ડિઝાઇન મળી માહિતી પર માહિતી તરફેણ થી આશા રાખી શકે છે, સંપન્ન કામદાર પ્રોજેક્ટ માહિતી કે જેમાં વસવાટ કરો છો ધોરણો વધી એક યુગમાં સામાજિક વર્ગ ભવિષ્ય વિશે તાજેતરમાં સૂચિત સિદ્ધાંત સંબોધવા માટે તૈયાર કરવામાં આવી એકત્ર કરી હતી. પરંતુ, Goldthorpe અને સહકર્મીઓ કોઈક સ્ત્રીઓ મતદાન વર્તન વિશે માહિતી એકત્રિત કરવા માટે "ભૂલી". અહીં તે કેવી રીતે નિકી હાર્ટના (1994) સમગ્ર એપિસોડ સારાંશો:
". . . તે તારણ છે કે જે સ્ત્રીઓ, કારણ કે આ 'દરજી કરવામાં' dataset એક સંક્ષિપ્ત તર્ક કે જેમાં સ્ત્રી અનુભવ બાકાત દ્વારા જ મર્યાદિત હતો અવગણવામાં આવ્યા હતા ટાળવા માટે મુશ્કેલ છે []. વર્ગ ચેતના અને પુરૂષ preoccupations પગલાં એક સૈદ્ધાંતિક દ્રષ્ટિ દ્વારા સંચાલિત છે. . . , Goldthorpe અને તેમના સાથીઓ પ્રયોગમૂલક સાબિતી છે કે જે આપવામાં આવે છે અને તેમને પર્યાપ્તતા માન્ય ટેસ્ટ માટે ખુલ્લા બદલે પોતાના સૈદ્ધાંતિક ધારણાઓને સંવર્ધન સમૂહ નિર્માણ. "
હાર્ટ ચાલુ રાખ્યું:
"સમૃદ્ધ કામદાર પ્રોજેક્ટ પ્રયોગમૂલક તારણો અમને સદીના મધ્યભાગમાં સમાજશાસ્ત્ર masculinist કિંમતો વિશે વધુ કહી કરતાં તેઓ સ્તરીકરણ, રાજકારણ અને ભૌતિક જીવનની પ્રક્રિયાઓ જાણ."
તમે અન્ય ઉદાહરણો છે જ્યાં બનાવાઇ માહિતી સંગ્રહ તે માં સમાયેલ માહિતી કલેક્ટર પક્ષપાતને છે વિચાર કરી શકો છો? આ કેવી રીતે ગાણિતિક સંકીર્ણ તુલના કરે છે? અસરો શું આ છે જ્યારે સંશોધકો Readymades ઉપયોગ કરવો જોઈએ માટે હોય શકે છે અને જ્યારે તેઓ Custommades ઉપયોગ કરવો જોઇએ?
[ ] આ પ્રકરણમાં, હું કંપનીઓ અને સરકારો દ્વારા બનાવવામાં વહીવટી રેકોર્ડ સાથે સંશોધકો માટે સંશોધકો દ્વારા એકત્રિત માહિતી વિપરિત છે. કેટલાક લોકો કહે છે આ વહીવટી રેકોર્ડ કે જે તેઓ સાથે વિરોધાભાસ "ડેટા, મળી" "ડિઝાઇન કરવામાં આવેલા ડેટા." એ વાત સાચી છે કે વહીવટી રેકોર્ડ સંશોધકો દ્વારા જોવા મળે છે, પરંતુ તેઓ પણ ખૂબ રચાયેલ છે. ઉદાહરણ તરીકે, આધુનિક ટેક કંપનીઓ ભેગી કરે છે અને તેમની માહિતી ખ્રિસ્તી દેવળના પાદરીનો મદદનીશ અને સાધનો સમય જંગી માત્રામાં વિતાવે છે. આમ, આ વહીવટી રેકોર્ડ બંને જોવા મળે છે અને તૈયાર કરવામાં આવે છે, તે ફક્ત તમારા પરિપ્રેક્ષ્ય (આકૃતિ 2.10) પર આધાર રાખે છે.
જ્યાં તે જોઈ જ્યારે સંશોધન માટે કે ડેટા સ્રોત મદદથી બંને જોવા મળે છે અને રચાયેલ ઉપયોગી છે ડેટા સ્રોત એક ઉદાહરણ પુરું પાડે છે.
[ ] એક વિચારશીલ નિબંધ, ખ્રિસ્તી Sandvig અને Eszter Hargittai (2015) ડિજિટલ સંશોધન, જ્યાં ડિજીટલ સિસ્ટમ "સાધન" અથવા બે પ્રકારના અભ્યાસ પ્રથમ પ્રકારની એક ઉદાહરણ વર્ણન "અભ્યાસ પદાર્થ છે." જ્યાં Bengtsson અને સહકર્મીઓ (2011) 2010 માં હૈતીમાં ભૂકંપ બાદ સ્થળાંતર ટ્રૅક કરવા માટે મોબાઇલ ફોન માહિતી ઉપયોગ બીજા પ્રકારની એક ઉદાહરણ છે જ્યાં જેનસન (2007) અભ્યાસ કેવી રીતે સમગ્ર કેરાલામાં મોબાઇલ ફોન પરિચય, ભારત માછલી માટે બજારમાં કામગીરી પર અસર. કારણ કે તે સ્પષ્ટતા ડિજિટલ માહિતી સ્ત્રોત મદદથી અભ્યાસ તદ્દન અલગ ગોલ પણ જો તેઓ ડેટા સ્રોત જ પ્રકારની ઉપયોગ કરી રહ્યા છો કરી શકો છો કે હું આ મદદરૂપ શોધો. બે એક સાધન તરીકે ડિજીટલ સિસ્ટમ ઉપયોગ કરે છે અને બે કે અભ્યાસ એક પદાર્થ તરીકે ડિજીટલ સિસ્ટમ વાપરો: ક્રમમાં આગળ આ તફાવત સ્પષ્ટ કરવા માટે, ચાર અભ્યાસ કે તમે જોઇ છે વર્ણવે છે. તમે આ પ્રકરણમાં ઉદાહરણો વાપરો જો તમે કરવા માંગો છો શકે છે.