ቁልፍ:
[ : ] ስልተ ያሳጣቸው በ Google የጉንፋን አዝማሚያዎች ጋር አንድ ችግር ነበር. በ ወረቀት አንብብ Lazer et al. (2014) , እና በ Google ላይ አንድ መሐንዲስ ችግር ሲተረጉምም ችግሩን ለመፍታት እንዴት አንድ ሀሳብ እንዲያቀርቡ አጭር, ግልጽ ኢሜይል ጻፍ.
[ ] Bollen, Mao, and Zeng (2011) ከ Twitter ውሂብ የአክሲዮን ገበያ መተንበይ ጥቅም ላይ ሊውል ይችላል እንደሆነ ይናገራል. ይህ ግኝት አጥር ፈንድ-Derwent ካፒታል ከ Twitter የተሰበሰበ ውሂብ ላይ የተመሠረተ የአክሲዮን ገበያ ላይ መዋዕለ ገበያዎች-አንድ ፍጥረት ሆኗል (Jordan 2010) . ምን ማስረጃ በዚያ ፈንድ ውስጥ ገንዘብ እየከተተች በፊት ማየት ይፈልጋሉ ነበር?
[ አንዳንድ ህዝባዊ የጤና ተሟጋቾች ማጨስ መቋረጥ ውጤታማ እርዳታ እንደ ኢ-ሲጋራዎች በረዶ ሲሆን], ሌሎች እንደ የኒኮቲን ያለውን ከፍተኛ-ደረጃ እንደ ሊያስከትል የሚችለውን አደጋ, ስለ ያስጠነቅቃሉ. አንድ ተመራማሪ ኢ-ሲጋራዎች-የተያያዙ Twitter ልጥፎች በመሰብሰብ እና በስሜት ትንተና በመምራት ኢ-ሲጋራዎች በተመለከተ የሕዝብ አስተያየት ማጥናት ከወሰነ እንበል.
[ ] ኅዳር 2009, ትዊተር "ምን እያደረጋችሁ ነው?" በማለት ከ Tweet ሳጥን ውስጥ ጥያቄ ተቀይሯል "ምን እየሆነ ነው?" (Https://blog.twitter.com/2009/whats-happening).
[ ] Kwak et al. (2010) በ Twitter አንድ በላይ ማጋራት መረጃ አዲስ አገናኝ ሆኖ ተጨማሪ የሚያገለግል የሚል መደምደሚያ ላይ በዚህ ትንተና ላይ የተመሠረተ 41.7 ሚሊዮን የተጠቃሚ መገለጫዎች, 1.47 ቢሊዮን ማኅበራዊ ግንኙነት, 4262 በመታየት ርእሶች, እና ሰኔ 6 ኛ እስከ ሰኔ 31 ቀን መካከል 106 ሚሊዮን ትዊትሮች, 2009 የተተነተነ ማህበራዊ አውታረ መረብ.
[ ] "Retweets" ብዙውን ጊዜ ተጽዕኖ ለመለካት ጥቅም ላይ እና Twitter ላይ ተፅዕኖ እየተስፋፋ ነው. መጀመሪያ ላይ, ተጠቃሚዎች መገልበጥ እና የወደዱትን Tweet ይለጥፉ, እሱ / እሷ እጀታ ጋር የዋናውን ጸሐፊ መለያ ይስጡ, እና እራስዎ አንድ ትዊት እንደሆነ ያመለክታሉ ወደ Tweet በፊት "RT" ዓይነት ነበር. ከዚያም, በ 2009 Twitter አንድ "ትዊት" አዝራር ታክሏል. ሰኔ 2016, በ Twitter የማይቻል ተጠቃሚዎች (https://twitter.com/twitter/status/742749353689780224) የራሳቸውን ትዊትሮች ትዊት አድርጓል. እነዚህን ለውጦች በእርስዎ ምርምር ውስጥ "retweets" መጠቀም ምን ስሜት ሊያሳድሩ ይገባል ብለህ ታስባለህ? ለምን? ካልሆነስ ለምን?
[ : : ] Michel et al. (2011) መጻሕፍት አህዛዊ ለማድረግ የ Google ጥረት ከ ለሚፈጠሩ አንድ ኮርፐስ ይገነባሉ. በ 2009 ላይ የታተመ እና 5 ሚሊዮን የኤክስሬይ መጻሕፍት ላይ የሚገኙትን ነበር ይህም ኮርፐስ, የመጀመሪያ ስሪት በመጠቀም, ደራሲያን የቋንቋ ለውጥ እና ባህላዊ አዝማሚያዎችን ለማጣራት ቃል አጠቃቀም ድግግሞሽ ፈትሿል. ብዙም ሳይቆይ በ Google መጽሐፍት ኮርፐስ ተመራማሪዎች ተወዳጅ የውሂብ ምንጭ ሆነ: ዳታቤዝ 2 ኛ ስሪት በ 2012 ወጥቶ ነበር.
ይሁን እንጂ, Pechenick, Danforth, and Dodds (2015) ተመራማሪዎች ሙሉ በሙሉ ሰፊ መደምደሚያ ላይ ለ ከመጠቀምዎ በፊት ኮርፐስ መካከል ለናሙና ሂደት ባሕርይ እንዳለብን አስጠንቅቋል. ዋናው ጉዳይ ኮርፐስ እያንዳንዱ መጽሐፍ በአንድ የያዘ,-ቤተ-መጽሐፍት እንደ መሆኑን ነው. በዚህም ምክንያት, አንድ ግለሰብ እንደ የተዋጣለት ደራሲ የሚታይ የ Google መጽሐፍት መዝገበ ቃላት ውስጥ አዲስ ሐረጎችን ለማስገባት ይችላል. ከዚህም በላይ, ሳይንሳዊ ጽሑፎች በ 1900 በመላው ኮርፐስ አንድ እየጨመረ በተጨባጭ ክፍል ናቸው. በተጨማሪ, በ እንግሊዝኛ ልቦለድ የውሂብ, Pechenick et al ሁለት ስሪቶች በማነጻጸር. በቂ ማጣሪያ የመጀመሪያ ስሪት ማፍራት ውስጥ ጥቅም ላይ መሆኑን የሚያሳይ. እንቅስቃሴ የሚያስፈልገው ውሂብ ሁሉም እዚህ ይገኛል: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
[ : : : ] Penney (2016) ሰኔ 2013 ውስጥ የ NSA / እድላችንን ክትትል (ማለትም, Snowden በመገለጥ) ስለ በስፋት በሕዝብ ዘንድ ግላዊነት ስጋቶች ማሳደግ ርዕሶች ላይ ውክፔዲያ ርዕሶች ትራፊክ ውስጥ ስለታም እና ድንገተኛ መቀነስ ጋር የተያያዘ እንደሆነ ይዳስሳል. እንዲህ ከሆነ, ባሕርይ ላይ ይህን ለውጥ የጅምላ ክትትል ምክንያት አሉታዊ ተጽዕኖ ጋር ተጣጥሞ ነበር. ያለው አቀራረብ Penney (2016) አንዳንድ ጊዜ ለተቋረጠው ጊዜ ተከታታይ ንድፍ ተብሎ ይጠራል እና ተጨባጭ ውሂብ (ክፍል 2.4.3) ከ ሙከራዎችን approximating የሚገልጸውን ምዕራፍ ውስጥ አቀራረቦች ጋር የተያያዘ ነው.
ርዕስ ቁልፍ ቃላትን መምረጥ, Penney በመከታተል እና ማህበራዊ ሚዲያ ለመከታተል የአገር ደህንነት የአሜሪካ መምሪያ ጥቅም ላይ ዝርዝር ጠቅሷል. የ DHS ዝርዝር ጉዳዮች, ማለትም "የጤና አሳቢነት," "የመሠረተ ደህንነት," እና "ሽብርተኝነት. አንድ ክልል ውስጥ አንዳንድ የፍለጋ ቃላት ይመድባል ሽብርተኝነት" (ሠንጠረዥ 8 ተመልከት "ጥናት ቡድኑ ያህል, Penney አርባ ስምንት ቁልፍ ቃላት ጋር የሚዛመድ ተጠቅሟል" አባሪ). ከዚያም የእርሱ ክርክር ለማጠናከር ነሐሴ 2014 መጨረሻ ላይ በጥር 2012 መጀመሪያ ጀምሮ እስከ አንድ ሠላሳ ሁለት ወር ጊዜ በላይ ተጓዳኝ አርባ ስምንት ውክፔዲያ ጽሑፎችን ለማግኘት በየወሩ መሠረት ላይ ውክፔዲያ ርዕስ እይታ ቆጠራዎች የተዋሃደ: እርሱ ደግሞ በርካታ ንጽጽር ፈጥረዋል በሌሎች ርዕሶች ላይ ርዕስ እይታዎች በመከታተል ቡድኖች.
አሁን, ለማባዛት እና እያሰፉ ይሄዳሉ Penney (2016) . ይህን እንቅስቃሴ ለ ይኖርብዎታል ሁሉ ጥሬ ውሂብ ውክፔዲያ (https://dumps.wikimedia.org/other/pagecounts-raw/) ማግኘት ነው. ወይስ R የጥቅል wikipediatrend ሆነው ማግኘት ይችላሉ (Meissner and Team 2016) . አንተ መጻፍ-ምትኬ ጊዜ የእርስዎን ምላሾች, የተጠቀሙበት የትኛው የውሂብ ምንጭ እባክዎ ልብ ይበሉ. (ማስታወሻ: ይህ ተመሳሳይ እንቅስቃሴ ደግሞ በምዕራፍ 6 ላይ ይገኛል)
[ ] Efrati (2016) "የመጀመሪያው ስርጭት ማጋራት" ወደ ታች ዓመት ከ 21% የሆነ ዓመት ሆኖ ሳለ በፌስቡክ ላይ "ጠቅላላ ማጋራት" ዓመት ገደማ 5.5% ዓመት ቀንሷል ነበር ምስጢራዊ መረጃ ላይ የተመሠረቱ ሪፖርቶች,. ይህ እየቀነሰ ዕድሜያቸው ከ 30 ዓመት በታች የፌስቡክ ተጠቃሚዎች ጋር በተለይ ይዘት ነበር. ሪፖርቱ ሁለት ምክንያቶች ወደ ማሽቆልቆል አስረድተዋል. አንዱ "ጓደኞች" ሰዎች ፌስቡክ ላይ ቁጥር ውስጥ እድገት ነው. ሌሎች አንዳንድ የማጋራት እንቅስቃሴ መልዕክት እና እንደ Snapchat ያሉ ተወዳዳሪዎች ጋር ሲለዋወጥ ነው. ሪፖርቱ በተጨማሪም ዜና መጋቢ ስልተ የመጀመሪያ ልጥፎች ይበልጥ ታዋቂ የሚያደርጉ አንዳንድ ለውጦችን, እንዲሁም ለብዙ ዓመታት በፊት "ይህ ቀን ላይ" የመጀመሪያው ልጥፎች ተጠቃሚዎች በየጊዜው ማሳሰቢያዎች ጨምሮ ፌስቡክ ማጋራት ለማሳደግ ሞክረው ነበር በተለያዩ ዘዴዎች, ገልጧል. እነዚህ ግኝቶች የውሂብ ምንጭ ሆኖ ፌስቡክ መጠቀም ይፈልጋሉ ተመራማሪዎች ምን እንድምታ, ማንኛውም ከሆነ ነው?
[ ] Tumasjan et al. (2010) የፖለቲካ ፓርቲ መጥቀስ ትዊቶች በዚያ መጠን ፓርቲ በ 2009 የጀርመን ፓርላማ ምርጫ የተቀበለው ድምጾች (ምስል 2.9) ላይ ድርሻ የተስማማ ዘግቧል. በሌላ አነጋገር, ወደ ምርጫ መተንበይ Twitter መጠቀም እንደሚችል ተገለጠ. ይህ ትልቅ ውሂብ የጋራ ምንጭ የሚሆን ጠቃሚ አጠቃቀም ሐሳብ ይመስል ነበር; ምክንያቱም በዚህ ጥናት የታተመበት ጊዜ ይህ በጣም አስደሳች እንደሆነ ተደርጎ ይታይ ነበር.
ትልቅ ውሂብ መጥፎ ባህሪያት ከተሰጠው በኋላ, ይሁን እንጂ ወዲያውኑ በዚህ ውጤት ላይ ጥርጣሬ መሆን አለበት. በ 2009 በ Twitter ላይ ጀርመኖች በጣም ያልሆነ ተወካይ ቡድን ነበሩ, እና አንድ ፓርቲ ደጋፊዎች ብዙ ጊዜ ፖለቲካ ስለ Tweet ይችላል. በመሆኑም መገመት ይችላል ሁሉ በተቻለ አድሏዊነት በሆነ መንገድ ወደ ውጭ መሰረዝ ፈቃደኞች አለመሆናቸው የሚያስገርም ይመስላል. እንዲያውም ውስጥ ውጤቶች Tumasjan et al. (2010) እውነተኛ መሆን በጣም ጥሩ ሆኖ ተገኘ. በእነርሱ ወረቀት, Tumasjan et al. (2010) ክርስቲያን ዴሞክራትስ (CDU) ክርስቲያን ሶሻል ዲሞክራትስ (CSU), SPD, Liberals (FDP), የ የግራ (Linke መሞት), እና ግሪን ፓርቲ (Grüne): ስድስት የፖለቲካ ፓርቲዎች ተመልክተናል. ይሁን እንጂ በዚያን ጊዜ በ Twitter ላይ በጣም የተጠቀሰው ጀርመን የፖለቲካ ፓርቲ Pirate ፓርቲ (Piraten), በኢንተርኔት መንግስት ደንብ የሚዋጋ አንድ ፓርቲ ነበር. የ ወንበዴ ፓርቲ ትንተና ውስጥ የተካተተ ጊዜ, Twitter የምርጫ ውጤቶች (ምስል 2.9) አንድ አስከፊ ሊመራ ይሆናል ይጠቅሳል (Jungherr, Jürgens, and Schoen 2012) .
ከዚያ በኋላ, በዓለም ዙሪያ የሚገኙ ሌሎች ተመራማሪዎች ደግሞ የተጠቀሙበት fancier ዘዴዎች-እንደ አዎንታዊ እና አሉታዊ መካከል ያለውን ልዩነት በስሜት ትንተና በመጠቀም እንደ ምርጫ የተለያዩ አይነቶች የተለያዩ መተንበይ Twitter ውሂብ ችሎታ ለማሻሻል ሲሉ ወገኖች ማለትም ስለ ይጠቅሳል (Gayo-Avello 2013; Jungherr 2015, Ch. 7.) . እንዴት እንደሆነ እነሆ Huberty (2015) ምርጫ ለመተንበይ እነዚህ ሙከራዎች ውጤት ጠቅለል:
እውነተኛ በጉጉት-በመመልከት የምርጫ ትንበያ የሚጠይቀውን ላስገዛለት ጊዜ "በማህበራዊ ማህደረ መረጃ ላይ ተመስርቶ ሁሉም የታወቀ ትንበያ ዘዴዎች አልተሳኩም. እነዚህ ያልተሳኩ ይልቅ methodological ወይም ስልተ ችግሮች ይልቅ የማህበራዊ ሚዲያ መሰረታዊ ባህርያት, ምክንያት ይመስላል. በአጭሩ ሳይሆን, የማኅበራዊ ሚዲያ ማድረግ, እና ምናልባትም, በመራጩ ጋጣ, unbiased, ተወካይ ስዕል ሊያቀርብ ፈጽሞ; እና ማህበራዊ ሚዲያ ምቾት ናሙናዎች እነዚህ ችግሮች ጊዜያዊ ለማስቀመጥ ለመጠገን በቂ መረጃ የላቸውም. "
ሊመራ ምርምር አንዳንድ አንብብ Huberty (2015) መደምደሚያ ላይ, እና Twitter ምርጫ ለመተንበይ ላይ መዋል ያለበት ከሆነ እንዴት የሚገልጽ አንድ የፖለቲካ እጩ አንድ አንድ ገጽ ማስታወሻ ጻፍ.
[ ] አንድ ሶሺዮሎጂስት እና ታሪክ መካከል ያለው ልዩነት ምንድን ነው? Goldthorpe መሠረት (1991) , አንድ ሶሺዮሎጂስት እና ታሪክ መካከል ያለው ዋና ልዩነት መረጃ አሰባሰብ ላይ ቁጥጥር ነው. የታሪክ የማኅበራዊ የተወሰነ ዓላማ ያላቸውን የውሂብ መሰብሰብ ሊያሻሻል ይችላሉ ግን ቅርሶች ለመጠቀም ይገደዳሉ. አንብብ Goldthorpe (1991) . እንዴት ነው በሶሺዮሎጂ እና ታሪክ መካከል ያለውን ልዩነት Custommades እና Readymades ሃሳብ ጋር የተያያዘ ነው?
[ ] ቀዳሚው ጥያቄ ላይ መገንባት, Goldthorpe (1991) Nicky ሃርት አንድ ጨምሮ ወሳኝ ምላሽ በርካታ, መዞ (1994) አደረገ ውሂብ ለማበጀት Goldthorpe ያደረ ጥያቄ ነው. የተዘጋጁ የውሂብ አቅም ውስንነት ግልጽ ለማድረግ, ሃርት ወደ ባለጠጎች ሠራተኛ ፕሮጀክት, አጋማሽ 1960 Goldthorpe እና ባልደረቦቻቸው የሚካሄደው ነበር ማኅበራዊ መደብ እና ድምጽ መስጠት መካከል ያለውን ዝምድና ለመለካት ትልቅ ጥናት ገልጿል. አንድ ሰው አልተገኘም ውሂብ ላይ ውሂብ ታስቦ የሞላብሽ አንድ ምሁር የሚጠበቅ ዘንድ እንደ ባለጠጎች ሠራተኛ ፕሮጀክት የኑሮ ደረጃ እየጨመረ ዘመን ውስጥ ማህበራዊ ክፍል ስለ ወደፊቱ በቅርቡ በታቀደው ንድፈ መንገድ የተዘጋጁ ነበር ውሂብ የተሰበሰበው. ነገር ግን, Goldthorpe እና ባልደረቦቻቸው በሆነ መንገድ ሴቶችን መስጫ ባህሪ መረጃ ለመሰብሰብ "ረሱኝ". እዚህ Nicky ሃርት እንዴት ነው (1994) ሙሉውን ክፍል ማጠቃለያዎች:
". . . ይህ የውሂብ ሴት ተሞክሮ የተገለሉ አንድ paradigmatic ሎጂክ በ ታስሮ ነበር 'እንድንታይ አደረገ' ምክንያቱም ሴቶች የተተዉ የሚል መደምደሚያ ላይ ለማስወገድ አስቸጋሪ [ነው]. ወንድ preoccupations እንደ ክፍል ህሊና እና እርምጃ አንድ የንድፈ ራእይ ይነዳ. . . , Goldthorpe እና ባልደረቦቹ ለመመገብ እና adequacy ልክ የሆነ ፈተና እነሱን በማጋለጥ ይልቅ የራሳቸውን የንድፈ ግምታዊ ሊሳካላቸው ይህም የሚያደርጉ የተጠኑ ማስረጃዎች ስብስብ የገነቡት. "
ሚዳቋና ቀጠለ:
"እነርሱ የተሸከረከረ, ፖለቲካ እና ቁሳዊ ሕይወት ሂደት የማሳወቅ ይልቅ ባለጠጎች ሠራተኛ ፕሮጀክት ያለው የማስወገ ግኝቶች እኛን አጋማሽ መቶ ዘመን በሶሺዮሎጂ ላይ masculinist እሴቶች ተጨማሪ ንገራቸው."
አንተ የተዘጋጁ ውሂብ ክምችት ወደ የተገነባው የውሂብ ሰብሳቢው ላይ አድሏዊነት ያለው የት ሌሎች ምሳሌዎችን መጥቀስ ትችላለህ? እንዴት ነው ይህን ስልተ ያሳጣቸው ጋር ሲወዳደር እንዴት? እነርሱም Custommades መጠቀም ያለብን ጊዜ ይህን ምን እንድምታ ተመራማሪዎች Readymades መጠቀም ያለብን ጊዜ አለን ይችላል?
[ ] በዚህ ምዕራፍ ውስጥ, ኩባንያዎች እና መንግስታት የተፈጠረ አስተዳደራዊ መዛግብት ጋር ተመራማሪዎች ለ ተመራማሪዎች የተሰበሰበ ውሂብ ጋር ያነፃፅራል. አንዳንድ ሰዎች ይህ አስተዳደር መዛግብት ተመራማሪዎች ይገኛሉ E ውነት የሆነ ነው. "የተነደፉ ውሂብ" እነዚህ አስተዳደራዊ መዛግብት እነሱ ጋር ማወዳደር ይህም "ውሂብ አልተገኘም" መጥራት, ነገር ግን ደግሞ በጣም የተዘጋጀ ነው. ለምሳሌ ያህል, ዘመናዊ ቴክኖሎጂ ኩባንያዎች ለመሰብሰብ እና ውሂብ መሰብሰብ ዘንድ ከፍተኛ ጊዜ መጠን እና መርጃዎችን ያሳልፋሉ. በመሆኑም እነዚህ አስተዳደራዊ መዛግብት ሁለቱም አግኝቶ የተሠሩ ናቸው, ይህ ብቻ አመለካከት (ምስል 2.10) ላይ የተመካ ነው.
ምርምር ውሂብ ምንጭ በመጠቀም ጊዜ አግኝቶ የተነደፉ ጠቃሚ ነው ሁለቱም እንደ አይቶ የት የውሂብ ምንጭ የሚያሳይ አንድ ምሳሌ ያቅርቡ.
[ ] አንድ አሳቢ ድርሰት ውስጥ, ክርስቲያን Sandvig እና Eszter Hargittai (2015) ወደ ዲጂታል ሥርዓት "የሙዚቃ መሣሪያ" ወይም የት ዲጂታል ምርምር, ሁለት ዓይነት ለመግለጽ "ጥናት ነገር." ጥናት የመጀመሪያ ዓይነት አንድ ምሳሌ ነው የት Bengtsson እና ባልደረቦቻቸው (2011) ሁለተኛው ዓይነት አንድ ምሳሌ ነው, በ 2010 በሄይቲ መናወጥ በኋላ ፍልሰት ለመከታተል የተንቀሳቃሽ ስልክ ውሂብ ጥቅም ላይ የት ጄንሰን (2007) በኬረለ በመላው የሞባይል ስልኮች መግቢያ, ሕንድ ዓሣ ገበያ ላይ ሥራውን ላይ ተጽዕኖ እንዴት ጥናቶች. ይህ ዲጂታል መረጃ ምንጮችን በመጠቀም ጥናቶች የውሂብ ምንጭ አንድ ዓይነት ነው እየተጠቀሙ ያሉት እንኳ ፈጽሞ የተለየ ግቦች እንደሚችሉ ያብራራል; ምክንያቱም ይህ ጠቃሚ እናገኛለን. አንድ መሣሪያ አድርጎ ዲጂታል ሥርዓት የሚጠቀሙ ሁለት እና ጥናት አንድ ነገር እንደ ዲጂታል ሥርዓት የሚጠቀሙ ሁለት: ጠቃሚነት ምክንያት: ይህንን ልዩነት ግልጽ ለማድረግ እንዲችሉ, ተመልክተናል አራት ጥናቶች ይገልጻሉ. የሚፈልጉ ከሆነ እርስዎ በዚህ ምዕራፍ ጀምሮ ምሳሌዎችን መጠቀም ይችላሉ.