කටයුතු

යතුර:

  • අමාරුවෙන් උපාධිය: පහසු පහසු , මධ්යම මධ්යම , දෘඪ වෙහෙස මහන්සි වී , ඉතා දුෂ්කර ඉතා දුෂ්කර
  • ගණිත අවශ්ය ( ගණිත අවශ්ය )
  • කේතනය අවශ්ය ( කේතනය අවශ්ය )
  • දත්ත එකතුව ( දත්ත එකතුව )
  • මගේ ප්රියතම ( මගේ ප්රියතම )
  1. [ මධ්යම , මගේ ප්රියතම ] Algorithmic පුදුමයට ගූගල් උණ ප්රවණතා සමග ගැටළුවක් විය. විසින් කඩදාසි කියවන්න Lazer et al. (2014) , සහ Google ප්රශ්නය පැහැදිලි හා ගැටලුව අදාල කරුණ නිවැරදි කිරීමට ආකාරය පිළිබඳ අදහසක්, ඉදිරිපත් දී ඉංජිනේරුවා කෙටි, පැහැදිලි ඊ-තැපැල් ලියන්න.

  2. [ මධ්යම ] Bollen, Mao, and Zeng (2011) ට්විටර් දත්ත කොළඹ කොටස් වෙළඳ පොළ ගැන අනාවැකි යොදා ගත හැකි බව ප්රකාශ කරයි. මෙම සොයා ගැනීම ට්විටර් එකතු දත්ත මත පදනම් වූ කොළඹ කොටස් වෙළඳ පොළ ආයෝජනය කිරීමට වෙළඳපොළ-අරමුදල් භාරකරු-Derwent කැපිටල් නිර්මාණය කිරීමට හේතු (Jordan 2010) . ඔබ අරමුදලේ ඔබේ මුදල් දමා පෙර දැකීමට අවශ්ය බව සාක්ෂි මොනවාද?

  3. [ පහසු ] සමහර මහජන සෞඛ්ය වෙනුවෙන් කතා දුම් නැවැත්වීෙම් සඳහා ඵලදායී ආධාර වශයෙන් ඊ-සිගරට් හුරේ දැමීම අතර අන් අය එවැනි නිකොටින් ඉහළ-මට්ටම් ලෙස ඇතිවිය හැකි අවදානම් ගැන අනතුරු අඟවයි. පර්යේෂකයකු ඊ-සිගරට් සම්බන්ධ ට්විටර් තනතුරු එකතු මනෝගතීන් විශ්ලේෂණය පවත්වා ඊ-සිගරට් දෙසට මහජන මතය අධ්යයනය කිරීමට තීරණය කියා සිතන්න.

    1. ඔබ මෙම අධ්යයනයේ දී පිළිබඳව ඉතාමත් කනස්සල්ලට පත්ව සිටින බව ඇති විය හැකි අගතීන් තුනක් මොනවාද?
    2. Clark et al. (2016) ඒ වගේ අධ්යයනය දිව්වා. පළමුව, ඔවුන් සමීප මත 2014 දෙසැම්බර් හරහා 2012 ජනවාරි මස සිට මෙම ඊ-සිගරට් සම්බන්ධ ප්රධාන වචන භාවිතා කරන tweets 850,000 එකතු, ඔවුන් මෙම tweets බොහෝ ස්වයංක්රීය බව වටහා (එනම්, මිනිසුන් විසින් නිෂ්පාදනය නොවේ) සහ මෙම ස්වයංක්රීය tweets බොහෝ අවශ්යයෙන්ම විය වෙළඳ. ඔවුන් කාබනික tweets සිට ස්වයංක්රීය tweets වෙන් කිරීමට මානව හඳුනා ඇල්ගොරිතම සංවර්ධනය. මෙම මානව භාවිතා කරමින් ඇල්ගොරිතම ඔවුන් tweets 80% ක් ස්වයංක්රීය රඳවාගෙන ඇති බව වාර්තාව විසින් සොයාගනු හදුනාගන්න. මෙම සොයා ගැනීම කොටසක් (අ) ඔබේ පිළිතුර වෙනස් වන්නේ කෙසේද?
    3. ඔවුන් කාබනික සහ ස්වයංක්රීය tweets දී මනෝගතීන් සසඳන විට ඔවුන් ස්වයංක්රීය tweets කාබනික tweets (6.17 5.84 එදිරිව) වඩා වැඩි ධනාත්මක බව සොයාගෙන ඇත. මෙම සොයා ගැනීම (ආ) ඔබේ පිළිතුර වෙනස් වන්නේ කෙසේද?
  4. [ පහසු ] 2009 නොවැම්බර් මාසයේ දී, ට්විටර් යන ප්රශ්නය ද ට්වීටර් කොටුව තුළ සිට වෙනස් "ඔයා මොකද කරන්නේ?" "වෙන්නේ කුමක්ද?" (Https://blog.twitter.com/2009/whats-happening).

    1. ඔබ කොහොමද විමසුම් වෙනස් ලෙස සටහන් සහ / හෝ ඔවුන් සටහන් කරනු ලබනවා දේ කරන බලපානු ඇත හිතන්නේ?
    2. ඔබ විමසුමක් කැමති වනු ඇත සඳහා එක් පර්යේෂණ ව්යාපෘතියේ නම "ඔයා මොකද කරන්නේ?" ඇයි? පැහැදිලි කරන්න.
    3. ඔබ විමසුමක් කැමති වනු ඇත සඳහා එක් පර්යේෂණ ව්යාපෘතියේ නම "වෙන්නේ කුමක්ද?" ඇයි? පැහැදිලි කරන්න.
  5. [ මධ්යම ] Kwak et al. (2010) ඔවුන් ට්විටර් වඩා තොරතුරු හුවමාරු නව මාධ්යයක් ලෙස වැඩි කරයි බව නිගමනය මෙම විග්රහය මත විශ්ලේෂණය මිලියන 41.7 දක්වා ඉහළ පරිශීලක පැතිකඩ, බිලියන 1.47 කින්, සමාජ සම්බන්ධතා, කරන්නන්ගේ සංබ්යාවද දිනෙන් මාතෘකා 4262, සහ ජූනි මස 6 වැනි හා ජූනි 31 වැනි දින, 2009 අතර tweets මිලියන 106 සමාජ ජාලය.

    1. , Kwak et al ගේ සොයා ගැනීම සලකා ඔබ Twitter දත්ත සමඟ කරන්නේ පර්යේෂණ කිනම් ආකාරයේ? ඔබ Twitter දත්ත සමඟ පර්යේෂණ කුමන ආකාරයේ නොකරන? මන්ද?
    2. 2010 දී, ට්විටර් පරිශීලකයින් වෙත සාදන යෝජනාවක් ඉදිරිපත් සේවාව අනුගමනය කිරීමට කවුද වැඩිදුරටත් සඳහන් කළේය. නිර්දේශ ත්රී ප්රධාන පිටුවට අවස්ථාවක පෙන්වා ඇත. නිර්දේශ බොහෝ විට එක් ගේ "මිතුරන්-of-මිතුරන්," හා අන්යෝන්ය සම්බන්ධතා උපුටාගෙන ද නිර්දේශය ප්රදර්ශනය කර ඇත. පරිශීලකයන් නිර්දේශ නව කට්ටලයක් දැකීමට හෝ නිර්දේශ දිගු ලැයිස්තුව සමග පිටුව බැලීමට refresh හැක. ඔබ මෙම නව ලක්ෂණය කොටසක් ඔබේ පිළිතුර වෙනස් වනු ඇත හිතන්නේ)? ඇයි, ඇයි බැරි?
    3. Su, Sharma, and Goel (2016) සේවය අනුගමනය කිරීම කවුද බලපෑම ඇගයීමට ලක් වූ අතර ජනප්රිය පරාසය හරහා පරිශීලකයන් නිර්දේශ ප්රතිලාභ ලබන අතර වඩාත් ජනප්රිය පරිශීලකයන් සාමාන්යයට වඩා සැලකිය යුතු ප්රමාණයකින් වැඩි ලාභයක් ලබා ඇති බවයි. මෙම සොයා ගැනීම කොටසක් ආ ඔබේ පිළිතුර වෙනස් කරයිද?) ඇයි, ඇයි බැරි?
  6. [ පහසු ] "Retweets" බොහෝ විට ට්විටර් බලපෑම බලපෑම හා පැතිරීම මැනීම සඳහා භාවිතා කරනු ලැබේ. මුලදී, පරිශීලකයන්, ඔවුන් දුටු සුන්දර ට්වීටර් පිටපත් කිරීමට සහ ඇලවීම ඔහුගේ / ඇයගේ අල්ලුවේ මුල් කතුවරයා ලේබල, සහ අතින් එය retweet බව, සඳහන් කිරීමට ට්වීටර් පෙර "RT" ටයිප් විය. එවිට, 2009 දී ට්විටර් වූ "retweet" බොත්තම වැඩිදුරටත් සඳහන් කළේය. 2016 ජූනි මාසයේ දී, ට්විටර් එය කළ හැකි පරිශීලකයන් තමන්ගේ tweets (https://twitter.com/twitter/status/742749353689780224) retweet කිරීම සඳහා ය. ඔබ මෙම වෙනස්කම් ඔබ ඔබේ පර්යේෂණ "retweets" භාවිතා කරන ආකාරය බලපෑ යුතු කරන්න පුළුවන් කියලා ඔබ හිතනවද? ඇයි, ඇයි බැරි?

  7. [ මධ්යම , දත්ත එකතුව , කේතනය අවශ්ය ] Michel et al. (2011) පොත් සංඛ්යාංකකරණය ගූගල් උත්සාහයක් හරහා මතු වෙමින් කෝපුස් ඉදිකර ඇත. 2009 දී ප්රකාශයට පත් හා ඩිජිටල් පොත් මිලියන 5 කට අධික අඩංගු කරන ලද කෝපුස්, පළමු අනුවාදය භාවිතා කරමින්, කතුවරුන්, භාෂාමය වෙනස්කම් හා සංස්කෘතික ප්රවණතා විමර්ශනය කිරීමට වචනය භාවිතය සංඛ්යාත විශ්ලේෂණය. වැඩි කල් යන්න කලින් ගූගල් පොත් කෝපුස් පර්යේෂකයන් සඳහා ජනප්රිය දත්ත මූලය බවට පත් විය, හා දත්ත-ගබඩාව ක 2 වන අනුවාදය 2012 දී නිකුත් කරන ලදී.

    කෙසේ වෙතත්, Pechenick, Danforth, and Dodds (2015) පර්යේෂකයන් පූර්ණ පුළුල් නිගමනවලට සඳහා එය භාවිතා කිරීමට පෙර කෝපුස් යන විශේෂණය අසිරියක් අවශ්ය බවට අනතුරු ඇඟවීය. ප්රධාන ප්රශ්නය එක් එක් පොතේ එක් අඩංගු පෙළ නායකත්වයක් පුස්තකාල වැනි බවයි. මෙහි ප්රතිඵලයක් වශයෙන්, තනි තනි, නිර්මානශීලී කතෘ, ඔහේගේ ගූගල් පොත් ශබ්ද කෝෂයේ තුළට අලුත් වාක්ය ඇතුල් කිරීමට සමත් ය. තව ද, විද්යාත්මක ග්රන්ථ 1900 පුරා කෝපුස් ක වැඩි වැඩියෙන් සැලකිය යුතු කොටසක් සමන්විත වේ. මීට අමතරව, ඉංග්රීසි ප්රබන්ධ හැකි දත්ත සංස්කරණ දෙකක්, Pechenick et al සන්සන්දනය. ප්රමාණවත් පෙරහන් පළමු අනුවාදය නිෂ්පාදනය සඳහා භාවිතා කරන ලදී බවට සාක්ෂි සොයාගෙන ඇත. ක්රියාකාරකම් සඳහා අවශ්ය දත්ත සියල්ල සපයා ගත වේ: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html

    1. මයිකල් et al ගේ. මුල් කඩදාසි (2011) , ඔවුන් ඉංග්රීසි දත්ත කාණ්ඩ 1 වන අනුවාදය භාවිතා වසර භාවිතය සංඛ්යාත කුමන්ත්රණ "1880", "1912" සහ "1973", සහ අපි "කරන බව නිගමනය කලේ ය ගෙවී යන සෑම වේගවත් අතීත අමතක "(පය. 3A, මයිකල් et al.). එම කුමන්ත්රණය 1 භාවිතා පය. 3A, මයිකල් et al ලෙස එම, පෙළ නායකත්වයක් 1 අනුවාදය ප්රතිනිර්මානය) සිංහල දත්ත සමුදාය (.)
    2. දැන් 1 අනුවාදය, ඉංග්රීසි ප්රබන්ධ දත්ත සමුදාය සමඟ එම කුමන්ත්රණය ප්රතිනිර්මානය.
    3. දැන් කෝපුස් 2 වන වෙළුම සමඟ එම කුමන්ත්රණය ප්රතිනිර්මානය, ඉංග්රීසි දත්ත සමුදාය.
    4. අවසාන වශයෙන්, 2 වන අනුවාදය, ඉංග්රීසි ප්රබන්ධ දත්ත සමුදාය සමඟ එම කුමන්ත්රණය ප්රතිනිර්මානය.
    5. මෙම කුමන්ත්රන හතර අතර වෙනස්කම් හා සමානකම් විස්තර කරන්න. ඔබ නිරීක්ෂණය ප්රවණතාව මයිකල් et al ගේ. මුල් අර්ථ සමග එකඟ වෙනවාද? (ඉඟිය: ඇ) සහ ඈ) Pechenick et al දී රූපය 16 සමාන විය යුතුය).
    6. දැන් ඔබ වෙනස් Google පොත් corpora භාවිතා සොයා මේ එක ද අනුකරනය ඇති බව, මයිකල් et al ගේ. මුල් කඩදාසි ඉදිරිපත් තවත් භාෂාමය වෙනසක් හෝ සංස්කෘතික සංසිද්ධීන් තෝරාගන්න. ඔබ Pechenick et al ඉදිරිපත් කර ඇති සීමාවන් ආලෝකය තුළ ඔවුන්ගේ අර්ථ නිරූපණය සමග එකඟ නැහැ.? ඔබේ තර්කය ශක්තිමත් කිරීමට, ඉහත සඳහන් ලෙස සකස් දත්ත විවිධ ප්රභේද භාවිතා කරමින් එම ප්රස්තාරය ප්රතිනිර්මානය උත්සාහ කරන්න.
  8. [ ඉතා දුෂ්කර , දත්ත එකතුව , කේතනය අවශ්ය , මගේ ප්රියතම ] Penney (2016) , 2013 ජූනි මාසයේ දී ජාතික ආරක්ෂක ඒජන්සියේ / PRISM නිරීක්ෂණ (ie, ස්නෝඩන් හෙලිදරව් කිරීම්) ගැන පැතිර පවත්නා ප්රචාරයක් පෞද්ගලිකත්වය ප්රශ්න මතුකිරීමට බව මාතෘකා මත විකිපීඩියා ලිපි රථවාහන තියුනු හා හදිසි අඩුවීමක් සමග සංෙයෝජිත ෙකෙර් යන්න සොයා බලයි. එසේ නම්, හැසිරීම තුළ මෙම වෙනස් ස්කන්ධය නිරීක්ෂණ හේතුවෙන් භයංකර බලපෑමක් අනුකූල වනු ඇත. ප්රවේශය Penney (2016) සමහර විට යම් බාධා කාල ශ්රේණි නිර්මාණය ලෙස හඳුන්වන අතර, නිරීක්ෂණ දත්ත (වගන්තිය 2.4.3) සිට පරීක්ෂණ ශූන්යයක් සන්නිකර්ෂණය ගැන පරිච්ඡේදයේ ප්රවේශයන් සම්බන්ධ වේ.

    මාතෘකාව ප්රධාන වචන තෝරා ගැනීමට, Penney සමාජ මාධ්ය ලුහුබැඳීම සහ නිරීක්ෂණය කිරීම සඳහා අභ්යන්තර ආරක්ෂක කටයුතු පිළිබඳ ඇමරිකානු දෙපාර්තමේන්තුව විසින් භාවිතා කරන ලැයිස්තුවට සඳහන්. ච්ඩ්ඉ ලැයිස්තුව ගැටළු රැසක් බවට ඇතැම් සෙවුම් පද ලක්කරමින්, එනම් "සෞඛ්ය සැලකිල්ල," "යටිතල පහසුකම් ආරක්ෂාව," හා "ත්රස්තවාදය. ත්රස්තවාදය" "අධ්යයන කන්ඩායමේ සඳහා, Penney සම්බන්ධ හතළිස්අටක් ප්රධාන වචන භාවිතා කරනු ලබන" (ව ව 8 බලන්න උපග්රන්ථය). ඔහු එසේ නම්, තිස් දෙකක් පමණ කාලය පුරා අදාල විකිපීඩියා ලිපි හතළිස් අට 2012 ජනවාරි මස මුල සිට 2014 අගෝස්තු මස අවසානය දක්වා ඔහුගේ තර්කය ශක්තිමත් කිරීම සඳහා මාසික පදනමින් Wikipedia article දැක්ම චෝදනා, ගොඩ ගසා, ඔහු ද කිහිපයක් සාපේක්ෂව නිර්මාණය අනෙකුත් මාතෘකා පිළිබඳ ලිපිය අදහස් සොයා ගැනීමේ විසින් කණ්ඩායම්.

    දැන්, ඔබ ජනකාන්ත හා දීර්ඝ කිරීමට යන්නේ Penney (2016) . ඔබ මෙම ක්රියාකාරකම සඳහා අවශ්ය වනු ඇත සියලු අමු දත්ත විකිපීඩියා, නිදහස් විශ්වකෝෂය (https://dumps.wikimedia.org/other/pagecounts-raw/) සිට ලබා ගත හැකි වේ. හෝ ඔබ ආර් පැකේජය wikipediatrend සිට එය ලබා ගත හැකි (Meissner and Team 2016) . ඔබ ලිවීම විට ඔබේ ප්රතිචාර, ඔබ විසින් භාවිතා කල දත්ත මූලය කරුණාවෙන් සලකන්න. (සටහන: මෙම එකම ක්රියාකාරකම් 6 වන පරිච්ඡේදය තුළ සඳහන් වේ)

    1. කියවන්න Penney (2016) සහ Figure 2 ප්රතිනිර්මානය "ත්රස්තවාදය" සඳහා පිටු අදහස් ස්නෝඩන් හෙළිදරව් පෙර හා පසු පිටු -related පෙන්නුම් කරන. සොයා ගැනීම් පහදා.
    2. ඊළඟට, ( "ත්රස්තවාදය" ලිපි -related) අධ්යයන කන්ඩායමේ ච්ඩ්ඉ ලැයිස්තුවෙන් "ච්ඩ්ඉ සහ වෙනත් ආයතන" යටතේ වර්ගීකරණය ප්රධාන වචන භාවිතා කරමින් comparator පිරිසක් සමග (උපග්රන්ථය වගුව 10 බලන්න) සංසන්දනය කරන පය 4 ඒ, ජනකාන්ත. සොයා ගැනීම් පහදා.
    3. කොටසක් ආ) ඔබ එක් comparator කණ්ඩායමට අධ්යයන කන්ඩායමේ සාපේක්ෂව. Penney යෝජනා දෙකක් comparator කණ්ඩායම් සාපේක්ෂව: "යටිතල පහසුකම් ආරක්ෂාව" ලිපි (උපග්රන්ථය වගුව 11) හා ජනප්රිය විකිපීඩියා, නිදහස් විශ්වකෝෂය පිටු (උපග්රන්ථය වගුව 12) -related. විකල්ප comparator පිරිසක් සමග පැමිණ, සහ කොටසක් ආ සොයා ගැනීම්වලින් නම් පරීක්ෂා) comparator පිරිසක් ඔබේ තේරීම සංවේදී වේ. comparator පිරිසක් කුමන තේරීම වඩාත් තේරුමක්? මන්ද?
    4. කතෘ, එක්සත් ජනපද ආන්ඩුව එහි සමඟ අමුත්තන් ඔත්තු පුහුණුවීම් සඳහා ප්රධාන යුක්ති සහගත කිරීම, ත්රස්තවාදය උපුටා නිසා "ත්රස්තවාදය" සම්බන්ධ ප්රධාන වචන විකිපීඩියා ලිපි තෝරා ගැනීමට භාවිතා කරන බවයි. මෙම 48 "ත්රස්තවාදය" යන චෙක්පතක් ප්රධාන වචන -related ලෙස, Penney (2016) ද ආණ්ඩුව දෝශ නිරාකරණය, පෞද්ගලිකත්ව-සංවේදී, සහ වැලැක්වීමේ (උපග්රන්ථය වගුව 7 සහ 8) ප්රකාරව ප්රධාන වචන එක් එක් ශ්රේණිගත කිරීම සඳහා ප්රතිචාර දැක්වූවන්ගෙන් ඉල්ලා MTurk මත සමීක්ෂණයක් පවත්වන ලදී. MTurk මත සමීක්ෂණය ප්රතිනිර්මානය සහ ඔබේ ප්රතිඵල සංසන්දනය කරන්න.
    5. කොටසක් ඈ) සහ ලිපිය ඔබේ කියවීමේ ප්රතිඵල මත, ඔබ පාඩම් කණ්ඩායමක් මාතෘකාවක් ප්රධාන වචන කතෘගේ තෝරා සමග එකඟ ඇයි? ඇයි, ඇයි බැරි? එසේ නොවේ නම්, ඔබට ඒ වෙනුවට දේ යෝජනා කරන්නේ?
  9. [ පහසු ] Efrati (2016) ෆේස්බුක් "මුළු හුවමාරු" අතර, "මුල් විකාශනය හුවමාරු 'බැස 21% වසර පුරා වසරක් විය% 5.5 පමණ වසර පුරා වසර අඩුවී ඇති බව, රහස්ය තොරතුරු මත පදනම්ව, වාර්තා කරයි. මෙම පිරිහීම වයස අවුරුදු 30 ට අඩු ෆේස්බුක් පරිශීලකයන් හා සමග, විශේෂයෙන් උග්ර විය. මෙම වාර්තාව සාධක දෙකක් කිරීමට පරිහානිය. එක් ජනතාව ෆේස්බුක් මත ඇති "මිතුරෝ" සංඛ්යාව වර්ධනය වේ. අනෙක් සමහර බෙදා හදා ක්රියාකාරකම් පණිවුඩ හා එවැනි SnapChat ලෙස තරඟකරුවන් වෙත ගෙනයන කර ඇති බවයි. මෙම වාර්තාව ද උපක්රම කිහිපයක් ෆේස්බුක් වසර කිහිපයකට පෙර, බෙදා හදා ඉහල දමා ගැනීමට උත්සාහ මුල් තනතුරු වඩාත් ප්රමුඛ කරන්න බව පුවත් සංග්රහය ඇල්ගොරිතම වෙනදාටත් වඩා, මෙන්ම මුල් තනතුරු පරිශීලකයන් "මෙම දිනය දා" යන වාර මතක් ඇතුළු කළ අනාවරණය වී ඇත. කුමක්ද ඇඟවුම්, ඕනෑම නම්, මෙම සොයා ගැනීම් දත්ත මූලාශයක ෆේස්බුක් භාවිතා කිරීමට අවශ්ය වන පර්යේෂකයන් සඳහා කුමක්ද?

  10. [ මධ්යම ] Tumasjan et al. (2010) දේශපාලන පක්ෂයක් සඳහන් tweets බව අනුපාතය 2009 දී ජර්මන් පාර්ලිමේන්තු මැතිවරණය (රූපය 2.9) ලැබී එම පක්ෂය ඡන්ද ප්රතිශතය සම්පාත වාර්තා කර ඇත. වෙනත් වචන වලින් කිවහොත්, එය ඔබ මැතිවරණ අනාවැකි පළ ට්විටර් භාවිතා කළ හැකි බව පෙනී යයි. එය විශාල දත්ත පොදු මූලාශ්රය සඳහා වටිනා භාවිතය යෝජනා කිරීමට මතුවීම නිසා මේ අධ්යයනය පළ කරන අවස්ථාව වන විට එය අතිශය සිත් ගන්නාසුලූ ලෙස සලකන ලදී.

    විශාල දත්ත නරක ලක්ෂණ ලබා දී, කෙසේ වෙතත්, ඔබ වහාම මේ ප්රතිඵලය සංශයවාදී විය යුතුය. 2009 දී ට්විටර් ජර්මානුවන් ඉතා-නියෝජිතයා නොවන පිරිසක් වූ අතර, එක් පාර්ශවයක් ආධාරකරුවන් දේශපාලනය ගැන බොහෝ විට සටහන් කරනු ලබනවා ඇති. ඒ අනුව, ඔබට හිතාගන්න හැකි බව හැකි සියළු අගතීන් කෙසේ හෝ පිටතට අවලංගු කරන බව පුදුමයට කරුණක් බව පෙනේ. ඇත්ත වශයෙන්ම, එම ප්රතිඵල Tumasjan et al. (2010) ඇත්ත වීමට හොඳ වීමට සිදු වූයේ. ඔවුන්ගේ පත්රිකාවේ, Tumasjan et al. (2010) ක්රිස්තියානි ප්රජාතන්ත්රවාදී පක්ෂය (සීඩීයූ), ක්රිස්තියානි සමාජ ප්රජාතන්ත්රවාදීන් (සීඑස්යූ), සමාජ ප්රජාතන්ත්රවාදී පක්ෂය, ලිබරල් පක්ෂය (ෆ්රෑන්ක් ස්කාෆ්ලර්), වාමාංශික (Die Linke), හා හරිත පක්ෂය (Grüne): දේශපාලන පක්ෂ හයක සලකා බලන ලදී. කෙසේ වෙතත්, එම අවස්ථාවේ දී ට්විටර් මත වඩාත් සඳහන් ජර්මන් දේශපාලන පක්ෂය වන මුහුදු කොල්ලකරුවන්ගේ පක්ෂය (Piraten), අන්තර්ජාලය ආණ්ඩුව සටන් වදින පක්ෂ විය. මෙම මුහුදු කොල්ලකරුවන්ගේ පක්ෂය විශ්ලේෂණය ඇතුළත් කරන විට, ට්විටර් ඡන්ද ප්රතිඵල (රූපය 2.9) ක දරුණු ප්රබල බවට පත් වෙයි සඳහන් (Jungherr, Jürgens, and Schoen 2012) .

    රූපය 2.9: (. Tumasjan et al 2010) ට්විටර් 2009 ජර්මන් මැතිවරණ ප්රතිඵල ගැන අනාවැකි පෙනී සඳහන්, නමුත් මේ නිසා සමහර අත්තනෝමතික සහ අසාධාරණ ලෙස තෝරා ගැනීම් (Jungherr, Jürgens, සහ 2012 Schoen) මත රඳා හැරෙනවා.

    රූපය 2.9: ට්විටර් 2009 ජර්මන් මැතිවරණ ප්රතිඵල ගැන අනාවැකි පෙනී සඳහන් (Tumasjan et al. 2010) , නමුත් මේ නිසා සමහර අත්තනෝමතික සහ අසාධාරණ ලෙස තෝරා ගැනීම් මත යැපෙන්නට හැරෙනවා (Jungherr, Jürgens, and Schoen 2012) .

    ඉන් අනතුරුව, ලොව පුරා වෙනත් පර්යේෂකයන් වඩා සුන්දර ක්රම-එවැනි ධනාත්මක සහ ඍණාත්මක අතර වෙනස හඳුනා ගැනීමට මනෝගතීන් විශ්ලේෂණයක් භාවිතා කරමින් ලෙස භාවිතා කර ඇති පක්ෂ මැතිවරණ විවිධ වර්ගයේ විවිධ අනාවැකි පළ ට්විටර් දත්ත හැකියාව වැඩි දියුණු කිරීම සඳහා නියෝගයක් සඳහන් (Gayo-Avello 2013; Jungherr 2015, Ch. 7.) . මෙන්න කරන ආකාරය Huberty (2015) මැතිවරණ අනාවැකි පළ මෙම උත්සාහය ප්රතිඵල සාරාංශ:

    සැබෑ ඉදිරියට පෙනුමක් මැතිවරණ පුරෝකථනය කිරීම ඉල්ලීම් ලක් වූ විට "සමාජ මාධ්ය මත පදනම් සියලු දන්නා ප්රක්ශේපණ ක්රම අසාර්ථක වී ඇත. මෙම අසාර්ථක වීම් සමාජ මාධ්ය මූලික ගුණ, ක්රමවේදාත්මක හෝ Algorithmic දුෂ්කරතා වෙනුවට නිසා ඇති බවක් පෙනී යයි. කෙටියෙන් කිවහොත්, සමාජ මාධ්ය නැහැ, සහ සමහරවිට, ස්ථාවර, අපක්ෂපාතී, නියෝජිත ආසනයේ චිත්රයක් ඉදිරිපත් කවදාවත්; හා සමාජ මාධ්ය පහසුව සාම්පල මේ ප්රශ්න පශ්චාත් තාවකාලික විසින් අදාල කරුණ නිවැරදි කිරීමට ප්රමාණවත් දත්ත නොමැති. "

    ඒ පිළිබඳ පර්යේෂණ සමහර කියවන්න Huberty (2015) එම නිගමනයට නම් හා විස්තර දේශපාලන අපේක්ෂක හා ආකාරය ට්විටර් මැතිවරණ අනාවැකි කිරීම සඳහා භාවිතා කල යුත්තේ එක් පිටුව සංදේශය ලියන්න.

  11. [ මධ්යම ] මොන සමාජ විද්යාඥයන්ට හා ඉතිහාසඥයෙකු අතර ඇති වෙනස කුමක්ද? Goldthorpe අනුව (1991) , අ සමාජ විද්යාඥයන්ට හා ඉතිහාසඥයෙකු අතර ප්රධාන වෙනස දත්ත රැස් පාලනය වේ. ඉතිහාසඥයන් සමාජ විද්යාඥයන් විශේෂ කාර්යයන් ඔවුන්ගේ දත්ත රැස් සකස් කළ හැකි බැවින්ද ධාතු භාවිතා කිරීමට බල කෙරී ඇත. කියවන්න Goldthorpe (1991) . Custommades හා Readymades අදහස සම්බන්ධ සමාජ විද්යාව සහ ඉතිහාසය අතර ඇති වෙනස කොහොමද?

  12. [ වෙහෙස මහන්සි වී ] පසුගිය ප්රශ්නය මතද, Goldthorpe (1991) Nicky හර්ද එක් ඇතුළු, විවේචනාත්මක ප්රතිචාර ගණනාවක් ඇද (1994) ඉදිරිපත් දත්ත මැනවින් සකස් කර ගැනීමට Goldthorpe තිබූ භක්තිය අභියෝග. විශේෂයෙන්ම සැකසූ දත්ත හැකි සීමාවන් පැහැදිලි කිරීමට, හර්ද මෙම ධනවත් සේවක ව්යාපෘතිය, 1960 ගනන් මැද දී Goldthorpe හා සගයන් විසින් සිදු කළ බව සමාජ පංතිය හා ඡන්ද අතර සම්බන්ධය මැනීම සඳහා විශාල සමීක්ෂණය විස්තර කර ඇත. එක් සොයා දත්ත මුල්කරගෙන නිර්මාණය දත්ත සිටීමට කැමති වූ විද්වතෙක් බලාපොරොත්තු විය හැකි පරිදි, ධනවත් සේවක ව්යාපෘති ජීවන තත්වයන් වැඩි වන යුගයක, සමාජ පංතිය අනාගතය ගැන පසුගියදා යෝජනා න්යාය ඇමතීමට ගැලපෙන ආකාරයට සකස් කළ බව දත්ත එකතු කරන ලදී. එහෙත්, Goldthorpe හා සගයන් කෙසේ හෝ කාන්තාවන් ඡන්ද හැසිරීම ගැන තොරතුරු රැස් කිරීමට "අමතක". මෙන්න Nicky හර්ද ආකාරය (1994) මුළු පරිච්ඡේදය සංක්ෂිප්ත:

    ". . . එය කාන්තාවන් නොකරන හරින ලද බව මෙම 'ලීසින්' දත්ත සමුදාය කාන්තා අත්දැකීම් බැහැර වන සුසමාදර්ශි තර්කනය සීමා වූ නිසා නිගමනය වැළකී දුෂ්කර [ය]. පිරිමි වියෝවී ලෙස පන්ති විඥානය හා ක්රියා කරන න්යායික දර්ශනය හේතුවී ඇත. . . , Goldthorpe සහ ඔහුගේ සගයන් පෝෂණය අතර, ඒ වෙනුවට වලංගු ප්රමාණාත්මකභාවය ටෙස්ට් ඔවුන් හෙලිදරව් තමන්ගේ න්යායික උපකල්පන පෝෂණය වූ ආනුභවික සාධකයන් කට්ටලයක් සෑදුවේය. "

    හර්ද දිගටම:

    "යන ධනවත් සේවක ව්යාපෘතියේ ආනුභවික සොයා ගැනීම් ඔවුන් පහත් භේද, දේශපාලනය සහ ද්රව්යමය ජීවිතය ක්රියාවලි දැනුම් වඩා අප මැද සියවසේ සමාජ විද්යාව පිළිබඳ masculinist වටිනාකම් ගැන තව කියන්න."

    ඔබ විශේෂයෙන්ම සැකසූ දත්ත රැස් එය තුලට ඉදිකරන ලද දත්ත එකතු කිරීමේ අගතීන් ඇත එහිදී තවත් උදාහරණ හැකිද? කොහොමද මේ Algorithmic පුදුමයට සමාන කරන්නේ ඇයි? මෙම පර්යේෂකයන් Readymades භාවිතා කළ යුතු අතර ඔවුන් Custommades භාවිතා කළ යුතු විට විට මොන බලපෑම් ඇති කළ හැක්කේ කෙසේද?

  13. [ මධ්යම ] මෙම පරිච්ඡේදයේ දී, මම සහ ආන්ඩුව විසින් නිර්මාණය පරිපාලන වාර්තා සමග පර්යේෂකයන් සඳහා පර්යේෂකයන් විසින් රැස් කළ දත්ත ප්රතිවිරුද්ධවය. සමහර අය "දත්ත සොයා," ඔවුන් සමග සංසන්දනාත්මකව වන මෙම පරිපාලන වාර්තා අමතන්න "නිර්මාණය දත්ත." එය පරිපාලන වාර්තා පර්යේෂකයින් විසින් දක්නට ලැබේ, නමුත් ඔවුන් ද ඉතා නිර්මාණය කර ඇත බව සැබෑ ය. උදාහරණයක් ලෙස, නූතන තාක්ෂණික සමාගම් තම දත්ත රැස් කිරීම සහ curate කිරීමට කාලය හා සම්පත් අති විශාල ප්රමාණයන්ගෙන් වියදම් කරනවා. මේ අනුව, මෙම පරිපාලන වාර්තා දෙකම සොයා නිර්මාණය කර ඇත, එය ඔබගේ ඉදිරිදර්ශනය (රූපය 2.10) මත රඳා පවතී.

    රූපය 2.10: පින්තූරය, තාරාවා සහ හාවා දෙකම ය; ඔබ දකින ඔබේ ඉදිරිදර්ශනය මත රඳා පවතී. රජයේ සහ ව්යාපාර පරිපාලන වාර්තා සොයා නිර්මාණය කර ඇත දෙකම; ඔබ දකින ඔබේ ඉදිරිදර්ශනය මත රඳා පවතී. උදාහරණයක් ලෙස, ෆෝන් සමාගම විසින් රැස් කරන ලද ඇමතුමක් දත්ත වාර්තා පර්යේෂකයෙක් ඉදිරිදර්ශනය දත්ත දක්නට ලැබේ. නමුත් මේ හරියටම සමාන වාර්තා දුරකතන සමාගමේ බිල් දෙපාර්තමේන්තුවේ වැඩ කෙනෙකු දත්ත ඉදිරිදර්ශනය නිර්මාණය කර ඇත. මූලාශ්රය: විකිපීඩියා, නිදහස් විශ්වකෝෂය

    රූපය 2.10: පින්තූරය, තාරාවා සහ හාවා දෙකම ය; ඔබ දකින ඔබේ ඉදිරිදර්ශනය මත රඳා පවතී. රජයේ සහ ව්යාපාර පරිපාලන වාර්තා සොයා නිර්මාණය කර ඇත දෙකම; ඔබ දකින ඔබේ ඉදිරිදර්ශනය මත රඳා පවතී. උදාහරණයක් ලෙස, ෆෝන් සමාගම විසින් රැස් කරන ලද ඇමතුමක් දත්ත වාර්තා පර්යේෂකයෙක් ඉදිරිදර්ශනය දත්ත දක්නට ලැබේ. නමුත් මේ හරියටම සමාන වාර්තා දුරකතන සමාගමේ බිල් දෙපාර්තමේන්තුවේ වැඩ කෙනෙකු දත්ත ඉදිරිදර්ශනය නිර්මාණය කර ඇත. මූලාශ්රය: විකිපීඩියා, නිදහස් විශ්වකෝෂය

    පර්යේෂණ සඳහා එම දත්ත ප්රභවය භාවිතා කරන විට හමු වූ අතර නිර්මාණය ලෙස දෙකම එය දුටු ප්රයෝජනවත් කොහෙද දත්ත මූලය උදාහරණයක් ලබා දීම.

  14. [ පහසු ] කල්පනාකාරීව රචනයේ දී, ක්රිස්තියානි Sandvig හා Eszter Hargittai (2015) ඩිජිටල් ක්රමය "මෙවලමක්" හෝ කොහෙද ඩිජිටල් පර්යේෂණ, වර්ග දෙකක් විස්තර "අධ්යයන වස්තුව." අධ්යයනය පළමු ආකාරයේ උදාහරණයක් එහිදී Bengtsson හා සගයන් වන (2011) ජෙන්සන් එහිදී 2010 දී හයිටි භූමිකම්පාවෙන් දෙවන ආකාරයේ උදාහරණයක් පසු සංක්රමණය නිරීක්ෂණය කිරීමට ජංගම දුරකතන දත්ත භාවිතා (2007) කෙසේ කේරල පුරා ජංගම දුරකථන හඳුන්වා අධ්යයනය, ඉන්දියාව මාළු සඳහා වෙළෙඳපොළ ක්රියාකාරීත්වය බලපෑවේය. එය ඩිජිටල් දත්ත මූලාශ්ර භාවිත අධ්යයන ඔවුන් දත්ත මූලය එකම ආකාරයේ භාවිතා කරන්නේ පවා නම් බෙහෙවින් වෙනස් ඉලක්ක ඇති හැකි බව පැහැදිලි නිසා මම මේ ප්රයෝජනවත්. මෙවලමක් සහ අධ්යයනය ලෙස වස්තුවක් ඩිජිටල් පද්ධති භාවිතා කරන දෙකක් ලෙස ඩිජිටල් පද්ධති භාවිතා කරන දෙකක්: මෙම වෙනස තවදුරටත් පැහැදිලි කිරීම සඳහා, අධ්යයන හතර ඔබ දැක ඇති බවට මෙයින් විස්තර කරන්න. ඔබට අවශ්ය නම්, ඔබ මෙම පරිච්ඡේදයේ සිට උදාහරණ භාවිතා කළ හැකිය.