אַקטיוויטעטן

שליסל:

  • גראַד פון שוועריקייט: גרינג גרינג , מיטל מיטל , שווער שווער , זייער שווער זייער שווער
  • ריקווייערז מאַט ( ריקווייערז מאַט )
  • ריקווייערז קאָודינג ( ריקווייערז קאָודינג )
  • דאַטן זאַמלונג ( דאַטן זאַמלונג )
  • מיין favorites ( מיין באליבטע )
  1. [ מיטל , מיין באליבטע ] אַלגאָריטהמיק קאָנפאָונדינג איז געווען אַ פּראָבלעם מיט Google פלו טרענדס. לייענען די פּאַפּיר דורך Lazer et al. (2014) , און שרייַבן אַ קורץ, קלאָר email צו אַ ינזשעניר בייַ גוגל יקספּליינינג די פּראָבלעם און מקריב אַ געדאַנק פון ווי צו פאַרריכטן דעם פּראָבלעם.

  2. [ מיטל ] Bollen, Mao, and Zeng (2011) קליימז אַז דאַטן פון טוויטטער קענען ווערן געניצט צו פאָרויסזאָגן די לאַגער מאַרק. דאס דערגייונג געפֿירט צו די שאַפונג פון אַ רעדנ מיט אַ האַלבנ מויל פאָנד-Derwent קאַפּיטאַל מאַרקעץ-צו ינוועסטירן אין די לאַגער מאַרק באזירט אויף דאַטן געזאמלט פון טוויטטער (Jordan 2010) . וואָס זאָגן וואָלט איר ווילן צו זען איידער פּאַטינג דיין געלט אין אַז פאָנד?

  3. [ גרינג ] בשעת עטלעכע ציבור געזונט אַדוואַקאַץ האָגל E-סיגערעץ ווי אַ עפעקטיוו הילף פֿאַר סמאָוקינג ופהער, אנדערע וואָרענען וועגן דער פּאָטענציעל ריסקס, אַזאַ ווי די הויך-לעוועלס פון ניקאָטין. ימאַדזשאַן אַז אַ פאָרשער דיסיידז צו לערנען עפנטלעך מיינונג צו E-סיגערעץ דורך קאַלעקטינג E-סיגערעץ-פֿאַרבונדענע טוויטטער הודעות און קאַנדאַקטינג סענטימענט אַנאַליסיס.

    1. וואָס זענען די דרייַ מעגלעך בייאַסיז אַז איר זענען רובֿ באַזאָרגט וועגן אין דעם לערנען?
    2. Clark et al. (2016) געלאָפֿן נאָר אַזאַ אַ לערנען. ערשטער, זיי געזאמלט 850,000 טוועעץ אַז געניצט E-פּאַפּיראָס-פֿאַרבונדענע טערמינען פון יאנואר 2012 דורך דעצעמבער 2014. אויף נעענטער דורכקוק, זיי איינגעזען אַז פילע פון ​​די טוועעץ זענען אָטאַמייטיד (ד"ה, ניט Produced דורך יומאַנז) און פילע פון ​​די אָטאַמייטיד טוועעץ זענען יסענשאַלי קאַמערשאַלז. זיי דעוועלאָפּעד אַ מענטשנרעכט דעטעקטיאָן אַלגאָריטהם צו שיידן אָטאַמייטיד טוועעץ פון אָרגאַניק טוועעץ. ניצן דעם מענטשנרעכט דעטעקט אַלגאָריטהם זיי געפֿונען אַז 80% פון טוועעץ זענען אָטאַמייטיד. טוט דעם דערגייונג טוישן דיין ענטפער צו טייל (אַ)?
    3. ווען זיי קאַמפּערד די סענטימענט אין אָרגאַניק און אָטאַמייטיד טוועעץ זיי געפֿונען אַז די אָטאַמייטיד טוועעץ זענען מער positive ווי אָרגאַניק טוועעץ (6.17 קעגן 5.84). טוט דעם דערגייונג טוישן דיין ענטפער צו (ב)?
  4. [ גרינג ] אין נאוועמבער 2009, טוויטטער געביטן דעם קשיא אין דער טוויט קאַסטן פון "וואָס זענען איר טאן?" צו "וואָס ס געשעעניש?" (Https://blog.twitter.com/2009/whats-happening).

    1. ווי טאָן איר טראַכטן די ענדערונג פון פּראַמפּס וועט ווירקן ווער טוועעט און / אָדער וואָס זיי טוועעט?
    2. נאמען איין פאָרשונג פּרויעקט פֿאַר וואָס איר וואָלט בעסער וועלן די פּינטלעך "וואָס זענען איר טאן?" דערקלערן וואָס.
    3. נאמען איין פאָרשונג פּרויעקט פֿאַר וואָס איר וואָלט בעסער וועלן די פּינטלעך "וואָס ס געשעעניש?" דערקלערן וואָס.
  5. [ מיטל ] Kwak et al. (2010) אַנאַלייזד 41,700,000 באַניצער Profiles, 1.47 בילליאָן געזעלשאַפטלעך באַציונגען, 4262 טרענדינג סוגיות, און 106,000,000 טוועעץ צווישן יוני 6 און יוני 31, 2009. באַזירט אויף דעם אַנאַליז זיי קאָנקלודעד אַז טוויטטער באדינט מער ווי אַ נייַ מיטל פון אינפֿאָרמאַציע ייַנטיילונג ווי אַ געזעלשאַפטלעך נעץ.

    1. קאָנסידערינג קוואַק עט על ס דערגייונג, וואָס טיפּ פון פאָרשונג וואָלט איר טאָן מיט טוויטטער דאַטן? וואָס טיפּ פון פאָרשונג וואָלט איר ניט טאָן מיט טוויטטער דאַטן? וואָס?
    2. אין 2010, טוויטטער צוגעלייגט אַ ווער צו נאָכגיין דינסט מאכן טיילערד פאָרשלאָג צו ניצערס. דריי רעקאַמאַנדיישאַנז זענען געוויזן אין אַ צייַט אויף די הויפּט בלאַט. רעקאַמאַנדיישאַנז זענען אָפט ציען פון איין 'ס "Friends-פון-Friends", און קעגנצייַטיק קאָנטאַקטן זענען אויך געוויזן אין די רעקאָמענדאַציע. ניצערס קענען דערפרישן צו זען אַ נייַ שטעלן פון רעקאַמאַנדיישאַנז אָדער באַזוכן אַ חשבון מיט אַ מער רשימה פון רעקאַמאַנדיישאַנז. צי איר טראַכטן דעם נייַ שטריך וואָלט טוישן דיין ענטפער צו טייל אַ)? וואָס אָדער וואָס נישט?
    3. Su, Sharma, and Goel (2016) עוואַלואַטעד די ווירקונג פון וואס צו גיי דינסט און געפֿונען אַז בשעת ניצערס אַריבער די פּאָפּולאַריטעט ספּעקטרום בענעפיטעד פון די רעקאַמאַנדיישאַנז, די רובֿ פאָלקס ניצערס פּראָפיטעד סאַבסטאַנשאַלי מער ווי דורכשניטלעך. טוט דעם דערגייונג טוישן דיין ענטפער צו טייל ב)? וואָס אָדער וואָס נישט?
  6. [ גרינג ] "רעטוועעץ" זענען אָפט געניצט צו מעסטן השפּעה און פאַרשפּרייטן פון השפּעה אויף טוויטטער. טכילעס, ניצערס האט צו צייכענען און פּאַפּ די טוועעט זיי לייקט, פאַרבינדן די אָריגינעל מחבר מיט זיין / איר שעפּן, און מאַניואַלי דרוקן "רט" איידער די טוועעט צו אָנווייַזן אַז עס ס אַ רעטוועעט. דעמאָלט, אין 2009 טוויטטער צוגעלייגט אַ "רעטוועעט" קנעפּל. אין יוני 2016, טוויטטער געמאכט עס מעגלעך פֿאַר ניצערס צו רעטוועעט זייער אייגן טוועעץ (https://twitter.com/twitter/status/742749353689780224). צי איר טראַכטן די ענדערונגען זאָל ווירקן ווי איר נוצן "רעטוועעץ" אין דיין פאָרשונג? וואָס אָדער וואָס נישט?

  7. [ מיטל , דאַטן זאַמלונג , ריקווייערז קאָודינג ] Michel et al. (2011) קאַנסטראַקטאַד אַ קאָרפּוס ימערדזשינג פון גוגל 'ס מי צו דידזשאַטייז ביכער. ניצן די ערשטער ווערסיע פון ​​די קאָרפּוס, וואָס איז ארויס אין 2009 און קאַנטיינד איבער 5 מיליאָן דיגיטאַליזירן ביכער, די מחברים אַנאַלייזד וואָרט באַניץ אָפטקייַט צו פאָרשן לינגגוויסטיק ענדערונגען און קולטור טרענדס. באלד דער Google ביכער קאָרפּוס איז געווארן אַ פאָלקס דאַטן מקור פֿאַר ריסערטשערז, און אַ 2 ווערסיע פון ​​די דייטאַבייס איז רעלעאַסעד אין 2012.

    אָבער, Pechenick, Danforth, and Dodds (2015) געווארנט אַז ריסערטשערז דאַרפֿן צו גאָר קעראַקטערייז די מוסטערונג פּראָצעס פון די קאָרפּוס איידער ניצן עס פֿאַר צייכענונג ברייט קאַנקלוזשאַנז. די הויפּט אַרויסגעבן איז אַז די קאָרפּוס איז ביבליאָטעק-ווי, מיט איין פון יעדער בוך. ווי אַ רעזולטאַט, אַ יחיד, פרוכפּערדיק מחבר איז ביכולת צו נאָוטיסאַבלי אַרייַנלייגן נייַ האָספּיטאַל אין די גוגל ביכער לעקסיקאַן. דערצו, SCIENTIFIC טעקסטן קאַנסטאַטוט אַ ינקריסינגלי סאַבסטאַנטיוו חלק פון די קאָרפּוס איבער די 1900 ס. אין דערצו, דורך קאַמפּערינג צוויי ווערסיעס פון די ענגליש בעלעטריסטיק דאַטאַסעץ, פּעטשעניקק עט על. געפֿונען זאָגן אַז ניט גענוגיק פֿילטרירונג איז געניצט אין פּראַדוסינג די ערשטער ווערסיע. אַלע די דאַטע דארף פֿאַר טעטיקייט איז בנימצא דאָ: http://storage.googleapis.com/books/ngrams/books/datasetsv2.html

    1. אין מיטשעל עט על. ס אָריגינעל פּאַפּיר (2011) , זיי געניצט די 1 ווערסיע פון די ענגליש דאַטן שטעלן, פּלאַטיד די אָפטקייַט פון באַניץ פון די יאר "1880", "1912" און "1973", און קאָנקלודעד אַז "מיר זענען פאָרגעטטינג אונדזער פאַרגאַנגענהייַט Faster מיט יעדער פּאַסינג יאָר "(Fig. 3A, מיטשעל עט על.). רעפּלאַקייט דער זעלביקער פּלאַנעווען ניצן 1) 1 ווערסיע פון ​​די קאָרפּוס, ענגליש דאַטאַסעט (זעלביקער ווי Fig. 3A, מיטשעל עט על.)
    2. איצט רעפּלאַקייט דער זעלביקער פּלאַנעווען מיט די 1 ווערסיע, ענגליש בעלעטריסטיק דאַטאַסעט.
    3. איצט רעפּלאַקייט דער זעלביקער פּלאַנעווען מיט די 2 ווערסיע פון ​​די קאָרפּוס, ענגליש דאַטאַסעט.
    4. צום סוף, רעפּלאַקייט דער זעלביקער פּלאַנעווען מיט די 2 ווערסיע, ענגליש בעלעטריסטיק דאַטאַסעט.
    5. שילדערן די חילוק און סימאַלעראַטיז צווישן די פיר פּלאַץ. צי איר שטימען מיט מיטשעל עט על. ס אָריגינעל ינטערפּריטיישאַן פון די באמערקט גאַנג? (אָנצוהערעניש: C) און ד) זאָל זיין דער זעלביקער ווי Figure 16 אין פּעטשעניקק עט על.)
    6. איצט אַז איר האָבן רעפּליקייטיד דעם איין דערגייונג ניצן פאַרשידענע גוגל ביכער קאָרפּאָראַ, קלייַבן אן אנדער לינגגוויסטיק ענדערן אָדער קולטור דערשיינונגען דערלאנגט אין מיטשעל עט על. ס אָריגינעל פּאַפּיר. צי איר שטימען מיט זייער ינטערפּריטיישאַן אין ליכט פון די לימיטיישאַנז דערלאנגט אין פּעטשעניקק עט על.? צו מאַכן דיין אַרגומענט שטארקער, פּרובירן רעפּלאַקייט דער זעלביקער גראַפיק ניצן פאַרשידענע ווערסיעס פון דאַטן שטעלן ווי אויבן.
  8. [ זייער שווער , דאַטן זאַמלונג , ריקווייערז קאָודינג , מיין באליבטע ] Penney (2016) יקספּלאָרז צי די וויידספּרעד פּירסעם וועגן נסאַ / פּריזמע סערוויילאַנס (ד"ה, די סנאָוודען התגלות) אין יוני 2013 איז פֿאַרבונדן מיט אַ שאַרף און פּלוצעמדיק פאַרקלענערן אין פאַרקער צו וויקיפּעדיע ארטיקלען אויף סוגיות אַז כאַפּן פּריוואַטקייט קאַנסערנז. אויב אַזוי, דעם ענדערונג אין נאַטור וואָלט זייַן קאָנסיסטענט מיט אַ טשילינג ווירקונג ריזאַלטינג פון מאַסע סערוויילאַנס. דער צוגאַנג פון Penney (2016) איז א מאל גערופֿן אַ ינטעראַפּטיד צייַט סעריע פּלאַן און איז שייך צו די אַפּראָוטשיז אין די קאַפּיטל וועגן אַפּפּראָקסימאַטינג יקספּעראַמאַנץ פון אָבסערוואַטיאָנאַל דאַטע (אָפּטיילונג 2.4.3).

    צו קלייַבן די טעמע טערמינען, פּעני רעפעררעד צו דער רשימה געניצט דורך יו דעפּאַרטמענט פון האָמעלאַנד סעקוריטי פֿאַר טראַקינג און מאָניטאָרינג געזעלשאַפטלעך מידיאַ. די DHS רשימה קאַטאַגערייזיז זיכער זוכן טערמינען אין אַ קייט פון ישוז, דאס הייסט "געזונט קאָנסערן", "Infrastructure סעקוריטי," און "טערעריזאַם." פֿאַר די לערנען גרופּע, פּעני געניצט די 48 טערמינען שייך צו "טערראָריסם" (זען טיש 8 אַפּפּענדיקס). ער דעמאָלט אַגראַגייטאַד וויקיפּעדיע אַרטיקל מיינונג קאַונץ אויף אַ כוידעשלעך יקער פֿאַר די קאָראַספּאַנדינג 48 וויקיפּעדיע אַרטיקלען איבער אַ 32 חודש צייַט, פֿון די אָנהייב פון יאנואר 2012 צו די סוף אויגוסט 2014. צו שטארקן זייַן אַרגומענט, ער אויך Created עטלעכע פאַרגלייַך גרופּעס דורך טראַקינג אַרטיקל קוקן אויף אנדערע טעמעס.

    איצט, איר זענען געגאנגען צו רעפּלאַקייט און פאַרברייטערן Penney (2016) . כל די רוי דאַטע אַז איר וועט דאַרפֿן פֿאַר דעם טעטיקייט איז פאַראַנען פון וויקיפּעדיע (https://dumps.wikimedia.org/other/pagecounts-raw/). אָדער איר קענען באַקומען עס פון די ר פּעקל וויקיפּעדיאַטרענד (Meissner and Team 2016) . ווען איר שרייַבן-אַרויף דיין רעספּאָנסעס, ביטע טאָן וואָס דאַטן מקור איר געוויינט. (באַמערקונג: דאס זעלבע טעטיקייט אויך אויס אין פּרק 6)

    1. לייענען Penney (2016) און רעפּלאַקייט Figure 2 וואָס ווייזט די בלאַט קוקן פֿאַר "טערראָריסם" -רעלאַטעד בלעטער איידער און נאָך די סנאָוודען התגלות. טייַטשן די פינדינגס.
    2. ווייַטער, רעפּלאַקייט Fig 4A, וואָס קאַמפּערז די לערנען גרופּע ( "טערראָריסם" -רעלאַטעד ארטיקלען) מיט אַ קאָמפּאַראַטאָר גרופּע ניצן טערמינען קאטיגארעזירט אונטער "DHS & אנדערע יידזשאַנסיז" פון די DHS רשימה (זען אַפּפּענדיקס טיש 10). טייַטשן די פינדינגס.
    3. אין טייל ב) איר קאַמפּערד די לערנען גרופּע צו איין קאָמפּאַראַטאָר גרופּע. פּעני אויך קאַמפּערד צו צוויי אנדערע קאָמפּאַראַטאָר גרופּעס: "Infrastructure סעקוריטי" -רעלאַטעד ארטיקלען (אַפּפּענדיקס טיש 11) און פאָלקס וויקיפּעדיע בלעטער (אַפּפּענדיקס טיש 12). קומען אַרויף מיט אַן אנדער ברירה קאָמפּאַראַטאָר גרופּע, און פּרובירן אויב די פינדינגס פון טייל ב) איז שפּירעוודיק צו דיין ברירה פון קאָמפּאַראַטאָר גרופּע. וואָס ברירה פון קאָמפּאַראַטאָר גרופּע מאכט רובֿ חוש? וואָס?
    4. דער מחבר סטייטיד אַז טערמינען רילייטינג צו "טערראָריסם" זענען געניצט צו סעלעקטירן דעם וויקיפּעדיע אַרטיקלען ווייַל די יו רעגירונג סייטאַד טערעריזאַם ווי אַ שליסל טערעץ פֿאַר זייַן אָנליין סערוויילאַנס פּראַקטיסיז. ווי אַ טשעק פון די 48 "טערראָריסם" -רעלאַטעד טערמינען, Penney (2016) אויך באגלייט אַ יבערבליק אויף מטורק אַסקינג ריספּאַנדאַנץ צו קורס יעדער פון טערמינען אין טערמינען פון רעגירונג טראָובלע, פּריוואַטקייט-שפּירעוודיק, און אַוואָידאַנסע (אַפּפּענדיקס טיש 7 און 8). רעפּלאַקייט די יבערבליק אויף מטורק און פאַרגלייַכן דיין רעזולטאַטן.
    5. באַזירט אויף די רעזולטאַטן אין טייל ד) און דיין לייענען פון דעם אַרטיקל, צי איר שטימען מיט דער מחבר 'ס ברירה פון טעמע טערמינען אין די לערנען גרופּע? וואָס אָדער וואָס נישט? אויב נישט, וואָס וואָלט איר פֿאָרשלאָגן אַנשטאָט?
  9. [ גרינג ] Efrati (2016) מעלדעט, באזירט אויף געהיים אינפֿאָרמאַציע, אַז "גאַנץ ייַנטיילונג" אויף Facebook האט דיקליינד דורך וועגן 5.5% יאָר איבער יאָר בשעת "אָריגינעל בראָדקאַסט ייַנטיילונג" איז אַראָפּ 21% יאָר איבער יאָר. דעם אַראָפּגיין איז געווען דער הויפּט אַקוטע מיט Facebook ניצערס אונטער 30 יאר פון עלטער. דער באַריכט אַטריביאַטאַד די אַראָפּגיין צו צוויי סיבות. איינער איז די גראָוט אין די נומער פון "Friends" מענטשן האָבן אויף Facebook. די אנדערע איז אַז עטלעכע ייַנטיילונג טעטיקייט האט שיפטעד צו מעסידזשינג און צו קאָמפּעטיטאָרס אַזאַ ווי Snapchat. דער באַריכט אויך גילוי די עטלעכע טאַקטיק Facebook האט פּרובירן צו בוסט ייַנטיילונג, כולל News קאָרמען אַלגערידאַם טוויקס אַז מאַכן אָריגינעל הודעות מער באַוווסט, ווי ווויל ווי פּעריאָדיקאַל רימיינדערז פון דער אָריגינעל הודעות ניצערס "אויף דעם טאָג" עטלעכע יאָרן צוריק. וואָס ימפּלאַקיישאַנז, אויב קיין, טוט די פינדינגס האָבן פֿאַר ריסערטשערז וואס ווילן צו נוצן Facebook ווי אַ דאַטע מקור?

  10. [ מיטל ] Tumasjan et al. (2010) געמאלדן אַז פּראָפּאָרציע פון טוועעץ מענשאַנינג אַ פּאָליטיש פּאַרטיי מאַטשט די פּראָפּאָרציע פון וואָוץ אַז פּאַרטיי באקומען אין די דייַטש פּאַרלאַמענערי וואַלן אין 2009 (Figure 2.9). אין אנדערע ווערטער, עס ארויס אַז איר קען נוצן טוויטטער צו פאָרויסזאָגן די וואַלן. אין דער צייַט דעם לערנען איז ארויס עס איז געווען באטראכט גאָר יקסייטינג ווייַל עס געווען צו פֿאָרשלאָגן אַ ווערטפול נוצן פֿאַר אַ פּראָסט מקור פון גרויס דאַטן.

    געגעבן די שלעכט פֿעיִקייטן פון גרויס דאַטן, אָבער, איר זאָל מיד ווערן סקעפּטיקאַל פון דעם רעזולטאַט. דייטשישער אויף טוויטטער אין 2009 זענען געווען גאַנץ אַ נאַן-רעפּריזענאַטיוו גרופּע, און סופּפּאָרטערס פון איין פּאַרטיי זאל טוועעט וועגן פּאָליטיק מער אָפֿט. אזוי, עס מיינט חידוש אַז אַלע די מעגלעך בייאַסיז אַז איר געקענט ימאַדזשאַן וואָלט יז באָטל מאַכן אויס. אין פאַקט, די רעזולטאטן אין Tumasjan et al. (2010) זיך אויס צו זיין צו גוט צו זיין אמת. אין זייער פּאַפּיר, Tumasjan et al. (2010) געהאלטן זעקס פּאָליטיש פּאַרטיעס: קריסטלעך דעמאָקראַץ (קדו), קריסטלעך סאציאל דעמאָקראַץ (קסו), ספּד, ליבעראַלס (FDP), די לינקס (די לינקע), און די גרין פּאַרטיי (גרüנע). אָבער, די מערסט דערמאנט דייַטש פּאָליטיש פּאַרטיי אויף טוויטטער בייַ אַז צייַט איז געווען די פּיראַטע פּאַרטיי (פּייראַץ), אַ פּאַרטיי וואָס פיגהץ רעגירונג רעגולירן פון די אינטערנעט. ווען די פּיראַט פּאַרטיי איז ינקלודעד אין די אַנאַליסיס, טוויטטער דערמאנט ווערט אַ שרעקלעך פּרידיקטער פון וואַלן רעזולטאטן (Figure 2.9) (Jungherr, Jürgens, and Schoen 2012) .

    ציפער 2.9: טוויטטער דערמאנט דערשייַנען צו פאָרויסזאָגן די רעזולטאַטן פון די 2009 דייַטש וואַלן (טומאַסדזשאַן עט על. 2010), אָבער דעם רעזולטאַט טורנס אויס צו אָפענגען אויף עטלעכע אַרביטראַריש און אומגערעכט ברירות (דזשונגהערר, דזשüרגענס, און סטשאָען 2012).

    ציפער 2.9: טוויטטער דערמאנט דערשייַנען צו פאָרויסזאָגן די רעזולטאַטן פון די 2009 דייַטש וואַלן (Tumasjan et al. 2010) , אָבער דעם רעזולטאַט טורנס אויס צו אָפענגען אויף עטלעכע אַרביטראַריש און אומגערעכט ברירות (Jungherr, Jürgens, and Schoen 2012) .

    דערנאָך, אנדערע ריסערטשערז אַרום דער וועלט האָבן געוויינט פאַנסיער מעטהאָדס-אַזאַ ווי ניצן סענטימענט אַנאַליסיס צו ויסטיילן צווישן positive און נעגאַטיוו דערמאנט פון די פּאַרטיעס אין סדר צו פֿאַרבעסערן די פיייקייַט פון טוויטטער דאַטן צו פאָרויסזאָגן אַ פאַרשיידנקייַט פון פאַרשידענע טייפּס פון ילעקשאַנז (Gayo-Avello 2013; Jungherr 2015, Ch. 7.) . דאָ ס ווי Huberty (2015) סאַמערייזד די רעזולטאטן פון די אַטטעמפּץ צו פאָרויסזאָגן ילעקשאַנז:

    "אַלע באקאנט פאָרעקאַסטינג מעטהאָדס באזירט אויף געזעלשאַפטלעך מידיאַ האָבן ניט אַנדערש ווען אונטערטעניק צו דעם דעמאַנדס פון אמת פאָרויס-קוקן עלעקטאָראַל פאָרעקאַסטינג. די פאַילורעס דערשייַנען צו זיין רעכט צו פונדאַמענטאַל פּראָפּערטיעס פון געזעלשאַפטלעך מידיאַ, אלא ווי צו מעטאַדאַלאַדזשיקאַל אָדער אַלגאָריטהמיק שוועריקייטן. אין קורץ, געזעלשאַפטלעך מידיאַ טאָן ניט, און מיסטאָמע קיינמאָל וועט, פאָרשלאָגן אַ סטאַביל, אַנבייאַסט, רעפּריזענאַטיוו בילד פון די ילעקטעראַט; און קאַנוויניאַנס סאַמפּאַלז פון געזעלשאַפטלעך מידיאַ פעלן גענוג דאַטן צו פאַרריכטן די פּראָבלעמס פּאָסטן האָק. "

    לייענען עטלעכע פון די פאָרשונג וואָס פירן Huberty (2015) צו אַז מסקנא, און שרייַבן אַ איין בלאַט מעמאָו צו אַ פּאָליטיש קאַנדידאַט דיסקרייבינג אויב און ווי טוויטטער זאָל ווערן געניצט צו פאָרויסזאָגן ילעקשאַנז.

  11. [ מיטל ] וואָס איז די חילוק צווישן אַ סאָוסיאַלאַדזשיסט און אַ היסטאריקער? לויט צו גאָלדטהאָרפּע (1991) , דער הויפּט חילוק צווישן אַ סאָוסיאַלאַדזשיסט און אַ היסטאריקער איז קאָנטראָל איבער דאַטן זאַמלונג. היסטאָריאַנס זענען געצווונגען צו נוצן רעליקס כוועראַז סאָוסיאַלאַדזשיסס קענען שנייַדער זייער דאַטן זאַמלונג צו ספּעציפיש צוועקן. לייענען Goldthorpe (1991) . ווי איז די חילוק צווישן סאָוסיאַלאַדזשי און געשיכטע שייך צו די געדאַנק פון קוסטאָממאַדעס און רעאַדימאַדעס?

  12. [ שווער ] בנין אויף די פרייַערדיק קשיא, Goldthorpe (1991) געצויגן אַ נומער פון קריטיש רעספּאָנסעס, כולל איינער פֿון ניקי האַרט (1994) אַז טשאַלאַדזשד גאָלדטהאָרפּע ס איבערגעגעבנקייט צו שנייַדער געמאכט דאַטן. צו דערקלערן די פּאָטענציעל לימיטיישאַנז פון שנייַדער-געמאכט דאַטן, האַרט דיסקרייבד די אַפפלוענט וואָרקער פּראָיעקט, אַ גרויס יבערבליק צו מעסטן די שייכות צווישן געזעלשאַפטלעך קלאַס און אָפּשטימונג וואָס איז געווען באגלייט דורך גאָלדטהאָרפּע און חברים אין דער מיטן 1960 ס. ווי איינער זאל דערוואַרטן פון אַ געלערנטער וואס פאַוואָרעד דיזיינד דאַטן איבער געפֿונען דאַטן, די אַפפלוענט וואָרקער פּראָיעקט געזאמלט דאַטע וואָס איז געווען טיילערד צו אַדרעס אַ לעצטנס פּראָפּאָסעד טעאָריע וועגן דער צוקונפֿט פון געזעלשאַפטלעך קלאַס אין אַ טקופע פון ​​ינקריסינג לעבעדיק סטאַנדאַרדס. אבער, גאָלדטהאָרפּע און חברים יז "פֿאַרגעסן" צו זאַמלען אינפֿאָרמאַציע וועגן די אָפּשטימונג נאַטור פון ווייבער. דאָ ס ווי ניקי האַרט (1994) סאַמעריז די גאנצע עפּיזאָד:

    ". . . עס [איז] שווער צו ויסמייַדן די מסקנא אַז נשים זענען איבערגעהיפּערט ווייַל דעם 'שנייַדער געמאכט' דאַטאַסעט איז קאָנפינעד דורך אַ פּאַראַדיגמאַטיק לאָגיק וואָס יקסקלודיד ווייַבלעך דערפאַרונג. געטריבן דורך אַ טעאָרעטיש זעאונג פון קלאַס באוווסטזיין און קאַמף ווי זכר פּרעאָקקופּאַטיאָנס. . . , גאָלדטהאָרפּע און זיין חברים קאַנסטראַקטאַד אַ סכום פון עמפּיריקאַל פּראָאָפס וואָס געפֿיטערט און נערטשערד זייער אייגן טעאָרעטיש אַסאַמפּשאַנז אַנשטאָט יקספּאָוזינג זיי צו אַ גילטיק פּרובירן פון אַדאַקוואַסי. "

    האַרט געצויגן:

    "די עמפּיריקאַל פינדינגס פון די אַפפלוענט וואָרקער פּראָיעקט זאָגן אונדז מער וועגן די מאַסקוליניסט וואַלועס פון מיטן יאָרהונדערט סאָוסיאַלאַדזשי ווי זיי מיטטיילן די פּראַסעסאַז פון סטראַטיפיקאַטיאָן, פּאָליטיק און מאַטעריאַל לעבן."

    קענען איר טראַכטן פון אנדערע יגזאַמפּאַלז ווו שנייַדער-געמאכט דאַטן זאַמלונג האט די בייאַסיז פון די דאַטן זאַמלער געבויט אין עס? ווי טוט דעם פאַרגלייַכן צו אַלגאָריטהמיק קאָנפאָונדינג? וואָס ימפּלאַקיישאַנז זאל דעם האָבן פֿאַר ווען ריסערטשערז זאָל נוצן רעאַדימאַדעס און ווען זיי זאָל נוצן קוסטאָממאַדעס?

  13. [ מיטל ] אין דעם קאַפּיטל, איך קאַנטראַסטאַד דאַטן געזאמלט דורך ריסערטשערז פֿאַר ריסערטשערז מיט אַדמיניסטראַטיווע רעקאָרדס Created by קאָמפּאַניעס און גאַווערמאַנץ. עטלעכע מענטשן רופן די אַדמיניסטראַטיווע רעקאָרדס "געפֿונען דאַטן," וואָס זיי קאַנטראַסט מיט "דיזיינד דאַטן." עס איז אמת אַז אַדמיניסטראַטיווע רעקאָרדס זענען געפֿונען דורך ריסערטשערז, אָבער זיי זענען אויך העכסט דיזיינד. לעמאָשל, מאָדערן טעק קאָמפּאַניעס פאַרברענגען ריזיק אַמאַונץ פון צייַט און רעסורסן צו זאַמלען און קוראַטע זייער דאַטן. אזוי, די אַדמיניסטראַטיווע רעקאָרדס זענען ביידע געפֿונען און דיזיינד, עס נאָר דעפּענדס אויף דיין פּערספּעקטיוו (Figure 2.10).

    רעכענען 2.10: די בילד איז ביידע אַ קאַטשקע און אַ קיניגל; וואָס איר זען דעפּענדס אויף דיין פּערספּעקטיוו. רעגירונג און געשעפט אַדמיניסטראַטיווע רעקאָרדס זענען ביידע געפֿונען און דיזיינד; וואָס איר זען דעפּענדס אויף דיין פּערספּעקטיוו. לעמאָשל, די רופן דאַטן רעקאָרדס געזאמלט דורך אַ צעל טעלעפאָנירן פירמע זענען געפֿונען דאַטן פון דער פּערספּעקטיוו פון אַ פאָרשער. אבער, די פּינטלעך זעלביקער רעקאָרדס זענען דיזיינד דאַטן פּערספּעקטיוו פון עמעצער ארבעטן אין די בילינג אָפּטיילונג פון די טעלעפאָנירן פירמע. מקור: וויקיפּעדיע

    רעכענען 2.10: די בילד איז ביידע אַ קאַטשקע און אַ קיניגל; וואָס איר זען דעפּענדס אויף דיין פּערספּעקטיוו. רעגירונג און געשעפט אַדמיניסטראַטיווע רעקאָרדס זענען ביידע געפֿונען און דיזיינד; וואָס איר זען דעפּענדס אויף דיין פּערספּעקטיוו. לעמאָשל, די רופן דאַטן רעקאָרדס געזאמלט דורך אַ צעל טעלעפאָנירן פירמע זענען געפֿונען דאַטן פון דער פּערספּעקטיוו פון אַ פאָרשער. אבער, די פּינטלעך זעלביקער רעקאָרדס זענען דיזיינד דאַטן פּערספּעקטיוו פון עמעצער ארבעטן אין די בילינג אָפּטיילונג פון די טעלעפאָנירן פירמע. מקור: וויקיפּעדיע

    צושטעלן אַ בייַשפּיל פון דאַטן מקור ווו געזען עס ביידע ווי געפֿונען און דיזיינד איז נוציק ווען ניצן אַז דאַטן מקור פֿאַר פאָרשונג.

  14. [ גרינג ] אין אַ פאַרטראַכט עסיי, קריסטלעך סאַנדוויג און עסזטער האַרגיטטאַי (2015) באַשרייַבן צוויי מינים פון דיגיטאַל פאָרשונג, ווו די דיגיטאַל סיסטעם איז "קיילע" אָדער "כייפעץ פון לערנען." אַ בייַשפּיל פון דער ערשטער מין פון לערנען איז ווו בענגצסאָן און חברים (2011) געניצט רירעוודיק טעלעפאָנירן דאַטע צו שפּור מייגריישאַן נאָך די ערדציטערניש אין האיטי אין 2010. אַ משל פון די רגע מין איז ווו Jensen (2007) שטודיום ווי די הקדמה פון מאָביל טעלעפֿאָנען איבער קעראַלאַ, ינדיאַ ימפּאַקטיד די פונקטיאָנינג פון דער מאַרק פֿאַר פיש. איך געפינען דעם נוציק ווייַל עס קלאַריפיעס אַז שטודיום ניצן דיגיטאַל דאַטן קוואלן קענען האָבן גאַנץ אַנדערש צילן אַפֿילו אויב זיי זענען ניצן די זעלבע מין פון דאַטן מקור. אין סדר צו ווייַטער דערקלערן דעם דיסטינגקשאַן, באַשרייַבן פיר שטודיום אַז איר ווע געזען: צוויי וואס נוצן אַ דיגיטאַל סיסטעם ווי אַ קיילע און צוויי אַז נוצן אַ דיגיטאַל סיסטעם ווי אַ כייפעץ פון לערנען. איר קענען נוצן יגזאַמפּאַלז פון דעם קאַפּיטל אויב איר ווילן.