פעילויות

מַפְתֵחַ:

  • דרגת הקושי: קל קַל , בינוני בינוני , קשה קָשֶׁה , קשה מאוד קשה מאוד
  • דורש מתמטיקה ( דורש מתמטיקה )
  • דורש קידוד ( דורש קידוד )
  • איסוף נתונים ( איסוף נתונים )
  • המועדפים שלי ( המועדף עליי )
  1. [ קָשֶׁה , דורש מתמטיקה ] בפרק, הייתי מאוד חיובי על-ריבוד פוסט. עם זאת, זה לא תמיד לשפר את איכות אומדנים. לבנות מצב שבו יכול לכתוב-ריבוד יכול לפגוע באיכות הערכות. (רמז, ראה Thomsen (1973) ).

  2. [ קָשֶׁה , איסוף נתונים , דורש קידוד עיצוב] ו לערוך סקר שאינו הסתברות באמזון MTurk לשאול על החזקת נשק ( "האם אתה, או עושה מישהו בבית שלך, אקדח, רובה או אקדח? זה אתה או מישהו אחר בבית שלך?") ו עמדות כלפי פיקוח על נשק ( "מה לדעתך הן יותר חשובות-מנת להגן על זכותן של אמריקאים לשאת כלי נשק, או לשלוט בעלות אקדח?").

    1. כמה זמן הסקר שלך לקחת? כמה זה עולה? איך את הנתונים הדמוגרפיים של המדגם שלך להשוות את המאפיינים הדמוגרפיים של אוכלוסיית ארה"ב?
    2. מהו אומדן הגלם של החזקת נשק באמצעות המדגם שלך?
    3. נכון עבור-הייצוגיות אי מדגם באמצעות-ריבוד פוסט או טכניקה אחרת. עכשיו מה הוא האומדן של החזקת נשק?
    4. איך הערכות שלך אל להשוות האומדן האחרון ממרכז המחקר Pew? מה דעתך להסביר את הפערים, אם יש בכלל?
    5. חזור על התרגיל 2-5 עבור עמדות כלפי פיקוח על נשק. כיצד הממצאים שלך שונים?
  3. [ קשה מאוד , איסוף נתונים , דורש קידוד ] גואל ועמיתיו (2016) מנוהלים סקר שאינו מבוסס-הסתברות מורכב 49 שאלות רבות ברירת attitudinal נמשכות מתוך הסקר החברתי הכללי (השב"כ) וסקרים בחרו ידי מרכז מחקר Pew באמזון MTurk. לאחר מכן הם להתאים את הייצוגיות-אי נתונים באמצעות מבוסס-מודל שלאחר ריבוד (מר P), ולהשוות את הערכות המותאמות עם מאלה שהוערכו באמצעות מבוססים-הסתברות השב"כ / Pew סקרים. לנהל אותו הסקר על MTurk ולנסות לשכפל איור 2 א ו -2 ב איור ידי השוואת אומדני המתואם שלך עם הערכות של הסיבובים האחרונים של השב"כ / Pew (ראה טבלת A2 עבור הרשימה של 49 שאלות).

    1. להשוות תוצאות שלך לתוצאות מ Pew והשב"כ.
    2. להשוות תוצאות שלך לתוצאות מהסקר MTurk ב Goel, Obeng, and Rothschild (2016) .
  4. [ בינוני , איסוף נתונים , דורש קידוד ] מחקרים רבים להשתמש באמצעי דיווח עצמי של נתוני פעילות הטלפון ניידים. זוהי הגדרה מעניינת שבו חוקר להשוות התנהגות בדיווח עצמי התנהגות שהייתה מחוברת (ראה, למשל, Boase and Ling (2013) ). שתי התנהגויות נפוצות לשאול על קוראי הודעות SMS, ושתי מסגרות זמן נפוץ הן "אתמול" ו- "בשבוע האחרון."

    1. לפני איסוף כל נתונים, אשר אמצעי הדיווח העצמי לדעתך יותר מדויק? למה?
    2. לגייס 5 החברים שלך להיות בסקר שלך. אנא בקצרה איך 5 חברים אלה נדגמו. אולי שיטת דגימה זה לגרום מגמות שונות בהערכות שלך?
    3. אנא שאל אותם במייקרו-הסקר הבא:
    • "כמה פעמים אמרתי לך להשתמש בטלפון הנייד כדי להתקשר לאחרים אתמול?"
    • "כמה הודעות טקסט שלחת אתמול?"
    • "כמה פעמים אמרתי לך להשתמש בטלפון הנייד שלך לקרוא לאחרים בשבעת הימים האחרונים?"
    • "כמה פעמים עשו לך להשתמש בטלפון הנייד שלך כדי לשלוח או לקבל הודעות טקסט / SMS בשבעת הימים האחרונים?" לאחר השלמת הסקר, לשאול כדי לבדוק את נתוני השימוש שלהם כמו הנרשם על-ידי ספק הטלפון או שירות שלהם.
    1. איך עצמי אין בדו"ח שימוש להשוות נתוני יומן? וזה הכי מדויק, שהוא לפחות מדויק?
    2. עכשיו לשלב את הנתונים שאספתם עם הנתונים מאנשים אחרים בכיתה שלך (אם אתה עושה הפעילות הזה בכיתה). עם מערך נתונים גדול זה, חזור חלק (ד).
  5. [ בינוני , איסוף נתונים ] שומאן ו פרסר (1996) טוענים כי צווי השאלה היה משנה עבור שני סוגים של יחסים בין שאלות: שאלות חלקי חלק שבו שתי שאלות הן באותה הרמה של סגוליות (למשל דירוגים של שני מועמדים לנשיאות); ושאלות-כולו חלק שבו שאלה כללית כדלקמן שאלה ספציפית יותר (למשל לשאול "באיזו מידה אתה עם העבודה שלך?" ואחריו "באיזו מידה אתה עם החיים שלך?").

    הם להמשיך לאפיין שני סוגים של שפעת שאלת סדר: השפעות עקביות להתרחש כאשר תשובות לשאלה מאוחר מובאים קרובים (ממה שהיה יכול להיות אחר) לאלו הניתנים שאלה קודמת; בניגוד תופעות להתרחש כאשר יש הבדלים גדולים בין התשובות לשתי השאלות.

    1. נוצר צמד שאלות במשרה חלקית כי אתה חושב יהיה השפעה מנת שאלה גדולה, זוג השאלות-כל חלק שאתה חושב יהיה השפעת הזמנה גדולה, ועם עוד צמד שאלות שסדר אתה חושב שלא משנה. הפעל ניסוי סקר על MTurk לבדוק השאלות שלך.
    2. כמה גדול היה אפקט במשרה חלקית היית מסוגל ליצור? האם זו השפעה עקבית או ניגוד?
    3. כמה גדול היה חלק-כולו האפקט היית מסוגל ליצור? האם זו השפעה עקבית או ניגוד?
    4. האם יש השפעה על מנת שאלה בצמד שלך שבו אתה לא חושב שזאת הפקודה הייתה משנה?
  6. [ בינוני , איסוף נתונים בניית] על עבודתו של שומאן ו פרסר, Moore (2002) מתאר ממד נפרד של אפקט סדר השאלות: תוספים ו חיסור. בעוד תופעות בניגוד ועקביויות מיוצרות כתוצאה "ערכות המשיבות מיום שני הפריטים ביחס לכל, תוסף אחר ואפקטי תוסף מיוצרים כאשר משיבים נעשים יותר רגישים במסגרת הרחבה שבו השאלות נשאלות. קרא Moore (2002) , ולאחר מכן לעצב להפעיל ניסוי סקר על MTurk להפגין תופעות כתוסף או חיסור.

  7. [ קָשֶׁה , איסוף נתונים ] כריסטופר Antoun ועמיתיו (2015) ערכו מחקר השוואת דגימות הנוחות המתקבלות מארבעה מקורות גיוס מקוונים שונים: MTurk, קרייגסליסט, Google AdWords ו- Facebook. עיצוב סקר פשוט לגייס משתתפים דרך לפחות שני מקורות גיוס מקוון שונים (הם יכולים להיות מקורות שונים מהארבעה המקורות המשמשים Antoun et al. (2015) ).

    1. השווה את עלות גיוס, במונחים של כסף וזמן, בין מקורות שונים.
    2. השווה את רכב הדגימות שהתקבלו ממקורות שונים.
    3. השווה את איכות הנתונים בין הדגימות. לקבלת רעיונות לגבי כיצד למדוד איכות נתוני המשיבים, ראה Schober et al. (2015) .
    4. מהו המקור המועדף עליך? למה?
  8. [ בינוני ] YouGov, חברת מחקר שוק באמצעות האינטרנט, שנערך סקרים מקוונים של פאנל של כ 800,000 המשיבים בבריטניה והשתמשו מר פ לחזות את התוצאה של משאל עם האיחוד האירופי (כלומר, Brexit) שבו הבוחרים בבריטניה להצביע או להישאר או לעזוב את האיחוד האירופי.

    תיאור מפורט של המודל הסטטיסטי של YouGov הוא כאן (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). באופן כללי, YouGov מחיצות הבוחרים לסוגים מבוססים על 2015 החלטה על אופן הצבעה כללית בבחירות, גיל, כישורים, מין, תאריך הראיון, כמו גם את הציבור הם חיים. ראשית, הם השתמשו בנתונים שנאספו חברי פנל YouGov להעריך, בין אלה מי להצביע, חלקם של אנשים מכל סוג בוחר המתכוונים להצביע Leave. להערכתם שיעור של כל סוג הבוחר באמצעות לחקר 2015 הבריטי הבחירות (BES) סקר פנים אל פנים שלאחר הבחירות, אשר תוקף שיעור מן לחמניות הבחירות. לבסוף, הם להעריך כמה אנשים יש בכל אחד מסוגים בוחרים בקרב הציבור הבוחר מבוסס על מפקד העדכנית אוכלוסיית סקר השנתי (עם קצת מידע נוסף מן BES, נתוני סקר YouGov מרחבים בבחירות הכלליות, והמידע על כמה אנשים הצביעו בעד כל צד בכל ציבור).

    שלושה ימים לפני ההצבעה, YouGov הראה יתרון של שתי נקודות רשות. ערב ההצבעה, הסקר הראה קרוב מדי לקרוא (49-51 הישארו). הגמר ב- the-יום עיון חזה 48/52 לטובת הישארו (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). למעשה, הערכה זו החמיצה את התוצאה הסופית (52-48 Leave) על ידי ארבע נקודות אחוז.

    1. השתמש מסגרת שגיאת סקר הכולל שנדונה בפרק זה להעריך מה יכול היה להשתבש.
    2. תגובת YouGov לאחר הבחירות (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) הסביר: "זה נראה בחלק גדול בשל שיעור - משהו שאמרנו כל זמן יהיה משקל מכריע לגבי התוצאות של כזה גזע מאוזן היטב. מודל ההשתתפות שלנו התבססה, בין השאר, בשאלה אם המשיבים הצביעו בבחירות הכלליות האחרונות רמת ההשתתפות לעיל כי הבחירות הכלליות להרגיז את המודל, במיוחד בצפון. "האם זה ישנה תשובתך חלק (א)?
  9. [ בינוני , דורש קידוד ] כתוב סימולציה כדי להמחיש לכל אחת מהשגיאות ייצוג באיור 3.1.

    1. ליצור מצב שבו שגיאות אלו למעשה לבטל.
    2. ליצור מצב שבו השגיאות מתחמות זה לזה.
  10. [ קשה מאוד , דורש קידוד ] המחקר של Blumenstock ועמיתיו (2015) מעורב בבניית מודל למידה מכונה שיכול להשתמש בנתוני עקבות דיגיטליים לחזות תוצאות סקר. עכשיו, אתה הולך לנסות את אותו הדבר עם בסיס נתונים שונים. Kosinski, Stillwell, and Graepel (2013) מצא כי פייסבוק אוהב יכול לחזות תכונותיו תכונות בודדות. באופן מפתיע, תחזיות אלו יכולים להיות אפילו יותר מדויקים מאשר אלו של חברים ועמיתים (Youyou, Kosinski, and Stillwell 2015) .

    1. קרא Kosinski, Stillwell, and Graepel (2013) , ולשכפל איור 2. נתונים שלהם זמינים כאן: http://mypersonality.org/
    2. עכשיו, לשכפל איור 3.
    3. לבסוף, נסה המודל שלהם על נתונים פייסבוק משלך: http://applymagicsauce.com/. כמה טוב זה עובד בשבילך?
  11. [ בינוני ] Toole et al. (2015) שיחת שימוש רשום פרט (CDRs) מטלפונים ניידים לחזות מגמות אבטלה המצרפי.

    1. השווה לעומת העיצוב של Toole et al. (2015) עם Blumenstock, Cadamuro, and On (2015) .
    2. האם אתה חושב CDRs צריך להחליף סקרים מסורתיים, משלים אותם או לא לשמש בכלל עבור קובעי מדיניות בממשלה לעקוב אבטלה? למה?
    3. אילו ראיות לשכנע אותך CDRs יכול להחליף אמצעים מסורתיים לחלוטין של שיעור האבטלה?