فعالیت

  • درجه سختی: آسان آسان ، متوسط متوسط ، سخت سخت ، خیلی سخت خیلی سخت
  • نیاز به ریاضی ( نیاز به ریاضی دارد )
  • نیاز به برنامه نویسی ( نیاز به برنامه نویسی دارد )
  • جمع آوری اطلاعات ( جمع آوری داده ها )
  • علایق من ( مورد علاقه من )
  1. [ سخت ، نیاز به ریاضی دارد ] در فصل، من در مورد پس از طبقه بندی بسیار مثبت بود. با این حال، این همیشه کیفیت تخمین ها را بهبود نمی بخشد. ایجاد یک وضعیت که پس از طبقه بندی می تواند کیفیت برآوردها را کاهش دهد. (برای یک اشاره، به Thomsen (1973) .)

  2. [ سخت ، جمع آوری داده ها ، نیاز به برنامه نویسی دارد ] طراحی و انجام یک نظرسنجی غیر احتمالی در آمازون مکانیک ترک در مورد مالکیت اسلحه و نگرش نسبت به کنترل اسلحه. به طوری که شما می توانید برآوردهای خود را با کسانی که از نمونه احتمالی استخراج می شوند مقایسه کنید، لطفا متن سوال و گزینه های پاسخ را مستقیما از یک نظرسنجی با کیفیت بالا مانند کسانی که توسط مرکز تحقیقاتی Pew اداره می شوند، کپی کنید.

    1. چه مدت بررسی شما انجام می شود؟ قیمت آن چند است؟ چگونه جمعیت شناسی نمونه شما با جمعیت جمعیت ایالات متحده مقایسه می شود؟
    2. ارزیابی خام از مالکیت تفنگ با استفاده از نمونه شما چیست؟
    3. برای عدم بیان نمونه خود با استفاده از طبقه بندی پس از آن یا روش دیگری اصلاح کنید. اکنون برآورد مالکیت اسلحه چیست؟
    4. چگونه برآوردهای شما با آخرین تخمین از یک نمونه مبتنی بر احتمالات مقایسه می شود؟ چه چیزی فکر می کنید، اختلافات را توضیح می دهد، اگر وجود داشته باشد؟
    5. سؤالات تکراری (ب) - (د) برای نگرش به کنترل اسلحه. چگونه یافته های شما متفاوت است؟
  3. [ خیلی سخت ، جمع آوری داده ها ، نیاز به برنامه نویسی دارد ] Goel و همکارانش (2016) 49 سوال سوالات چند گزینه ای را که از نظر عمومی اجتماعی (GSS) گرفته شده اند، توسط بررسی مرکز تحقیقاتی پیو انتخاب شده اند تا نمونه های غیر احتمالی پاسخ دهندگان از آمازون مککرات ترک را انتخاب کنند. سپس آنها را برای عدم ارزیابی داده ها با استفاده از طبقه بندي مبتنی بر مدل تعدیل کرده و برآوردهای تعدیل شده خود را با آن ها از نظرسنجی های احتمال مبتنی بر GSS و Pew مقایسه کردند. انجام همان نظرسنجی در مورد آمازون مکانیکر ترک و سعی کنید تکرار شکل 2a و شکل 2b با مقایسه برآوردهای تنظیم شده خود را با برآوردهای از جدیدترین دوران بررسی GSS و Pew. (جدول ضمیمه جدول A2 برای فهرست 49 سوال را ببینید)

    1. مقایسه و مقایسه نتایج خود را با کسانی که از Pew و GSS.
    2. مقایسه و مقایسه نتایج خود را با کسانی که از بررسی مکانیک ترک در Goel, Obeng, and Rothschild (2016) .
  4. [ متوسط ، جمع آوری داده ها ، نیاز به برنامه نویسی دارد ] بسیاری از مطالعات استفاده از تلفن همراه خود را گزارش می دهند. این یک محیط جالب است که محققان می توانند رفتار خود گزارش شده با رفتار ورودی را مقایسه کنند (به عنوان مثال، Boase and Ling (2013) ). دو رفتار مشترک برای پرسیدن در مورد تماس و پیام کوتاه است، و دو فریم زمان مشترک، "دیروز" و "در هفته گذشته است."

    1. قبل از جمع آوری داده ها، کدامیک از اقدامات گزارش خود را به نظرتان دقیق تر است؟ چرا؟
    2. پنج نفر از دوستان خود را در نظر سنجی خود قرار دهید. لطفا به طور خلاصه نحوه نمونه برداری این پنج دوست را خلاصه کنید. آیا این روش نمونه گیری ممکن است برآورد های خاصی را ایجاد کند؟
    3. از سوالات زیر به پرسش های زیر پاسخ دهید:
    • "چند بار از تلفن همراه خود برای دیروز با دیگران تماس گرفتید؟"
    • "چند پیام نوشتاری دیروز فرستادید؟"
    • "چند بار از تلفن همراه خود برای تماس با دیگران در هفت روز گذشته استفاده کرده اید؟"
    • "چند بار از تلفن همراه خود برای ارسال یا دریافت پیام های متنی / پیامک در هفت روز گذشته استفاده کرده اید؟"
    1. پس از اتمام این میکروسکوپ، درخواست داده های مربوط به استفاده خود را از طریق تلفن یا ارائه دهنده خدمات خود وارد کنید. نحوه استفاده از گزارش خود نسبت به ورود به سیستم چگونه است؟ کدام دقیق ترین است، که حداقل دقیق است؟
    2. اکنون داده هایی را که با داده های دیگران در کلاس خود جمع آوری کرده اید ترکیب کنید (اگر این فعالیت را برای یک کلاس انجام می دهید). با استفاده از این مجموعه بزرگتر، قسمت (d) را تکرار کنید.
  5. [ متوسط ، جمع آوری داده ها ] Schuman و Presser (1996) معتقدند که دستورات سؤالی برای دو نوع پرسش مهم هستند: سوالات بخشی که در آن دو سوال در سطح یکسان بودن ویژگی (به عنوان مثال، رتبه بندی دو نامزد ریاست جمهوری)؛ و سؤالات جزئی تمام وقت که یک سوال کلی به یک سوال خاص جواب می دهد (به عنوان مثال، پرسیدن «چگونه با کارتان راضی هستید؟» و «چگونه با زندگی خود راضی هستید؟»).

    آنها دو نوع نظم نظم را توصیف می کنند: اثرات انسجام زمانی اتفاق می افتد که پاسخ هایی که به سوال بعدی می آیند نسبت به آنچه که به سوال قبلی داده شده نزدیک ترند (نسبت به موارد دیگر). اثرات کنتراست رخ می دهد زمانی که تفاوت های زیادی بین پاسخ به دو سوال وجود دارد.

    1. یک سوالی از بخش بخشی ایجاد کنید که فکر می کنید اثر بزرگ نظم بزرگ داشته باشید. یک جفت سوال تمام بخش که شما فکر می کنید اثر نظم بزرگ داشته باشد؛ و یک جفت سوال که سفارش شما فکر می کنید مهم نیست. برای بررسی سوالات خود یک آزمایش نظرسنجی در آمازون مکانیک ترک انجام دهید.
    2. چقدر توانسته بود بخشی از بخشی را ایجاد کند؟ این یک اثر سازگاری یا کنتراست بود؟
    3. چقدر می توانست اثر بخشی کامل را ایجاد کند؟ این یک اثر سازگاری یا کنتراست بود؟
    4. آیا نظم اثر سؤال در جفت شما وجود داشت که در آن شما فکر نکردید نظم مهم است؟
  6. [ متوسط ، جمع آوری داده ها Moore (2002) بر اساس کار شومان و مطبوعات، یک بعد جداگانه از نظریه اثر را شرح می دهد: اثرات افزودنی و کم اثر. در حالی که اثرات کنتراست و سازگاری به عنوان یک نتیجه از ارزیابی پاسخ دهندگان از دو مورد در رابطه با یکدیگر تولید می شود، اثرات افزودنی و تفریق زمانی ایجاد می شود که پاسخ دهندگان نسبت به چارچوب بزرگتر که در آن سوالات مطرح می شود، حساس تر می شود. دفعات بازدید: Moore (2002) ، پس از آن طراحی و اجرای آزمایش بررسی در MTurk برای نشان دادن اثرات افزودنی و یا کم اثر.

  7. [ سخت ، جمع آوری داده ها ] کریستوفر آنتون و همکارانش (2015) مطالعه ای را انجام دادند که نمونه های راحتی آن را از چهار منبع مختلف منابع آنلاین آنلاین MTurk، Craigslist، Google AdWords و فیس بوک مقایسه کردند. طراحی یک نظرسنجی ساده و شرکت کنندگان را از طریق حداقل دو منبع مختلف منابع آنلاین استخدام کنید (این منابع می توانند متفاوت از چهار منبع مورد استفاده در Antoun et al. (2015) ).

    1. مقایسه هزینه های مربوط به استخدام - از لحاظ پول و زمان - بین منابع مختلف.
    2. مقایسه ترکیبات نمونه های حاصل از منابع مختلف را مقایسه کنید.
    3. مقایسه کیفیت داده ها بین نمونه ها. برای ایده هایی درباره چگونگی اندازه گیری کیفیت داده ها از پاسخ دهندگان، نگاه کنید به Schober et al. (2015) .
    4. منبع مورد نظر شما چیست؟ چرا؟
  8. [ متوسط ] در تلاش برای پیش بینی نتایج رأی دهی اتحادیه اروپا در سال 2016 (یعنی Brexit)، YouGov، یک شرکت تحقیقاتی در زمینه بازار اینترنتی، نظرسنجی های آنلاین را در اختیار پانل حدود 800،000 پاسخ دهنده در انگلستان قرار داد.

    شرح مفصلی از مدل آماری YouGov را می توانید در https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/ پیدا کنید. به طور خلاصه، YouGov رای دهندگان را براساس رای رای انتخابات عمومی سال 2015، سن، تحصیلات، جنسیت و تاریخ مصاحبه و همچنین حوزه ای که در آن زندگی می کردند، تقسیم می کند. اولا، از داده های جمع آوری شده از اعضای هیئت مدیره YouGov استفاده می شود تا از میان رای دهندگان، میزان افراد هر نوع رای دهنده ای که قصد رای دادن را دارند، تخمین بزنند. آنها با استفاده از مطالعه انتخابات بریتانیا 2015 (BES)، یک نظرسنجی صورت گرفته در انتخابات پس از انتخابات، که انتخابات را از رأی گیری های انتخاباتی تأیید کرد، برآورد می کند که هر نوع رای دهندگان را انتخاب کند. سرانجام، براساس آخرین آمار و ارقام سالانه جمعیت (با برخی اطلاعات اضافی از سایر منابع داده شده)، تعداد افرادی که از هر نوع رای دهندگان در انتخابات برآورد شده بودند، وجود داشت.

    سه روز قبل از رای گیری، YouGov دو طرفه را برای Leave نشان داد. در آستانه رای گیری، نظرسنجی نشان داد که نتیجه تماس بسیار نزدیک بود (49/51 Remain). در این مطالعه نهایی، 48/52 به نفع Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/) پیش بینی شده است. در واقع، این برآورد، نتیجه نهایی (52/48 ترک) را با 4 درصد از دست داد.

    1. از چارچوب خطای بررسی کلی بررسی شده در این فصل برای ارزیابی آنچه که ممکن است اشتباه گرفته شود استفاده کنید.
    2. پاسخ شما پس از انتخابات YouGov (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) توضیح داد: "این به نظر می رسد در بخش بزرگی به دلیل حضور در بازار، چیزی است که ما همه چیز را بیان کرده ایم تا نتیجه چنین مسابقه ای دقیق و متعادل داشته باشیم. مدل مشارکت ما بر اساس اینکه پاسخ دهندگان در آخرین انتخابات عمومی رای مثبت داده بودند، و سطح حضور در انتخابات بالاتر از انتخابات عمومی، مدل را به خصوص در شمال تغییر دادند. آیا این پاسخ شما را به بخش (a) تغییر می دهد؟
  9. [ متوسط ، نیاز به برنامه نویسی دارد ] یک شبیه سازی برای نشان دادن هر یک از خطاهای نمایشی در شکل 3.2 بنویسید.

    1. ایجاد یک وضعیت که این خطاها واقعا حذف می شوند.
    2. ایجاد یک وضعیت که در آن خطا متصل یکدیگر.
  10. [ خیلی سخت ، نیاز به برنامه نویسی دارد ] تحقیق Blumenstock و همکارانش (2015) ساخت یک مدل یادگیری ماشین را که می تواند داده های ردیابی دیجیتال را برای پیش بینی پاسخ های نظرسنجی استفاده کند. در حال حاضر، شما می خواهید یک مورد با یک مجموعه داده های مختلف را امتحان کنید. Kosinski, Stillwell, and Graepel (2013) دریافتند که Kosinski, Stillwell, and Graepel (2013) فیس بوک میتواند صفات و ویژگیهای فردی را پیش بینی کند. به طور شگفت انگیز، این پیش بینی ها می تواند حتی دقیق تر از دوستان و همکاران (Youyou, Kosinski, and Stillwell 2015) باشد.

    1. خواندن Kosinski, Stillwell, and Graepel (2013) و تکرار رقم 2. داده های آنها در http://mypersonality.org/ در دسترس است
    2. در حال حاضر، تکرار شکل 3.
    3. در نهایت، مدل خود را بر روی اطلاعات فیس بوک خود آزمایش کنید: http://applymagicsauce.com/. برای شما خوب است؟
  11. [ متوسط ] Toole et al. (2015) استفاده از جزئیات تماس (CDRs) از تلفن های موبایل برای پیش بینی روند کلی بیکاری.

    1. مقایسه و مقایسه طراحی مطالعه Toole et al. (2015) با Blumenstock, Cadamuro, and On (2015) .
    2. آیا فکر می کنید CDR ها باید جایگزین نظرسنجی های سنتی شوند، آنها را تکمیل و یا برای سیاست گذاران دولتی برای پیگیری بیکاری استفاده نکنند؟ چرا؟
    3. چه مدارکی شما را متقاعد می کند که CDR ها می توانند به طور کامل جایگزین اقدامات سنتی نرخ بیکاری شوند؟