дейности

Key:

  • степен на трудност: лесно лесно , среден среда , твърд твърд , много трудно много трудно
  • изисква математика ( изисква по математика )
  • изисква кодиране ( изисква кодиране )
  • събиране на данни ( събиране на данни )
  • любимите ми ( Моят фаворит )
  1. [ твърд , изисква по математика ] В главата, бях много положително за пост-стратификация. Въпреки това, тя не винаги се подобри качеството на оценките. Построява се ситуация, в която може да пусне-стратификация може да намали качеството на оценките. (За намек, вижте Thomsen (1973) ).

  2. [ твърд , събиране на данни , изисква кодиране ] Проектиране и провеждане на анкета, която не е вероятност на Amazon MTurk да попитам за притежаване на оръжие ( "Смятате ли, или има ли някой във вашето домакинство, притежава пистолет, пушка или пистолет? Е, че вие ​​или някой друг във вашето домакинство?") И нагласи към контрол пистолет ( "Какво според вас е по-важно-да се защити правото на американците да притежават оръжие, или да се контролира притежаване на оръжие?").

    1. Колко време отнема вашата анкета? Колко струва? Как демографията на вашата проба се сравни с демографията на населението на САЩ?
    2. Какво е най-сурова оценка на притежаване на оръжие, използвайки вашата проба?
    3. Точен за не-представителността на вашата проба с помощта на пост-стратификация или някаква друга техника. Сега каква е прогнозата за притежаване на оръжие?
    4. Как вашите прогнози се сравняват с най-новата оценка от Pew Research Center? Какво мислите обясни несъответствията, ако има такива?
    5. Повторете упражнението 2-5 за отношението към контрола върху оръжията. Как да си констатации се различават?
  3. [ много трудно , събиране на данни , изисква кодиране ] Goel и колеги (2016) , прилагани без вероятност на базата на проучване, състояща се от 49 с избор от няколко нагласата към въпроса, изготвени от General Social Survey (GSS) и изберете изследванията от изследователския център Pew на Amazon MTurk. След това те се коригира за не-представителността на данни с използване на модел на базата на пост-стратификация (г-н P), и сравняване на коригирани оценките с тези, определени с помощта на вероятностите-базирани GSS / Пю проучвания. Провеждане на същото изследване на MTurk и се опита да възпроизведе фигура 2а и фигура 2b чрез сравняване на коригираните си оценки с оценките от последните кръгове на GSS / Pew (Виж Приложение Таблица A2 за списъка от 49 въпроса).

    1. Сравняват и съпоставят резултатите си за резултатите от Pew и GSS.
    2. Сравняват и съпоставят резултатите си за резултатите от проучването MTurk в Goel, Obeng, and Rothschild (2016) .
  4. [ среда , събиране на данни , изисква кодиране ] Много проучвания използват мерки самостоятелно доклад на данните мобилни телефони дейност. Това е една интересна обстановка, където изследователите могат да сравняват себе съобщава поведение с регистриран поведение (виж например, Boase and Ling (2013) ). Две общи поведение, за да питат за звъните и изпращане на текстови съобщения, както и две общ времеви рамки са "вчера" и "през ​​изминалата седмица."

    1. Преди събирането на всички данни, които на самостоятелно доклада мерки според вас е по-точно? Защо?
    2. Набиране 5 на приятелите си, за да бъде във вашата анкета. Моля, опишете накратко как са били взети проби тези 5 приятели. Може тази процедура за вземане на проби се индуцира специфични отклонения в прогнозите си?
    3. Моля, попитайте ги следната микро-изследване:
    • "Колко пъти сте използвали мобилен телефон да се обадя на другите вчера?"
    • "Колко текстови съобщения са ви изпрати вчера?"
    • "Колко пъти да използвате мобилния си телефон, за да се обадя на другите в последните седем дни?"
    • "Колко пъти да използвате мобилния си телефон, за да изпращат или получават текстови съобщения / SMS в последните седем дни?" След като проучването е пълна, да поиска да се провери своите данни за употребата като влезете с телефона си или доставчик на услуги.
    1. Как използване самостоятелно доклад за сравнение, за да влезете данни? Коя е най-точното, което е най-малко точни?
    2. Сега се комбинират данните, които са събрани с данните от други хора в класа си (ако сте прави тази дейност в продължение на един клас). С този голям набор от данни, повторете част (г).
  5. [ среда , събиране на данни ] Шуман и притискащото (1996) твърдят, че поръчките въпрос би имало значение за два вида отношения между въпроси: непълно част на въпроса, където два въпроса са на същото ниво на специфичност (например рейтинги на двете президентски кандидати); и част-цяло въпроса къде общ въпрос следва по-конкретен въпрос (напр питат "Как сте доволни от работата си?", последван от "Доколко сте доволни от живота си?").

    Освен това те се характеризират два вида въпрос, за ефект: консистенция ефекти се появяват, когато отговори на по-късен въпрос са донесли по-близо (отколкото иначе би било) на тези, дадени на по-ранна въпрос; контрастни реакции се появят, когато има големи разлики между отговорите на два въпроса.

    1. Създаване на чифт детайл-детайл въпроси, които според Вас ще има голям ефект въпрос ред, чифт част-цяло въпроси, които според Вас ще има голям ефект цел, и друг чифт въпроси, чиито ред мислите, нямаше да има значение. Изпълнение на експеримент проучване на MTurk за тестване на вашите въпроси.
    2. Колко голям е бил част-част ефект сте били в състояние да се създаде? Беше ли последователност или контрастен ефект?
    3. Колко голям е бил част-цяло ефектът сте били в състояние да се създаде? Беше ли последователност или контрастен ефект?
    4. Имаше един въпрос, за ефект във вашата двойка, където можете не мисля, че заповедта да има значение?
  6. [ среда , събиране на данни ] Въз основа на работата на Шуман и притискащото, Moore (2002) описва отделно измерение на въпроса, за ефект: добавка и изваждане. Докато контрастни и консистенция ефекти са произведени в резултат на оценките на двете позиции на респондентите по отношение един към друг, добавка и изваждане ефекти са произведени, когато респондентите са направени по-чувствителни към по-голямата рамка, в която се поставя на въпросите. Прочетете Moore (2002) , а след това се проектира и да се извърши експеримент проучване на MTurk да демонстрира адитивен или изваждане ефекти.

  7. [ твърд , събиране на данни ] Кристофър Antoun и колеги (2015) провеждат проучване, сравняващо пробите удобство, получени от четири различни онлайн източници за набиране: MTurk, Craigslist, Google AdWords и Facebook. Дизайн прост проучване и привличане на участници чрез най-малко два различни източника онлайн набиране (те могат да бъдат различни източници от четирите източници, използвани в Antoun et al. (2015) ).

    1. Сравнете цената на новобранец, от гледна точка на пари и време, между различни източници.
    2. Сравнете състава на проби, получени от различни източници.
    3. Сравнете качеството на данни между пробите. За идеи за това как да се измери качеството на данните от анкетираните, вижте Schober et al. (2015) .
    4. Какво е източникът? Защо?
  8. [ среда ] YouGov, интернет-базирана компания за пазарни проучвания, проведено онлайн анкети на група от около 800 000 респонденти във Великобритания и използва н P. да се предскаже резултата от референдума в ЕС (т.е., Brexit), където избирателите Великобритания гласуват или да останат в или да напусне Европейския съюз.

    Подробно описание на статистически модел YouGov е тук (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Грубо казано, YouGov разделя избирателите в типа на базата на 2015 общи избори избор гласуване, възраст, квалификация, пол, дата на интервю, както и избирателите, които те живеят. Първо, те са използвали данни, събрани от панелистите YouGov за оценка, сред тези, които гласуват, делът на хората от всеки тип избирател, които възнамеряват да гласуват отпуск. Те смятат, избирателната активност на всеки тип избирател с помощта на британската избирателна изследване на 2015 г. (BES) след изборите лице в лице проучване, което валидиран избирателна активност от избирателните списъци. И накрая, те се прецени колко хора има на всеки тип избирател в електората на базата на последното преброяване на населението и Годишно изследване на населението (с някои допълнение информация от BES, данни YouGov изследване от около изборите, както и информация за това как много хора са гласували за всяка от страните във всеки избирателен район).

    Три дни преди гласуването, YouGov показва две точки преднина за отпуск. В навечерието на гласуването, анкетата показа твърде близо до наричаме (49-51 Remain). окончателното проучване на на-на деня прогнозира 48/52 в полза на Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). В действителност, тази оценка пропусна крайния резултат (52-48 отпуск) с четири процентни пункта.

    1. Използвайте общата рамка грешка проучване обсъжда в тази глава, за да се оцени това, което би могло да се обърка.
    2. отговор YouGov след изборите (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) обяснява: "Това изглежда в голяма степен се дължи на избирателна активност - нещо, което казахме всички заедно ще бъде от решаващо значение за изхода на такъв фино балансиран раса. Нашата избирателна активност модел се основава отчасти, от това дали респондентите са гласували в последните общи избори и на ниво избирателна активност над тази на общите избори разстрои модела, особено на север. "Това променя ли отговор на въпроса си към част (а)?
  9. [ среда , изисква кодиране ] Добави симулация, за да илюстрират всяка от грешките на представителство на фигура 3.1.

    1. Създаване на ситуация, в която тези грешки всъщност неутрализират.
    2. Създаване на ситуация, в която грешките утежняват помежду си.
  10. [ много трудно , изисква кодиране ] Изследването на Blumenstock и колеги (2015) участва изграждане модел машина, обучение, които биха могли да използват цифрови данни следи да се предскаже отговорите от проучването. Сега, вие ще се опитате едно и също нещо с различен набор от данни. Kosinski, Stillwell, and Graepel (2013) установи, че Facebook харесва може да предскаже индивидуални черти и качества. Изненадващо, тези прогнози може да бъде дори по-точни от тези на приятели и колеги (Youyou, Kosinski, and Stillwell 2015) .

    1. Прочетете Kosinski, Stillwell, and Graepel (2013) , и репликира Фигура 2. са на разположение Техните данни тук: http://mypersonality.org/
    2. Сега, репликира Фигура 3.
    3. И накрая, опитайте техния модел на собствения си Facebook данни: http://applymagicsauce.com/. Колко добре работи тя за вас?
  11. [ среда ] Toole et al. (2015) подробно употреба повикване записи (CDR) от мобилни телефони, за да прогнозират съвкупните тенденции безработица.

    1. Сравняват и съпоставят дизайна на Toole et al. (2015) с Blumenstock, Cadamuro, and On (2015) .
    2. Смятате ли, че CDR, следва да заменят традиционните изследвания, като ги допълват или не се използват изобщо за държавни политиците да следите безработица? Защо?
    3. Какви доказателства ще ви убеди, че CDR, може напълно да замени традиционните мерки на равнището на безработица?