дейности

  • степен на трудност: лесно лесно , средно среда , твърд твърд , много трудно много трудно
  • изисква математика ( изисква математика )
  • изисква кодиране ( изисква кодиране )
  • събиране на данни ( събиране на данни )
  • любимите ми ( Моят фаворит )
  1. [ твърд , изисква математика ] В главата бях много позитивна пост-стратификация. Това обаче не винаги подобрява качеството на оценките. Изградете ситуация, при която след стратификацията може да се намали качеството на оценките. (За намек, вижте Thomsen (1973) .)

  2. [ твърд , събиране на данни , изисква кодиране ] Проектиране и провеждане на проучване за невъзможност на Amazon Mechanical Turk да попита за собствеността на оръжието и отношението към оръжейния контрол. За да можете да сравните оценките си с тези, получени от вероятностна проба, копирайте текста на въпроса и опциите за отговор директно от висококачествено проучване, като тези, проведени от Pew Research Center.

    1. Колко време от вашето проучване? Колко струва? Как се сравняват демографските данни на вашата извадка с демографските данни на американското население?
    2. Каква е суровата оценка за собствеността на оръжието, използвайки пробата ви?
    3. Коригирайте за непредставеността на вашата проба, като използвате пост-стратификация или някаква друга техника. Сега каква е прогнозата за собствеността на оръжието?
    4. Как се сравняват вашите прогнози с последната прогноза от проба, базирана на вероятностите? Какво мислите, че обяснява несъответствията, ако има такива?
    5. Повтаряйте въпроси (b) - (d) за отношението към контрола на оръжието. Как се различават вашите констатации?
  3. [ много трудно , събиране на данни , изисква кодиране ] Гоел и колегите (2016) администрират 49 въпроса за нагласите, изведени от Общото социално изследване (GSS) и избират проучвания от Изследователския център на Pew за проба от респондентите, извлечени от Amazon Mechanical Turk. След това те се приспособяват към непредставимостта на данните, използвайки модел, основан на пост-стратификацията, и сравняват своите коригирани прогнози с тези от проучванията GSS и Pew, базирани на вероятностите. Проведете същото проучване на Amazon Mechanical Turk и опитайте да копирате фигури 2а и 2б, като сравнявате коригираните си прогнози с оценките от последните кръгове на проучванията на GSS и Pew. (Вж. Таблицата за приложение А2 за списъка с 49 въпроса.)

    1. Сравнете и контрастирайте резултатите си с тези от Pew и GSS.
    2. Сравнете и контрастирайте резултатите си с резултатите от проучването Mechanical Turk в Goel, Obeng, and Rothschild (2016) .
  4. [ среда , събиране на данни , изисква кодиране ] Много проучвания използват самостоятелно съобщени мерки за използване на мобилни телефони. Това е интересна обстановка, в която изследователите могат да сравняват самооправдано поведение със записано поведение (вж. Напр. Boase and Ling (2013) ). Две обичайни поведения, за които се питате, се обаждат и изпращат текстови съобщения, а две общи времеви рамки са "вчера" и "през ​​изминалата седмица".

    1. Преди да съберете каквито и да било данни, кои от мерките за самооценка смятате за по-точни? Защо?
    2. Наемете пет от вашите приятели, за да бъдете в проучването си. Моля, обобщете накратко как са били взети проби от тези пет приятели. Възможно ли е тази процедура за вземане на проби да предизвика специфични отклонения във вашите прогнози?
    3. Попитайте ги на следните въпроси, свързани с микросурфите:
    • "Колко пъти сте използвали мобилния си телефон, за да се обадите на други вчера?"
    • "Колко текстови съобщения сте изпратили вчера?"
    • "Колко пъти сте използвали мобилния си телефон, за да се свържете с други хора през последните седем дни?"
    • "Колко пъти сте използвали мобилния си телефон, за да изпращате или получавате текстови съобщения / SMS през последните седем дни?"
    1. След като приключите с микрослужбата, поискайте да проверите данните за използването им, както са записани от техния телефон или доставчик на услуги. Как се сравнява използването на собствения отчет с данните в дневника? Кое е най-точното, което е най-малко точно?
    2. Сега комбинирайте данните, които сте събрали с данните от други хора във вашия клас (ако правите тази дейност за клас). С този по-голям набор от данни повторете част (d).
  5. [ среда , събиране на данни ] Schuman и Presser (1996) твърдят, че въпросните заповеди биха имали значение за два вида въпроси: частични въпроси, при които два въпроса са на същото ниво на специфичност (напр. Рейтинг на двама кандидати за президент); и частични въпроси, където общият въпрос е вследствие на по-конкретен въпрос (напр. питане "Колко сте доволни от работата си", последвано от "Колко сте доволни от живота си?").

    Те освен това характеризират два вида ефекти от реда на въпроси: последователните ефекти се появяват, когато отговорите на по-късен въпрос се доближават (в противен случай биха били) до тези, дадени на предишен въпрос; контрастните ефекти се появяват, когато има по-големи различия между отговорите на два въпроса.

    1. Създайте чифт части от части, които смятате, че ще имат голям ефект на въпрос; чифт частично цели въпроси, които смятате, че ще имат голям ефект; и чифт въпроси, чийто ред смятате, че няма значение. Проведете експеримент за проучване на Amazon Mechanical Turk, за да тествате вашите въпроси.
    2. Колко голям ефект от част от част сте могли да създадете? Дали това е консистенция или контрастен ефект?
    3. Колко голям ефект сте получили за цял живот? Дали това е консистенция или контрастен ефект?
    4. Имаше ли някакъв въпрос, който да повлияе на двойката ви, когато не мислите, че това ще е от значение?
  6. [ среда , събиране на данни ] Въз основа на работата на Schuman и Presser, Moore (2002) описва отделно измерение на ефекта на реда за въпроси: добавки и субтрактивни ефекти. Докато резултатите от контраста и консистенцията се получават вследствие на оценката на респондентите за двата елемента във връзка един с друг, добавките и субтрактивните ефекти се получават, когато респондентите стават по-чувствителни към по-голямата рамка, в която се поставят въпросите. Прочетете Moore (2002) , след което проектирайте и проведете експеримент с изследване върху MTurk, за да покажете добавъчни или субтрактивни ефекти.

  7. [ твърд , събиране на данни ] Кристофър Антон и колеги (2015) направиха проучване, сравняващо удобните проби, получени от четири различни онлайн източници за набиране на персонал: MTurk, Craigslist, Google AdWords и Facebook. Проектирайте просто проучване и набирайте участници чрез най-малко два различни онлайн източници за набиране на персонал (тези източници могат да бъдат различни от четирите източника, използвани в Antoun et al. (2015) ).

    1. Сравнете разходите за наематели - по отношение на пари и време - между различни източници.
    2. Сравнете състава на пробите, получени от различни източници.
    3. Сравнете качеството на данните между пробите. За идеи как да измервате качеството на данните от респондентите, вижте Schober et al. (2015) .
    4. Какъв е вашият предпочитан източник? Защо?
  8. [ среда ] В опит да се прогнозират резултатите от референдума за 2016 г. на ЕС (т.е. "Брексит"), YouGov - интернет базирана фирма за проучване на пазара, проведе онлайн анкети на група от около 800 000 респонденти в Обединеното кралство.

    Подробно описание на статистическия модел на YouGov можете да намерите на адрес https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Приблизително казано, YouGov разделя гласоподавателите на типове, основани на избора на гласоподаватели, възрастта, квалификациите, пола и датата на интервюто, както и избирателния район, в който са живели. Първо, те използваха данните, събрани от журналистите от YouGov, за да преценят сред гласувалите процента на хората от всеки тип избирател, който възнамеряваше да гласува. Те оценяват избирателната активност на всеки тип гласоподаватели, като използват Британското избирателно проучване (BES) от 2015 г., изгодно след анкетно проучване, което потвърждава избирателната активност от избирателните списъци. И накрая, те оценяват колко хора са имали от всеки тип избиратели в електората, въз основа на последното преброяване на населението и годишното проучване на населението (с някои допълнителни данни от други източници на данни).

    Три дни преди гласуването YouGov показа двубой за Leave. В навечерието на гласуването анкетата посочи, че резултатът е твърде близо до повикване (49/51 остава). Последното проучване на деня предвижда 48/52 в полза на Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Всъщност тази прогноза пропусна крайния резултат (52/48 Отпуск) с четири процентни пункта.

    1. Използвайте общата рамка за грешки в обсъждането, обсъдена в тази глава, за да прецените какво би могло да се обърка.
    2. Отговорът на YouGov след изборите (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) обяснява: "Това в голяма степен се дължи на избирателна активност - нещо, което казахме, че всичко това ще бъде от решаващо значение за резултата от подобна фино балансирана раса. Нашият модел на избирателна активност се основаваше отчасти на това дали респондентите са гласували на последните общи избори, а избирателната активност над това на общите избори разстрои модела, особено на север. "Това променя ли отговор на част (а)?
  9. [ среда , изисква кодиране ] Напишете симулация, за да илюстрирате всяка от представените грешки на фигура 3.2.

    1. Създайте ситуация, в която тези грешки действително се отменят.
    2. Създайте ситуация, в която грешките се комбинират помежду си.
  10. [ много трудно , изисква кодиране ] Изследванията на Blumenstock и колеги (2015) включват изграждане на модел за машинно обучение, който може да използва цифровите данни за проследяване, за да предскаже отговорите от проучването. Сега ще опитате едно и също нещо с различен набор от данни. Kosinski, Stillwell, and Graepel (2013) установиха, че Facebook харесва, може да предскаже индивидуални черти и атрибути. Изненадващо, тези прогнози могат да бъдат дори по-точни от тези на приятели и колеги (Youyou, Kosinski, and Stillwell 2015) .

    1. Прочетете Kosinski, Stillwell, and Graepel (2013) фигура 2. Данните им са на разположение на http://mypersonality.org/
    2. Сега копирайте фигура 3.
    3. И накрая, опитайте модела си на собствените си данни във Facebook: http://applymagicsauce.com/. Колко добре работи за вас?
  11. [ среда ] Toole et al. (2015) използват записи с подробни данни за обажданията (CDRs) от мобилни телефони, за да предвидят общите тенденции в безработицата.

    1. Сравнете и контрастирайте изследването на Toole et al. (2015) с тази на Blumenstock, Cadamuro, and On (2015) .
    2. Смятате ли, че CDRs трябва да заменят традиционните проучвания, да ги допълват или изобщо да не се използват за правителствените политици, които да следят безработицата? Защо?
    3. Какви доказателства биха ви убедили, че CDRs могат напълно да заменят традиционните мерки на нивото на безработица?