активности

  • степен на тежина: лесно лесно , средно медиум , тешко тешко , многу тешко многу тешко
  • бара математика ( бара математика )
  • бара кодирање ( бара кодирање )
  • собирање на податоци ( собирање на податоци )
  • Мои фаворити ( мојот омилен )
  1. [ тешко , бара математика ] Во поглавјето, бев многу позитивен за пост-стратификација. Сепак, ова не секогаш го подобрува квалитетот на проценките. Конструирајте ситуација во која пост-стратификацијата може да го намали квалитетот на проценките. (За навестување, види Thomsen (1973) .)

  2. [ тешко , собирање на податоци , бара кодирање ] Дизајнирајте и спроведете анкета за неверојатност на Амазон Механички Турк, за да побарате сопственост и ставови за оружје за контрола на оружјето. За да можете да ги споредувате вашите проценки со оние што се добиени од примерок за веројатност, ве молиме копирајте го текстот за прашања и одговорите директно од висококвалитетното истражување, како што се оние што ги води Центарот за истражување на Пју.

    1. Колку долго трае истражувањето? Колку чини? Како демографијата на вашиот примерок се споредува со демографијата на населението во САД?
    2. Која е суровата проценка на сопственоста на оружје со помош на примерокот?
    3. Поправи за непредлаганоста на примерокот користејќи пост-стратификација или некоја друга техника. Што е проценката на сопственоста на оружјето?
    4. Како вашите проценки се споредуваат со најновата проценка од примерокот базиран на веројатност? Што мислите, што ги објаснува разликите, ако ги има?
    5. Повторете ги прашањата (б) - (г) за ставовите кон контролата на оружјето. Како се разликуваат вашите наоди?
  3. [ многу тешко , собирање на податоци , бара кодирање ] Goel и неговите колеги (2016) спровеле 49 прашања со повеќе одбрани ставови извлечени од општата социјална анкета (GSS) и избрани истражувања од страна на Центарот за истражување на Пју на примерок од неверојатна веројатност од испитаници составени од Амазон Механички Турчин. Потоа се приспособија за неспроведливоста на податоците користејќи пост-стратификација врз основа на модел и ги споредуваа нивните приспособени проценки со оние од испитувањата на GSS и Pew базирани на веројатност. Спроведете го истото истражување на Amazon Mechanical Turk и обидете се да ја повторите сликата 2а и слика 2б со споредување на вашите приспособени проценки со проценките од најновите рунди на GSS и Pew истражувањата. (Види прилог табела А2 за списокот од 49 прашања.)

    1. Споредба и контраст на вашите резултати со оние од Pew и GSS.
    2. Споредба и контраст на вашите резултати со оние од истражувањето Механички Турк во Goel, Obeng, and Rothschild (2016) .
  4. [ медиум , собирање на податоци , бара кодирање ] Многу студии користат само-пријавени мерки за користење на мобилни телефони. Ова е интересен амбиент во кој истражувачите можат да го споредат сопственото пријавување со најавено однесување (види, на пример, Boase and Ling (2013) ). Две заеднички однесувања за кои треба да се запрашани се повикувањето и испраќањето текстуални пораки, а две вообичаени временски рамки се "вчера" и "во изминатата недела".

    1. Пред собирање на какви било податоци, која од мерките за самоодобрување сметате дека е попрецизна? Зошто?
    2. Регрутирате пет од вашите пријатели да бидат во вашата анкета. Ве молиме накратко да резимираме како се земаат примероците од петте пријатели. Може ли оваа постапка за земање мостри да предизвика специфични предрасуди во вашите проценки?
    3. Прашајте ги следниве прашања за микрослучаите:
    • "Колку пати го користевте вашиот мобилен телефон за вчера да ги повикате другите?"
    • "Колку текстуални пораки си испрати вчера?"
    • "Колку пати го користевте вашиот мобилен телефон за да ги повикате другите во последните седум дена?"
    • "Колку пати го користевте вашиот мобилен телефон да испраќате или примате текстуални пораки / SMS во последните седум дена?"
    1. Откако ќе заврши микрослужбата, побарајте да ги проверат нивните податоци за користење како што е најавен од нивниот телефон или провајдер на услуги. Како се користи извештајот за само-пријавување со податоците на дневникот? Што е најточна, што е најмалку точна?
    2. Сега комбинирајте ги податоците што сте ги собрале со податоците од други луѓе во вашата класа (ако ја вршите оваа активност за некоја класа). Со овој поголем набавката, повторете го делот (г).
  5. [ медиум , собирање на податоци Шуман и Припер (1996) тврдат дека наредбите за прашања би биле важни за два вида прашања: делумни прашања каде што две прашања се на исто ниво на специфичност (на пример, рејтингот на двајца претседателски кандидати); и дел-цели прашања каде општото прашање го следи поспецифичното прашање (на пример, прашањето "Колку сте задоволни со вашата работа?", а потоа следи "Колку сте задоволни со вашиот живот?").

    Тие понатаму карактеризираат два вида на ефект на ефектот: ефектите на конзистенција се појавуваат кога одговорите на некое подоцнежно прашање се приближуваат (отколку што инаку би биле) на оние што се дадени на претходното прашање; контрастните ефекти се јавуваат кога постојат поголеми разлики помеѓу одговорите на две прашања.

    1. Направете пар на делумни прашања за кои мислите дека ќе имаат голем ефект на редоследот на прашањето; пар дел-целина прашања за кои мислите дека ќе имаат голем ефект на цел; и пар прашања чиј цел мислите дека не би било важно. Извршете експеримент на анкетата на Amazon Mechanical Turk за да ги тестирате вашите прашања.
    2. Колку голем дел дел ефект сте биле во можност да се создаде? Дали е тоа ефект на конзистенција или контраст?
    3. Колку голем дел ефект бил во можност да создадете? Дали е тоа ефект на конзистенција или контраст?
    4. Имаше ли ефект на редоследот на прашањето во вашиот пар каде што не мислите дека редоследот ќе биде важен?
  6. [ медиум , собирање на податоци ] Градење на делото на Шуман и Присер, Moore (2002) опишува посебна димензија на ефектот на ефектот на прашањето: адитивни и субтрактивни ефекти. Додека ефектите на контраст и конзистентност се продуцираат како последица на оценките на испитаниците од двете точки во однос на едни со други, се добиваат адитивни и субтрактивни ефекти кога испитаниците се чувствителни на поголемата рамка во која се поставуваат прашањата. Прочитајте Moore (2002) , потоа дизајнирајте и извршите експеримент за истражување на Муррк за да покажете адитивни или субтрактивни ефекти.

  7. [ тешко , собирање на податоци ] Кристофер Антоун и неговите колеги (2015) спроведоа студија во која се споредуваат примероците за погодност добиени од четири различни извори за регрутирање на интернет: Муррк, Craigslist, Google AdWords и Фејсбук. Дизајнирајте едноставна анкета и регрутирајте ги учесниците преку најмалку два различни онлајн извори за регрутирање (овие извори може да бидат различни од четирите извори што се користат во Antoun et al. (2015) ).

    1. Споредба на трошоците за регрутира - во смисла на пари и време - помеѓу различни извори.
    2. Споредба на составот на примероците добиени од различни извори.
    3. Споредете го квалитетот на податоците помеѓу примероците. За идеи за тоа како да се измери квалитетот на податоците од испитаниците, видете Schober et al. (2015) .
    4. Кој е вашиот изворен извор? Зошто?
  8. [ медиум ] Во обид да ги предвиди резултатите од 2016-таот референдум за ЕУ ​​(т.е. Брексит), YouGov, компанија за истражување на пазарот заснована на интернет, спроведе анкети на панел од околу 800.000 испитаници во Обединетото Кралство.

    Детален опис на статистичкиот модел на YouGov може да се најде на https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Грубо кажано, YouGov ги подели гласачите во типови врз основа на изборот, возраста, квалификациите, родот и датумот на интервјуто, како и изборната единица во која живееле. Прво, тие користеа податоци собрани од YouGov панелистите за да ги проценат, меѓу оние што гласале, процентот на луѓе од секој тип избирачи кои имале намера да гласаат за напуштање. Тие го проценуваа одѕивот на секој од избирачите користејќи ја британската изборна студија (БЕС) во 2015 година, пост-изборно лице-в-лице анкета, која го потврди одѕивот од гласачките списоци. Конечно, тие проценуваа колку луѓе имало од секој тип избирачи во електоратот, врз основа на последното Попис и Годишно истражување за населението (со некои дополнителни информации од други извори на податоци).

    Три дена пред гласањето, YouGov покажа две-точка предност за Оставете. Во пресрет на гласањето, анкетата покажа дека резултатот е премногу блиску да се јави (49/51 Остани). Конечната студија на ден предвиде 48/52 во корист на Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Всушност, оваа проценка го пропушти конечниот резултат (52/48 Остави) за четири процентни поени.

    1. Користете ја целосната рамка за грешка во истражувањето што е дискутирана во ова поглавје за да се процени што може да погреши
    2. Одговорот на YouGov по изборите (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) објасни: "Ова се чини дека во голем дел се должи на одѕивот - нешто што рековме дека цело време ќе биде од суштинско значење за исходот од една таква ситно избалансирана трка. Нашиот модел на излезност делумно се базираше на тоа дали испитаниците гласале на последните општи избори и нивото на одѕив над општите избори го вознемирило моделот, особено на север. "Дали ова го менува вашиот одговор на дел (а)?
  9. [ медиум , бара кодирање ] Напишете симулација за да ја илустрирате секоја од грешките за застапеност на слика 3.2.

    1. Направете ситуација каде што овие грешки всушност се откажат.
    2. Направете ситуација каде грешките се мешаат едни со други.
  10. [ многу тешко , бара кодирање ] Истражувањето на Blumenstock и неговите колеги (2015) вклучувало изградба на модел за машинско учење кој може да користи дигитални податоци за следење за да ги предвиди одговорите на анкетата. Сега, ќе испробате истото со различен назив на податоци. Kosinski, Stillwell, and Graepel (2013) откриле дека Фејсбук сака да ги предвиди индивидуалните особини и атрибути. Изненадувачки, овие предвидувања можат да бидат уште попрецизни отколку оние на пријателите и колегите (Youyou, Kosinski, and Stillwell 2015) .

    1. Прочитајте Kosinski, Stillwell, and Graepel (2013) и реплицирајте ја сликата 2. Нивните податоци се достапни на http://mypersonality.org/
    2. Сега, повторете ја сликата 3.
    3. Конечно, обидете се со нивниот модел на сопствените Фејсбук податоци: http://applymagicsauce.com/. Колку добро работи за вас?
  11. [ медиум ] Toole et al. (2015) користеше евиденција за детали за повици (CDRs) од мобилни телефони за да ги предвиди агрегатните трендови за невработеност.

    1. Споредба и контраст на дизајнот на студијата на Toole et al. (2015) со онаа на Blumenstock, Cadamuro, and On (2015) .
    2. Дали мислите дека CDR треба да ги заменат традиционалните истражувања, да ги надополнуваат или да не се користат воопшто за владините креатори на политики за следење на невработеноста? Зошто?
    3. Кои докази ќе ве убедат дека CDR може целосно да ги заменат традиционалните мерки на стапката на невработеност?