активности

клуч:

  • степен на тежина: лесни лесно , средни среден , тешко тешко , многу тешко многу тешко
  • бара математика ( бара математика )
  • бара кодирање ( бара кодирање )
  • собирање на податоци ( собирање на податоци )
  • Мои фаворити ( мојот омилен )
  1. [ тешко , бара математика ] Во ова поглавје, јас бев многу позитивни за пост-стратификација. Сепак, тоа не секогаш се подобри квалитетот на проценки. Конструирај ситуација во која може да се пост-стратификација може да го намали квалитетот на проценки. (За совет, види Thomsen (1973) ).

  2. [ тешко , собирање на податоци , бара кодирање ] Се дизајнира и спроведе истражување на не-веројатност на Амазон MTurk да прашам за поседување на оружје ( "Дали, или дали некој во вашето домаќинство, поседуваат пиштол, пушка или пиштол? Дали е тоа вие или некој друг во Вашето домаќинство?") И ставови за контрола на оружјето ( "Што мислите дека е уште поважно, да го заштити правото на Американците да поседуваат оружје, или за контрола на поседувањето оружје?").

    1. Колку долго трае вашето истражување? Колку чини? Како да демографијата на примерокот се споредуваат со демографијата на населението на САД?
    2. Што е сурова проценка на поседување оружје со вашиот примерок?
    3. Исправи за нерепрезентативноста на вашиот примерок со користење на пост-стратификација или некоја друга техника. Сега она што е проценка на поседување оружје?
    4. Како се вашите проценки се споредуваат со последната проценка од Истражувачкиот центар Пју? Што мислите објасни разликите, ако постои било каква?
    5. Повторете ја вежбата 2-5 за ставовите за контрола на оружјето. Како вашите наоди се разликуваат?
  3. [ многу тешко , собирање на податоци , бара кодирање ] Гоел и колеги (2016) се дава не-веројатност-базирани истражување се состои од 49 повеќе-избор прашања ставовите составен од општата социјална Истражување (GSS) и одберете истражувања од страна на Истражувачкиот центар Пју на Амазон MTurk. Тие потоа се приспособат за нерепрезентативноста на податоци со користење на модел базиран пост-стратификација (г-P), и споредба на приспособена проценки со тие проценки на веројатноста базирани GSS / Пју анкети. Спроведе истото истражување на MTurk и да се обиде да се реплицираат Слика 2а и 2б слика со споредување на вашиот приспособена проценки со проценките од најновите рунди на GSS / Пју (Види Додаток Табела А2 за листата на 49 прашања).

    1. Споредете и контрастот вашите резултати со резултатите од Пју и GSS.
    2. Споредете и контрастот вашите резултати со резултатите од истражувањето MTurk во Goel, Obeng, and Rothschild (2016) .
  4. [ среден , собирање на податоци , бара кодирање ] Многу студии користат мерките за само-извештај на мобилен телефон податоци активност. Ова е интересен амбиент каде што научниците може да се спореди само-објави однесување со Сочувана однесување (види на пример, Boase and Ling (2013) ). Две заеднички однесувања за да прашуваат за се повикува и Texting и две заеднички временски рамки се "вчера" и "во изминатата недела."

    1. Пред собирање на податоци, која од само-извештај мерки мислите дека е повеќе точни? Зошто?
    2. Регрутира 5 од вашите пријатели да се биде во вашиот истражување. Ве молиме да резимираме накратко како се земаат мостри овие 5 пријатели. Можеби оваа постапка за земање мостри предизвикаат одредени предрасуди во оценките?
    3. Ве молиме да им ги поставите следните микро-анкетата:
    • "Колку пати да го користите мобилниот телефон да се јавам другите вчера?"
    • "Колку текстуални пораки те пратив вчера?"
    • "Колку пати си го користите вашиот мобилен телефон да се јавам на другите во последните седум дена?"
    • "Колку пати ќе го користите вашиот мобилен телефон да праќате и примате текстуални пораки / СМС во последните седум дена?" Откако истражувањето е завршено, побара да ги проверат своите податоци за употреба како најавени од страна на нивните телефон или давател на услуги.
    1. Како го прави користењето на авто-извештајот се споредуваат за да се најавите на податоци? Што е најмногу точни, што е најмалку точни?
    2. Сега се комбинираат податоците што сте ги собрале со податоците од другите луѓе во својата класа (ако се прави оваа активност за класа). Со оваа поголемите бази, повторете дел (d).
  5. [ среден , собирање на податоци ] Шуман и печат (1996) тврдат дека налозите прашање би било важно за два вида на односи меѓу прашања: скратено работно дел прашања, каде две прашања се на исто ниво на специфичност (на пример, рејтингот на двајцата претседателски кандидати); и со скратено работно целиот прашања за кои општо прашање следи повеќе конкретно прашање (на пример, прашува: "Колку сте задоволни со вашата работа?", а по него "Колку сте задоволни со вашиот живот?").

    Тие понатаму се карактеризираат два вида на прашањето за ефект: конзистентност ефекти се јавуваат кога одговори на прашањето подоцна се приближи (отколку што инаку би се случило) со оние дадени на претходниот збор; контраст ефекти се јавуваат кога има поголеми разлики помеѓу одговори на две прашања.

    1. Се создаде еден пар на скратено работно дел прашања кои мислите дека ќе има голем ефект прашањето цел, еден пар на скратено работно целиот прашања кои мислите дека ќе има голем ефект ред, и уште еден пар на прашања чија цел мислите дека не би било важно. Стартувај експеримент истражување за MTurk да ги тестираат вашите прашања.
    2. Колку е голема беше дел-дел ефект сте биле во можност да се создаде? Беше тоа конзистентност или контраст ефект?
    3. Како голем е со скратено работно целата сила сте биле во можност да се создаде? Беше тоа конзистентност или контраст ефект?
    4. Дали постои прашање за ефектот во пар каде што не мислам дека редоследот би било важно?
  6. [ среден , собирање на податоци ] Градење на работата на Шуман и печат, Moore (2002) опишува посебна димензија на прашањето за ефект: адитиви и subtractive. Додека контраст и конзистентност ефекти се произведуваат како последица на оценките на два предмети испитаниците во однос на едни со други, адитиви и subtractive ефекти се произведуваат кога испитаниците се направени повеќе чувствителни кон проширување на рамката во која се поставуваат прашања. Прочитај Moore (2002) , а потоа дизајн и да се изврши експериментот истражување за MTurk да покажат адитив или subtractive ефекти.

  7. [ тешко , собирање на податоци ] Кристофер Antoun и колеги (2015) спроведе студија споредување примероци погодности добиени од четири различни извори на интернет регрутирање: MTurk, Craigslist, Google AdWords и Фејсбук. Дизајн едноставен истражување и регрутирање на учесници преку најмалку два различни извори онлајн регрутирање (тие можат да бидат различни извори од четири извори кои се користат во Antoun et al. (2015) ).

    1. Споредете цена на регрутира, во смисла на пари и време, помеѓу различни извори.
    2. Споредба на составот на примероци добиени од различни извори.
    3. Споредете го квалитетот на податоците помеѓу примероци. За идеи за тоа како да се измери квалитетот на податоците од испитаниците, видете Schober et al. (2015) .
    4. Што е претпочитаниот извор? Зошто?
  8. [ среден ] YouGov, на интернет-базирани истражување на пазарот фирмата, спроведена на интернет анкетите на панел од околу 800.000 испитаници во Велика Британија и се користи за г-дин П. да се предвиди резултатот од референдумот на ЕУ (на пример, Brexit) каде што избирачите Велика Британија гласаат или да остане во или да ја напуштат Европската унија.

    Детален опис на статистички модел YouGov е тука (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Грубо кажано, YouGov партиции гласачите во видови врз основа на 2015 Генерален избори избор гласови, возраст, квалификации, пол, датум на интервју, како и изборната единица во која живеат. Прво, тие се користат податоците собрани од панелистите на YouGov да се процени, меѓу оние што гласале, бројот на луѓе на секој тип на гласачите кои имаат намера да гласаат отсуство. Тие проценуваат одѕивот на секој тип на гласачите со помош на британските избори Студијата за 2015 година (BES) постизборните лице-в-лице анкета, која потврдена на гласачите од избирачките списоци. Конечно, тие се процени колку луѓе има на секој тип на гласачите во електоратот врз основа на последниот попис и годишно истражување на населението (со некои тоа информации од Бес, податоци YouGov Истражувањето од целиот општите избори, како и информации за тоа колку луѓе гласаа за секоја страна во секоја изборна единица).

    Три дена пред гласањето, YouGov покажа два поени предност за отсуство. Во пресрет на гласањето, анкетата покажа премногу блиску до повик (49-51 остане). конечна студија на на-на-ден предвиде 48/52 во корист на Останете (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Всушност, оваа проценка пропушти крајниот резултат (52-48 одмор) со четири процентни поени.

    1. Користете вкупниот рамка грешка анкета дискутирани во ова поглавје се оцени она што би можеле да се качил во ред.
    2. одговор на YouGov по изборите (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) објаснува: "Се чини дека во голем дел се должи на гласачите - нешто што ние сме изјави дека сите заедно ќе бидат клучни за исходот од таквите ситно избалансиран трката. Нашите одѕив модел беше, делумно, од тоа дали испитаниците гласале на последните општи избори и на ниво на гласачите погоре дека на општите избори вознемири модел, особено во северниот дел. "Дали ова се промени вашиот одговор на делот (а)?
  9. [ среден , бара кодирање ] Напиши симулација за да се илустрира секој од грешки застапеноста на Слика 3.1.

    1. Создаде ситуација во која овие грешки се, всушност, се поништуваат.
    2. Создаде ситуација во која грешките сложена едни со други.
  10. [ многу тешко , бара кодирање ] Истражувањето на Blumenstock и колеги (2015) вклучени градењето модели на машина за учење кои може да се користи за дигитални податоци за следење за да се предвиди одговори истражувањето. Сега, ви се случува да се обиде на истото со различни податоци. Kosinski, Stillwell, and Graepel (2013) покажа дека Фејсбук сака може да се предвиди индивидуални црти и атрибути. Изненадувачки, овие предвидувања може да биде дури и повеќе точни од оние на пријатели и колеги (Youyou, Kosinski, and Stillwell 2015) .

    1. Прочитај Kosinski, Stillwell, and Graepel (2013) , и да се реплицираат Слика 2. Нивните податоци се достапни тука: http://mypersonality.org/
    2. Сега, реплицира слика 3.
    3. Конечно, обидете нивниот модел на свој Фејсбук податоци: http://applymagicsauce.com/. Колку добро го работат за вас?
  11. [ среден ] Toole et al. (2015) , повеќе употреба јавете се на евиденција (CDR) од мобилни телефони да се предвиди агрегат трендови на невработеност.

    1. Споредете и контрастот на дизајнот на Toole et al. (2015) со Blumenstock, Cadamuro, and On (2015) .
    2. Дали мислите дека CDR-и треба да ги замени традиционалните истражувања, ги дополнуваат или не се користи на сите за владата креаторите на политиката да ги пратите невработеност? Зошто?
    3. Какви докази ќе ве убеди дека CDRs не може целосно да ги замени традиционалните мерки на стапката на невработеност?