Zajęcia

Klawisz:

  • Stopień trudności: łatwe łatwo , średni średni , ciężko ciężko , bardzo trudny bardzo trudny
  • wymaga matematyki ( wymaga matematyki )
  • Wymaga kodowania ( wymaga kodowania )
  • zbieranie danych ( zbieranie danych )
  • moje ulubione ( mój ulubiony )
  1. [ ciężko , wymaga matematyki ] W rozdziale, byłem bardzo pozytywnie o post-stratyfikacji. Jednak nie zawsze poprawić jakość szacunków. Narysuj sytuację, w której może post-rozwarstwienie może obniżyć jakość szacunków. (Aby uzyskać podpowiedź, zobacz Thomsen (1973) ).

  2. [ ciężko , zbieranie danych , wymaga kodowania ] Projekt i przeprowadzenie badania bez prawdopodobieństwa na Amazon MTurk zapytać o posiadania broni ( "Czy ty, albo czy ktoś z domowników, własny pistolet, karabin czy pistolet? Czy ty lub ktoś w twoim domu?") Oraz postawy wobec kontroli broni ( "Jak myślisz, co jest ważniejsze, aby chronić prawa Amerykanów do posiadania broni, lub do kontroli własności pistolet?").

    1. Jak długo trwa Twoja ankieta zajmie? Ile to kosztuje? Jak demografia próbkę porównaniu do demografii populacji Stanów Zjednoczonych?
    2. Jaki jest surowe szacunek posiadania broni przy użyciu próbki?
    3. Prawidłowe za brak reprezentatywności próbki przy użyciu swojej post-rozwarstwienie lub jakąś inną technikę. Teraz to, co jest oszacowanie posiadania broni?
    4. Jak twoje szacunki w porównaniu do ostatnich szacunków z Pew Research Center? Co sądzisz wyjaśnić rozbieżności, jeśli istnieje?
    5. Powtórz ćwiczenie 2-5 dla postawy wobec kontroli broni. Jak wasze odkrycia różnią?
  3. [ bardzo trudny , zbieranie danych , wymaga kodowania ] Goel i współpracownicy (2016) podaje przegląd zakaz prawdopodobieństwa opartego na które składają się 49 wielokrotnego wyboru postaw pytań zaczerpniętych z General Social Survey z (GSS) i wybrać ankiet przez Pew Research Center na Amazon MTurk. Następnie ustawić za brak reprezentatywności danych z wykorzystaniem modelu opartego na post-stratyfikacji (pan P) i porównać z tymi, skorygowane oszacowania prawdopodobieństwa oszacować na podstawie badań opartych GSS / Pew. Przeprowadzić takie samo badanie na MTurk i spróbuj powtórzyć Rysunek 2a i figura 2b, porównując swoje skorygowane oszacowania z szacunkami z ostatnich rund GSS / Pew (patrz załącznik tabela A2 na listę 49 pytań).

    1. Porównać i swoje wyniki z wynikami z Pew i GSS.
    2. Porównać i swoje wyniki z wynikami z badania MTurk w Goel, Obeng, and Rothschild (2016) .
  4. [ średni , zbieranie danych , wymaga kodowania ] Wiele badań wykorzystywać środki samoopisowe mobilnych danych o aktywności telefonu. Jest to ciekawe ustawienie, w którym naukowcy będą mogli porównać zachowanie własnej zgłaszane z zalogowanego zachowania (patrz np Boase and Ling (2013) ). Dwa typowe zachowania zapytać o dzwonisz i SMS-y, a dwóch ram czasowych są powszechne "wczoraj" i "w ubiegłym tygodniu."

    1. Przed zbierania jakichkolwiek danych, które z samoopisu środki myślisz jest bardziej dokładne? Czemu?
    2. Rekrutować 5 z znajomych, aby być w swoim badaniu. Proszę krótko podsumować, jak te 5 znajomych pobrano próbki. Procedura pobierania próbek może to wywoływać konkretne upodobania w waszych szacunków?
    3. Proszę zwrócić im następujące mikro-ankieta:
    • "Ile razy nie używasz telefonu komórkowego, aby zadzwonić innym wczoraj?"
    • "Ilu tekst wiadomości wysłałeś wczoraj?"
    • "Ile razy nie można korzystać z telefonu komórkowego, aby zadzwonić do innych w ciągu ostatnich siedmiu dni?"
    • "Ile razy korzystania z telefonu komórkowego do wysyłania i odbierania wiadomości SMS / SMS w ciągu ostatnich siedmiu dni?" Kiedy badanie jest zakończone, poproś, aby sprawdzić swoje dane użycia jako zarejestrowany przez swój telefon lub usługodawcy.
    1. W jaki sposób korzystanie z self-report porównanie danych do logowania? Która jest najbardziej dokładne, który jest najmniej dokładny?
    2. Teraz połączyć dane, które zostały zebrane z danymi z innymi ludźmi w swojej klasie (jeśli robisz to ćwiczenie dla klasy). Z tym większym zbiorze powtórzyć część (d).
  5. [ średni , zbieranie danych ] Schuman i dociskowej (1996) twierdzą, że zlecenia pytanie miałoby znaczenia dla dwóch typów stosunków między pytania: pytania niepełnym części, w której dwa pytania są na tym samym poziomie specyficzności (ratingi dwóch kandydatów na prezydenta na przykład); Pytania i niepełnym wymiarze całych gdzie ogólny pytanie wynika bardziej konkretne pytanie (np pytaniem "Jak zadowolony jesteś ze swojej pracy?", a następnie "Jak jesteś zadowolony ze swojego życia?").

    Oni dalej scharakteryzować dwa rodzaje efektu zlecenia pytanie: Efekty konsystencję występują, gdy odpowiedzi na późniejszym pytaniu są przybliżone (niż byłyby inaczej) podanym do wcześniejszego pytania; kontrastują efekty występują, gdy istnieją większe różnice między odpowiedziami na dwa pytania.

    1. Tworzenie parę pytań w niepełnym wymiarze części, które naszym zdaniem będą miały duży wpływ zamówień pytanie, parę części, cała pytania, które naszym zdaniem będą miały duży wpływ kolejności, a kolejną parę pytań, których kolejność myślisz nie ma znaczenia. Przeprowadź eksperyment badania dotyczącego MTurk przetestować swoje pytania.
    2. Jak duży był wpływ niepełnym wymiarze część udało ci się stworzyć? Czy była to konsekwencja lub kontrast efekt?
    3. Jak duży był wpływ niepełnym wymiarze cała udało ci się stworzyć? Czy była to konsekwencja lub kontrast efekt?
    4. Czy istnieje kwestia efekt porządkowania pary, gdzie nie sądziłem, że kolejność nie ma znaczenia?
  6. [ średni , zbieranie danych ] Opierając się na pracach Schuman i Presser, Moore (2002) opisuje osobny wymiar efektu zlecenia pytanie: dodatków i subtraktywnymi. Mimo kontrastu i spójność skutki są wytwarzane w wyniku oceny respondentów obu elementów w stosunku do siebie, dodatków i efekty subtraktywnymi są wytwarzane, gdy respondenci są bardziej wrażliwe na większej ramy, w których stawiane są pytania. Czytaj Moore (2002) , a następnie zaprojektować i przeprowadzić eksperyment badania dotyczącego MTurk wykazać efekty addytywne lub subtraktywnymi.

  7. [ ciężko , zbieranie danych ] Christopher Antoun i współpracownicy (2015) przeprowadzili badanie porównujące próbek wygodę uzyskane z czterech różnych źródeł rekrutacji online: MTurk, Craigslist, Google AdWords i Facebook. Zaprojektowanie prostego badania i rekrutacji uczestników za pośrednictwem co najmniej dwóch różnych źródeł rekrutacji sieci (mogą mieć różne źródła z czterech źródeł wykorzystywanych Antoun et al. (2015) ).

    1. Porównaj koszt rekrutacji, pod względem czasu i pieniędzy, między różnymi źródłami.
    2. Porównanie składu próbek otrzymanych z różnych źródeł.
    3. Porównaj jakości danych pomiędzy próbkami. Dla idei o jak mierzyć jakość danych od respondentów, zobacz Schober et al. (2015) .
    4. Jaki jest Twój preferowany źródło? Czemu?
  8. [ średni ] YouGov, firma badania rynku w oparciu o internet, przeprowadzone sondaże internetowe panelu około 800 tysięcy respondentów z Wielkiej Brytanii i używane pana P. przewidzieć wynik referendum w UE (tj Brexit), gdzie wyborcy UK głosu albo do pozostawania lub opuścić Unię Europejską.

    Szczegółowy opis modelu statystycznego YouGov jest tutaj (https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/). Z grubsza rzecz biorąc, YouGov dzieli wyborców na typy w oparciu o 2015 wyborach powszechnych wyboru głosowanie, wiek, kwalifikacje, płeć, data wywiadu, a także okręgu w którym żyją. Najpierw wykorzystali dane zebrane z panelistów YouGov oszacować, wśród tych, którzy głosują, odsetek ludzi z każdego rodzaju wyborców, którzy zamierzają głosować odejść. Szacują oni frekwencję każdego typu wyborców za pomocą 2015 brytyjski wyborów studiów (BES) powyborczy twarzą w twarz ankiety, które zatwierdzone frekwencję z list wyborczych. Wreszcie, oszacować, ile osób jest każdego rodzaju wyborców w elektoracie podstawie ostatniego spisu powszechnego i rocznych Population Survey (z pewnymi informacjami dodatkowo z BES YouGov dane ankietowe z całego wyborach powszechnych, a także informacje o tym, jak wiele osób głosowało za każda ze stron w każdym okręgu).

    Trzy dni przed głosowaniem, YouGov wykazało dwa punkty przewagi na urlopy. W przeddzień głosowania, ankieta wykazała zbyt blisko, aby zadzwonić (49-51 pozostać). W ostatnim badaniu on-the-day przewidział 48/52 na korzyść Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). W rzeczywistości, to szacunek brakowało wynik końcowy (52-48 Leave) o cztery punkty procentowe.

    1. Użyj globalnych ram błędzie badania omówione w niniejszym rozdziale, aby ocenić, co mogło pójść źle.
    2. Odpowiedź YouGov po wyborach (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/~~HEAD=pobj) wyjaśnia: "Wydaje się, że w dużej mierze ze względu na frekwencję - coś, mówiliśmy cały czas będzie kluczowa dla wyniku takiego równowagą wyścigu. Nasz model frekwencja była oparta po części od tego, czy respondenci głosowali w ostatnich wyborach i frekwencja na poziomie wyższym niż wyborach zdenerwowany model, szczególnie na północy. "Czy to zmienić odpowiedź na części (a)?
  9. [ średni , wymaga kodowania ] Napisz symulacji ilustrują każdy z błędów reprezentacji na rysunku 3.1.

    1. Tworzenie sytuacji, w której te błędy faktycznie znoszą się.
    2. Tworzenie sytuacji, w której błędy związek ze sobą.
  10. [ bardzo trudny , wymaga kodowania ] Badania Blumenstock i współpracowników (2015) zaangażowane budowy modelu uczenia maszynowego, które mogą wykorzystać dane śledzenia cyfrowych do przewidzenia odpowiedzi ankietowych. Teraz masz zamiar spróbować to samo z innym zbiorze. Kosinski, Stillwell, and Graepel (2013) stwierdził, że Facebook nie lubi można przewidzieć indywidualne cechy i atrybuty. Co ciekawe, te prognozy mogą być jeszcze bardziej dokładne niż przyjaciół i współpracowników (Youyou, Kosinski, and Stillwell 2015) .

    1. Czytaj Kosinski, Stillwell, and Graepel (2013) , i replikować Rysunek 2. Ich dane są dostępne tutaj: http://mypersonality.org/
    2. Teraz replikować rysunku 3.
    3. Wreszcie, spróbuj swój model na własnym danych Facebooku: http://applymagicsauce.com/. Jak dobrze to działa dla Ciebie?
  11. [ średni ] Toole et al. (2015) zapisy szczegółowo wykorzystanie połączeń (CDR) z telefonów komórkowych do przewidzenia zbiorcze trendy bezrobotnych.

    1. Porównać i projektowanie Toole et al. (2015) z Blumenstock, Cadamuro, and On (2015) .
    2. Czy uważasz, że CDR powinien zastąpić tradycyjne badania, uzupełniają je lub nie może być stosowany na wszystkich dla decydentów rządowych śledzić bezrobocie? Czemu?
    3. Jakie dowody będą przekonywać, że CDR mogą całkowicie zastąpić tradycyjne środki bezrobocia?