Zajęcia

  • stopień trudności: łatwy łatwo , średni średni , ciężko ciężko , bardzo trudny bardzo trudny
  • wymaga matematyki ( wymaga matematyki )
  • wymaga kodowania ( wymaga kodowania )
  • zbieranie danych ( zbieranie danych )
  • moje ulubione ( mój ulubiony )
  1. [ ciężko , wymaga matematyki ] W rozdziale byłem bardzo pozytywnie nastawiony do post stratyfikacji. Jednak nie zawsze poprawia to jakość szacunków. Skonstruuj sytuację, w której stratyfikacja po terminie może obniżyć jakość szacunków. (Aby uzyskać podpowiedź, zobacz Thomsen (1973) .)

  2. [ ciężko , zbieranie danych , wymaga kodowania ] Zaprojektuj i przeprowadź ankietę o prawdopodobieństwie błędu na Amazon Mechanical Turk, aby zapytać o posiadanie broni i jej nastawienie do kontroli nad bronią. Abyś mógł porównać swoje oszacowania z tymi pochodzącymi z próbki prawdopodobieństwa, skopiuj tekst pytania i opcje odpowiedzi bezpośrednio z wysokiej jakości ankiety, takiej jak te prowadzone przez Pew Research Center.

    1. Ile trwa twoja ankieta? Ile to kosztuje? W jaki sposób demografia Twojej próbki jest porównywana z danymi demograficznymi populacji USA?
    2. Jaka jest szacunkowa wartość posiadania broni przy użyciu twojej próbki?
    3. Prawidłowe dla niereprezentatywności próbki przy użyciu stratyfikacji lub innej techniki. Jaki jest szacunek posiadania broni?
    4. Jak szacunki są porównywane z najnowszymi szacunkami z próbki opartej na prawdopodobieństwie? Jak sądzisz, co tłumaczy rozbieżności, jeśli takie istnieją?
    5. Powtórz pytania (b) - (d) dotyczące postaw wobec kontroli broni. Jak różnią się twoje odkrycia?
  3. [ bardzo trudny , zbieranie danych , wymaga kodowania ] Goel i współpracownicy (2016) Przeprowadzili 49 pytań wielokrotnego wyboru związanych z ogólną ankietą społeczną (GSS) i wybierali ankiety przeprowadzane przez Pew Research Center na próbę niesatysfakcjonującą respondentów z Amazon Mechanical Turk. Następnie skorygowano o niereprezentatywność danych za pomocą modelowania po stratyfikacji i porównano ich skorygowane szacunki z danymi z badań GSS i Pew przeprowadzonych z prawdopodobieństwem. Przeprowadź tę samą ankietę na Amazon Mechanical Turk i spróbuj powtórzyć rysunek 2a i rysunek 2b, porównując skorygowane prognozy z szacunkami z ostatnich rund badania GSS i Pew. (Patrz tabela dodatków A2 dla listy 49 pytań.)

    1. Porównaj i porównuj wyniki z tymi z Pew i GSS.
    2. Porównaj i porównaj wyniki z wynikami z badania Mechanical Turk w Goel, Obeng, and Rothschild (2016) .
  4. [ średni , zbieranie danych , wymaga kodowania ] Wiele badań wykorzystuje samodzielnie zgłaszane miary korzystania z telefonów komórkowych. Jest to interesujące ustawienie, w którym badacze mogą porównywać zgłaszane przez siebie zachowania z zarejestrowanymi zachowaniami (patrz np. Boase and Ling (2013) ). Dwa typowe zachowania, o które należy zapytać, to wywoływanie i pisanie wiadomości tekstowych, a dwie typowe ramy czasowe to "wczoraj" i "w zeszłym tygodniu".

    1. Przed pobraniem jakichkolwiek danych, które z pomiarów zgłaszanych przez siebie są bardziej dokładne? Czemu?
    2. Zwerbuj pięciu znajomych, aby znaleźli się w Twojej ankiecie. Podsumuj krótko, w jaki sposób wybrano tych pięciu przyjaciół. Czy ta procedura pobierania próbek może wywołać określone błędy w twoich szacunkach?
    3. Zadaj im następujące pytania dotyczące mikroprzetoczników:
    • "Ile razy korzystałeś z telefonu komórkowego, aby wczoraj dzwonić do innych osób?"
    • "Ile SMS-ów wysłałeś wczoraj?"
    • "Ile razy korzystałeś z telefonu komórkowego, aby dzwonić do innych w ciągu ostatnich siedmiu dni?"
    • "Ile razy używasz telefonu komórkowego do wysyłania lub odbierania wiadomości tekstowych / wiadomości SMS w ciągu ostatnich siedmiu dni?"
    1. Po zakończeniu tej mikroprocesury poproś o sprawdzenie danych o użytkowaniu, zarejestrowanych przez ich telefon lub usługodawcę. W jaki sposób korzystanie z samodzielnego raportu jest porównywane z danymi dziennika? Który z nich jest najdokładniejszy, a najmniej dokładny?
    2. Teraz połącz zebrane dane z danymi innych osób w klasie (jeśli robisz to dla klasy). W tym większym zbiorze danych powtórz część (d).
  5. [ średni , zbieranie danych ] Schuman i Presser (1996) twierdzą, że rozkazy pytań mają znaczenie dla dwóch rodzajów pytań: pytań częściowych, gdzie dwa pytania są na tym samym poziomie szczegółowości (np. Oceny dwóch kandydatów na prezydenta); i częściowe pytania, w przypadku których ogólne pytanie wiąże się z bardziej konkretnym pytaniem (np. pytanie "Jak bardzo jesteś zadowolony ze swojej pracy?", a następnie "Jak bardzo jesteś zadowolony ze swojego życia?").

    Ponadto charakteryzują dwa rodzaje efektów zapytania: efekty spójności pojawiają się, gdy odpowiedzi na późniejsze pytanie są przybliżane (w przeciwnym razie byłyby) do odpowiedzi na wcześniejsze pytanie; Efekty kontrastowe występują, gdy występują większe różnice między odpowiedziami na dwa pytania.

    1. Utwórz parę częściowych pytań, które według ciebie będą miały duży efekt zapytania; parę częściowych pytań, które według ciebie będą miały duży efekt zamówienia; i parę pytań, które według ciebie nie miałyby znaczenia. Przeprowadź ankietę na Amazon Mechanical Turk, aby przetestować swoje pytania.
    2. Jak duży efekt częściowy mógłbyś stworzyć? Czy był to efekt konsystencji lub kontrastu?
    3. Jak duży efekt częściowy mógłbyś stworzyć? Czy był to efekt konsystencji lub kontrastu?
    4. Czy w parze pojawił się efekt porządku pytania, w którym nie sądziłeś, że zamówienie będzie miało znaczenie?
  6. [ średni , zbieranie danych ] W oparciu o prace Schumana i Pressera, Moore (2002) opisuje oddzielny wymiar efektu zapytania: efekty addytywne i subtraktywne. Efekty kontrastu i konsystencji powstają w wyniku oceny respondentów dwóch elementów w stosunku do siebie, efekty addytywne i subtraktywne są tworzone, gdy respondenci są bardziej wrażliwi na większe ramy, w których stawia się pytania. Przeczytaj Moore (2002) , następnie zaprojektuj i przeprowadź eksperyment ankietowy na MTurku, aby zademonstrować efekty addytywne lub subtraktywne.

  7. [ ciężko , zbieranie danych ] Christopher Antoun i współpracownicy (2015) przeprowadzili badanie porównujące próbki wygody uzyskane z czterech różnych źródeł rekrutacji online: MTurk, Craigslist, Google AdWords i Facebook. Zaprojektuj prostą ankietę i zwerbuj uczestników za pomocą co najmniej dwóch różnych internetowych źródeł rekrutacji (źródła te mogą się różnić od czterech źródeł używanych w Antoun et al. (2015) ).

    1. Porównaj koszt jednego rekrutacji pod względem pieniądza i czasu pomiędzy różnymi źródłami.
    2. Porównaj skład próbek otrzymanych z różnych źródeł.
    3. Porównaj jakość danych między próbkami. Aby uzyskać pomysły na temat mierzenia jakości danych od respondentów, zobacz Schober et al. (2015) .
    4. Jakie jest Twoje preferowane źródło? Czemu?
  8. [ średni ] Starając się przewidzieć wyniki referendum UE w 2016 r. (Tj. Brexit), YouGov - internetowa firma zajmująca się badaniem rynku - przeprowadziła ankiety internetowe panelu około 800 000 respondentów w Wielkiej Brytanii.

    Szczegółowy opis modelu statystycznego YouGov można znaleźć na stronie https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Z grubsza rzecz biorąc, YouGov podzielił wyborców na typy w oparciu o wybory głosowania w wyborach w 2015 r., Wiek, kwalifikacje, płeć i datę rozmowy, a także okręg wyborczy, w którym żyli. Najpierw wykorzystali dane zebrane od panelistów YouGov do oszacowania, wśród tych, którzy głosowali, proporcji osób każdego typu wyborców, którzy zamierzali głosować na urlop. Oszacowali frekwencję każdego rodzaju wyborców za pomocą brytyjskiego brytyjskiego badania wyborów 2015 (BES), powyborczego wywiadu bezpośredniego, który zatwierdził frekwencję z list wyborczych. Na koniec oszacowano, ile osób było w wyborach każdego rodzaju wyborców, na podstawie ostatniej ankiety dotyczącej spisu ludności i rocznej liczby ludności (z dodatkowymi informacjami z innych źródeł danych).

    Trzy dni przed głosowaniem YouGov wykazał dwupunktową przewagę za wyjazdem. W przeddzień głosowania sondaż wskazywał, że wynik był zbyt bliski wezwania (49/51 Remain). Ostateczne badanie na dzień przewidywało 48/52 na rzecz Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). W rzeczywistości szacunek ten nie uzyskał wyniku końcowego (urlop 52/48) o cztery punkty procentowe.

    1. Skorzystaj z ogólnego schematu błędów ankiet omówionych w tym rozdziale, aby ocenić, co mogło pójść nie tak.
    2. Odpowiedź YouGova po wyborach (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) wyjaśniła: "Wydaje się to w dużej części ze względu na frekwencję - coś, co Powiedzieliśmy, że cały czas będzie miało kluczowe znaczenie dla wyniku tak wyważonego wyścigu. Nasz model frekwencji był częściowo oparty na tym, czy respondenci głosowali na ostatnich wyborach powszechnych, a frekwencja wyższa niż w wyborach powszechnych zaburzyła model, szczególnie na północy. "Czy to zmieni twoją odpowiedź na część (a)?
  9. [ średni , wymaga kodowania ] Napisz symulację ilustrującą każdy z błędów reprezentacji na rysunku 3.2.

    1. Stwórz sytuację, w której błędy te faktycznie znikają.
    2. Stwórz sytuację, w której błędy się wzajemnie zlewają.
  10. [ bardzo trudny , wymaga kodowania ] Badanie Blumenstock i współpracowników (2015) dotyczyło zbudowania modelu uczenia maszynowego, który mógłby wykorzystywać cyfrowe dane śledzenia do przewidywania odpowiedzi ankietowych. Teraz spróbujesz zrobić to samo z innym zestawem danych. Kosinski, Stillwell, and Graepel (2013) stwierdzili, że Facebook lubi przewidywać indywidualne cechy i cechy. Co zaskakujące, te prognozy mogą być jeszcze bardziej dokładne niż te z przyjaciółmi i współpracownikami (Youyou, Kosinski, and Stillwell 2015) .

    1. Czytaj Kosinski, Stillwell, and Graepel (2013) i powtórz cyfrę 2. Ich dane są dostępne na stronie http://mypersonality.org/
    2. Teraz powtórz rysunek 3.
    3. Na koniec wypróbuj model na swoich własnych danych na Facebooku: http://applymagicsauce.com/. Jak to działa dla Ciebie?
  11. [ średni ] Toole et al. (2015) użył rekordów szczegółowych rozmów telefonicznych (CDR) z telefonów komórkowych do prognozowania zagregowanych tendencji bezrobocia.

    1. Porównaj i kontrastuj projekt badawczy Toole et al. (2015) z tym z Blumenstock, Cadamuro, and On (2015) .
    2. Czy uważasz, że CDR powinny zastąpić tradycyjne ankiety, uzupełnić je lub nie zostać użyte w ogóle dla polityków rządowych do śledzenia bezrobocia? Czemu?
    3. Jakie dowody przekonają cię, że CDR mogą całkowicie zastąpić tradycyjne miary stopy bezrobocia?