[ , ] W rozdziale byłem bardzo pozytywnie nastawiony do post stratyfikacji. Jednak nie zawsze poprawia to jakość szacunków. Skonstruuj sytuację, w której stratyfikacja po terminie może obniżyć jakość szacunków. (Aby uzyskać podpowiedź, zobacz Thomsen (1973) .)
[ , , ] Zaprojektuj i przeprowadź ankietę o prawdopodobieństwie błędu na Amazon Mechanical Turk, aby zapytać o posiadanie broni i jej nastawienie do kontroli nad bronią. Abyś mógł porównać swoje oszacowania z tymi pochodzącymi z próbki prawdopodobieństwa, skopiuj tekst pytania i opcje odpowiedzi bezpośrednio z wysokiej jakości ankiety, takiej jak te prowadzone przez Pew Research Center.
[ , , ] Goel i współpracownicy (2016) Przeprowadzili 49 pytań wielokrotnego wyboru związanych z ogólną ankietą społeczną (GSS) i wybierali ankiety przeprowadzane przez Pew Research Center na próbę niesatysfakcjonującą respondentów z Amazon Mechanical Turk. Następnie skorygowano o niereprezentatywność danych za pomocą modelowania po stratyfikacji i porównano ich skorygowane szacunki z danymi z badań GSS i Pew przeprowadzonych z prawdopodobieństwem. Przeprowadź tę samą ankietę na Amazon Mechanical Turk i spróbuj powtórzyć rysunek 2a i rysunek 2b, porównując skorygowane prognozy z szacunkami z ostatnich rund badania GSS i Pew. (Patrz tabela dodatków A2 dla listy 49 pytań.)
[ , , ] Wiele badań wykorzystuje samodzielnie zgłaszane miary korzystania z telefonów komórkowych. Jest to interesujące ustawienie, w którym badacze mogą porównywać zgłaszane przez siebie zachowania z zarejestrowanymi zachowaniami (patrz np. Boase and Ling (2013) ). Dwa typowe zachowania, o które należy zapytać, to wywoływanie i pisanie wiadomości tekstowych, a dwie typowe ramy czasowe to "wczoraj" i "w zeszłym tygodniu".
[ , ] Schuman i Presser (1996) twierdzą, że rozkazy pytań mają znaczenie dla dwóch rodzajów pytań: pytań częściowych, gdzie dwa pytania są na tym samym poziomie szczegółowości (np. Oceny dwóch kandydatów na prezydenta); i częściowe pytania, w przypadku których ogólne pytanie wiąże się z bardziej konkretnym pytaniem (np. pytanie "Jak bardzo jesteś zadowolony ze swojej pracy?", a następnie "Jak bardzo jesteś zadowolony ze swojego życia?").
Ponadto charakteryzują dwa rodzaje efektów zapytania: efekty spójności pojawiają się, gdy odpowiedzi na późniejsze pytanie są przybliżane (w przeciwnym razie byłyby) do odpowiedzi na wcześniejsze pytanie; Efekty kontrastowe występują, gdy występują większe różnice między odpowiedziami na dwa pytania.
[ , ] W oparciu o prace Schumana i Pressera, Moore (2002) opisuje oddzielny wymiar efektu zapytania: efekty addytywne i subtraktywne. Efekty kontrastu i konsystencji powstają w wyniku oceny respondentów dwóch elementów w stosunku do siebie, efekty addytywne i subtraktywne są tworzone, gdy respondenci są bardziej wrażliwi na większe ramy, w których stawia się pytania. Przeczytaj Moore (2002) , następnie zaprojektuj i przeprowadź eksperyment ankietowy na MTurku, aby zademonstrować efekty addytywne lub subtraktywne.
[ , ] Christopher Antoun i współpracownicy (2015) przeprowadzili badanie porównujące próbki wygody uzyskane z czterech różnych źródeł rekrutacji online: MTurk, Craigslist, Google AdWords i Facebook. Zaprojektuj prostą ankietę i zwerbuj uczestników za pomocą co najmniej dwóch różnych internetowych źródeł rekrutacji (źródła te mogą się różnić od czterech źródeł używanych w Antoun et al. (2015) ).
[ ] Starając się przewidzieć wyniki referendum UE w 2016 r. (Tj. Brexit), YouGov - internetowa firma zajmująca się badaniem rynku - przeprowadziła ankiety internetowe panelu około 800 000 respondentów w Wielkiej Brytanii.
Szczegółowy opis modelu statystycznego YouGov można znaleźć na stronie https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Z grubsza rzecz biorąc, YouGov podzielił wyborców na typy w oparciu o wybory głosowania w wyborach w 2015 r., Wiek, kwalifikacje, płeć i datę rozmowy, a także okręg wyborczy, w którym żyli. Najpierw wykorzystali dane zebrane od panelistów YouGov do oszacowania, wśród tych, którzy głosowali, proporcji osób każdego typu wyborców, którzy zamierzali głosować na urlop. Oszacowali frekwencję każdego rodzaju wyborców za pomocą brytyjskiego brytyjskiego badania wyborów 2015 (BES), powyborczego wywiadu bezpośredniego, który zatwierdził frekwencję z list wyborczych. Na koniec oszacowano, ile osób było w wyborach każdego rodzaju wyborców, na podstawie ostatniej ankiety dotyczącej spisu ludności i rocznej liczby ludności (z dodatkowymi informacjami z innych źródeł danych).
Trzy dni przed głosowaniem YouGov wykazał dwupunktową przewagę za wyjazdem. W przeddzień głosowania sondaż wskazywał, że wynik był zbyt bliski wezwania (49/51 Remain). Ostateczne badanie na dzień przewidywało 48/52 na rzecz Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). W rzeczywistości szacunek ten nie uzyskał wyniku końcowego (urlop 52/48) o cztery punkty procentowe.
[ , ] Napisz symulację ilustrującą każdy z błędów reprezentacji na rysunku 3.2.
[ , ] Badanie Blumenstock i współpracowników (2015) dotyczyło zbudowania modelu uczenia maszynowego, który mógłby wykorzystywać cyfrowe dane śledzenia do przewidywania odpowiedzi ankietowych. Teraz spróbujesz zrobić to samo z innym zestawem danych. Kosinski, Stillwell, and Graepel (2013) stwierdzili, że Facebook lubi przewidywać indywidualne cechy i cechy. Co zaskakujące, te prognozy mogą być jeszcze bardziej dokładne niż te z przyjaciółmi i współpracownikami (Youyou, Kosinski, and Stillwell 2015) .
[ ] Toole et al. (2015) użył rekordów szczegółowych rozmów telefonicznych (CDR) z telefonów komórkowych do prognozowania zagregowanych tendencji bezrobocia.