Δραστηριότητες

  • βαθμός δυσκολίας: εύκολη εύκολος , Μεσαίο Μεσαίο , σκληρά σκληρά , πολύ δύσκολο πολύ δύσκολο
  • απαιτεί μαθηματικά ( απαιτεί μαθηματικά ),
  • απαιτεί κωδικοποίηση ( απαιτεί κωδικοποίηση ),
  • συλλογή δεδομένων ( συλλογή δεδομένων ),
  • τα αγαπημένα μου ( το αγαπημένο μου ),
  1. [ σκληρά , απαιτεί μαθηματικά ] Στο κεφάλαιο, ήμουν πολύ θετικός για τη μετα-στρωματοποίηση. Ωστόσο, αυτό δεν βελτιώνει πάντα την ποιότητα των εκτιμήσεων. Κατασκευάστε μια κατάσταση όπου η μεταστρωματοποίηση μπορεί να μειώσει την ποιότητα των εκτιμήσεων. (Για μια υπόδειξη, βλ. Thomsen (1973) .)

  2. [ σκληρά , συλλογή δεδομένων , απαιτεί κωδικοποίηση ] Σχεδιάστε και διεξάγετε μια έρευνα μη πιθανότητας για την Amazon Mechanical Turk για να ρωτήσετε για την ιδιοκτησία όπλων και τις στάσεις απέναντι στον έλεγχο των όπλων. Για να συγκρίνετε τις εκτιμήσεις σας με εκείνες που προέρχονται από ένα δείγμα πιθανότητας, αντιγράψτε το κείμενο ερώτησης και τις επιλογές απόκρισης απευθείας από μια έρευνα υψηλής ποιότητας, όπως αυτές που διεξάγονται από το ερευνητικό κέντρο Pew.

    1. Πόσο καιρό λαμβάνει η έρευνα σας; Πόσο κοστίζει? Πώς συγκρίνονται τα δημογραφικά στοιχεία του δείγματος σας με τα δημογραφικά στοιχεία του πληθυσμού των ΗΠΑ;
    2. Ποια είναι η ακαθάριστη εκτίμηση της ιδιοκτησίας όπλων χρησιμοποιώντας το δείγμα σας;
    3. Διορθώστε τη μη αντιπροσωπευτικότητα του δείγματος σας χρησιμοποιώντας μετα-στρωματοποίηση ή κάποια άλλη τεχνική. Τώρα ποια είναι η εκτίμηση της ιδιοκτησίας όπλων;
    4. Πώς συγκρίνονται οι εκτιμήσεις σας με την πιο πρόσφατη εκτίμηση από ένα δείγμα βάσει πιθανότητας; Τι πιστεύεις ότι εξηγεί τις διαφορές, αν υπάρχουν;
    5. Επαναλάβετε τις ερωτήσεις (β) - (δ) για τις στάσεις απέναντι στον έλεγχο των όπλων. Πώς διαφέρουν τα ευρήματά σας;
  3. [ πολύ δύσκολο , συλλογή δεδομένων , απαιτεί κωδικοποίηση ] Ο Goel και οι συνάδελφοί του (2016) διέθεσαν 49 ερωτήσεις ευαισθητοποίησης πολλαπλής επιλογής που προέρχονται από τη Γενική Κοινωνική Έρευνα (GSS) και επιλέγουν έρευνες από το Κέντρο Έρευνας Pew στο δείγμα ερωτηματολογίων μη πιθανότητας που προέρχονται από την Amazon Mechanical Turk. Στη συνέχεια, προσαρμόστηκαν για την μη αντιπροσωπευτικότητα των δεδομένων χρησιμοποιώντας τη μεταστρωματοποίηση με βάση το μοντέλο και συνέκριναν τις προσαρμοσμένες εκτιμήσεις τους με εκείνες των ερευνών GSS και Pew με βάση την πιθανότητα. Διεξάγετε την ίδια έρευνα στην Amazon Mechanical Turk και προσπαθήστε να αντιγράψετε το σχήμα 2α και το σχήμα 2b συγκρίνοντας τις προσαρμοσμένες εκτιμήσεις σας με τις εκτιμήσεις από τους πιο πρόσφατους κύκλους των ερευνών GSS και Pew. (Βλ. Πίνακα A2 του παραρτήματος για τον κατάλογο των 49 ερωτήσεων).

    1. Συγκρίνετε και αντιπαραβάλλετε τα αποτελέσματά σας με αυτά της Pew και του GSS.
    2. Συγκρίνετε και αντιπαραβάλλετε τα αποτελέσματά σας με τα αποτελέσματα της έρευνας Mechanical Turk στο Goel, Obeng, and Rothschild (2016) .
  4. [ Μεσαίο , συλλογή δεδομένων , απαιτεί κωδικοποίηση ] Πολλές μελέτες χρησιμοποιούν αυτοαναφερόμενες μετρήσεις χρήσης κινητού τηλεφώνου. Αυτό είναι ένα ενδιαφέρον πλαίσιο στο οποίο οι ερευνητές μπορούν να συγκρίνουν την αυτοαναφερόμενη συμπεριφορά με καταγεγραμμένη συμπεριφορά (βλ. Π.χ. Boase and Ling (2013) ). Δύο κοινές συμπεριφορές για να ρωτήσετε για κλήσεις και γραπτά μηνύματα και δύο κοινά χρονικά πλαίσια είναι "χθες" και "την προηγούμενη εβδομάδα".

    1. Πριν από τη συλλογή οποιωνδήποτε δεδομένων, ποια από τα μέτρα αυτοελέγχου πιστεύετε ότι είναι ακριβέστερα; Γιατί;
    2. Προσλάβετε πέντε από τους φίλους σας για να είστε στην έρευνά σας. Ανακεφαλαιώστε συνοπτικά πώς ελήφθησαν δείγματα από αυτούς τους πέντε φίλους. Μπορεί αυτή η διαδικασία δειγματοληψίας να προκαλέσει συγκεκριμένες προκαταλήψεις στις εκτιμήσεις σας;
    3. Ζητήστε τους τις ακόλουθες ερωτήσεις σχετικά με την μικροδιαχείρηση:
    • "Πόσες φορές χρησιμοποιήσατε το κινητό σας για να καλέσετε άλλους χθες;"
    • "Πόσα μηνύματα κειμένου στείλατε χθες;"
    • "Πόσες φορές χρησιμοποιήσατε το κινητό σας για να καλέσετε άλλους χρήστες τις τελευταίες επτά ημέρες;"
    • "Πόσες φορές χρησιμοποιήσατε το κινητό σας τηλέφωνο για να στέλνετε ή να λαμβάνετε μηνύματα SMS / SMS τις τελευταίες επτά ημέρες;"
    1. Μόλις ολοκληρωθεί αυτή η μικροελέγχρωση, ζητήστε να ελέγξετε τα δεδομένα χρήσης όπως καταγράφονται από το τηλέφωνο ή το φορέα παροχής υπηρεσιών. Πώς συγκρίνεται η χρήση της αναφοράς μόνο με τα δεδομένα καταγραφής; Ποιο είναι το πιο ακριβές, το λιγότερο ακριβές;
    2. Συνδυάστε τώρα τα δεδομένα που συλλέξατε με τα δεδομένα άλλων ατόμων της τάξης σας (αν κάνετε αυτή τη δραστηριότητα για μια τάξη). Με αυτό το μεγαλύτερο σύνολο δεδομένων, επαναλάβετε το τμήμα (d).
  5. [ Μεσαίο , συλλογή δεδομένων ] Οι Schuman και Presser (1996) υποστηρίζουν ότι οι παραγγελίες ερωτήσεων θα είχαν σημασία για δύο τύπους ερωτήσεων: ερωτήσεις μερικής συνιστώσας όπου δύο ερωτήματα έχουν το ίδιο επίπεδο ειδικότητας (π.χ. βαθμολογίες δύο προεδρικών υποψηφίων). και μερικές ολόκληρες ερωτήσεις όπου μια γενική ερώτηση ακολουθεί μια πιο συγκεκριμένη ερώτηση (π.χ., ρωτώντας "Πόσο ικανοποιημένος είσαι εσύ με τη δουλειά σου" και ακολουθούμενη από το "Πόσο ικανοποιημένος είσαι με τη ζωή σου;").

    Επιπλέον, χαρακτηρίζουν δύο τύπους αποτελεσμάτων: οι συνέπειες συνέπειας εμφανίζονται όταν οι απαντήσεις σε ένα μεταγενέστερο ερώτημα έρχονται πιο κοντά (από ό, τι διαφορετικά) σε εκείνες που δόθηκαν σε προηγούμενη ερώτηση. τα φαινόμενα αντίθεσης εμφανίζονται όταν υπάρχουν μεγαλύτερες διαφορές μεταξύ των απαντήσεων σε δύο ερωτήσεις.

    1. Δημιουργήστε ένα ζευγάρι ερωτήσεων μερικής σκέψης που νομίζετε ότι θα έχουν μεγάλη επίδραση ερωτήματος. ένα ζεύγος ερωτήσεων μερικής σκέψης που νομίζετε ότι θα έχουν ένα μεγάλο αποτέλεσμα. και ένα ζευγάρι ερωτήσεων των οποίων η σειρά νομίζετε ότι δεν θα είχε σημασία. Εκτελέστε ένα πείραμα έρευνας στο Amazon Mechanical Turk για να ελέγξετε τις ερωτήσεις σας.
    2. Πόσο μεγάλο είναι ένα αποτέλεσμα μερικής απασχόλησης που μπορέσατε να δημιουργήσετε; Ήταν ένα αποτέλεσμα συνέπειας ή αντίθεσης;
    3. Πόσο μεγάλο ήταν ένα μερικό αποτέλεσμα; Ήταν ένα αποτέλεσμα συνέπειας ή αντίθεσης;
    4. Υπήρξε μια επίδραση ερωτήματος για το ζευγάρι σας, όπου δεν νομίζατε ότι η σειρά θα είχε σημασία;
  6. [ Μεσαίο , συλλογή δεδομένων ] Βασιζόμενοι στο έργο των Schuman και Presser, Moore (2002) περιγράφει μία ξεχωριστή διάσταση της επίδρασης της σειράς ερωτήσεων: προσθετικά και αφαιρετικά αποτελέσματα. Αν και οι συνέπειες της αντίθεσης και της συνέπειας προκύπτουν ως αποτέλεσμα των αξιολογήσεων των ερωτηθέντων των δύο αντικειμένων σε σχέση μεταξύ τους, δημιουργούνται προσθετικά και αφαιρετικά αποτελέσματα όταν οι ερωτώμενοι γίνονται πιο ευαίσθητοι στο ευρύτερο πλαίσιο μέσα στο οποίο τίθενται οι ερωτήσεις. Διαβάστε το Moore (2002) , στη συνέχεια σχεδιάστε και εκτελέστε ένα πείραμα έρευνας στο MTurk για να δείξετε πρόσθετα ή αφαιρετικά αποτελέσματα.

  7. [ σκληρά , συλλογή δεδομένων ] Ο Christopher Antoun και οι συνεργάτες του (2015) διεξήγαγαν μια μελέτη που συνέκρινε τα δείγματα ευκολίας που ελήφθησαν από τέσσερις διαφορετικές πηγές πρόσληψης σε απευθείας σύνδεση: MTurk, Craigslist, Google AdWords και Facebook. Σχεδιάστε μια απλή έρευνα και προσλάβετε τους συμμετέχοντες μέσω τουλάχιστον δύο διαφορετικών πηγών πρόσληψης σε απευθείας σύνδεση (οι πηγές αυτές μπορεί να διαφέρουν από τις τέσσερις πηγές που χρησιμοποιούνται στον Antoun et al. (2015) ).

    1. Συγκρίνετε το κόστος ανά άτομο - από άποψη χρημάτων και χρόνου - μεταξύ διαφορετικών πηγών.
    2. Συγκρίνετε τη σύνθεση των δειγμάτων που λαμβάνονται από διαφορετικές πηγές.
    3. Συγκρίνετε την ποιότητα των δεδομένων μεταξύ των δειγμάτων. Για ιδέες σχετικά με τον τρόπο μέτρησης της ποιότητας των δεδομένων από τους ερωτηθέντες, βλ. Schober et al. (2015) .
    4. Ποια είναι η προτιμώμενη πηγή σας; Γιατί;
  8. [ Μεσαίο ] Σε μια προσπάθεια να προβλέψουμε τα αποτελέσματα του δημοψηφίσματος του 2016 (π.χ. Brexit), η YouGov, μια εταιρεία έρευνας αγοράς με βάση το Διαδίκτυο, διεξήγαγε διαδικτυακές δημοσκοπήσεις από μια ομάδα περίπου 800.000 ερωτηθέντων στο Ηνωμένο Βασίλειο.

    Μια λεπτομερής περιγραφή του στατιστικού μοντέλου YouGov διατίθεται στη διεύθυνση https://yougov.co.uk/news/2016/06/21/yougov-referendum-model/. Σχεδόν μιλώντας, η YouGov χώρισε τους ψηφοφόρους σε τύπους με βάση τη γενική εκλογή των εκλογών του 2015, την ηλικία, τα προσόντα, το φύλο και την ημερομηνία της συνέντευξης, καθώς και την εκλογική περιφέρεια στην οποία ζούσαν. Πρώτον, χρησιμοποίησαν τα δεδομένα που συγκέντρωσαν από τους πάντες YouGov για να εκτιμήσουν, μεταξύ αυτών που ψήφισαν, το ποσοστό των ανθρώπων κάθε τύπου ψηφοφόρου που σκόπευαν να ψηφίσουν Αφήστε. Εκτίμησαν την προσέλευση κάθε τύπου ψηφοφόρου χρησιμοποιώντας τη βρετανική μελέτη εκλογών του 2015 (BES), μια μετεκλογική έρευνα με πρόσωπο πρόσωπο με πρόσωπο, η οποία επικύρωσε την προσέλευση από τους εκλογικούς καταλόγους. Τέλος, εκτιμάται πόσοι άνθρωποι υπήρχαν από κάθε τύπο ψηφοφόρου στο εκλογικό σώμα, με βάση την τελευταία Απογραφή Πληθυσμού και Ετήσια Πληθυσμιακή Έρευνα (με μερικές προσθήκες από άλλες πηγές δεδομένων).

    Τρεις ημέρες πριν από την ψηφοφορία, η YouGov έδειξε ένα προβάδισμα δύο σημείων για το Leave. Την παραμονή της ψηφοφορίας, η δημοσκόπηση έδειξε ότι το αποτέλεσμα ήταν πολύ κοντά στην κλήση (49/51 Remain). Η τελική μελέτη της ημέρας προέβλεπε 48/52 υπέρ του Remain (https://yougov.co.uk/news/2016/06/23/yougov-day-poll/). Στην πραγματικότητα, ο υπολογισμός αυτός έχασε το τελικό αποτέλεσμα (52/48 Άδεια) κατά τέσσερις ποσοστιαίες μονάδες.

    1. Χρησιμοποιήστε το συνολικό πλαίσιο σφάλματος της έρευνας που εξετάζεται σε αυτό το κεφάλαιο για να αξιολογήσετε τι θα μπορούσε να πάει στραβά.
    2. Η απάντηση της YouGov μετά τις εκλογές (https://yougov.co.uk/news/2016/06/24/brexit-follows-close-run-campaign/) εξήγησε: "Αυτό φαίνεται σε μεγάλο βαθμό εξαιτίας της συμμετοχής - κάτι που είπαμε ότι όλα αυτά θα ήταν κρίσιμα για την έκβαση μιας τόσο ισορροπημένης φυλής. Το μοντέλο συμμετοχής μας στηριζόταν, εν μέρει, στο αν οι ερωτηθέντες είχαν ψηφίσει στις τελευταίες γενικές εκλογές και το επίπεδο συμμετοχής σε ψηφοφορία υψηλότερο από εκείνο των γενικών εκλογών, έστρεψε το μοντέλο, ιδιαίτερα στο Βορρά. "Αλλάζει αυτή η απάντησή σας στο μέρος (α);
  9. [ Μεσαίο , απαιτεί κωδικοποίηση ] Γράψτε μια προσομοίωση για να απεικονίσετε καθένα από τα σφάλματα αναπαράστασης στο σχήμα 3.2.

    1. Δημιουργήστε μια κατάσταση όπου αυτά τα σφάλματα ακυρώνονται πραγματικά.
    2. Δημιουργήστε μια κατάσταση όπου τα σφάλματα συνδυάζονται μεταξύ τους.
  10. [ πολύ δύσκολο , απαιτεί κωδικοποίηση ] Η έρευνα του Blumenstock και των συναδέλφων του (2015) περιλάμβανε την οικοδόμηση ενός μοντέλου μηχανικής μάθησης που θα μπορούσε να χρησιμοποιήσει ψηφιακά δεδομένα ίχνους για να προβλέψει τις απαντήσεις της έρευνας. Τώρα, θα δοκιμάσετε το ίδιο πράγμα με διαφορετικό σύνολο δεδομένων. Kosinski, Stillwell, and Graepel (2013) διαπίστωσαν ότι το Facebook Kosinski, Stillwell, and Graepel (2013) να μπορεί να προβλέψει μεμονωμένα χαρακτηριστικά και ιδιότητες. Παραδόξως, αυτές οι προβλέψεις μπορούν να είναι ακόμη ακριβέστερες από αυτές των φίλων και συναδέλφων (Youyou, Kosinski, and Stillwell 2015) .

    1. Διαβάστε τους Kosinski, Stillwell, and Graepel (2013) και επαναλάβετε το σχήμα 2. Τα στοιχεία τους είναι διαθέσιμα στη διεύθυνση http://mypersonality.org/
    2. Τώρα, αντιγράψτε το σχήμα 3.
    3. Τέλος, δοκιμάστε το μοντέλο τους στα δικά σας δεδομένα στο Facebook: http://applymagicsauce.com/. Πόσο καλά λειτουργεί για εσάς;
  11. [ Μεσαίο ] Toole et al. (2015) χρησιμοποίησε αρχεία λεπτομερειών κλήσεων (CDR) από κινητά τηλέφωνα για να προβλέψει τις συνολικές τάσεις ανεργίας.

    1. Συγκρίνετε και αντιπαραβάλλετε το σχεδιασμό μελέτης των Toole et al. (2015) με εκείνη των Blumenstock, Cadamuro, and On (2015) .
    2. Πιστεύετε ότι οι ΚΠΔ πρέπει να αντικαταστήσουν τις παραδοσιακές έρευνες, να τις συμπληρώσουν ή να μην χρησιμοποιηθούν καθόλου για τους κυβερνητικούς φορείς χάραξης πολιτικής για την παρακολούθηση της ανεργίας; Γιατί;
    3. Ποιες αποδείξεις θα σας πείσουν ότι τα CDR μπορούν να αντικαταστήσουν εντελώς τα παραδοσιακά μέτρα του ποσοστού ανεργίας;