Εκπροσώπηση είναι για την εξαγωγή συμπερασμάτων από τους ερωτηθέντες σας με τον πληθυσμό-στόχο σας.
Για να κατανοήσουμε το είδος των λαθών που μπορεί να συμβεί όταν συνάγοντας από τους ερωτηθέντες με το μεγαλύτερο πληθυσμό, ας εξετάσουμε το άχυρο δημοσκόπηση Λογοτεχνικό Digest που προσπάθησαν να προβλέψει την έκβαση των ΗΠΑ προεδρικές εκλογές του 1936. Αν και ήταν περισσότερο από ό, τι πριν από 75 χρόνια, αυτή η πανωλεθρία εξακολουθεί να έχει ένα σημαντικό μάθημα για να διδάξει τους ερευνητές σήμερα.
Λογοτεχνική Digest ήταν ένα δημοφιλές περιοδικό γενικού ενδιαφέροντος, αρχής γενομένης από το 1920 που άρχισε να τρέχει άχυρο κάλπες για να προβλέψει τα αποτελέσματα των προεδρικών εκλογών. Για να κάνετε αυτές τις προβλέψεις που θα στείλει ψηφοδέλτια σε πολλούς ανθρώπους, και στη συνέχεια απλά να λογαριάζετε τις ψηφοδέλτια που επεστράφησαν? Λογοτεχνική αφομοίωση με υπερηφάνεια ανέφερε ότι τα ψηφοδέλτια που έλαβαν ήταν ούτε το "σταθμισμένη, προσαρμόζεται, ούτε ερμηνεύεται." Αυτή η διαδικασία προβλέψει σωστά το νικητή των εκλογών το 1920, 1924, 1928 και 1932. το 1936, εν μέσω της Μεγάλης Ύφεσης, Λογοτεχνική αφομοίωση έστειλε ψηφοδέλτια σε 10 εκατομμύρια ανθρώπους, των οποίων τα ονόματα κατά κύριο λόγο προέρχονταν από τους τηλεφωνικούς καταλόγους και τα αρχεία εγγραφής αυτοκινήτων. Εδώ είναι το πώς περιγράφεται η μεθοδολογία τους:
«Ομαλή λειτουργία της μηχανής μετακινεί το DIGEST με την ταχεία ακρίβεια της εμπειρίας τριάντα χρόνια για να μειώσει εικασία για σκληρά γεγονότα. . . .Αυτό Εβδομάδα 500 πένες γδαρμένο περισσότερο από το ένα τέταρτο του ενός εκατομμυρίου διευθύνσεις ημέρα. Κάθε μέρα, σε ένα μεγάλο δωμάτιο ψηλά πάνω από Fourth Avenue κινητήρα ταινιωτών, στη Νέα Υόρκη, 400 εργαζόμενοι σύρετε επιδέξια ένα εκατομμύριο τεμάχια έντυπα-αρκετά για να ανοίξει σαράντα πόλη μπλοκ-στα απευθύνεται τυλίγει [sic]. Κάθε ώρα, το δικό το προϊόν της πέψης'S Post Office Υποσταθμός, τρεις φλυαρία μηχανήματα μέτρησης ταχυδρομικών τελών σφραγίζεται και σφραγίζονται τα λευκά στενόμακρα? εξειδικευμένο ταχυδρομικούς υπαλλήλους τους γυρίσει σε διόγκωση mailsacks? στόλου DIGEST φορτηγά επιτάχυνε τους να εκφράσουν αλληλογραφίας τρένα. . . Την επόμενη εβδομάδα, οι πρώτες απαντήσεις από αυτά τα δέκα εκατομμύρια θα ξεκινήσει το εισερχόμενο ρεύμα των αξιοσημείωτη ψηφοδελτίων, να είναι τριπλά ελέγχονται, επαληθεύονται, πέντε φορές cross-ταξινομημένες και ανήλθαν. Όταν το τελευταίο ψηφίο έχει totted και να ελέγχεται, αν την εμπειρία του παρελθόντος είναι ένα κριτήριο, η χώρα θα ξέρετε μέσα σε ένα κλάσμα του 1 τοις εκατό η πραγματική λαϊκή ψήφο των σαράντα εκατομμυρίων [ψηφοφόρους]. »(22 του Αυγούστου του 1936)
φετιχισμού του Digest της μέγεθος είναι άμεσα αναγνωρίσιμο σε κάθε ερευνητή «μεγάλα δεδομένα" σήμερα. Από τα 10 εκατομμύρια ψηφοδέλτια διανεμηθεί, ένα εκπληκτικό 2,4 εκατομμύρια ψηφοδέλτια επεστράφησαν-ότι είναι περίπου 1.000 φορές μεγαλύτερη από τις σύγχρονες πολιτικές δημοσκοπήσεις. Από αυτά τα 2,4 εκατομμύρια ερωτηθέντων η ετυμηγορία ήταν σαφής: Literary Digest προέβλεψε ότι ο αμφισβητίας Alf Landon επρόκειτο να νικήσει το νυν Franklin Roosevelt. Αλλά, στην πραγματικότητα, το ακριβώς αντίθετο συνέβη. Roosevelt νίκησε Landon σε μια κατολίσθηση. Πώς θα μπορούσε να Λογοτεχνική αφομοίωση πάει στραβά με τόσα πολλά στοιχεία; Σύγχρονη αντίληψη μας για τη δειγματοληψία κάνει λάθη Λογοτεχνική αφομοίωση του σαφείς και μας βοηθά να αποφύγουμε παρόμοια λάθη στο μέλλον.
Σκεφτόμαστε με σαφήνεια σχετικά με τη δειγματοληψία απαιτεί από εμάς να εξετάσουμε τέσσερις διαφορετικές ομάδες ανθρώπων (Σχήμα 3.1). Η πρώτη ομάδα των ανθρώπων που είναι ο πληθυσμός-στόχος? Αυτή είναι η ομάδα που η έρευνα προσδιορίζει ως τον πληθυσμό του ενδιαφέροντος. Στην περίπτωση των λογοτεχνικών Digest ο πληθυσμός στόχος ήταν οι ψηφοφόροι στο 1936 Προεδρικές Εκλογές. Μετά τη λήψη απόφασης σχετικά με έναν πληθυσμό-στόχο, ένας ερευνητής δίπλα χρειάζεται να αναπτύξει μια λίστα των ανθρώπων που μπορούν να χρησιμοποιηθούν για τη δειγματοληψία. Αυτός ο κατάλογος καλείται δειγματοληπτικό πλαίσιο και ο πληθυσμός για το πλαίσιο δειγματοληψίας ονομάζεται ο πληθυσμός πλαίσιο. Στην περίπτωση των λογοτεχνικών Digest ο πληθυσμός πλαίσιο ήταν οι 10 εκατομμύρια άνθρωποι των οποίων τα ονόματα προήλθε κατά κύριο λόγο από τους τηλεφωνικούς καταλόγους και τα αρχεία εγγραφής αυτοκινήτων. Ιδανικά ο πληθυσμός στόχος και ο πληθυσμός του πλαισίου θα είναι ακριβώς η ίδια, αλλά στην πράξη αυτό δεν είναι συχνά η περίπτωση. Οι διαφορές μεταξύ του πληθυσμού στόχου και του πληθυσμού πλαίσιο που ονομάζεται σφάλμα κάλυψης. σφάλμα κάλυψη δεν, από μόνη της να εγγυηθεί προβλήματα. Αλλά, αν οι άνθρωποι στον πληθυσμό πλαισίου είναι συστηματικά διαφορετικό από τους ανθρώπους που δεν του πληθυσμού πλαίσιο θα υπάρξει προκατάληψη κάλυψη. Σφάλμα κάλυψης ήταν η πρώτη από τις μεγάλες αδυναμίες με τη δημοσκόπηση Λογοτεχνικό Digest. Ήθελαν να μάθουν για τους ψηφοφόρους, που ήταν ο στόχος του πληθυσμού, αλλά κατασκεύασαν ένα πλαίσιο δειγματοληψίας κατά κύριο λόγο από τους τηλεφωνικούς καταλόγους και τα μητρώα αυτοκινήτων, τις πηγές ότι υπερεκπροσωπούνται πλουσιότερες τους Αμερικανούς, οι οποίοι ήταν πιο πιθανό να υποστηρίξουν Alf Landon (ανάκληση ότι και οι δύο από αυτές τις τεχνολογίες, που είναι κοινά σήμερα, ήταν σχετικά νέα στο χρόνο και ότι οι ΗΠΑ ήταν στη μέση της Μεγάλης Ύφεσης).
Μετά τον καθορισμό του πληθυσμού πλαίσιο, το επόμενο βήμα είναι για έναν ερευνητή να επιλέξει τον πληθυσμό του δείγματος? αυτοί είναι οι άνθρωποι που ο ερευνητής θα προσπαθήσει να πάρει συνέντευξη. Εάν το δείγμα έχει διαφορετικά χαρακτηριστικά από τον πληθυσμό πλαίσιο, τότε μπορούμε να εισαγάγει δειγματοληπτικό σφάλμα. Αυτό είναι το είδος του λάθους ποσοτικά στο περιθώριο σφάλματος που συνοδεύει συνήθως τις εκτιμήσεις. Στην περίπτωση του φιάσκο Λογοτεχνικό Digest, υπάρχει πραγματικά δεν ήταν δείγμα? προσπάθησαν να επικοινωνήσουν με όλους στον πληθυσμό πλαίσιο. Ακόμα κι αν δεν υπήρχε σφάλμα δειγματοληψίας, υπήρξε προφανώς ακόμα λάθος. Αυτό διευκρινίζει ότι τα περιθώρια των λαθών που συνήθως αναφέρονται με τις εκτιμήσεις από τις έρευνες είναι συνήθως παραπλανητικά μικρό? δεν περιλαμβάνουν όλες τις πηγές των σφαλμάτων.
Τέλος, ο ερευνητής προσπαθεί να πάρει συνέντευξη από όλους στον πληθυσμό του δείγματος. Αυτοί οι άνθρωποι που έχουν πραγματοποιηθεί επιτυχώς συνέντευξη καλούνται ερωτηθέντων. Στην ιδανική περίπτωση, ο πληθυσμός του δείγματος και οι ερωτηθέντες θα ήταν ακριβώς το ίδιο, αλλά στην πράξη δεν υπάρχει μη απάντησης. Δηλαδή, οι άνθρωποι που έχουν επιλεγεί στο δείγμα αρνούνται να συμμετάσχουν. Αν οι άνθρωποι που ανταποκρίνονται είναι διαφορετικοί από εκείνους που δεν ανταποκρίνονται, τότε μπορεί να υπάρχει προκατάληψη μη απάντησης. Προκατάληψη μη ανταπόκρισης ήταν το δεύτερο κύριο πρόβλημα με τη δημοσκόπηση Λογοτεχνικό Digest. Μόνο το 24% των ανθρώπων που έλαβαν ένα ψηφοδέλτιο απάντησε, και αποδείχθηκε ότι οι άνθρωποι που υποστήριξαν Landon ήταν πιο πιθανό να ανταποκριθούν.
Πέρα από απλά είναι ένα παράδειγμα για να εισάγουν τις ιδέες της παράστασης, η δημοσκόπηση Λογοτεχνικό Digest είναι μια συχνά επαναλαμβανόμενη παραβολή, προειδοποιώντας τους ερευνητές σχετικά με τους κινδύνους του τυχαία δειγματοληψία. Δυστυχώς, νομίζω ότι το μάθημα που πολλοί άνθρωποι αντλήσει από αυτή την ιστορία είναι το λάθος. Η πιο κοινή ηθικό δίδαγμα της ιστορίας είναι ότι οι ερευνητές δεν μπορούν να μάθουν τίποτα από δείγματα μη πιθανότητας (δηλαδή, τα δείγματα χωρίς αυστηρούς κανόνες πιθανοτήτων που βασίζονται για την επιλογή των συμμετεχόντων). Αλλά, όπως θα σας δείξω αργότερα σε αυτό το κεφάλαιο, αυτό δεν είναι απόλυτα σωστό. Αντ 'αυτού, νομίζω ότι υπάρχουν πραγματικά δύο ήθος σε αυτή την ιστορία? ήθη που είναι, όπως ισχύει σήμερα, όπως ήταν το 1936. Πρώτον, ένα μεγάλο ποσό τυχαία δεδομένα που συλλέγονται δεν θα εγγυηθεί μια καλή εκτίμηση. Δεύτερον, οι ερευνητές πρέπει να λογοδοτήσουν για το πώς τα δεδομένα τους συλλέχθηκαν όταν κάνουν εκτιμήσεις από αυτό. Με άλλα λόγια, επειδή η διαδικασία συλλογής δεδομένων στη δημοσκόπηση Λογοτεχνικό Digest συστηματικά λοξή προς ορισμένους ερωτηθέντες, οι ερευνητές πρέπει να χρησιμοποιήσετε μια πιο σύνθετη διαδικασία εκτίμηση πως τα βάρη ορισμένοι από τους ερωτηθέντες περισσότερο από άλλους. Αργότερα σε αυτό το κεφάλαιο, θα σας δείξω μια τέτοια στάθμιση διαδικασία-μετά-στρωματοποίηση-που μπορεί να σας δώσει τη δυνατότητα να προβαίνουν σε καλύτερες εκτιμήσεις με δείγματα μη πιθανότητας.