מיט גויים-מאַשמאָעס סאַמפּאַלז, ווייץ קענען ופמאַכן דיסטאָרשאַנז געפֿירט דורך די אנגענומען מוסטערונג פּראָצעס.
אין דער זעלביקער וועג אַז ריסערטשערז וואָג רעספּאָנסעס פון מאַשמאָעס סאַמפּאַלז, זיי קענען אויך וואָג רעספּאָנסעס פון נאַן-מאַשמאָעס סאַמפּאַלז. לעמאָשל, ווי אַן אנדער ברירה צו די קפּס, ימאַדזשאַן אַז איר געשטעלט פאָן אַדס אויף טויזנטער פון וועבסיטעס צו רעקרוט פּאַרטיסאַפּאַנץ פֿאַר אַ יבערבליק צו אָפּשאַצן די אַרבעטלאָזיקייַט קורס. געוויינטלעך, איר וואָלט זיין סקעפּטיקאַל אַז די פּשוט מיינען פון דיין מוסטער וואָלט זיין אַ גוט שאַצן פון די אַרבעטלאָזיקייַט קורס. דיין סקעפּטיסיזאַם איז מיסטאָמע ווייַל איר טראַכטן אַז עטלעכע מענטשן זענען מער מסתּמא צו גאַנץ אייער יבערבליק ווי אנדערע. לעמאָשל, מענטשן וואס טאָן ניט פאַרברענגען אַ פּלאַץ פון צייַט אויף די וועב זענען ווייניקער מסתּמא צו פאַרענדיקן דיין יבערבליק.
ווי מיר געזען אין די לעצטע אָפּטיילונג, אָבער, אויב מיר וויסן ווי די מוסטער איז אויסגעקליבן-ווי מיר טאָן מיט מאַשמאָעס סאַמפּאַלז-דעמאָלט מיר קענען ופמאַכן דיסטאָרשאַנז געפֿירט דורך די מוסטערונג פּראָצעס. צום באַדויערן, ווען ארבעטן מיט גויים-מאַשמאָעס סאַמפּאַלז, מיר טאָן ניט וויסן ווי די מוסטער איז אויסגעקליבן. אבער, מיר קענען מאַכן אַסאַמפּשאַנז וועגן די מוסטערונג פּראָצעס און דעמאָלט צולייגן ווייטינג אין די זעלבע וועג. אויב די אַסאַמפּשאַנז זענען ריכטיק, דעריבער דער ווייטינג וועט ופמאַכן די דיסטאָרשאַנז געפֿירט דורך די מוסטערונג פּראָצעס.
לעמאָשל, ימאַדזשאַן אַז אין ענטפער צו דיין פאָן אַדס, איר ריקרוטיד 100.000 ריספּאַנדאַנץ. אבער, איר טאָן ניט גלויבן אַז די 100,000 ריספּאַנדאַנץ זענען אַ פּשוט ראַנדאָם מוסטער פון אמעריקאנער אַדאַלץ. אין פאַקט, ווען איר פאַרגלייַכן דיין ריספּאַנדאַנץ צו די יו באַפעלקערונג, איר געפינען אַז מענטשן פֿון עטלעכע לענדער (למשל, ניו יארק) זענען איבער-רעפּריזענטיד און אַז מענטשן פֿון עטלעכע לענדער (למשל, אלאסקע) זענען אונטער-רעפּריזענטיד. אזוי, דער אַרבעטלאָזיקייַט קורס פון דיין מוסטער איז מסתּמא צו זיין אַ שלעכט אָפּשאַצונג פון די אַרבעטלאָזיקייַט קורס אין די ציל באַפעלקערונג.
איין וועג צו ופמאַכן די דיסטאָרשאַן אַז געשען אין די מוסטערונג פּראָצעס איז צו באַשטימען ווייץ צו יעדער מענטש; נידעריקער ווייץ צו מענטשן פֿון שטאַטן אַז ביסט איבער-רעפּריזענטיד אין די מוסטער (למשל, ניו יארק) און העכער ווייץ צו מענטשן פון אמעריקע וואס זענען אונטער-רעפּריזענטיד אין די מוסטער (למשל, אלאסקע). מער ספּעסיפיקאַללי, די וואָג פֿאַר יעדער ענטפערער איז שייך צו זייער פּרעוואַלאַנס אין דיין מוסטער קאָרעוו צו זייער פּרעוואַלאַנס אין די יו באַפעלקערונג. דאס ווייטינג פּראָצעדור איז גערופֿן פּאָסטן-סטראַטיפיקאַטיאָן, און דער געדאַנק פון ווייינג זאָל דערמאָנען איר פון די בייַשפּיל אין סעקשאַן 3.4.1 ווו ריספּאַנדאַנץ פון ראָוד אינזל זענען געגעבן ווייניקער וואָג ווי ריספּאַנדאַנץ פֿון California. פּאָסטן-סטראַטיפיקאַטיאָן ריקווייערז אַז איר וויסן גענוג צו שטעלן דיין ריספּאַנדאַנץ אין גרופּעס און צו וויסן די פּראָפּאָרציע פון די ציל באַפעלקערונג אין יעדער גרופּע.
כאָטש די ווייטינג פון די מאַשמאָעס מוסטער און פון די גויים-מאַשמאָעס מוסטער זענען די זעלבע מאַטאַמאַטיקלי (זען טעכניש אַפּפּענדיקס), זיי אַרבעט געזונט אין פאַרשידענע סיטואַטיאָנס. אויב די פאָרשער האט אַ גאנץ מאַשמאָעס מוסטער (ד"ה, ניט קאַווערידזש טעות און קיין ניט-ענטפער), דעמאָלט ווייטינג וועט פּראָדוצירן אַנבייאַסט עסטאַמאַץ פֿאַר אַלע טרייץ אין אַלע קאַסעס. דאס שטאַרק טעאָרעטיש גאַראַנטירן איז וואָס אַדוואַקאַץ פון מאַשמאָעס סאַמפּאַלז געפינען זיי אַזוי אַטראַקטיוו. אויף די אנדערע האַנט, ווייטינג נאַן-מאַשמאָעס סאַמפּאַלז וועט בלויז פּראָדוצירן אַנבייאַסט עסטאַמאַץ פֿאַר אַלע טרייץ אויב די ענטפער פּראָפּענסיטיעס זענען די זעלבע פֿאַר אַלעמען אין יעדער גרופּע. אין אנדערע ווערטער, טראכטן צוריק צו אונדזער בייַשפּיל, ניצן פּאָסטן-סטראַטיפיקאַטיאָן וועט פּראָדוצירן אַנבייאַסט עסטאַמאַץ אויב אַלעמען אין ניו יארק האט די זעלבע מאַשמאָעס פון פּאַרטיסאַפּייטינג און אַלעמען אין אַלאַסקאַ האט די זעלבע מאַשמאָעס פון פּאַרטיסאַפּייטינג און אַזוי אויף. דעם האַשאָרע איז גערופֿן דעם כאָומאַדזשיניאַס-ענטפער-פּראָפּענסיטיעס-ין-גרופּעס האַשאָרע, און עס plays אַ שליסל ראָלע אין געוואוסט אויב פּאָסטן-סטראַטיפיקאַטיאָן וועט אַרבעטן געזונט מיט גויים-מאַשמאָעס סאַמפּאַלז.
צום באַדויערן, אין אונדזער בייַשפּיל, די כאָומאַדזשיניאַס-ענטפער-פּראָפּענסיטיעס-ין-גרופּעס האַשאָרע מיינט אַנלייקלי צו זיין אמת. אַז איז, עס מיינט אַנלייקלי אַז אַלעמען אין אַלאַסקאַ האט די זעלבע מאַשמאָעס פון ווייל אין דיין יבערבליק. אבער, עס זענען דרייַ וויכטיק ווייזט צו האַלטן אין גייַסט וועגן פּאָסטן-סטראַטיפיקאַטיאָן, אַלע פון וואָס מאַכן עס ויסקומען מער פּראַמאַסינג.
ערשטער, כאָומאַדזשיניאַס-ענטפער-פּראָפּענסיטיעס-ין-גרופּעס האַשאָרע ווערט מער גלייבלעך ווי די נומער פון גרופּעס ינקריסאַז. און, ריסערטשערז זענען נישט באגרענעצט צו גרופּעס נאָר באזירט אויף אַ איין Geographic ויסמעסטונג. לעמאָשל, מיר קען מאַכן גרופּעס באזירט אויף שטאַט, עלטער, געשלעכט, און מדרגה פון בילדונג. עס מיינט מער גלייבלעך אַז עס איז כאָומאַדזשיניאַס ענטפער פּראָפּענסיטיעס ין די גרופּע פון 18-29, ווייַבלעך, קאָלעגע גראַדזשאַוואַץ לעבעדיק אין אַלאַסקאַ ווי ין די גרופּע פון אַלע מענטשן לעבעדיק אין אַלאַסקאַ. אזוי, ווי די נומער פון גרופּעס געניצט פֿאַר פּאָסטן-סטראַטיפיקאַטיאָן ינקריסאַז, די אַסאַמפּשאַנז דארף צו שטיצן עס ווערן מער גלייַך. געגעבן דעם פאַקט, עס מיינט ווי אַ ריסערטשערז וואָלט ווילן צו שאַפֿן אַ ריזיק נומער פון גרופּעס פֿאַר פּאָסטן-סטראַטיפיקאַטיאָן. אבער, ווי די נומער פון גרופּעס ינקריסאַז, ריסערטשערז לויפן אין אַ אַנדערש פּראָבלעם: דאַטן ספּאַרסיטי. אויב עס זענען בלויז אַ קליין נומער פון מענטשן אין יעדער גרופּע, דעריבער די עסטאַמאַץ וועט זיין מער ומזיכער, און אין די עקסטרעם פאַל ווו עס איז אַ גרופּע וואָס האט ניט ריספּאַנדאַנץ, דעמאָלט פּאָסטן-סטראַטיפיקאַטיאָן גאָר ברייקס אַראָפּ. עס זענען צוויי וועגן אויס פון דעם טאָכיק שפּאַנונג צווישן די פּלאַוסיביליטי פון האָמאָגענעאָוס- ענטפער-פּראַפּענסיטי-ין-גרופּעס האַשאָרע און די פאָדערונג פֿאַר גלייַך מוסטער סיזעס אין יעדער גרופּע. איינער צוגאַנג איז צו באַוועגן צו אַ מער sophisticated סטאַטיסטיש מאָדעל פֿאַר קאַלקיאַלייטינג ווייץ און די אנדערע איז צו זאַמלען אַ גרעסערע, מער דייווערס מוסטער, וואָס העלפּס ענשור גלייַך מוסטער סיזעס אין יעדער גרופּע. און, מאל ריסערטשערז טאָן ביידע, ווי איך וועט באַשרייַבן אין מער דעטאַל אונטן.
א צווייט באַטראַכטונג ווען ארבעטן מיט פּאָסטן-סטראַטיפיקאַטיאָן פון נאַן-מאַשמאָעס סאַמפּאַלז איז אַז די כאָומאַדזשיניאַס-ענטפער-פּראַפּענסיטי-ין-גרופּעס האַשאָרע איז שוין אָפט געמאכט ווען אַנאַלייזינג מאַשמאָעס סאַמפּאַלז. די סיבה אַז דעם האַשאָרע איז דארף פֿאַר מאַשמאָעס סאַמפּאַלז אין פיר איז אַז מאַשמאָעס סאַמפּאַלז האָבן ניט-ענטפער, און די רובֿ פּראָסט אופֿן פֿאַר אַדזשאַסטינג פֿאַר ניט-ענטפער איז פּאָסטן-סטראַטיפיקאַטיאָן ווי דיסקרייבד אויבן. פון קורס, נאָר ווייַל פילע ריסערטשערז מאַכן אַ זיכער האַשאָרע טוט נישט מיינען אַז איר זאָל טאָן עס אויך. אבער, עס טוט מיינען אַז ווען קאַמפּערינג נאַן-מאַשמאָעס סאַמפּאַלז צו מאַשמאָעס סאַמפּאַלז אין פיר, מיר מוזן האַלטן אין מיינונג אַז ביידע אָפענגען אויף אַסאַמפּשאַנז און אַגזיליערי אינפֿאָרמאַציע אין סדר צו פּראָדוצירן עסטאַמאַץ. אין רובֿ רעאַליסטיש סעטטינגס, עס איז נאָר ניט האַשאָרע פּאָטער צוגאַנג צו ינפערענסע.
צום סוף, אויב איר זאָרגן וועגן איין אָפּשאַצונג אין באַזונדער, אין אונדזער בייַשפּיל אַרבעטלאָזיקייַט קורס-דעמאָלט איר דאַרפֿן אַ צושטאַנד וויקער ווי כאָומאַדזשיניאַס-ענטפער-פּראַפּענסיטי-ין-גרופּעס האַשאָרע. ספּעסיפיקאַללי, איר טאָן ניט דאַרפֿן צו יבערנעמען אַז אַלעמען האט די זעלבע ענטפער פּראַפּענסיטי, איר נאָר דאַרפֿן צו יבערנעמען אַז עס איז קיין קאָראַליישאַן צווישן ענטפער פּראַפּענסיטי און אַרבעטלאָזיקייַט קורס אין יעדער גרופּע. אַוואַדע, אַפֿילו דעם וויקער צושטאַנד וועט ניט האַלטן אין עטלעכע סיטואַטיאָנס. לעמאָשל, ימאַדזשאַן עסטאַמייטינג די פּראָפּאָרציע פון אמעריקאנער וואָס טאָן פרייַוויליקער אַרבעט. אויב מענטשן וואס טאָן פרייַוויליקער אַרבעט זענען מער מסתּמא צו שטימען צו זיין אין אַ יבערבליק, דעמאָלט ריסערטשערז וועט סיסטאַמאַטיקלי איבער-אָפּשאַצן די סומע פון וואָלאַנטירינג, אַפֿילו אויב זיי טאָן פּאָסטן-סטראַטיפיקאַטיאָן אַדזשאַסטמאַנץ, אַ רעזולטאַט וואָס האט שוין דעמאַנסטרייטיד עמפּיריקלי דורך Abraham, Helms, and Presser (2009) .
ווי איך געזאגט פריער, נאַן-מאַשמאָעס סאַמפּאַלז זענען וויוד מיט גרויס סקעפּטיסיזאַם דורך געזעלשאַפטלעך סייאַנטיס, אין טייל ווייַל פון זייער ראָלע אין עטלעכע פון די מערסט ימבעראַסינג פאַילורעס אין די פרי טעג פון יבערבליק פאָרשונג. א קלאָר בייַשפּיל פון ווי ווייַט מיר האָבן קומען מיט ניט-מאַשמאָעס סאַמפּאַלז איז די פאָרשונג פון וויי וואַנג, דוד ראָטשילד, שאַראַד גאָעל, און אנדריי געלמאַן אַז ריכטיק ריקאַווערד די אַוטקאַם פון די 2012 יו וואַלן ניצן אַ ניט-מאַשמאָעס מוסטער פון אמעריקאנער קסבאָקס ניצערס -אַ דיסיידאַדלי נאַן-ראַנדאָם מוסטער פון אמעריקאנער (Wang et al. 2015) . די ריסערטשערז ריקרוטיד ריספּאַנדאַנץ פון די קסבאָקס גיימינג סיסטעם, און ווי איר זאל דערוואַרטן, די קסבאָקס מוסטער סקיוד זכר און סקיוד יונג: 18-29 יאָר אָולדז מאַכן אַרויף 19% פון די ילעקטעראַט אָבער 65% פון די קסבאָקס מוסטער און מענטשן מאַכן אַרויף 47% פון די ילעקטעראַט און 93% פון די קסבאָקס מוסטער (Figure 3.4). ווייַל פון די שטאַרק דעמאָגראַפיק בייאַסיז, די רוי קסבאָקס דאַטן איז געווען אַ אָרעם גראדן פון וואַלן קערט. עס פּרעדיקטעד אַ שטאַרק זיג פֿאַר Mitt Romney איבער באַראַקק אבאמא. ווידער, דאָס איז אן אנדער בייַשפּיל פון די דיינדזשערז פון רוי, ונאַדדזשוסטעד נאַן-מאַשמאָעס סאַמפּאַלז און איז רעמאַניסאַנט פון די ליטערארישע דיגעסט פיאַסקאָ.
אָבער, וואַנג און חברים זענען אַווער פון די פּראָבלעמס און אַטטעמפּטעד צו וואָג די ריספּאַנדאַנץ צו ריכטיק פֿאַר די מוסטערונג פּראָצעס. אין באַזונדער, זיי געניצט אַ מער sophisticated פאָרעם פון די פּאָסטן-סטראַטיפיקאַטיאָן איך דערציילט איר וועגן. עס איז כדאי צו וויסן אַ ביסל מער וועגן זייער צוגאַנג ווייַל עס טוט בויען ינטוישאַן וועגן פּאָסטן-סטראַטיפיקאַטיאָן, און די באַזונדער ווערסיע וואַנג און חברים געניצט איז איינער פון די מערסט יקסייטינג אַפּראָוטשיז צו ווייטינג נאַן-מאַשמאָעס סאַמפּאַלז.
אין אונדזער פּשוט בייַשפּיל וועגן עסטאַמייטינג אַרבעטלאָזיקייַט אין סעקשאַן 3.4.1, מיר צעטיילט די באַפעלקערונג אין גרופּעס באזירט אויף שטאַט פון וווינאָרט. אין קאַנטראַסט, וואַנג און חברים צעטיילט די באַפעלקערונג אין זיך 176,256 גרופּעס Defined דורך: דזשענדער (2 קאַטעגאָריעס), ראַסע (4 קאַטעגאָריעס), עלטער (4 קאַטעגאָריעס), בילדונג (4 קאַטעגאָריעס), שטאַט (51 קאַטעגאָריעס), פּאַרטיי שייַן (3 קאַטעגאָריעס), ידעאָלאָגיע (3 קאַטעגאָריעס) און 2008 שטימען (3 קאַטעגאָריעס). מיט מער גרופּעס, די ריסערטשערז כאָופּט אַז עס וואָלט זיין ינקריסינגלי מסתּמא אַז ין יעדער גרופּע, ענטפער פּראַפּענסיטי איז ונקאָררעלאַטעד מיט שטיצן פֿאַר אבאמא. ווייַטער, אלא ווי קאַנסטראַקטינג יחיד-מדרגה ווייץ, ווי מיר האבן אין אונדזער בייַשפּיל, וואַנג און חברים געניצט אַ קאָמפּלעקס מאָדעל צו אָפּשאַצן די פּראָפּאָרציע פון מענטשן אין יעדער גרופּע וואָס וואָלט שטימען פֿאַר אבאמא. צום סוף, זיי קאַמביינד די גרופּע עסטאַמאַץ פון שטיצן מיט די באקאנט גרייס פון יעדער גרופּע צו פּראָדוצירן אַ עסטימאַטעד קוילעלדיק מדרגה פון שטיצן. אין אנדערע ווערטער, זיי געהאַקט אַרויף די באַפעלקערונג אין פאַרשידענע גרופּעס, עסטימאַטעד די שטיצן פֿאַר אבאמא אין יעדער גרופּע, און דעמאָלט גענומען אַ ווייטיד דורכשניטלעך פון די גרופּע עסטאַמאַץ צו פּראָדוצירן אַ קוילעלדיק אָפּשאַצונג.
אזוי, די גרויס אַרויסרופן אין זייער צוגאַנג איז צו אָפּשאַצן די שטיצן פֿאַר אבאמא אין יעדער פון די 176,256 גרופּעס. כאָטש זייער טאַפליע ינקלודעד 345,858 יינציק פּאַרטיסאַפּאַנץ, אַ ריזיק נומער דורך די סטאַנדאַרדס פון וואַלן פּאָללינג, עס זענען פילע, פילע גרופּעס פֿאַר וואָס וואַנג און חברים האט כּמעט קיין ריספּאַנדאַנץ. דעריבער, צו אָפּשאַצן די שטיצן אין יעדער גרופּע זיי געניצט אַ טעכניק גערופֿן מאַלטילעוואַל ראַגרעשאַן מיט פּאָסטן-סטראַטיפיקאַטיאָן, וואָס ריסערטשערז אַפפעקטיאָנאַטעלי רופן הער פּי עססענטיאַללי, צו אָפּשאַצן די שטיצן פֿאַר אבאמא ין אַ ספּעציפיש גרופּע, הער פּי פּאָאָלס אינפֿאָרמאַציע פון פילע ענג פֿאַרבונדענע גרופּעס. לעמאָשל, באַטראַכטן די אַרויסרופן פון עסטאַמייטינג די שטיצן פֿאַר אבאמא צווישן ווייַבלעך, היספּאַניקס, צווישן 18-29 יאר אַלט, וואס זענען קאָלעגע גראַדזשאַוואַץ וואס זענען רעגיסטרירט דעמאָקראַץ, וואס זעלבסט-ידענטיפיצירן ווי מאָדעראַטעס, און וואס וואָוטאַד פֿאַר אבאמא אין 2008. דעם איז אַ זייער, זייער ספּעציפיש גרופּע, און עס איז מעגלעך אַז עס איז קיינער אין דער מוסטער מיט די טשאַראַקטעריסטיקס. דעריבער, צו מאַכן עסטאַמאַץ וועגן דעם גרופּע, הער פּי פּאָאָלס צוזאַמען עסטאַמאַץ פון מענטשן אין זייער ענלעך גרופּעס.
ניצן דעם אַנאַליסיס סטראַטעגיע, וואַנג און חברים זענען ביכולת צו נוצן די קסבאָקס נאַן-מאַשמאָעס מוסטער צו זייער ענג אָפּשאַצונג די קוילעלדיק שטיצן אַז אבאמא באקומען אין די 2012 וואַלן (Figure 3.5). אין פאַקט זייער עסטאַמאַץ זענען מער פּינטלעך ווי אַ געמיינזאַם פון עפנטלעך מיינונג פּאָללס. אזוי, אין דעם פאַל, ווייטינג-ספּעסיפיקאַללי הער פּי-מיינט צו טאָן אַ גוט אַרבעט קערעקטינג די בייאַסיז אין ניט-מאַשמאָעס דאַטן; בייאַסיז וואָס זענען קענטיק ווען איר קוק בייַ די עסטאַמאַץ פון די ונאַדדזשוסטעד קסבאָקס דאַטן.
עס זענען צוויי הויפּט לעקציעס פון דעם לערנען פון וואַנג און חברים. ערשטער, ונאַדדזשוסטעד נאַן-מאַשמאָעס סאַמפּאַלז קענען פירן צו שלעכט עסטאַמאַץ; דאָס איז אַ לעקציע אַז פילע ריסערטשערז האָבן געהערט פריער. אָבער, די צווייט לעקציע איז אַז ניט-מאַשמאָעס סאַמפּאַלז, ווען ווייטיד רעכט, קענען אַקטשאַוואַלי פּראָדוצירן גאַנץ גוט עסטאַמאַץ. אין פאַקט, זייער עסטאַמאַץ זענען מער פּינטלעך ווי די עסטאַמאַץ פון pollster.com, אַ אַגגרעגאַטיאָן פון מער טראדיציאנעלן וואַלן פּאָללס.
סוף, עס זענען וויכטיק לימיטיישאַנז צו וואָס מיר קענען לערנען פון דעם איין ספּעציפיש לערנען. נאָר ווייַל פּאָסטן-סטראַטיפיקאַטיאָן געארבעט געזונט אין דעם באַזונדער פאַל, עס איז קיין גאַראַנטירן אַז עס וועט אַרבעטן געזונט אין אנדערע קאַסעס. אין פאַקט, ילעקשאַנז זענען טאָמער איינער פון די יזיאַסט סעטטינגס ווייַל פּאָללסטערס האָבן שוין געלערנט ילעקשאַנז פֿאַר כּמעט 100 יאר, עס איז רעגולער באַמערקונגען (מיר קענען זען וואס ווינס די ילעקשאַנז), און פּאַרטיי לעגיטימאַציע און דעמאָגראַפיק טשאַראַקטעריסטיקס זענען לעפיערעך פּרידיקטיוו פון אָפּשטימונג. אין דעם פונט, מיר פעלן האַרט טעאָריע און עמפּיריקאַל דערפאַרונג צו וויסן ווען ווייטינג אַדזשאַסטמאַנץ צו נאַן-מאַשמאָעס סאַמפּאַלז וועט פּראָדוצירן גענוג פּינטלעך עסטאַמאַץ. איין זאַך וואָס איז קלאָר, אָבער, איז אויב איר זענען געצווונגען צו אַרבעטן מיט ניט-מאַשמאָעס סאַמפּאַלז, דעמאָלט עס איז שטאַרק סיבה צו גלויבן אַז אַדזשאַסטיד עסטאַמאַץ וועט זיין בעסער ווי ניט-אַדזשאַסטיד עסטאַמאַץ.