כאָטש עס קענען זיין מעסי, ענריטשט אַסקינג קענען זיין שטאַרק.
אַ אַנדערש צוגאַנג צו דילינג מיט די ינקאָמפּלעטענעסס פון דיגיטאַל שפּור דאַטן איז צו באַרייַכערן עס גלייַך מיט יבערבליק דאַטן, אַ פּראָצעס וואס איך וועט רופן ענריטשט אַסקינג. איין בייַשפּיל פון ענריטשט אַסקינג איז די לערנען פון Burke and Kraut (2014) , וואָס איך דיסקרייבד פריער אין די קאַפּיטל (אָפּטיילונג 3.2), וועגן צי ינעראַקטינג אויף Facebook ינקריסאַז פרייַנדשאַפט שטאַרקייַט. אין אַז פאַל, בורקע און Kraut קאַמביינד יבערבליק דאַטן מיט Facebook קלאָץ דאַטע.
די באַשטעטיקן אַז בורקע און Kraut זענען ארבעטן אין, אָבער, מענט אַז זיי האבן נישט האָבן צו האַנדלען מיט צוויי גרויס פּראָבלעמס אַז ריסערטשערז טאן ענריטשט אַסקינג פּנים. ערשטער, אַקטשאַוואַלי פֿאַרבינדונג צוזאַמען די דאַטן שטעלט-אַ פּראָצעס גערופֿן רעקאָרד לינגקאַדזש, די וואָס ריכטן פון אַ רעקאָרד אין איין דאַטאַסעט מיט די צונעמען רעקאָרד אין די אנדערע דאַטאַסעט-קענען זיין שווער און טעות-פּראָון (מיר וועט זען אַ בייַשפּיל פון דעם פּראָבלעם ונטן ). די רגע הויפּט פּראָבלעם פון ענריטשט אַסקינג איז אַז די קוואַליטעט פון די דיגיטאַל טראַסעס וועט אָפט זיין שווער פֿאַר ריסערטשערז צו אַססעסס. לעמאָשל, מאל דער פּראָצעס דורך וואָס עס איז געזאמלט איז פּראַפּרייאַטערי און קען זיין סאַסעפּטאַבאַל צו פילע פון די פּראָבלעמס דיסקרייבד אין טשאַפּטער 2. אין אנדערע ווערטער, ענריטשט אַסקינג וועט אָפט אַרייַנציען טעות-פּראָון פֿאַרבינדונג פון סערווייז צו שוואַרץ-קעסטל דאַטן קוואלן פון אומבאַקאַנט קוואַליטעט. טראָץ די קאַנסערנז אַז די צוויי פּראָבלעמס פאָרשטעלן, עס איז מעגלעך צו אָנפירן וויכטיק פאָרשונג מיט דעם סטראַטעגיע ווי איז דעמאַנסטרייטיד דורך סטיווען אַנסאָלאַבעהערע און איתן הערש (2012) אין זייער פאָרשונג אויף אָפּשטימונג פּאַטערנז אין די יו. עס איז ווערטיק צו גיין איבער דעם לערנען אין עטלעכע דעטאַל ווייַל פילע פון די סטראַטעגיעס אַז אַנסאָלאַבעהערע און הערש דעוועלאָפּעד וועט זיין נוצלעך אין אנדערע אַפּלאַקיישאַנז פון ענריטשט אַסקינג.
וויילער טורנאָוט האט שוין די ונטערטעניק פון ברייט פאָרשונג אין פּאָליטיש וויסנשאַפֿט, און אין די פאַרגאַנגענהייַט, ריסערטשערז 'שכל פון וואס וואָוץ און וואָס האט בכלל געווען באזירט אויף די אַנאַליסיס פון יבערבליק דאַטע. אָפּשטימונג אין די יו, אָבער, איז אַ ומגעוויינטלעך נאַטור אין אַז די רעגירונג רעקאָרדס צי יעדער בירגער האט וואָוטאַד (פון קורס, די רעגירונג טוט נישט רעקאָרד וואס יעדער בירגער וואָוץ פֿאַר). פֿאַר פילע יאָרן, די רעגירונגס אָפּשטימונג רעקאָרדס זענען פאַראַנען אויף פּאַפּיר Forms, צעוואָרפן אין פאַרשידן היגע רעגירונג אָפפיסעס אַרום דעם מדינה. דעם געמאכט עס שווער, אָבער ניט אוממעגלעך, פֿאַר פּאָליטיש סייאַנטיס צו האָבן אַ גאַנץ בילד פון די ילעקטעראַט און צו פאַרגלייַכן וואָס מענטשן זאָגן אין סערווייז וועגן אָפּשטימונג צו זייער פאַקטיש אָפּשטימונג נאַטור (Ansolabehere and Hersh 2012) .
אבער, איצט די אָפּשטימונג רעקאָרדס האָבן שוין דיגיטאַליזירן, און אַ נומער פון פּריוואַט קאָמפּאַניעס האָבן סיסטאַמאַטיקלי געזאמלט און מערדזשד די אָפּשטימונג רעקאָרדס צו פּראָדוצירן פולשטענדיק בעל אָפּשטימונג טעקעס אַז רעקאָרד די אָפּשטימונג נאַטור פון אַלע אמעריקאנער. אַנסאָלאַבעהערע און הערש פּאַרטנערעד מיט איינער פון די קאָמפּאַניעס-קאַטאַליסט LCC-אין סדר צו נוצן זייער בעל אָפּשטימונג טעקע צו העלפן אַנטוויקלען אַ בעסער בילד פון די ילעקטעראַט. ווייטער, ווייַל עס רילייד אויף דיגיטאַל רעקאָרדס געזאמלט און קוראַטעד דורך אַ פירמע, עס געפֿינט זיך אַ נומער פון אַדוואַנטאַגעס איבער פרייַערדיק השתדלות דורך ריסערטשערז וואס האט שוין געטאן אָן דער הילף פון קאָמפּאַניעס און ניצן אַנאַלאָג רעקאָרדס.
ווי פילע פון די דיגיטאַל שפּור קוואלן אין טשאַפּטער 2, די קאַטאַליסט בעל טעקע האט ניט אַרייַננעמען פיל פון די דעמאָגראַפיק, אַטטיטודינאַל, און ביכייוויעראַל אינפֿאָרמאַציע אַז אַנסאָלאַבעהערע און הערש דארף. אין דערצו צו דעם אינפֿאָרמאַציע, אַנסאָלאַבעהערע און הערש זענען דער הויפּט אינטערעסירט אין קאַמפּערינג געמאלדן אָפּשטימונג אָפּפירונג צו וואַלאַדייטאַד אָפּשטימונג נאַטור (ד"ה, די אינפֿאָרמאַציע אין די קאַטאַליסט דייטאַבייס). אזוי, דער ריסערטשערז געזאמלט די דאַטע אַז זיי געוואלט ווי אַ טייל פון די קאָאָפּעראַטיווע קאָנגרעססיאָנאַל וואַלן לערנען (קסעס), אַ גרויס געזעלשאַפטלעך יבערבליק. ווייַטער, די ריסערטשערז האט דעם דאַטן צו קאַטאַליסט, און קאַטאַליסט געגעבן די ריסערטשערז צוריק אַ מערדזשד דאַטע טעקע אַז ינקלודעד וואַלאַדייטאַד אָפּשטימונג נאַטור (פֿון קאַטאַליסט), די זעלבסט-געמאלדן אָפּשטימונג נאַטור (פֿון קסעס) און די דעמאָגראַפיקס און אַטאַטודז פון ריספּאַנדאַנץ (פֿון קסעס ). אין אנדערע ווערטער, אַנסאָלאַבעהערע און הערש ענריטשט די אָפּשטימונג דאַטע מיט יבערבליק דאַטן, און די ריזאַלטינג מערדזשד טעקע ינייבאַלז זיי צו טאָן עפּעס אַז ניט דער טעקע ענייבאַלד ינדיווידזשואַלי.
דורך ינריטשינג די קאַטאַליסט בעל דאַטן טעקע מיט יבערבליק דאַטן, אַנסאָלאַבעהערע און הערש איז געקומען צו דרייַ וויכטיק קאַנקלוזשאַנז. ערשטער, איבער-ריפּאָרטינג פון אָפּשטימונג איז ומגעצוימט: כּמעט העלפט פון די גויים-וואָטערס געמאלדן אָפּשטימונג. אָדער, אן אנדער וועג פון קוקן אין עס איז אויב עמעצער געמאלדן אָפּשטימונג, עס איז בלויז אַ 80% שאַנס אַז זיי אַקטשאַוואַלי וואָוטאַד. רגע, איבער-רעפּאָרטינג איז נישט ראַנדאָם; איבער-ריפּאָרטינג איז מער פּראָסט צווישן הויך-האַכנאָסע, געזונט-געבילדעט, פּאַרטאַזאַנז, וואס זענען פאַרקנאַסט אין ציבור ענינים. אין אנדערע ווערטער, די מענטשן וואס זענען רובֿ מסתּמא צו שטימען זענען אויך רובֿ מסתּמא צו ליגן וועגן אָפּשטימונג. דריט, און רובֿ קריטיקאַלי, ווייַל פון די סיסטעמאַטיש נאַטור פון איבער-ריפּאָרטינג, די פאַקטיש חילוק צווישן וואָטערס און גויים-וואָטערס זענען קלענערער ווי זיי דערשייַנען נאָר פֿון סערווייז. לעמאָשל, יענע מיט אַ באַטשעלאָרס גראַד זענען וועגן 22 פּראָצענט ווייזט מער מסתּמא צו באַריכט אָפּשטימונג, אָבער זענען בלויז 10 פּראָצענט ווייזט מער מסתּמא צו פאַקטיש שטימען. ווייַטער, שאַפֿן מיטל-באזירט טיריז פון אָפּשטימונג זענען פיל בעסער בייַ פּרידיקטינג וואס וועט מעלדונג אָפּשטימונג ווי וואס אַקטשאַוואַלי וואָוץ, אַ עמפּיריקאַל דערגייונג וואָס קאַללס פֿאַר נייַ טיריז צו פֿאַרשטיין און פאָרויסזאָגן אָפּשטימונג.
אָבער, ווי פיל זאָל מיר געטרויען די רעזולטאטן? געדענק די רעזולטאַטן אָפענגען אויף טעות-פּראָון פֿאַרבינדונג צו שוואַרץ-קעסטל דאַטע מיט אומבאַקאַנט אַמאַונץ פון טעות. מער ספּעסיפיקאַללי, די רעזולטאטן הינגע אויף צוויי שליסל טריט: 1) די פיייקייַט פון קאַטאַליסט צו פאַרבינדן פילע דיספּעריט דאַטע קוואלן צו פּראָדוצירן אַן פּינטלעך בעל דאַטאַפילע און 2) די פיייקייַט פון קאַטאַליסט צו רונג די יבערבליק דאַטן צו זייַן בעל דאַטאַפילע. יעדער פון די טריט איז גאַנץ שווער און ערראָרס בייַ יעדער שריט קען פירן ריסערטשערז צו דעם אומרעכט קאַנקלוזשאַנז. אָבער, ביידע דאַטן פּראַסעסינג און וואָס ריכטן זענען קריטיש צו די געצויגן עקזיסטענץ פון קאַטאַליסט ווי אַ געזעלשאַפט אַזוי עס קענען ינוועסטירן רעסורסן אין סאַלווינג די פּראָבלעמס, אָפֿט בייַ אַ וואָג אַז קיין יחיד אַקאַדעמיק פאָרשער אָדער גרופּע פון ריסערטשערז קענען גלייַכן. אין דער ווייַטער לייענען אין די סוף פון די קאַפּיטל, איך באַשרייַבן די פּראָבלעמס אין מער דעטאַל און ווי אַנסאָלאַבעהערע און הערש בויען בטחון אין זייער רעזולטאַטן. כאָטש די דעטאַילס זענען ספּעציפיש צו דעם לערנען, ישוז ענלעך צו די וועט אויפֿשטיין פֿאַר אנדערע ריסערטשערז געוואלט צו לינק צו שוואַרץ-קעסטל דיגיטאַל שפּור דאַטן קוואלן.
וואָס זענען די גענעראַל לעקציעס ריסערטשערז קענען ציען פון דעם לערנען? ערשטער, עס איז קאָלאָסאַל ווערט פון ינריטשינג דיגיטאַל טראַסעס מיט יבערבליק דאַטע. רגע, אַפֿילו כאָטש די אַגראַגייטאַד, געשעפט דאַטן קוואלן זאָל ניט זיין געהאלטן "ערד אמת", אין עטלעכע קאַסעס זיי קענען זיין נוצלעך. אין פאַקט, עס איז בעסטער צו פאַרגלייַכן די דאַטע קוואלן נישט צו אַבסאָלוט אמת (פון וואָס זיי וועלן שטענדיק פאַלן קורץ). אלא, עס איז בעסער צו פאַרגלייַכן זיי צו אנדערע פאַראַנען דאַטן קוואלן, וואָס טאָמיד האָבן ערראָרס ווי געזונט.