פּראָסט קאַונטינג קענען זייַן טשיקאַווע אויב איר פאַרבינדן אַ גוט קשיא מיט גוט דאַטן.
כאָטש עס איז קאָוטשעד אין sophisticated סאַונדינג שפּראַך, גורל פון געזעלשאַפטלעך פאָרשונג איז טאַקע נאָר קאַונטינג זאכן. אין דער עלטער פון גרויס דאַטן, ריסערטשערז קענען ציילן מער ווי אלץ, אָבער אַז טוט נישט אויטאָמאַטיש מיינען אַז פאָרשונג זאָל זייַן קאָנצענטרירט אויף קאַונטינג מער און מער שטאָפּן. אַנשטאָט, אויב מיר זענען געגאנגען צו טאָן גוט פאָרשונג מיט גרויס דאַטן, מיר דאַרפֿן צו פרעגן: וואָס זאכן זענען ווערט קאַונטינג? דאס מייַ ויסקומען ווי אַ לעגאַמרע סאַבדזשעקטיוו ענין, אָבער עס זענען עטלעכע גענעראַל פּאַטערנז.
אָפֿט סטודענטן מאָטיווירן זייער קאַונטינג פאָרשונג דורך אַזוי צו זאָגן: איך בין געגאנגען צו ציילן עפּעס אַז קיין איינער האט אלץ גערעכנט איידער. לעמאָשל, אַ תּלמיד זאל זאָגן, פילע מענטשן האָבן געלערנט מייגראַנץ און פילע מענטשן האָבן געלערנט צווילינג, אָבער קיינער האט געלערנט נאַווענאַדניק צווילינג. מאָוטאַוויישאַן דורך אַוועק טוט ניט יוזשאַוואַלי פירן צו גוט פאָרשונג. פון קורס, עס זאל זיין גוט סיבות צו לערנען נאַווענאַדניק צווילינג, אָבער דער פאַקט אַז זיי האָבן ניט שוין געלערנט איידער טוט נישט מיינען אַז זיי זאָל זיין געלערנט איצט. קיין איינער האט אלץ גערעכנט די נומער פון פֿעדעם אויף די טעפּעך אין מיין אָפיס, אָבער אַז טוט נישט אויטאָמאַטיש מיינען אַז דעם וואָלט זיין אַ גוט פאָרשונג פּרויעקט. מאָוטאַוויישאַן דורך אַוועק איז מין פון ווי אַזוי צו זאָגן: קוק, דאָרט ס אַ לאָך איבער דאָרט, און איך בין געגאנגען צו אַרבעטן זייער שווער צו פּלאָמבירן עס אַרויף. אבער, נישט יעדער לאָך דארף צו זיין אָנגעפילט.
אָנשטאָט מאָוטאַווייטינג דורך אַוועק, איך טראַכטן אַז קאַונטינג לידז צו גוט פאָרשונג אין צוויי סיטואַטיאָנס, ווען די פאָרשונג איז טשיקאַווע אָדער וויכטיק (אָדער יידילי ביידע). לעמאָשל, מעסטן די קורס פון אַרבעטלאָזיקייַט איז וויכטיק ווייַל עס איז אין גראדן פון די עקאנאמיע אַז דרייווז פּאָליטיק דיסיזשאַנז. בכלל, מען האָבן אַ שיין גוט זינען פון וואָס איז וויכטיק. אזוי, אין די מנוחה פון דעם אָפּטיילונג, איך בין געגאנגען צו צושטעלן דרייַ יגזאַמפּאַלז ווו קאַונטינג איז טשיקאַווע. אין יעדער פאַל, די ריסערטשערז זענען נישט קאַונטינג האַפאַזאַרדלי, אלא זיי זענען קאַונטינג אין זייער באַזונדער סעטטינגס אַז גילוי וויכטיק ינסייץ אין מער אַלגעמיין געדאנקען וועגן ווי געזעלשאַפטלעך סיסטעמס אַרבעטן. אין אנדערע ווערטער, אַ פּלאַץ פון וואָס מאכט די באַזונדער קאַונטינג עקסערסייזיז טשיקאַווע איז נישט אין די דאַטן זיך, עס קומט פון די מער אַלגעמיין געדאנקען.
ונטער איך וועט פאָרשטעלן דרייַ יגזאַמפּאַלז אויף: 1) די אַרבעט אָפּפירונג פון טאַקסי דריווערס אין ניו יארק (סעקשאַן 2.4.1.1), 2) פרייַנדשאַפט פאָרמירונג דורך סטודענטן (אָפּטיילונג 2.4.1.2) און 3) געזעלשאַפטלעך מידיאַ צענזור אָפּפירונג פון די כינעזיש רעגירונג (אָפּטיילונג 2.4.1.3). וואָס די יגזאַמפּאַלז טיילן איז אַז זיי אַלע ווייַזן אַז קאַונטינג גרויס דאַטן קענען ווערן געניצט צו פּרובירן טעאָרעטיש פֿאָרויסזאָגן. אין עטלעכע קאַסעס, גרויס דאַטן קוואלן געבן איר צו טאָן דעם קאַונטינג לעפיערעך גלייַך (ווי אין דעם פאַל פון ניו יארק טאַקסיס). אין אנדערע קאַסעס, ריסערטשערז וועט דאַרפֿן צו האַנדלען מיט ינקאָמפּלעטענעסס דורך מערדזשינג דאַטן צוזאַמען און אָפּעראַטיאָנאַליזינג טעאָרעטיש קאַנסטראַקץ (ווי אין דעם פאַל פון פרייַנדשאַפט פאָרמירונג); און אין עטלעכע קאַסעס ריסערטשערז וועט דאַרפֿן צו זאַמלען זייער אייגן אָבסערוואַטיאָנאַל דאַטע (ווי אין דעם פאַל פון געזעלשאַפטלעך מידיאַ צענזור). ווי איך האָפֿן די יגזאַמפּאַלז ווייַזן, פֿאַר ריסערטשערז וואס זענען ביכולת צו פרעגן טשיקאַווע שאלות, גרויס דאַטן האלט גרויס צוזאָג.