2.4.2 פאָרעקאַסטינג און נאָווקאַסטינג

פּרעדיקטינג די צוקונפֿט איז שווער, אָבער פּרידיקטינג די פאָרשטעלן איז גרינגער.

די רגע הויפּט סטראַטעגיע געניצט דורך ריסערטשערז מיט אָבסערוואַטיאָנאַל דאַטע איז פאָרעקאַסטינג. פּרעדיקטינג די צוקונפֿט איז נאָוטאָריאַסלי שווער, אָבער עס קענען זייַן ינקרעדאַבלי וויכטיק פֿאַר באַשלוס מייקערז, צי זיי אַרבעטן אין קאָמפּאַניעס אָדער גאַווערמאַנץ.

Kleinberg et al. (2015) Offers צוויי מעשיות אַז דערקלערן די וויכטיקייט פון פאָרעקאַסטינג פֿאַר זיכער פּאָליטיק פּראָבלעמס. ימאַדזשאַן איינער פּאָליטיק פאַבריקאַנט, איך וועט רופן איר אננא, וואס איז facing אַ טריקעניש און מוזן באַשליסן צי צו דינגען אַ שאַמאַן צו טאָן אַ רעגן טאַנצן צו פאַרגרעסערן די געלעגנהייַט פון רעגן. אן אנדער פּאָליטיק פאַבריקאַנט, איך וועט רופן אים באָב, מוזן באַשליסן צי צו נעמען אַ שירעם צו אַרבעטן צו ויסמייַדן געטינג נאַס אויף די וועג היים. ביידע אננא און באָב קענען מאַכן אַ בעסער באַשלוס אויב זיי פֿאַרשטיין וועטער, אָבער זיי דאַרפֿן צו וויסן פאַרשידענע זאכן. אננא דאַרף צו פֿאַרשטיין צי די רעגן טאַנצן ז רעגן. באָב, אויף די אנדערע האַנט, טוט ניט דאַרפֿן צו שכל עפּעס וועגן קאַוסאַליטי; ער נאָר דאַרף אַ פּינטלעך פאָרויסזאָגן. סאציאל ריסערטשערז אָפֿט פאָקוס אויף וואָס Kleinberg et al. (2015) רופן "רעגן טאַנצן-ווי" פּאָליטיק פּראָבלעמס-יענע וואס פאָקוס אויף קאַוסאַליטי-און איגנאָרירן "שירעם-ווי" פּאָליטיק פּראָבלעמס אַז ביסט פאָקוסעד אויף פאָרעקאַסטינג.

איך 'ד ווי צו פאָקוס, אָבער, אויף אַ ספּעציעל מין פון פאָרעקאַסטינג גערופֿן נאָווקאַסטינג -אַ טערמין דערייווד פון קאַמביינינג "איצט" און "פאָרעקאַסטינג." אלא ווי פּרידיקטינג דער צוקונפֿט, נאָווקאַסטינג אַטטעמפּץ צו פאָרויסזאָגן די פאָרשטעלן (Choi and Varian 2012) . אין אנדערע ווערטער, נאָווקאַסטינג ניצט פאָרעקאַסטינג מעטהאָדס פֿאַר פּראָבלעמס פון מעזשערמאַנט. ווי אַזאַ, עס זאָל זיין ספּעציעל נוציק צו גאַווערמאַנץ וואס דאַרפן בייַצייַטיק און פּינטלעך מיטלען וועגן זייער לענדער. נאָווקאַסטינג קענען זיין ילאַסטרייטאַד רובֿ קלאר מיט די משל פון גוגל פלו טרענדס.

ימאַדזשאַן אַז איר זענט געפיל אַ ביסל אונטער די וועטער אַזוי איר דרוקן "פלו רעמאַדיז" אין אַ זוכן מאָטאָר, באַקומען אַ חשבון פון לינקס אין ענטפער, און דעמאָלט נאָכגיין איינער פון זיי צו אַ נוציק וועבפּאַגע. איצט ימאַדזשאַן דעם טעטיקייט ווייל פּלייַעד אויס פון דער פּערספּעקטיוו פון די זוכן מאָטאָר. יעדער מאָמענט, מיליאַנז פון קוויריז זענען ערייווינג פון אַרום די וועלט, און דעם טייַך פון קוויריז-וואָס Battelle (2006) האט געהייסן דער "דייטאַבייס פון ינטענטשאַנז" - גיט אַ קעסיידער ופּדאַטעד פֿענצטער אין דער קאָלעקטיוו גלאבאלע באוווסטזיין. אָבער, אויסגעדרייט דעם טייַך פון אינפֿאָרמאַציע אין אַ מעזשערמאַנט פון די פּרעוואַלאַנס פון די פלו איז שווער. סימפּלי קאַונטינג אַרויף די נומער פון קוויריז פֿאַר "פלו רעמאַדיז" זאל ניט אַרבעט געזונט. ניט אַלעמען וואס האט די פלו אָנפֿרעגן פֿאַר פלו רעמאַדיז און ניט אַלעמען וואס סערטשערז פֿאַר פלו רעמאַדיז האט די פלו.

די וויכטיק און קלוג קונץ הינטער גוגל פלו טרענדס איז צו ווענדן אַ מעזשערמאַנט פּראָבלעם זיך אַ פאָרעקאַסטינג פּראָבלעם. די יו סענטערס פֿאַר דיסעאַסע קאָנטראָל און פּרעווענטיאָן (סידיסי) האט אַ ינפלוענציע מאָניטאָרינג סיסטעם אַז קאַלעקץ אינפֿאָרמאַציע פון ​​דאקטוירים אַרום דעם מדינה. אָבער, איין פּראָבלעם מיט דעם סידיסי סיסטעם איז עס איז אַ צוויי וואָך ריפּאָרטינג אָפּשטיי; די צייַט עס נעמט פֿאַר די דאַטן ערייווינג פון דאקטוירים צו זייַן קלינד, פּראַסעסט, און ארויס. אבער, ווען האַנדלינג אַן ימערדזשינג עפּידעמיע, ציבור געזונט אָפפיסעס טאָן ניט ווילן צו וויסן ווי פיל ינפלוענציע עס איז געווען צוויי וואָכן צוריק; זיי ווילן צו וויסן ווי פיל ינפלוענציע עס איז רעכט איצט. אין פאַקט, אין פילע אנדערע בעקאַבאָלעדיק קוואלן פון געזעלשאַפטלעך דאַטע, עס זענען גאַפּס צווישן כוואליעס פון דאַטן זאַמלונג און ריפּאָרטינג לאַגס. רוב גרויס דאַטן קוואלן, אויף די אנדערע האַנט, זענען שטענדיק-אויף (אָפּטיילונג 2.3.1.2).

דעריבער, דזשערעמי גינסבערג און חברים (2009) פּרובירן צו פאָרויסזאָגן די סידיסי פלו דאַטן פון די גוגל זוכן דאַטן. דאס איז אַ בייַשפּיל פון "פּרידיקטינג די פאָרשטעלן" ווייַל די ריסערטשערז זענען טריינג צו מעסטן ווי פיל פלו עס איז איצט דורך פּרידיקטינג צוקונפֿט דאַטן פון די סידיסי, צוקונפֿט דאַטע אַז איז מעסטן די פּרעזענט. ניצן מאַשין לערנען, זיי געזוכט דורך 50 מיליאָן פאַרשידענע זוכן טערמינען צו זען וואָס זענען רובֿ פּרידיקטיוו פון די סידיסי פלו דאַטן. לעסאָף, זיי געפֿונען אַ סכום פון 45 פאַרשידענע קוויריז אַז סימד צו זייַן רובֿ פּרידיקטיוו, און די רעזולטאטן זענען געווען גאַנץ גוט: זיי קען נוצן די זוכן דאַטן צו פאָרויסזאָגן די סידיסי דאַטן. באַזירט אין טייל אויף דעם פּאַפּיר, וואָס איז ארויס אין נאַטור, גוגל פלו טרענדס געווארן אַ אָפט ריפּיטיד הצלחה געשיכטע וועגן דער מאַכט פון גרויס דאַטן.

עס זענען צוויי וויכטיק קאַוועאַץ צו דעם קלאָר הצלחה, אָבער, און שכל די קאַוועאַץ וועט העלפן איר אָפּשאַצן און טאָן פאָרעקאַסטינג און נאָווקאַסטינג. ערשטער, דער פאָרשטעלונג פון גוגל פלו טרענדס איז אַקשלי ניט פיל בעסער ווי אַ פּשוט מאָדעל אַז עסטאַמאַץ די סומע פון פלו באזירט אויף אַ לינעאַר עקסטראַפּאָלאַטיאָן פון די צוויי מערסט פריש מעזשערמאַנץ פון פלו פּרעוואַלאַנס (Goel et al. 2010) . און, איבער עטלעכע מאָל פּיריאַדז גוגל פלו טרענדס איז אַקשלי ערגער ווי דעם פּשוט צוגאַנג (Lazer et al. 2014) . אין אנדערע ווערטער, גוגל פלו טרענדס מיט אַלע זייַן דאַטן, מאַשין לערנען, און שטאַרק קאַמפּיוטינג האט נישט דראַמאַטיקלי אָוטפּערפאָרם אַ פּשוט און גרינגער צו פֿאַרשטיין כיוריסטיק. דעם סאַגדזשעסץ אַז ווען יוואַליוייטינג קיין פאָרויסזאָגן אָדער נאָווקאַסט עס איז וויכטיק צו פאַרגלייַכן קעגן אַ באַסעלינע.

די רגע וויכטיק קייוויאַט וועגן Google פלו טרענדס איז אַז זייַן פיייקייַט צו פאָרויסזאָגן די סידיסי פלו דאַטן איז געווען פּראָנע צו קורץ-טערמין דורכפאַל און לאַנג-טערמין פאַרפוילן ווייַל פון DRIFT און אַלגאָריטהמיק קאָנפאָונדינג. לעמאָשל, בעשאַס די 2009 חזירים פלו ויסברוך גוגל פלו טרענדס דראַמאַטיקלי איבער-עסטימאַטעד די סומע פון ינפלוענציע, מיסטאָמע ווייַל מענטשן טענד צו טוישן זייער זוכן נאַטור אין ענטפער צו וויידספּרעד מורא פון אַ גלאבאלע פּאַנדעמיק (Cook et al. 2011; Olson et al. 2013) . אין דערצו צו די קורץ-טערמין פּראָבלעמס, די פאָרשטעלונג ביסלעכווייַז פאַרפוילט איבער צייַט. דייאַגנאָוסינג די סיבות פֿאַר דעם לאַנג טערמין פאַרפוילן זענען שווער ווייַל די גוגל זוכן אַלגערידאַמז זענען פּראַפּרייאַטערי, אָבער עס אויס אַז אין 2011 גוגל געמאכט ענדערונגען וואָס וואָלט פֿאָרשלאָגן Related search ווערטער ווען מען זוכן פֿאַר סימפּטאָמס ווי "היץ" און "הוסט" (עס אויך ויסקומען וואָס דעם שטריך איז ניט מער אַקטיוו). אַדדינג דעם שטריך איז אַ טאָוטאַלי גלייַך זאַך צו טאָן אויב איר זענען פליסנדיק אַ זוכן מאָטאָר געשעפט, און עס האט די ווירקונג פון דזשענערייטינג מער געזונט פֿאַרבונדענע אָנפֿרעגן. דאס איז געווען מיסטאָמע אַ הצלחה פֿאַר די געזעלשאַפֿט, אָבער עס איז געפֿירט גוגל פלו טרענדס צו איבער-שאַצן פלו פּרעוואַלאַנס (Lazer et al. 2014) .

צומ גליק, די פּראָבלעמס מיט Google פלו טרענדס זענען פיקסאַבלע. אין פאַקט, ניצן מער אָפּגעהיט מעטהאָדס, Lazer et al. (2014) און Yang, Santillana, and Kou (2015) זענען ביכולת צו באַקומען בעסער רעזולטאטן. געגאנגען פאָרויס, איך דערוואַרטן אַז נאָווקאַסטינג שטודיום אַז פאַרבינדן גרויס דאַטן מיט פאָרשער געזאמלט דאַטן-אַז פאַרבינדן דוטשאַמפּ-נוסח רעאַדימאַדעס מיט מיטשאַעלאַנגעלאָ-נוסח קוסטאָממאַדעס-וועט געבן פּאָליטיק מייקערז צו פּראָדוצירן Faster און מער פּינטלעך מעזשערמאַנץ פון די פאָרשטעלן און פֿאָרויסזאָגן פון דער צוקונפֿט.