2.3.1.2 เปิดตลอดเวลา

ตลอดเวลาในข้อมูลขนาดใหญ่จะช่วยให้การศึกษาของเหตุการณ์ที่ไม่คาดคิดและการวัดเวลาจริง

หลายระบบข้อมูลขนาดใหญ่อยู่เสมอบน; พวกเขามีอย่างต่อเนื่องการเก็บรวบรวมข้อมูล ลักษณะนี้เสมอในการให้นักวิจัยที่มีข้อมูลระยะยาว (เช่นข้อมูลในช่วงเวลา) เป็นเสมอในการมีสองนัยสำคัญสำหรับการวิจัย

แรกเสมอในการเก็บรวบรวมข้อมูลที่ช่วยให้นักวิจัยสามารถศึกษาเหตุการณ์ที่ไม่คาดคิดในรูปแบบที่เป็นไปไม่ได้ก่อนหน้านี้ ยกตัวอย่างเช่นนักวิจัยสนใจศึกษาครอบครองประท้วง Gezi ในประเทศตุรกีในช่วงฤดู​​ร้อนของปี 2013 จะมักจะมุ่งเน้นไปที่พฤติกรรมของผู้ประท้วงในระหว่างการแข่งขัน Ceren Budak และดันแคนวัตต์ (2015) ก็สามารถที่จะทำมากขึ้นโดยใช้ธรรมชาติเสมอบนทวิตเตอร์ของทวิตเตอร์ในการศึกษาโดยใช้การชุมนุมประท้วงก่อนระหว่างและหลังเหตุการณ์ และพวกเขาก็สามารถที่จะสร้างกลุ่มของผู้เข้าร่วมการเปรียบเทียบที่ไม่ใช่ (หรือผู้เข้าร่วมที่ไม่ได้ทวีตเกี่ยวกับการประท้วง) ก่อนระหว่างและหลังจากเหตุการณ์ (รูปที่ 2.1) รวมแผงอดีตของพวกเขารวมถึงการโพสต์ทวิตเตอร์ 30,000 คนกว่าสองปี โดยการเพิ่มข้อมูลที่ใช้กันทั่วไปจากการประท้วงที่มีข้อมูลอื่น ๆ นี้ Budak และวัตต์ก็สามารถที่จะเรียนรู้มากขึ้นพวกเขาก็สามารถที่จะประเมินสิ่งที่ชนิดของผู้คนมีแนวโน้มที่จะมีส่วนร่วมในการประท้วง Gezi และเพื่อประเมินการเปลี่ยนแปลงในทัศนคติของ ผู้เข้าร่วมและไม่เข้าร่วม-ทั้งในระยะสั้น (เปรียบเทียบก่อน Gezi ไปในช่วง Gezi) และระยะยาว (เปรียบเทียบก่อน Gezi ที่จะโพสต์ Gezi)

รูปที่ 2.1: การออกแบบใช้โดย Budak และวัตต์ (2015) เพื่อศึกษาครอบครองประท้วง Gezi ในประเทศตุรกีในช่วงฤดู​​ร้อนของปี 2013 โดยใช้ธรรมชาติเสมอบนทวิตเตอร์ของนักวิจัยที่สร้างสิ่งที่พวกเขาเรียกว่าแผงอดีตโพสต์ที่เกี่ยวกับการรวม 30,000 คนกว่าสองปี ในทางตรงกันข้ามการศึกษาทั่วไปที่มุ่งเน้นไปที่ผู้เข้าร่วมในระหว่างการประท้วงที่แผงอดีตโพสต์เพิ่ม 1) ข้อมูลจากผู้เข้าร่วมก่อนและหลังเหตุการณ์และ 2) ข้อมูลจากการไม่เข้าร่วมก่อนระหว่างและหลังจากเหตุการณ์ โครงสร้างข้อมูลนี้อุดมเปิดการใช้งาน Budak และวัตต์ที่จะประเมินสิ่งที่ชนิดของผู้คนมีแนวโน้มที่จะมีส่วนร่วมในการประท้วง Gezi และเพื่อประเมินการเปลี่ยนแปลงในทัศนคติของผู้เข้าร่วมและผู้เข้าร่วมที่ไม่ใช่ทั้งในระยะสั้น (เปรียบเทียบก่อน Gezi ไปในช่วง Gezi) และระยะยาว (เปรียบเทียบก่อน Gezi ที่จะโพสต์ Gezi)

รูปที่ 2.1: การออกแบบใช้โดย Budak and Watts (2015) เพื่อศึกษาการประท้วง Occupy Gezi ในประเทศตุรกีในช่วงฤดูร้อนของปี 2013 โดยใช้ธรรมชาติเสมอบนทวิตเตอร์ของนักวิจัยที่สร้างสิ่งที่พวกเขาเรียกว่าแผงอดีตโพสต์ที่เกี่ยวกับการรวม 30,000 คนกว่าสองปี ในทางตรงกันข้ามการศึกษาทั่วไปที่มุ่งเน้นไปที่ผู้เข้าร่วมในระหว่างการประท้วงที่แผงอดีตโพสต์เพิ่ม 1) ข้อมูลจากผู้เข้าร่วมก่อนและหลังเหตุการณ์และ 2) ข้อมูลจากการไม่เข้าร่วมก่อนระหว่างและหลังจากเหตุการณ์ โครงสร้างข้อมูลนี้อุดมเปิดการใช้งาน Budak และวัตต์ที่จะประเมินสิ่งที่ชนิดของผู้คนมีแนวโน้มที่จะมีส่วนร่วมในการประท้วง Gezi และเพื่อประเมินการเปลี่ยนแปลงในทัศนคติของผู้เข้าร่วมและผู้เข้าร่วมที่ไม่ใช่ทั้งในระยะสั้น (เปรียบเทียบก่อน Gezi ไปในช่วง Gezi) และระยะยาว (เปรียบเทียบก่อน Gezi ที่จะโพสต์ Gezi)

มันเป็นความจริงว่าบางส่วนของประมาณการเหล่านี้อาจได้รับการทำโดยไม่ต้องตลอดเวลาในการเก็บรวบรวมข้อมูลแหล่งที่มา (เช่นประมาณการในระยะยาวของการเปลี่ยนแปลงทัศนคติ) แม้ว่าการเก็บรวบรวมข้อมูลดังกล่าว 30,000 คนจะได้รับค่อนข้างแพง และแม้จะได้รับงบประมาณไม่ จำกัด ฉันไม่สามารถคิดวิธีการอื่นใดที่เป็นหลักช่วยให้นักวิจัยที่จะเดินทางกลับในเวลาและโดยตรงสังเกตพฤติกรรมผู้เข้าร่วมในอดีตที่ผ่านมา ทางเลือกที่ใกล้เคียงที่สุดที่จะเก็บรวบรวมรายงานย้อนหลังของพฤติกรรม แต่รายงานเหล่านี้จะเป็นความละเอียดที่ จำกัด และความถูกต้องสงสัย ตารางที่ 2.1 แสดงตัวอย่างการอื่น ๆ ของการศึกษาที่ใช้ตลอดเวลาบนแหล่งข้อมูลเพื่อการศึกษาเหตุการณ์ที่ไม่คาดคิด

ตารางที่ 2.1: การศึกษาของเหตุการณ์ที่ไม่คาดคิดโดยใช้เสมอในแหล่งที่มาของข้อมูลขนาดใหญ่
เหตุการณ์ที่ไม่คาดคิด เสมอกับแหล่งข้อมูล การอ้างอิง
เคลื่อนไหวครอบครอง Gezi ในตุรกี พูดเบาและรวดเร็ว Budak and Watts (2015)
ประท้วงร่มในฮ่องกง Weibo Zhang (2016)
ยิงตำรวจในนิวยอร์กซิตี้ รายงานและค้นหยุด Legewie (2016)
คนเข้าร่วม ISIS พูดเบาและรวดเร็ว Magdy, Darwish, and Weber (2016)
11 กันยายน 2001 การโจมตี livejournal.com Cohn, Mehl, and Pennebaker (2004)
11 กันยายน 2001 การโจมตี ข้อความเพจเจอร์ Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

ประการที่สองเสมอในการเก็บรวบรวมข้อมูลที่ช่วยให้นักวิจัยในการผลิตการวัดแบบ real-time ซึ่งจะมีความสำคัญในการตั้งค่าที่ผู้กำหนดนโยบายต้องการที่จะไม่เพียง แต่เรียนรู้จากพฤติกรรมที่มีอยู่ แต่ยังตอบสนองต่อมัน ตัวอย่างเช่นข้อมูลสื่อสังคมสามารถนำมาใช้เพื่อเป็นแนวทางในการตอบสนองต่อภัยพิบัติทางธรรมชาติ (Castillo 2016)

สรุปได้ว่าตลอดเวลาในระบบข้อมูลช่วยให้นักวิจัยเพื่อศึกษาเหตุการณ์ที่ไม่คาดคิดและให้ข้อมูลแบบ real-time เพื่อให้ผู้กำหนดนโยบาย ฉันไม่ได้ แต่เสนอว่าตลอดเวลาในระบบข้อมูลช่วยให้นักวิจัยเพื่อติดตามการเปลี่ยนแปลงในช่วงระยะเวลานาน นั่นเป็นเพราะหลายระบบข้อมูลขนาดใหญ่จะมีการเปลี่ยนแปลง-A กระบวนการที่เรียกว่าดริฟท์ (มาตรา 2.3.2.4)