ตลอดเวลาในข้อมูลขนาดใหญ่จะช่วยให้การศึกษาของเหตุการณ์ที่ไม่คาดคิดและการวัดเวลาจริง
หลายระบบข้อมูลขนาดใหญ่อยู่เสมอบน; พวกเขามีอย่างต่อเนื่องการเก็บรวบรวมข้อมูล ลักษณะนี้เสมอในการให้นักวิจัยที่มีข้อมูลระยะยาว (เช่นข้อมูลในช่วงเวลา) เป็นเสมอในการมีสองนัยสำคัญสำหรับการวิจัย
แรกเสมอในการเก็บรวบรวมข้อมูลที่ช่วยให้นักวิจัยสามารถศึกษาเหตุการณ์ที่ไม่คาดคิดในรูปแบบที่เป็นไปไม่ได้ก่อนหน้านี้ ยกตัวอย่างเช่นนักวิจัยสนใจศึกษาครอบครองประท้วง Gezi ในประเทศตุรกีในช่วงฤดูร้อนของปี 2013 จะมักจะมุ่งเน้นไปที่พฤติกรรมของผู้ประท้วงในระหว่างการแข่งขัน Ceren Budak และดันแคนวัตต์ (2015) ก็สามารถที่จะทำมากขึ้นโดยใช้ธรรมชาติเสมอบนทวิตเตอร์ของทวิตเตอร์ในการศึกษาโดยใช้การชุมนุมประท้วงก่อนระหว่างและหลังเหตุการณ์ และพวกเขาก็สามารถที่จะสร้างกลุ่มของผู้เข้าร่วมการเปรียบเทียบที่ไม่ใช่ (หรือผู้เข้าร่วมที่ไม่ได้ทวีตเกี่ยวกับการประท้วง) ก่อนระหว่างและหลังจากเหตุการณ์ (รูปที่ 2.1) รวมแผงอดีตของพวกเขารวมถึงการโพสต์ทวิตเตอร์ 30,000 คนกว่าสองปี โดยการเพิ่มข้อมูลที่ใช้กันทั่วไปจากการประท้วงที่มีข้อมูลอื่น ๆ นี้ Budak และวัตต์ก็สามารถที่จะเรียนรู้มากขึ้นพวกเขาก็สามารถที่จะประเมินสิ่งที่ชนิดของผู้คนมีแนวโน้มที่จะมีส่วนร่วมในการประท้วง Gezi และเพื่อประเมินการเปลี่ยนแปลงในทัศนคติของ ผู้เข้าร่วมและไม่เข้าร่วม-ทั้งในระยะสั้น (เปรียบเทียบก่อน Gezi ไปในช่วง Gezi) และระยะยาว (เปรียบเทียบก่อน Gezi ที่จะโพสต์ Gezi)
มันเป็นความจริงว่าบางส่วนของประมาณการเหล่านี้อาจได้รับการทำโดยไม่ต้องตลอดเวลาในการเก็บรวบรวมข้อมูลแหล่งที่มา (เช่นประมาณการในระยะยาวของการเปลี่ยนแปลงทัศนคติ) แม้ว่าการเก็บรวบรวมข้อมูลดังกล่าว 30,000 คนจะได้รับค่อนข้างแพง และแม้จะได้รับงบประมาณไม่ จำกัด ฉันไม่สามารถคิดวิธีการอื่นใดที่เป็นหลักช่วยให้นักวิจัยที่จะเดินทางกลับในเวลาและโดยตรงสังเกตพฤติกรรมผู้เข้าร่วมในอดีตที่ผ่านมา ทางเลือกที่ใกล้เคียงที่สุดที่จะเก็บรวบรวมรายงานย้อนหลังของพฤติกรรม แต่รายงานเหล่านี้จะเป็นความละเอียดที่ จำกัด และความถูกต้องสงสัย ตารางที่ 2.1 แสดงตัวอย่างการอื่น ๆ ของการศึกษาที่ใช้ตลอดเวลาบนแหล่งข้อมูลเพื่อการศึกษาเหตุการณ์ที่ไม่คาดคิด
เหตุการณ์ที่ไม่คาดคิด | เสมอกับแหล่งข้อมูล | การอ้างอิง |
---|---|---|
เคลื่อนไหวครอบครอง Gezi ในตุรกี | พูดเบาและรวดเร็ว | Budak and Watts (2015) |
ประท้วงร่มในฮ่องกง | Zhang (2016) | |
ยิงตำรวจในนิวยอร์กซิตี้ | รายงานและค้นหยุด | Legewie (2016) |
คนเข้าร่วม ISIS | พูดเบาและรวดเร็ว | Magdy, Darwish, and Weber (2016) |
11 กันยายน 2001 การโจมตี | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
11 กันยายน 2001 การโจมตี | ข้อความเพจเจอร์ | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
ประการที่สองเสมอในการเก็บรวบรวมข้อมูลที่ช่วยให้นักวิจัยในการผลิตการวัดแบบ real-time ซึ่งจะมีความสำคัญในการตั้งค่าที่ผู้กำหนดนโยบายต้องการที่จะไม่เพียง แต่เรียนรู้จากพฤติกรรมที่มีอยู่ แต่ยังตอบสนองต่อมัน ตัวอย่างเช่นข้อมูลสื่อสังคมสามารถนำมาใช้เพื่อเป็นแนวทางในการตอบสนองต่อภัยพิบัติทางธรรมชาติ (Castillo 2016)
สรุปได้ว่าตลอดเวลาในระบบข้อมูลช่วยให้นักวิจัยเพื่อศึกษาเหตุการณ์ที่ไม่คาดคิดและให้ข้อมูลแบบ real-time เพื่อให้ผู้กำหนดนโยบาย ฉันไม่ได้ แต่เสนอว่าตลอดเวลาในระบบข้อมูลช่วยให้นักวิจัยเพื่อติดตามการเปลี่ยนแปลงในช่วงระยะเวลานาน นั่นเป็นเพราะหลายระบบข้อมูลขนาดใหญ่จะมีการเปลี่ยนแปลง-A กระบวนการที่เรียกว่าดริฟท์ (มาตรา 2.3.2.4)