ყოველთვის დიდი მონაცემები საშუალებას შესწავლა მოულოდნელი მოვლენების და რეალურ დროში გაზომვა.
ბევრი დიდი მონაცემები სისტემები მუდამ; ისინი მუდმივად მონაცემთა შეგროვებას. ეს მუდმივი დამახასიათებელი უზრუნველყოფს მკვლევარები გრძივი მონაცემები (ანუ, მონაცემები დროთა განმავლობაში). როგორც ყოველთვის-on ორი მნიშვნელოვანი გავლენა კვლევა.
პირველ რიგში, მონაცემთა შეგროვება ყოველთვის მკვლევარებს საშუალებას აძლევს შეისწავლონ მოულოდნელი მოვლენები გზებზე, რომლებიც სხვაგვარად არ იქნება შესაძლებელი. მაგალითისთვის, 2013 წლის ზაფხულში თურქეთში ოკუპაციის გეზიში შესწავლილი მკვლევარები დაინტერესდებიან, როგორც წესი, აქციის მონაწილეების ქცევაზე. Ceren Budak და Duncan Watts (2015) შეძლეს უფრო მეტი გამოყენებით Twitter- ის ბუნების გამოყენებით, რათა შეისწავლონ დემონსტრანტები, რომლებიც იყენებდნენ Twitter- ს, დროს და მოვლენის შემდეგ. და მათ შეძლეს შექმნან შედარებადი მონაწილეთა ჯგუფი ადრე, დროს და მოვლენის შემდეგ (ფიგურა 2.2). საერთო ჯამში, მათი ყოფილი პოსტი პანელი შედის tweets 30,000 ადამიანი ორი წლის განმავლობაში. ამ ინფორმაციის სხვა საშუალებებით გავრცელებული მონაცემების გაზრდის გზით, ბუდაკმა და ვატსმა შეძლეს გაცილებით უფრო მეტი გაიგონეს: მათ შეეძლოთ შეაფასონ რა სახის ადამიანები უფრო მეტად იყვნენ მონაწილეობდნენ გეზიში საპროტესტო აქციებში და შეაფასებდნენ ცვლილებებს მონაწილეები და არაპარტნიორები, როგორც მოკლევადიან პერსპექტივაში (გეზიზე წინასწარ გეზი შედარებით) და გრძელვადიან პერსპექტივაში (წინასწარი გეზი, პოსტ-გეზითან შედარებით).
სკეპტიკურად შეიძლება აღინიშნოს, რომ ზოგიერთი ამ მონაცემების შეფასების გარეშე შესაძლებელი იყო მონაცემთა შეგროვების წყაროების გარეშე (მაგალითად, დამოკიდებულების ცვლილების გრძელვადიანი შეფასებები) და ეს სწორია, თუმცა ასეთი მონაცემების შეგროვება 30,000 ადამიანს ექნებოდა ძვირია. მაშინაც კი, შეუზღუდავი ბიუჯეტიც კი არ მიმაჩნია, რომ სხვა მეთოდებიც კი არ არის შესაძლებელი, რაც საშუალებას იძლევა მკვლევარებს დროულად დაუბრუნონ და უშუალოდ დაიცვან მონაწილეთა ქცევა წარსულში. უახლოესი ალტერნატივა იქნებოდა ქცევის რეტროსპექტული ანგარიშების შეგროვება, მაგრამ ეს ანგარიშები იქნებოდა შეზღუდული გრანულურობა და საეჭვო სიზუსტე. ცხრილი 2.1 უზრუნველყოფს სწავლის სხვა მაგალითებს, რომლებიც ხშირად იყენებენ მონაცემთა წყაროს, რათა შეისწავლონ მოულოდნელი მოვლენა.
მოულოდნელი მოვლენა | ყოველთვის - მონაცემთა წყაროზე | ციტირება |
---|---|---|
გეზი მოძრაობა თურქეთში | Budak and Watts (2015) | |
ქოლგა საპროტესტო აქციები ჰონგ კონგში | Zhang (2016) | |
ნიუ-იორკში პოლიციის სროლები | Stop-and-frisk ანგარიშები | Legewie (2016) |
პირი ISIS- ში გაწევრიანებას | Magdy, Darwish, and Weber (2016) | |
2001 წლის 11 სექტემბრის თავდასხმა | livejournal.com | Cohn, Mehl, and Pennebaker (2004) |
2001 წლის 11 სექტემბრის თავდასხმა | პეიჯერი შეტყობინებები | Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011) |
გარდა იმისა, რომ მოულოდნელი მოვლენების შესწავლა, ყოველთვის დიდ მონაცემთა სისტემებში, მკვლევარებს საშუალებას აძლევს რეალურ დროში შეაფასონ, რაც შეიძლება მნიშვნელოვანი იყოს იმ პარამეტრებში, სადაც პოლიტიკოსები - მთავრობაში ან ინდუსტრიაში - სიტუაციის გაცნობიერების საფუძველზე რეაგირება სურთ. მაგალითად, სოციალური მედიის მონაცემები შეიძლება გამოყენებულ იქნას ბუნებრივი კატასტროფების (Castillo 2016) გადაუდებელი რეაგირებისთვის და სხვადასხვა დიდი მონაცემთა წყაროების გამოყენება შეიძლება გამოყენებულ იქნას ეკონომიკური აქტივობის რეალურ დროში შეფასებებზე (Choi and Varian 2012) .
საბოლოო ჯამში, მონაცემთა სისტემაში ყოველთვის იძლევა მკვლევარებს, შეისწავლონ მოულოდნელი მოვლენები და უზრუნველყონ რეალურ დროში ინფორმაცია პოლიტიკოსებისათვის. მე არ ვფიქრობ, რომ ყოველთვის მონაცემთა სისტემებს კარგად შეეფერება დროთა მანძილზე ცვლილებების თვალსაზრისით. ეს იმიტომ, რომ ბევრი დიდი მონაცემთა სისტემა მუდმივად იცვლება - პროცესი, რომელსაც მე მოვუწოდებ დრიფტის შემდეგ (თავი 2.3.7).