2.3.1.2 მუდამ

ყოველთვის დიდი მონაცემები საშუალებას შესწავლა მოულოდნელი მოვლენების და რეალურ დროში გაზომვა.

ბევრი დიდი მონაცემები სისტემები მუდამ; ისინი მუდმივად მონაცემთა შეგროვებას. ეს მუდმივი დამახასიათებელი უზრუნველყოფს მკვლევარები გრძივი მონაცემები (ანუ, მონაცემები დროთა განმავლობაში). როგორც ყოველთვის-on ორი მნიშვნელოვანი გავლენა კვლევა.

პირველი, მუდმივი მონაცემების შეგროვების საშუალებას მკვლევართა შესწავლა მოულოდნელი მოვლენების გზები, რომ არ შეიძლება ადრე. მაგალითად, მეცნიერებმა შესწავლით დაინტერესებული ოკუპაციას გეზის საპროტესტო აქციები თურქეთში 2013 წლის ზაფხულში, როგორც წესი, ფოკუსირება ქცევის მომიტინგე ღონისძიებაზე. Ceren ბუდაკი და Duncan Watts (2015) შეძლეს ამის გაკეთება უფრო გამოყენებით მუდმივი ხასიათის Twitter შესწავლა Twitter გამოყენებით საპროტესტო აქციის ადრე, დროს და შემდეგ ღონისძიება. და, მათ შეძლეს შექმნა შედარებით ჯგუფი არასამთავრობო მონაწილე (ან მონაწილეები, რომლებიც არ tweet საპროტესტო) ადრე, დროს და შემდეგ ღონისძიება (ნახაზი 2.1). საერთო ჯამში, მათი ex-post panel შედის tweets 30,000 ადამიანი ორი წლის განმავლობაში. გადიდებით საყოველთაოდ გამოყენებული მონაცემების საპროტესტო ეს სხვა ინფორმაცია, ბუდაკი და Watts შეძლეს ვისწავლოთ უფრო მეტი: მათ შეძლეს, რათა დადგინდეს, თუ რა სახის ადამიანი უფრო სავარაუდოა, რომ მონაწილეობას გეზის საპროტესტო აქციები და შეაფასებს ცვლილებები დამოკიდებულება მონაწილეები და არასამთავრობო მონაწილეებს, როგორც მოკლევადიანი (შედარებით წინასწარ გეზის დროს გეზი) და გრძელვადიანი (შედარებით წინასწარ გეზის პოსტ-გეზის).

დიაგრამა 2.1: დიზაინი გამოიყენება ბუდაკი და Watts (2015) შესწავლა ოკუპაციას გეზის საპროტესტო აქციები თურქეთში 2013 წლის ზაფხულში გამოყენებით მუდმივი ხასიათის Twitter, მკვლევართა ის, რაც მათ ე.წ. ex-post პანელი, რომელიც მოიცავდა 30,000 ადამიანი ორი წლის განმავლობაში. განსხვავებით ტიპიური კვლევა, რომელიც ორიენტირებულია მონაწილეებს საპროტესტო აქციების დროს, ყოფილი პოსტი პანელი დასძენს 1) მონაცემების მონაწილეებს ადრე და შემდეგ ღონისძიება და 2) მონაცემების არასამთავრობო მონაწილეებს ადრე, დროს და შემდეგ ღონისძიება. ეს გამდიდრებული მონაცემები სტრუქტურა ჩართულია ბუდაკი და Watts შეფასდეს, თუ რა სახის ადამიანი უფრო სავარაუდოა, რომ მონაწილეობას გეზის პროტესტი და შეფასდეს ცვლილებების დამოკიდებულებების მონაწილეთა და არასამთავრობო მონაწილეებს, როგორც მოკლევადიანი (შედარებით წინასწარ გეზის დროს გეზი) და გრძელვადიანი (შედარებით წინასწარ გეზის პოსტ-გეზის).

დიაგრამა 2.1: დიზაინი გამოიყენება Budak and Watts (2015) შესწავლა ოკუპაციას გეზის საპროტესტო აქციები თურქეთში 2013 წლის ზაფხულში გამოყენებით მუდმივი ხასიათის Twitter, მკვლევართა ის, რაც მათ ე.წ. ex-post პანელი, რომელიც მოიცავდა 30,000 ადამიანი ორი წლის განმავლობაში. განსხვავებით ტიპიური კვლევა, რომელიც ორიენტირებულია მონაწილეებს საპროტესტო აქციების დროს, ყოფილი პოსტი პანელი დასძენს 1) მონაცემების მონაწილეებს ადრე და შემდეგ ღონისძიება და 2) მონაცემების არასამთავრობო მონაწილეებს ადრე, დროს და შემდეგ ღონისძიება. ეს გამდიდრებული მონაცემები სტრუქტურა ჩართულია ბუდაკი და Watts შეფასდეს, თუ რა სახის ადამიანი უფრო სავარაუდოა, რომ მონაწილეობას გეზის პროტესტი და შეფასდეს ცვლილებების დამოკიდებულებების მონაწილეთა და არასამთავრობო მონაწილეებს, როგორც მოკლევადიანი (შედარებით წინასწარ გეზის დროს გეზი) და გრძელვადიანი (შედარებით წინასწარ გეზის პოსტ-გეზის).

მართალია, რომ ზოგიერთი შეფასებით შეეძლო გაკეთდა გარეშე მუდამ მონაცემთა შეგროვების წყაროები (მაგ, გრძელვადიანი შეფასებით დამოკიდებულება ცვლილება), მიუხედავად იმისა, რომ ასეთი მონაცემების შეგროვება 30,000 ადამიანი იქნებოდა საკმაოდ ძვირია. და მაშინაც კი, მოცემული შეუზღუდავი ბიუჯეტი, მე არ ვფიქრობ, რომ რაიმე სხვა მეთოდი, რომელიც არსებითად საშუალებას მკვლევარებს გამგზავრება უკან დრო და პირდაპირ დაიცვან მონაწილეთა ქცევა წარსულში. უახლოესი ალტერნატიული იქნება შეაგროვოს რეტროსპექტივა ანგარიშები საქციელი, მაგრამ ამ ანგარიშების იქნება შეზღუდული დეტალიზაცია და საეჭვო სიზუსტით. ცხრილი 2.1 სხვა მაგალითებიც კვლევების გამოყენება მუდმივი მონაცემთა წყარო შესწავლა მოულოდნელი მოვლენაა.

ცხრილი 2.1: კვლევების მოულოდნელი მოვლენების გამოყენებით მუდამ დიდი მონაცემები.
მოულოდნელი მოვლენა მუდამ მონაცემთა წყარო Citation
ოკუპაციას გეზის მოძრაობა თურქეთში twitter Budak and Watts (2015)
Umbrella საპროტესტო ჰონკონგი Weibo Zhang (2016)
სროლის პოლიციის ნიუ იორკში შეაჩერე და ზედაპირული შემოწმების ანგარიშები Legewie (2016)
პირი უერთდება ISIS twitter Magdy, Darwish, and Weber (2016)
2001 წლის 11 სექტემბრის თავდასხმის livejournal.com Cohn, Mehl, and Pennebaker (2004)
2001 წლის 11 სექტემბრის თავდასხმის ძალაშია შეტყობინებები Back, Küfner, and Egloff (2010) , Pury (2011) , Back, Küfner, and Egloff (2011)

მეორე, მუდამ მონაცემთა შეგროვების საშუალებას მკვლევარები წარმოების რეალურ დროში გაზომვები, რომელიც შეიძლება იყოს მნიშვნელოვანი პარამეტრები, სადაც პოლიტიკოსები გვინდა, რომ არა მხოლოდ სწავლობენ არსებული ქცევის, არამედ რეაგირება მოახდინონ. მაგალითად, სოციალური მედიის მონაცემები შეიძლება გამოყენებული იქნას, რათა გამოიწვიოს რეაგირება სტიქიური უბედურებების (Castillo 2016) .

დასასრულს, მუდმივი მონაცემები სისტემები საშუალებას მკვლევართა შესწავლა მოულოდნელი მოვლენების და რეალურ დროში ინფორმაციის პოლიტიკოსები. მე არ თუმცა, შესთავაზოს, რომ მუდმივი მონაცემები სისტემები საშუალებას მკვლევარებს აკონტროლოთ ცვლილებები ხანგრძლივი დროის. ეს იმიტომ, რომ ბევრი დიდი მონაცემთა სისტემები მუდმივად იცვლება პროცესს ეწოდება drift (სექცია 2.3.2.4).