ანალოგურ ასაკში, ქცევის შესახებ მონაცემების შეგროვება - ვინ აკეთებს რა, და როდის იყო ძვირი და, შესაბამისად, შედარებით იშვიათი. ახლა, ციფრული ასაკის, ქცევის მილიარდობით ადამიანი ჩაწერილია, ინახება და ანალიზის. მაგალითად, ყოველ დროს, როდესაც თქვენ დააჭირეთ ვებ-გვერდს, გააკეთე ზარი თქვენს მობილურ ტელეფონზე, ან გადაიხადოთ რაღაც საკრედიტო ბარათთან, თქვენი ქცევის ციფრული ჩანაწერი ქმნის და ინახავს ბიზნესს. იმის გამო, რომ ამ ტიპის მონაცემები ხალხის ყოველდღიური ქმედებების პროპორციაა, ისინი ხშირად ციფრულ კვალიანობას უწოდებენ. გარდა იმისა, რომ ამ კვალი კმაყოფილია ბიზნესის, მთავრობებს ასევე აქვს ძალიან მდიდარი მონაცემები ორივე ადამიანი და ბიზნესი. ეს ბიზნესი და სამთავრობო ჩანაწერები ხშირად უწოდებენ დიდ მონაცემებს .
დიდი მონაცემების მუდმივი გადინება ნიშნავს იმას, რომ სამყაროში გადავედით, სადაც ქცევითი მონაცემები მწირია მსოფლიოში, სადაც ქცევითი მონაცემები უხვად არის. დიდი მონაცემების სწავლის პირველი ნაბიჯი არის იმის გაცნობიერება, რომ ეს არის მონაცემთა უფრო ფართო კატეგორიის ნაწილი, რომელიც მრავალი წლის განმავლობაში გამოიყენება სოციალური კვლევისთვის: დაკვირვების მონაცემები . უშუალოდ, დაკვირვების მონაცემები არის ნებისმიერი მონაცემები, რომლებიც გარკვეულწილად ჩარევის გარეშე სოციალური სისტემის დაკვირვებას იწვევს. ნელ-ნელა გზაზე ფიქრი ისაა, რომ დაკვირვების მონაცემები არის ყველაფერი, რაც ადამიანებს არ უერთდება (მაგალითად, კვლევები, თავი 3 თავი) ან შეცვლის ხალხის გარემოში (მაგალითად, ექსპერიმენტი, თავი 4-ის თემა). ამდენად, ბიზნესისა და მთავრობის ჩანაწერების გარდა, დაკვირვების მონაცემები ასევე მოიცავს საგაზეთო სტატიებისა და სატელიტური ფოტოების ტექსტებს.
ამ თავში სამი ნაწილია. პირველ რიგში, მე -2 განყოფილებაში მე უფრო დეტალურად ვსაუბრობ დიდ მონაცემთა წყაროებზე და განვმარტო მათ შორის ფუნდამენტური სხვაობა და ის მონაცემები, რომლებიც ჩვეულებრივ იყენებდნენ სოციალურ კვლევას წარსულში. შემდეგ 2.3 განყოფილებაში აღწერს დიდი მონაცემთა წყაროების ათი საერთო მახასიათებელს. ამ მახასიათებლების გაგება საშუალებას მოგცემთ სწრაფად აღიაროთ არსებული წყაროების ძლიერი და სუსტი მხარეები და დაგეხმარებათ ახალი წყაროების შემუშავებაში, რომლებიც ხელმისაწვდომი იქნება მომავალში. საბოლოოდ, მე -2 განყოფილებაში, მე აღწერეთ სამი ძირითადი კვლევის სტრატეგია, რომელიც შეგიძლიათ გამოიყენოთ დაკვირვების მონაცემებიდან: დათვლა, პროგნოზირება და ექსპერიმენტის დაახლოება.