Böyük məlumat mənbələri hər yerdə var, amma sosial tədqiqatlar üçün istifadə etmək çətin ola bilər. Təcrübəmdə, məlumat üçün "heç bir pulsuz yemək" qayda kimi bir şey var: əgər onu yığmaqla bir çox iş qoymasanız, onda siz çox işlə məşğul olmağı düşünürsünüz və analiz edir.
Bu günün böyük məlumat mənbələri və ehtimal ki, sabah - 10 xüsusiyyətə malikdir. Bunlardan üçü ümumiyyətlə (lakin həmişə deyil) tədqiqat üçün faydalıdır: böyük, həmişə və qeyri-reaktivdir. Yeddi tədqiqat üçün ümumiyyətlə (lakin həmişə deyil) problemlidir: natamam, əlçatmaz, natamam, sürüklənən, alqoritmik şəkildə qarışıq, kirli və həssasdır. Bu xüsusiyyətlərin əksəriyyəti nəticədə ortaya çıxır, çünki böyük məlumat mənbələri sosial tədqiqat məqsədi üçün yaradılıb.
Bu fəsildə fikirlərə əsaslanaraq, məncə, böyük məlumat mənbələrinin sosial tədqiqatlar üçün ən qiymətli olan üç əsas yolu var. Birincisi, tədqiqatçılara rəqabətçi nəzəri proqnozlar arasında qərar verməyə imkan yarada bilər. Bu cür iş nümunələri Farber (2015) (New York Taksi sürücüləri) və King, Pan, and Roberts (2013) (Çində senzura) daxildir. İkincisi, böyük məlumat mənbələri indikasiya yolu ilə siyasət üçün təkmilləşdirilmiş ölçülərə imkan verir. Bu işin nümunəsi Ginsberg et al. (2009) (Google Flu Trends). Nəhayət, böyük məlumat mənbələri tədqiqatçıların eksperimentləri davam etdirmədən səbəblərə görə qiymətləndirməyə kömək edə bilər. Bu cür iş nümunələri Mas and Moretti (2009) (məhsuldarlığa Einav et al. (2015) təsirlər) və Einav et al. (2015) (eBay-də hərraclara başlanğıc qiymətinin təsiri). Bununla yanaşı, bu yanaşmaların hər biri tədqiqatçıların qiymətləndirmə üçün əhəmiyyətli miqdarda müəyyənləşdirilməsi və ya rəqabət qabiliyyətli proqnozları yaradan iki nəzəriyyə kimi məlumatlara çox şey gətirməyi tələb edir. Beləliklə, məncə, böyük məlumat mənbələrinin nə edə biləcəyi barədə ən yaxşı şəkildə düşünmək, maraqlı və vacib suallar verə biləcək tədqiqatçılara kömək edə bilər.
Xülasə verməzdən əvvəl, hesab edirəm ki, böyük məlumat mənbələri məlumat və nəzəriyyə arasındakı əlaqələrə əhəmiyyətli təsir göstərə bilər. Bu günə qədər bu fəsildə nəzəriyyəyə söykənən empirik araşdırmaların yanaşması olmuşdur. Amma böyük məlumat mənbələri tədqiqatçılara empirik şəkildə nəzarəti təmin etməyə imkan verir. Ampirik faktlar, nümunələr və bulmacaların diqqətlə yığılması sayəsində tədqiqatçılar yeni nəzəriyyələr yarada bilərlər. Bu alternativ, nəzəriyyəyə verilən məlumatlara ilk yanaşma yeni deyil və əsaslandırılmış nəzəriyyə çağırışı ilə Barney Glaser və Anselm Strauss (1967) tərəfindən ən möhkəm şəkildə ifadə edilmişdir. Bununla yanaşı, bu məlumatın ilk yanaşması rəqəmsal yaşdakı tədqiqat ətrafında bəzi jurnallarda iddia edilən "teorinin sonu" demək deyil (Anderson 2008) . Əksinə, məlumat mühiti dəyişdikcə, məlumat və nəzəriyyə arasındakı əlaqədə bərpa edilməsini gözləmək lazımdır. Məlumatların toplanmasının bahalı olduğu bir dünyada, yalnız nəzəriyyələrin təklif etdiyinə dair məlumatları toplamaq mantiqiydi. Amma böyük miqdarda məlumatın pulsuz olaraq mövcud olduğu bir dünyada, məlumatın ilk yanaşmasını (Goldberg 2015) tətbiq etmək (Goldberg 2015) .
Bu fəsildə göstərdiyim kimi, tədqiqatçılar insanları izləməklə çox şey öyrənə bilərlər. Növbəti üç fəsildə mən məlumatlarınızı toplayırıq və insanların suallarını (3-cü fəsildə), təcrübələrlə (4-cü fəsildə) soruşmaqla daha çox birbaşa əlaqə yaratdıqda və hətta onları birləşdirsək daha çox və fərqli şeylər öyrənə biləcəyik. tədqiqat prosesində birbaşa (5-ci fəsildə).