Grouss Datenquellen ginn iwwerall, awer si benotze fir sozial Fuerschung kann schwiereg sinn. A meng Erfahrung, et gëtt eppes wéi "keng gratis Mëttespaus" fir d'Donnée: wann Dir net vill Aarbecht schaaft, da gesitt Dir wahrscheinlech vill Aarbecht un dat ze denken an analyséieren.
Déi grouss Datenquelle vun haut - an héchstwahrscheinlech mëttlerweil - sinn 10 Charakteristiken. Dräi dovun sinn allgemeng (awer net ëmmer) hëlleft fir d'Recherche: grouss, ëmmer-on an onreaktiv. Siwe si meeschtens (awer net ëmmer) problematesch fir Fuerschung: onkomplett, net zougänglech, nonpresentativ, driftend, algorithmesch verwiesselt, dreckeg an empfindlech. Vill vun dëse Charakteristiken léien eventuell op, well grouss Datenquelle net zum Zweck vun der sozialer Fuerschung geschaf ginn sinn.
Opgrond vun den Iddien an dësem Kapitel, ech denken, datt et dräi Haaptméiglechkeeten ass datt grouss Datenquelle am Wäert vun der sozialer Fuerschung sinn. Als éischt kënnen d'Fuerscher sech entscheeden tëschent konkret theoretesch Prognosen. Beispiller fir dës Zort vu Wierk: Farber (2015) (New York Taxi) a King, Pan, and Roberts (2013) (Zensur zu China). Zweetens, grouss Datenquellen kënne e bessere Messung fir d'Politik duerch d'Noféierung maachen. E Beispill fir dës Zort Aarbecht ass Ginsberg et al. (2009) (Google Grippe Trends). Schlussendlech sinn grouss Datenquelle hëllefen de Fuerscher Kausalschätzungen maachen ouni Experimenter ze lafen. Beispiller fir dës Zort Aarbecht si Mas and Moretti (2009) (Peer Effekter op Produktivitéit) an Einav et al. (2015) (Effekt vum Startpräis op Auktionen op eBay). All eenzel vun dësen Approchen ass awer e Resultat fir d'Fuerscher ze erfannen, fir vill ze vill ze bréngen, wéi d'Definitioun vun enger Quantitéit déi wichteg ass fir ze schätzen oder zwee Theorien déi konkurenz Préift maachen. Also, denken ech den bescht Manéier wéi Dir mengt wat grouss Datenquellen maache kënnen ass datt si Forscher hëllefe kënnen déi interessant a wichteg Froe stellen.
Virun Enn de Schlussend, mengen ech, ass et wäert ze bedenken datt grouss Datenquellen e wichtege Effekt op d'Bezéiung tëschent Daten an Theorie hunn. Bis elo huet dëst Kapitel d'Approche vun der Theorie vun der empirescher Recherche geholl. Mä grouss Datenquellen erlaaben d'Fuerscher och empiresch an der Theorie . Dat ass duerch d'virsiichtege Akkumulatioun vun empiresche Fakten, Mustern a Puzzlen, d'Fuerscher kënnen nei Theorien ze bauen. Dës Alternativ, d'Daten-éischt Approche zur Theorie ass net nei, an et war am meeschten staark duerch d'Barney Glaser an Anselm Strauss (1967) mat hirem Uruff fir Grondpréift . Dës Daten-éischt Approche awer behaapt net "dem Enn vun der Theorie", wéi et an e puer vun de Journalismus ëm d'Recherche am digitale Alter (Anderson 2008) . Vill Ännerungen, wéi d'Datenumgebung geännert gëtt, soll een Neitspartnerschaft vun der Bezéiung tëschent Daten an Theorie erwaarden. An enger Welt, wou d'Datensammlung teuer ass, huet et Sënn fir d'Donnéeë ze sammelen déi d'Theorië virschloen de nëtzlechsten. Mä, an enger Welt wou enorm Mounts vu Donnéeën sinn schonn gratis zouhëlt, mécht et Sënn fir och eng éischt Daten (Goldberg 2015) .
Wéi ech et an dësem Kapitel fonnt hunn, kënnen d'Fuerscher vill léieren duerch d'Leit kucken. An den nächsten dräi Kapitelen wäert ech beschreiwen, wéi mer méi an aner Saachen léieren kënnen, wann mir eis Datebank sammelen an interagéieren mat Leit méi direkt duerch Froen ze stellen (Kapitel 3), Experimente lafen (Chapit 4), a souguer mat hinnen am Fuerschungsprozess direkt (Kapitel 5).