L'altri fonti di dati sò in ogni locu, ma l'utilizanu per a ricerca sociale pò esse sbagliatu. In a mo spirimintà, ci hè quarchi cosa cum'è un regnu "senza lunchu" per a dati: sè ùn site micca moltu di travagliu per sceglie, perchè ghjè prubabilmente avè da esse di molti di travagliu pensanu à quessa è analizeghja.
I grandi fatti di dati di l'oghje è, prubabilmente dumande, tendenu di 10 caractères. Trè da queste sò in generale (ma micca sempre) utili per a ricerca: grande, sempre-on e nonreactive. Sette sò in generale (ma micca sempre) problematique per a ricerca: incomplete, inaccessibili, nonrepresentative, drifting, algorithmically confused, bruttu è sensibule. Molti di sti caractères ultimamente risultu perchè e grande fonti di dati ùn anu micca creatu per u scopu di a ricerca suciale.
Basatu nantu à l'idee in issu capu, crede chì quì sò trè vii principali chì e grande fonti di dati sianu più preziosa per a ricerca suciale. Prima, ponu permettà i circunstanzi di decide entre i predichi pricichi teorichi. Esempi di sta tipu di travagliu include Farber (2015) (New York Taxi) è King, Pan, and Roberts (2013) (censura in Cina). Secondu, e grandi funziunalità di dati pò permettà a mediu improvatu per pulitica through nowcasting. Un esempiu di stu tipu di travagliu hè Ginsberg et al. (2009) (Google Fluss Fluctuations). Infine, e grandi fonti di dati pò aiutà i circunsidenti facenu estimi causale senza esecutà esperimenti. Esempi di sti modi di travagliu sò Mas and Moretti (2009) (Eperazioni parenti nantu à a produtividade) è Einav et al. (2015) (l'effettu di u prezzu di u principiu nantu à l'auction in eBay). Ogni sti acchamplii, in ogni casu, tende di dumandà i ricchieri in atturciate assai di i dati, cum'è a definizione di una quantità chì hè impurtante per stima o duie teorii chì facenu cunferenze predichi. Cusì, crede chì u megliu modu di penserà quale cose da l'altru fonti di dati hè chì pò aiutà i circunsidenti chì puderanu dumandà dumande interessanti è impurtanti.
Prima di cuncludi, crede chì vale a pena chì e grandi funziunalità di dati pò avè un effettu significativu à a rapportu trà e dati è a teoria. Finu à quì, stu capitulu hà pigliatu l'approcciu di a ricerca empirica propria di a teoria. Ma l'altri fonti di dati altri permettenu ancu chì i circunstanzi di mette in a teorizazione empiricamenti . Questu hè, traversu l'accumulazioni curretta di fatti fatti empirichi, i patogeni è i puzziche, i ricerchi anu pudè edificà e teonii novi. Questu alternativu, u principiu di prima di dati à a teoria ùn hè micca nova, è era più forti articulata da Barney Glaser è Anselm Strauss (1967) incù u so scopu di a teoria in terra . Stu dati di primu primu approccamu, ma ùn importa micca "a fine di a teoria", cum'ellu hè statu rivenditu di qualchi di u ghjurnalismu annantu à a ricerca in l'era digitale (Anderson 2008) . Per via, quandu l'ambienti di l'inturnianza cambia, avemu deveru esse rimbursatu in a relazione trà e dati è a teoria. In un mondu induve a cullizzioni di dati era caru, ùn hà fattu sensu per reciclar solu i dati chì e teori suggerenu serà u più utile. Ma, in un mondu induve numeri enormi di dati sò dispunibili dispunibili, hè sensu ancu di pruvate una strada di dati prima (Goldberg 2015) .
Cumu aghju avete dimustratu in stu capitulu, i circòccheru ponu amparà assai in vede e persone. In i seguenti trè capudi, aghju da esse l'infurmazioni di quantu pudemu amparà più è e diverse cose se fenecimanu a nostra ricerca di dati è interagisce cù e persone più direttamente dumandendu à e dumande (capitu 3), sperienze direttamente (capitu 4), è ancu avè parte in u prucessu di ricerca direttamenti (capitu 5).