Big datu-iturriak edonon daude, baina ikerketa sozialak erabiliz, delikatua izan daiteke. Nire esperientzian, datuak "doako janaririk gabeko" arauak bezalakoak dira: lan asko biltzen ez baduzu, ziurrenik zuk lan asko egin beharko duzu pentsatu eta hori aztertzea.
Gaurko datu-iturri handiak eta biharko probabilitatea 10 ezaugarri izango dituzte. Horietako hiru oro har (baina ez beti) ikerketarako lagungarriak dira: big, beti-on, eta ez erreaktiboa. Zazpi ikerketarako arazoak izaten dira (baina ez beti): osatugabea, eskuraezina, ez errepresentatzailea, driftinga, algoritmikoki nahastuta, zikin eta sentikorra. Ezaugarri horietako asko azken batean sortzen dira, datu-iturri handiak ez baitira sortutako gizarte-ikerketarako.
Kapitulu honetako ideietan oinarriturik, uste dut datu-iturri handiak baliagarriak direla ikerketa sozialerako tresnak direla. Lehenik eta behin, ikertzaileek aurreikuspen teoriko lehiakorren artean erabakitzen dute. Lan mota horien adibideak Farber (2015) (New Yorkeko Taxi gidariak) eta King, Pan, and Roberts (2013) (zentsura Txinan). Bigarrenik, datu-iturri handiek hobekuntza-neurriak ahalbidetu ditzakete gaur egungo isurketaren bidez. Lan mota honetako adibide bat Ginsberg et al. (2009) (Google Gripearen joerak). Azkenean, datu-iturri handiek ikertzaileek estimazio kausalak egin ditzakete esperimentuak exekutatu gabe. Lan mota honetako adibideak Mas and Moretti (2009) (produktibitatearen gaineko eraginak) eta Einav et al. (2015) (eBay-en enkanteen prezioa hasierako eragina). Ikuspegi horietako bakoitzak, ordea, ikertzaileek datu asko ekartzea eskatzen du, esate baterako, estimazio garrantzitsua edo bi lehiakideen aurreikuspenak egiteko bi teoriak definitzea. Horrela, uste dut datu-iturri handiek zer egin dezaketen pentsatzeko modurik onena galdera interesgarri eta garrantzitsuak eska diezaieketen ikertzaileei laguntzeko.
Amaitu baino lehen, uste dut merezi duten datu-iturri handiak ondorio garrantzitsuak izan ditzakeela datuen eta teoriaren arteko harremana. Orain arte, kapitulu honek ikerketa enpirikoaren teoria bultzatu zuen. Datu-iturri handiek, halaber, ikertzaileek teorizazio enpirikoki bultzatuta egin ditzakete . Hau da, gertaeren enpirikoen, ereduen eta puzzleen metaketa sakonaren bidez, ikertzaileek teoria berriak eraikitzen dituzte. Teoria teorikoari buruzko datu alternatibo hau ez da berria, eta Barney Glaser eta Anselm Straussek (1967) artikuluaren indarra izan zuten , teoria oinarrituta . Datu-lehen hurbilketa honek, ordea, ez du "teoriaren amaiera" esan nahi, antzinako ikerketen inguruko kazetaritza erreklamatu den moduan (Anderson 2008) . Baizik eta, datuen ingurunea aldatzen denean, datuen eta teoriaren arteko harremana berrezarriko litzateke. Datuen bilketa garestia izan den mundu batean, zentzua da teoriak iradoki ditzakeen datuak bakarrik biltzea. Baina, datu kopuru izugarriak dohainik dagoen mundu batean, zentzuzkoa da datu-lehen hurbilketa bat ere saiatzea (Goldberg 2015) .
Kapitulu honetan azaldu dudan moduan, ikertzaileek asko ikasi dezakete jendea behatuz. Hiru kapituluetan azalduko dut nola gehiago eta gauza ezberdinak ikasiko ditugula gure datuen bilketa neurrira eta pertsona batzuekin zuzenean elkarreragiten badugu zuzeneko galderak (kapitulu 3), esperimentuak martxan jartzea (4. kapitulua), eta are gehiago inplikatuz zuzenean ikerketa-prozesuan (5. kapitulua).