Mae ffynonellau data mawr ymhobman, ond gall eu defnyddio ar gyfer ymchwil gymdeithasol fod yn anodd. Yn fy mhrofiad i, mae rhywbeth fel rheol "dim cinio am ddim" ar gyfer data: os nad ydych chi'n rhoi llawer o waith yn ei gasglu, yna mae'n debyg y bydd yn rhaid i chi roi llawer o waith i feddwl amdano a dadansoddi.
Bydd ffynonellau data mawr heddiw - ac yn debygol yfory - yn tueddu i gael 10 nodwedd. Yn gyffredinol, mae tri o'r rhain (ond nid bob amser) yn ddefnyddiol ar gyfer ymchwil: mawr, bob amser, ac anweithredol. Mae saith yn gyffredinol (ond nid bob amser) yn broblemus ar gyfer ymchwil: anghyflawn, anhygyrch, annatyniadol, diflannu, yn anghydnaws, yn fudr ac yn sensitif. Yn y pen draw, mae llawer o'r nodweddion hyn yn codi oherwydd na chreu ffynonellau data mawr at ddibenion ymchwil gymdeithasol.
Yn seiliedig ar y syniadau yn y bennod hon, credaf fod tair prif ffordd y bydd ffynonellau data mawr yn fwyaf gwerthfawr ar gyfer ymchwil gymdeithasol. Yn gyntaf, gallant alluogi ymchwilwyr i benderfynu rhwng rhagfynegiadau damcaniaethol sy'n cystadlu. Mae enghreifftiau o'r math hwn o waith yn cynnwys Farber (2015) (gyrwyr tacsi New York) a King, Pan, and Roberts (2013) (sensoriaeth yn Tsieina). Yn ail, gall ffynonellau data mawr alluogi gwell mesur ar gyfer polisi trwy nawr. Enghraifft o'r math hwn o waith yw Ginsberg et al. (2009) (Google Flu Trends). Yn olaf, gall ffynonellau data mawr helpu ymchwilwyr i wneud amcangyfrifon achosol heb redeg arbrofion. Enghreifftiau o'r math hwn o waith yw Mas and Moretti (2009) (effeithiau cyfoedion ar gynhyrchiant) ac Einav et al. (2015) (effaith pris cychwyn ar arwerthiannau yn eBay). Fodd bynnag, mae pob un o'r dulliau hyn yn tueddu i fynnu bod ymchwilwyr yn dod â llawer i'r data, megis y diffiniad o swm sy'n bwysig i amcangyfrif neu ddau ddamcaniaeth sy'n gwneud rhagfynegiadau cystadleuol. Felly, rwy'n credu mai'r ffordd orau i feddwl am yr hyn y gall ffynonellau data mawr ei wneud yw y gallant helpu ymchwilwyr sy'n gallu gofyn cwestiynau diddorol a phwysig.
Cyn dod i ben, credaf ei bod yn werth ystyried y gallai ffynonellau data mawr gael effaith bwysig ar y berthynas rhwng data a theori. Hyd yn hyn, mae'r bennod hon wedi cymryd ymagwedd ymchwil empirig a arweinir gan theori. Ond mae ffynonellau data mawr hefyd yn galluogi ymchwilwyr i wneud theori yn empirig . Hynny yw, trwy grynhoi ffeithiau empirig, patrymau a phosau yn ofalus, gall ymchwilwyr greu damcaniaethau newydd. Nid yw'r dull amgen hwn, sy'n ymwneud â data, tuag at theori yn newydd, ac fe'i mynegwyd yn gryf gan Barney Glaser ac Anselm Strauss (1967) gyda'u galw am theori ar sail sail . Fodd bynnag, nid yw'r ymagwedd ddata-gyntaf hon yn awgrymu "diwedd theori," fel yr honnwyd mewn rhai o'r newyddiaduraeth o amgylch ymchwil yn yr oes ddigidol (Anderson 2008) . Yn hytrach, wrth i'r amgylchedd data newid, dylem ddisgwyl ail-gydbwyso yn y berthynas rhwng data a theori. Mewn byd lle roedd casglu data yn ddrud, roedd yn gwneud synnwyr i gasglu'r data y mae'r damcaniaethau a awgrymir yn fwyaf defnyddiol yn unig. Ond, mewn byd lle mae symiau enfawr o ddata ar gael yn rhad ac am ddim, mae'n gwneud synnwyr hefyd i roi cynnig ar ddull data-first (Goldberg 2015) .
Fel y dangosais yn y bennod hon, gall ymchwilwyr ddysgu llawer trwy wylio pobl. Yn y tair pennod nesaf, disgrifiaf sut y gallwn ddysgu mwy a phethau gwahanol os ydym yn teilwra ein casglu data a'n rhyngweithio â phobl yn fwy uniongyrchol trwy ofyn cwestiynau iddynt (pennod 3), rhedeg arbrofion (pennod 4), a hyd yn oed eu cynnwys yn y broses ymchwil yn uniongyrchol (pennod 5).