I aois aschur, ag bailiú sonraí faoi iompar-cé a dhéanann cén nuair-a bhí daor, agus dá bhrí sin, sách annamh. Anois, san aois dhigiteach, an iompar na billiúin daoine a thaifeadadh, a stóráil, agus analyzable. Mar shampla, gach uair a dhéanann tú cliceáil ar an suíomh gréasáin, a dhéanamh glaoch ar do ghuthán cille, nó a íoc as rud éigin le do chárta creidmheasa, tá taifead digiteach de do iompar chruthú agus a stóráil ag gnólacht. Mar go bhfuil na sonraí a trí-táirge de gach gníomhaíochtaí lá na ndaoine, a thugtar go minic rianta digiteach. Chomh maith leis na rianta i seilbh gnólachtaí, tá rialtais freisin sonraí incredibly saibhir faoi dhaoine agus do ghnóthaí, sonraí a bhfuil go minic dhigitiú agus analyzable. Le chéile na taifid seo gnó agus rialtais a dtugtar go minic sonraí mór.
Ciallaíonn an tuile de shíor ag ardú de shonraí mór go táimid tar éis bogadh ó ndomhan ina raibh sonraí iompraíochta gann le ndomhan ina bhfuil sonraí iompraíochta flúirseach. Ach, mar go bhfuil na sonraí cineálacha réasúnta nua, Breathnaíonn méid trua taighde iad a úsáid mar eolaithe blindly chasing sonraí atá ar fáil. An chaibidil, in ionad, cuireann cur chuige phrionsabálta a tuiscint a fháil ar fhoinsí difriúla sonraí, agus conas is féidir iad a úsáid. Ba chóir an tuiscint níos saibhre cabhrú leat mheaitseáil níos fearr do chuid ceisteanna taighde ar fhoinsí iomchuí na sonraí. Nó, má tá na foinsí atá ann cheana féin den sórt sin a ann, ina luí leat a bhailiú do chuid sonraí féin a baint úsáide as na smaointe i gcaibidlí amach anseo.
Tá an chéad chéim chun foghlaim ó sonraí mór a thuiscint go bhfuil sé mar chuid de chatagóir ghinearálta de shonraí a úsáideadh le haghaidh taighde sóisialta ar feadh blianta fada: sonraí breathnadóireachta. Garbh, tá sonraí breathnadóireachta aon sonraí a eascraíonn as breathnú córas sóisialta gan idirghabháil ar bhealach éigin. Is bealach amh ag smaoineamh air go bhfuil sonraí breathnadóireachta gach rud nach bhfuil i gceist ag caint le daoine (m.sh., suirbhéanna, ar an ábhar Chaibidil 3) nó daoine imshaoil (m.sh., turgnaimh, an ábhar Chaibidil 4) a athrú. Dá bhrí sin, chomh maith le taifid gnó agus rialtais, folaíonn sé na sonraí breathnaithe freisin rudaí cosúil le téacs ailt nuachtáin agus grianghraif satailíte.
Tá trí chuid sa chaibidil. Gcéad dul síos, i gCuid 2.2, cur síos mé sonraí mór níos mine agus difríocht bhunúsach idir é agus na sonraí a bhí in úsáid go ginearálta le haghaidh taighde sóisialta san am atá thart a shoiléiriú. Ansin, i gCuid 2.3, déan cur síos mé deich comhthréithe na bhfoinsí sonraí mór. Tuiscint ar na saintréithe ár gcumas a aithint go tapa ar na láidreachtaí agus laige na bhfoinsí reatha agus cabhróidh sé linn leas a bhaint as na foinsí nua a bheidh a cruthaíodh sa todhchaí. Ar deireadh, i gCuid 2.4, déan cur síos mé trí straitéisí taighde is mó gur féidir leat é a úsáid chun foghlaim ó shonraí breathnadóireachta: rudaí comhaireamh, rudaí réamhaisnéise, agus comhfhogasú ar thurgnamh.