Ann an Analog aois, a 'tional dàta mu dheidhinn giùlan-dè a' dèanamh nuair a bha daor-, agus uime sin, an ìre mhath tearc. A-nis, anns an àm dhidseatach, a 'giùlain na billeanan de dhaoine air an clàradh, air an stòradh, agus analyzable. Mar eisimpleir, a h-uile uair a phutas tu air làrach-lìn a dhèanamh air a 'ghairm agad fòn làimhe, no pàigheadh airson rudeigin le cairt-creideis agaibh, digiteach chlàr de ghiùlan agaibh a chruthachadh agus a stòradh le gnìomhachas. Seach gu bheil an dàta sin tha fo-bhathar de dhaoine a h-uile latha gnìomhan, tha iad tric canar didseatach comharran. A thuilleadh air sin comharran a chaidh a chumail le gnothachasan, riaghaltasan cuideachd uabhasach beairteach dàta mu dheidhinn an dà chuid daoine agus gnìomhachasan, dàta a tha gu tric a 'digiteachadh agus analyzable. Còmhla, tha na clàran gnìomhachais agus an riaghaltas a tha canar gu tric mòr dàta.
A 'sìor-èirigh tuil mòr dàta a' ciallachadh gu bheil sinn air gluasad bhon t-saoghal far a bheil giùlain dàta bha gann gu saoghal far giùlain dàta pailt. Ach, air sgàth na seòrsachan dàta a tha an ìre mhath ùr, an t-suim de rannsachadh mì-fhortanach a bhith gan cleachdadh mar luchd-saidheans a 'coimhead gu dall an tòir dàta ri fhaotainn. Tha an caibideil seo, an àite sin, a 'tabhann prìomh mhodhan gus tuigse fhaighinn air na diofar thobraichean dàta agus mar a dh'fhaodas iad a chleachdadh. Seo na bu bheairtiche tuigse bu chòir cuideachadh a thoirt dhuibh a mhaidseadh nas fheàrr do na ceistean rannsachaidh iomchaidh gus tùsan dàta. No, ma tha a leithid ann an-dràsta na stòran a tha a dhìth, chreideadh sibh a 'cruinneachadh dàta agad fhèin a' cleachdadh an smuaintean ann an caibideilean san àm ri teachd.
A 'chiad cheum a bhith ag ionnsachadh bho mòr dàta a thoirt gu buil gu bheil e na phàirt de roinn-seòrsa nas fharsainge de dhàta a tha air a bhith air a chleachdadh airson rannsachadh sòisealta airson iomadh bliadhna: beachdachail dàta. Garg, beachdachail dàta sam bith dàta thoraidhean bho amharc sòisealta siostam gun eadraiginn ann an dòigh air choreigin. A amh dòigh gus smaoineachadh mu na tha e gun beachdachail dàta h-uile càil nach eil a 'gabhail a-steach bruidhinn ri daoine (me, suirbhidhean, cuspair an Caibideal 3) no ag atharrachadh dhaoine àrainneachdan (me, deuchainnean, cuspair Caibideal 4). Mar sin, a thuilleadh air gnothachas agus riaghaltas clàran, beachdachail dàta cuideachd a 'gabhail a-steach rudan mar an teacsa artaigilean agus dealbhan saideil.
Tha an caibideil seo tha trì pàirtean. An toiseach, ann an earrann 2.2, bidh mi a 'toirt cunntas air mòr dàta nas mionaidiche agus a shoilleireachadh bunaiteach eadar-dhealachadh eadar e agus an dàta a tha anns a' chumantas air a chleachdadh airson rannsachadh sòisealta san àm a dh'fhalbh. An uair sin, ann an Earrann 2.3, tha mi a 'toirt cunntas deich cumanta feartan mòr tobraichean dàta. Tuigsinn na feartan sin a 'toirt cothrom dhuinn gu luath ag aithneachadh an neartan agus laigsean ann an-dràsta stòran agus bheir iad cuideachadh dhuinn feum ùr thùsan a thèid a chruthachadh anns an àm ri teachd. Mu dheireadh, ann an Earrann 2.4, tha mi ag innse mu na trì prìomh ro-innleachdan rannsachaidh a dh'fhaodas sibh a 'cleachdadh gus ionnsachadh bho beachdachail dàta: cunntadh rudan, rudan sìde, agus approximating an deuchainn.