Yn yr oes analog, casglu data am ymddygiad-pwy sy'n gwneud beth pan-yn ddrud, ac felly, yn gymharol brin. Yn awr, yn yr oes ddigidol, mae'r ymddygiadau o biliynau o bobl yn cael eu cofnodi, eu storio, a analyzable. Er enghraifft, bob tro y byddwch yn clicio ar wefan, yn gwneud galwad ar eich ffôn cell, neu dalu am rywbeth gyda'ch cerdyn credyd, cofnod digidol eich ymddygiad yn cael ei greu a'i storio gan fusnes. Gan fod y data hwn yn-gynnyrch gan y camau gweithredu bob dydd pobl, maent yn aml yn cael eu galw'n olion digidol. Yn ogystal â'r olion hyn a ddelir gan fusnesau, hefyd yn cael lywodraethau data hynod o gyfoethog am y ddau bobl a busnesau, data sydd yn aml wedi'u digido ac analyzable. Gyda'i gilydd mae'r cofnodion busnes a llywodraeth yn aml gelwir data mawr yn.
Mae'r llifogydd byth-gynyddol o ddata mawr yn golygu ein bod wedi symud o fyd lle mae data ymddygiadol yn brin i fyd lle mae data ymddygiadol yn doreithiog. Ond, gan fod y rhain data mathau yn gymharol newydd, swm anffodus o waith ymchwil sy'n eu defnyddio yn edrych fel gwyddonwyr blindly mynd ar drywydd data sydd ar gael. Mae'r bennod hon, yn lle hynny, yn cynnig dull egwyddorol at ddeall y gwahanol ffynonellau data a sut y gellir eu defnyddio. Dylai hyn ddealltwriaeth gyfoethocach yn eich helpu i gyd-fynd yn well eich cwestiynau ymchwil i ffynonellau priodol o ddata. Neu, os ffynonellau o'r fath yn bodoli eisoes yn brin, argyhoeddi chi i gasglu eich data eu hunain gan ddefnyddio'r syniadau yn y penodau yn y dyfodol.
Y cam cyntaf i ddysgu o ddata fawr yw sylweddoli ei fod yn rhan o gategori ehangach o ddata sydd wedi cael ei defnyddio ar gyfer ymchwil gymdeithasol ers blynyddoedd lawer: data arsylwadol. Yn fras, mae data arsylwadol yw unrhyw ddata sy'n deillio o arsylwi system cymdeithasol heb ymyrryd mewn rhyw ffordd. Ffordd crai i feddwl am y peth yw bod data arsylwadol yn bopeth nad yw'n cynnwys siarad â phobl (ee, arolygon, y pwnc o Bennod 3) neu newid amgylcheddau pobl (ee, arbrofion, y pwnc o Pennod 4). Felly, yn ogystal â chofnodion busnes a llywodraeth, data arsylwadol hefyd yn cynnwys pethau fel testun erthyglau papur newydd a lluniau lloeren.
Mae tair rhan y bennod hon. Yn gyntaf, yn Adran 2.2, Disgrifiaf data mawr yn fwy manwl ac yn egluro'r gwahaniaeth sylfaenol rhyngddo a'r data sydd wedi cael eu defnyddio yn gyffredinol ar gyfer ymchwil gymdeithasol yn y gorffennol. Yna, yn Adran 2.3, yr wyf yn disgrifio deg nodweddion cyffredin o ffynonellau data mawr. Deall nodweddion hyn yn ein galluogi i adnabod cryfderau a gwendidau ffynonellau presennol yn gyflym a bydd yn ein helpu i harneisio ffynonellau newydd a gaiff eu creu yn y dyfodol. Yn olaf, yn Adran 2.4, yr wyf yn disgrifio tair prif strategaethau ymchwil y gallwch eu defnyddio i ddysgu o ddata arsylwadol: pethau cyfrif, pethau rhagweld, a brasamcanu arbrawf.