Mae mesur mewn ffynonellau data mawr yn llawer llai tebygol o newid ymddygiad.
Un her o ymchwil gymdeithasol yw y gall pobl newid eu hymddygiad pan fyddant yn gwybod eu bod yn cael eu harsylwi gan ymchwilwyr. Yn gyffredinol, mae gwyddonwyr cymdeithasol yn galw'r adweithiad hwn (Webb et al. 1966) . Er enghraifft, gall pobl fod yn fwy hael mewn astudiaethau labordy nag astudiaethau maes oherwydd yn y gorffennol maent yn ymwybodol iawn eu bod yn cael eu harsylwi (Levitt and List 2007a) . Un agwedd ar ddata mawr y mae llawer o ymchwilwyr yn ei chael yn addawol yw nad yw cyfranogwyr yn ymwybodol fel arfer bod eu data'n cael ei ddal neu eu bod wedi dod yn gyfarwydd â'r casgliad data hwn nad yw'n newid ei ymddygiad mwyach. Gan nad yw cyfranogwyr yn anweithredol , felly, gellir defnyddio llawer o ffynonellau data mawr i astudio ymddygiad nad oedd modd ei fesur yn gywir yn flaenorol. Er enghraifft, defnyddiodd Stephens-Davidowitz (2014) gyffredinrwydd termau hiliol mewn ymholiadau peiriannau chwilio i fesur animeidd hiliol mewn gwahanol ranbarthau yn yr Unol Daleithiau. Roedd y natur anadweithiol ac anweithredol (gweler adran 2.3.1) natur y data chwilio yn galluogi mesuriadau a fyddai'n anodd defnyddio dulliau eraill, megis arolygon.
Nid yw anweithgarwch anweithgarwch, fodd bynnag, yn sicrhau bod y data hyn yn rhywsut yn adlewyrchiad uniongyrchol o ymddygiad neu agweddau pobl. Er enghraifft, fel y dywedodd un ymatebydd mewn astudiaeth yn seiliedig ar gyfweliad, "Nid dydy i ddim yn cael problemau, dydw i ddim ond eu rhoi ar Facebook" (Newman et al. 2011) . Mewn geiriau eraill, er bod rhai ffynonellau data mawr yn anweithredol, nid ydynt bob amser yn rhydd o ragfarn dymunol cymdeithasol, y tueddiad i bobl am eu cyflwyno eu hunain yn y ffordd orau bosibl. Ymhellach, fel y disgrifiaf yn ddiweddarach yn y bennod, weithiau bydd yr ymddygiad sy'n cael ei ddal mewn ffynonellau data mawr yn cael ei effeithio gan nodau perchnogion y llwyfan, mater y byddaf yn galw'n ddryslyd algorithmig . Yn olaf, er bod diffyg anweithgarwch yn fanteisiol i ymchwil, mae olrhain ymddygiad pobl heb eu caniatâd ac ymwybyddiaeth yn codi pryderon moesegol y byddaf yn eu disgrifio'n fanwl ym mhennod 6.
Mae'r tri eiddo yr wyf newydd eu disgrifio - mawr, bob amser, ac anweithredol - yn gyffredinol, ond nid bob amser, yn fanteisiol ar gyfer ymchwil gymdeithasol. Nesaf, byddaf yn troi at y saith eiddo o ffynonellau data mawr-anghyflawn, anhygyrch, an-gynrychioliadol, diflannu, algorithmig yn ddryslyd, yn fudr, ac yn sensitif - sy'n gyffredinol, ond nid bob amser, yn creu problemau ar gyfer ymchwil.