O ystyried y rhain deg nodweddion ffynonellau data mawr a'r cyfyngiadau cynhenid o ddata hyd yn oed a welwyd yn berffaith, pa fath o strategaethau ymchwil yn ddefnyddiol? Hynny yw, sut y gallwn ddysgu pan na fyddwn yn gofyn cwestiynau ac nid ydynt yn rhedeg arbrofion? Gallai ymddangos na allai pobl dim ond gwylio yn arwain at ymchwil diddorol, ond nid yw hynny'n wir.
Rwy'n gweld tair prif strategaethau ar gyfer dysgu o ddata arsylwadol: pethau cyfrif, pethau rhagweld, a frasamcanu arbrofion. 'N annhymerus' yn disgrifio pob un o'r dulliau-a oedd y rhain gellid ei alw'n "strategaethau ymchwil" neu "ryseitiau ymchwil" -ac byddaf yn eu darlunio gydag enghreifftiau. Mae'r strategaethau hyn naill ai'n annibynnol ar ei gilydd nac yn gyflawn, ond maent yn dal llawer o waith ymchwil gyda data arsylwadol.
I foreshadow yr honiadau sy'n dilyn, cyfrif pethau sydd bwysicaf pan fyddwn yn beirniadu empirig rhwng rhagfynegiadau o wahanol ddamcaniaethau. Rhagweld, ac yn enwedig nowcasting, gall fod yn ddefnyddiol i lunwyr polisi. Yn olaf, mae data mawr yn cynyddu ein gallu i wneud amcangyfrifon achosol o ddata arsylwadol.