Foinsí Big sonraí claonadh go bhfuil deich saintréithe; Tá roinnt mhaith do thaighde sóisialta agus tá cuid acu dona.
Má tá taighdeoirí ag dul a fhoghlaim ó shonraí móra nach raibh siad a chruthú nó a bhailiú, ansin ní mór iad a thuiscint a saintréithe ginearálta. In áit a bheith ag cur ardán le cur chuige ardán (m.sh., a anseo cad is gá duit ar an eolas faoi Twitter, a anseo cad is gá duit ar an eolas faoi sonraí cuardaigh Google, srl), tá mé ag dul chun cur síos deich tréithe ginearálta sonraí mór, saintréithe a thagann chun cinn toisc nach raibh na sonraí a cruthaíodh chun críocha taighde sóisialta. Ag stepping ar ais ó na sonraí faoi gach córas ar leith agus féachaint ar na hairíonna ginearálta, is féidir taighdeoirí níos mó faoi na foinsí sonraí atá ann cheana a fhoghlaim go tapa agus tá sraith daingean de smaointe a chur i bhfeidhm le foinsí sonraí todhchaí.
Bhfaighidh mé chuidiú é a ghrúpáil na saintréithe i dhá chatagóir:
Tríd is tríd, tá taifid riaracháin rialtais chomh neamh-ionadaí, chomh algorithmically confounded, agus níos lú drifting. Ar an láimh eile, claonadh a bhíonn na taifid riaracháin gnó a bheith níos mó agus níos i gcónaí ar.