Is cuma cé chomh mór is atá do shonraí móra, ní dócha go bhfuil an fhaisnéis is mian leat.
Tá na foinsí sonraí is mó neamhiomlán , sa chiall nach bhfuil an fhaisnéis acu a theastaíonn uait as do chuid taighde. Gné coitianta é seo de shonraí a cruthaíodh chun críocha seachas taighde. Bhí taithí ag go leor eolaithe sóisialta cheana féin maidir le déileáil le neamhiomlán, mar shampla suirbhé atá ann cheana féin nár iarr an cheist a bhí ag teastáil. Ar an drochuair, bíonn fadhbanna na neamhiomlán i bhfad níos mó i sonraí móra. I mo thaithí, is cosúil go mbíonn trí chineál faisnéise ag baint le sonraí móra le haghaidh taighde sóisialta: faisnéis dhéimeagrafach faoi rannpháirtithe, iompar ar ardáin eile, agus sonraí chun tógálacha teoiriceacha a oibriú.
Maidir leis na trí chineál neamhiomlán, is é an fhadhb a bhaineann le sonraí neamhiomlána chun tógálacha teoiriceacha a oibriú ná an deacra a réiteach. Agus is é mo thaithí, is minic nach ndéantar dearmad ar thaisme. Is beag tuairimí teoiriciúla iad smaointe teibí a dhéanann staidéar teoiriciúil ar eolaithe sóisialta a dhéanann staidéar teoiriciúil orthu agus iad ag feidhmiú ar bhealach éigin chun an tógáil sin a ghabháil le sonraí inbhraite. Ar an drochuair, is minic a bhíonn an próiseas simplí fuaime seo deacair go leor. Mar shampla, is féidir linn a shamhlú ag iarraidh an t-éileamh is cosúil go simplí a thástáil go hintíreach go bhfaigheann daoine atá níos cliste airgead níos mó. D'fhonn an t-éileamh seo a thástáil, ní mór duit "faisnéis" a thomhas. Ach cad é faisnéis? D'áitigh Gardner (2011) go bhfuil ocht gcineál faisnéise i ndáiríre ann. Agus an bhfuil nósanna imeachta ann a d'fhéadfadh aon cheann de na foirmeacha faisnéise seo a thomhas go cruinn? In ainneoin mórmhéid oibre ag síceolaithe, níl freagraí neamhbhrí fós ag na ceisteanna seo.
Dá bhrí sin, is féidir éileamh fiú réasúnta simplí a dhéanamh ar dhaoine a bhfuil níos mó cliste níos mó airgid acu - is féidir iad a mheas go hintíreach mar go bhféadfadh sé a bheith deacair tógálacha teoiriciúla a oibriú i sonraí. I measc samplaí eile de thógálacha teoiriciúla atá tábhachtach ach go bhfuil siad deacair a oibriú, tá "noirmí," "caipiteal sóisialta," agus "daonlathas." Glaoíonn eolaithe sóisialta an mheaitseáil idir tógálacha teoiriciúla agus bailíocht thógála sonraí (Cronbach and Meehl 1955) . De réir mar a thaispeánann an liosta gearr seo de thógálacha, is fadhb í a thógann eolaithe sóisialta le tamall an-fhada. Ach i mo thaithí, tá na fadhbanna a bhaineann le bailíocht a thógáil níos mó fós nuair a bhíonn siad ag obair le sonraí nach raibh cruthaithe chun críocha taighde (Lazer 2015) .
Nuair a bhíonn toradh taighde á mheas agat, is é bealach tapa agus úsáideach measúnú a dhéanamh ar bhailíocht tógála ná an toradh a ghlacadh, a léirítear de ghnáth i dtéarmaí tógálacha, agus é a athfhriotail i dtéarmaí na sonraí a úsáidtear. Mar shampla, déan staidéar ar dhá staidéar hipitéiseach a éilíonn a thaispeáint go bhfaigheann daoine atá níos cliste airgead níos mó. Sa chéad staidéar, d'aimsigh an taighdeoir go ndearna daoine a scór go maith ar Thástáil na gCáithníní um Fhorbairt Raven - tástáil a ndearnadh staidéar orthu ar fhaisnéis anailíse (Carpenter, Just, and Shell 1990) - ioncam tuairiscithe níos airde ar a gcuid tuairisceáin chánach. Sa dara staidéar, d'aimsigh an taighdeoir gur dócha go mbainfeadh daoine ar Twitter a d'úsáid focail níos faide brandaí só a lua. Sa dá chás, d'fhéadfadh na taighdeoirí seo a éileamh gur léirigh siad go bhfaigheann daoine atá níos cliste airgead níos mó. Mar sin féin, sa chéad staidéar, tá na sonraí tógála teoiriciúil ag feidhmiú go maith ag na sonraí, agus sa dara háit nach bhfuil siad. Thairis sin, mar a léiríonn an sampla seo, ní dhéanann sonraí níos mó fadhbanna a réiteach go huathoibríoch le bailíocht a thógáil. Ba cheart duit amhras a dhéanamh ar thorthaí an dara staidéir an raibh milliún tweets, billiún tweets, nó trilliún tweets ann. I gcás nach bhfuil taithí ag taighdeoirí ar an smaoineamh maidir le bailíocht a thógáil, soláthraíonn tábla 2.2 roinnt samplaí de staidéir a bhfuil tógálacha teoiriceacha oibrithe ag baint úsáide as sonraí rianúla digiteacha.
Foinse sonraí | Tógáil teoiriciúil | Tagairtí |
---|---|---|
Logáil ríomhphoist ó ollscoil (meiteashonraí amháin) | Caidrimh shóisialta | Kossinets and Watts (2006) , Kossinets and Watts (2009) , De Choudhury et al. (2010) |
Poist meáin shóisialta ar Weibo | Rannpháirtíocht shibhialta | Zhang (2016) |
Logáil ríomhphoist ó ghnólacht (meiteashonraí agus téacs iomlán) | Feiliúnach cultúrtha in eagraíocht | Srivastava et al. (2017) |
Cé go bhfuil fadhb na sonraí neamhiomlána le haghaidh tógálacha teoiriciúla a ghabháil deacair a réiteach, tá réitigh choiteanna ann do na cineálacha coitianta neamhiomlán eile: faisnéis dhéimeagrafach neamhiomlán agus faisnéis neamhiomlán maidir le hiompar ar ardáin eile. Is é an chéad réiteach ná na sonraí a theastaíonn uait a bhailiú i ndáiríre; Inseoidh mé duit faoi sin i gcaibidil 3 nuair a chuirim in iúl duit faoi shuirbhéanna. Is é an réiteach is dara is mó a dhéanamh cad a thugann eolaithe sonraí thátal úsáideora-tréith agus eolaithe sóisialta glaoch-leith. Sa chur chuige seo, úsáideann taighdeoirí an fhaisnéis atá acu ar roinnt daoine chun tréithe daoine eile a bhaint amach. Is é an tríú réiteach is féidir ná foinsí éagsúla sonraí a chur le chéile. Tugtar nasc taifead ar an bpróiseas seo uaireanta. Scríobh Dunn (1946) an meafar is fearr leat don phróiseas seo sa chéad mhír den chéad pháipéar a scríobh riamh ar nasc taifead:
"Cruthaíonn gach duine ar domhan Leabhar Saoil. Tosaíonn an Leabhar seo le breith agus críochnaíonn sé le bás. Tá a chuid leathanach comhdhéanta de thaifid de na príomhimeachtaí sa saol. Is é an nasc taifead an t-ainm a thugtar don phróiseas chun leathanaigh an leabhair seo a chomhdhéanamh i méid. "
Nuair a scríobh Dunn an sliocht sin bhí sé ag smaoineamh go bhféadfadh mór-imeachtaí saoil a bheith i Leabhar na Beatha mar bhreith, pósadh, colscaradh agus bás. Mar sin féin, áfach, go bhfuil an oiread eolais faoi dhaoine taifeadta, d'fhéadfadh an leabhar Saoil a bheith ina phortráid thar a bheith mionsonraithe, más féidir na leathanaigh éagsúla (ie ár rianta digiteacha) a cheangal le chéile. D'fhéadfadh an Leabhar Saoil seo a bheith ina acmhainn iontach do thaighdeoirí. Ach, d'fhéadfaí bunachar sonraí de ruin (Ohm 2010) , a d'fhéadfaí a úsáid le haghaidh gach cineál críocha neamhéigiúil, mar a chuirfidh mé síos i gcaibidil 6 (Eitic).