Laibikita nla rẹ data nla, o jasi ko ni alaye ti o fẹ.
Ọpọlọpọ awọn orisun data nla ko ni pe , ni ori pe wọn ko ni alaye ti o yoo fẹ fun iwadi rẹ. Eyi jẹ ẹya ti o wọpọ ti data ti a da fun awọn idi miiran ju iwadi lọ. Ọpọlọpọ awọn onimo ijinlẹ awujọ ti tẹlẹ ti ni iriri iriri awọn ailopin, gẹgẹbi iwadi ti o wa tẹlẹ ti ko beere ibeere ti a nilo. Laanu, awọn iṣoro ti aipe ko ni iyipada pupọ ni data nla. Ni iriri mi, data nla n duro lati padanu awọn iru alaye mẹta ti o wulo fun iwadi awujọ: alaye ti ara ẹni nipa awọn alabaṣepọ, ihuwasi lori awọn iru ẹrọ miiran, ati data lati ṣe itọnisọna awọn ọna itumọ.
Ninu awọn iru aiṣedede mẹta, iṣoro ti ailopin data lati ṣe iṣiro awọn ọna itumọ jẹ nira julọ lati yanju. Ati ninu iriri mi, o maa n aṣiṣe lairotẹlẹ. Lai ṣe pataki, awọn itumọ ti ofin jẹ awọn imọran ti o jẹ imọran ti awọn onimo ijinle sayensi ṣe iwadi ati sisẹ-ṣiṣe kan ti o tumọ si ni ọna ti nfunni diẹ ninu ọna lati gba iru-iṣẹ naa pẹlu awọn data ti a lero. Laanu, ilana ti o rọrun yii wa nigbagbogbo lati wa nira. Fun apeere, jẹ ki a ronu pe o gbiyanju lati ṣe idanwo ni idaniloju pe o rọrun nipe pe awọn eniyan ti o ni oye julọ ni o ni owo diẹ sii. Lati ṣe idanwo idiyele yii, iwọ yoo nilo lati "oye". Ṣugbọn kini oye? Gardner (2011) jiyan pe o wa ni pato mẹjọ awọn oriṣiriṣi oriṣi awọn itetisi. Ati pe awọn ilana wa ti o le ṣe atunṣe eyikeyi ninu awọn ọna itọnisọna wọnyi? Pelu ọpọlọpọ awọn oye iṣẹ nipasẹ awọn ogbon imọran, awọn ibeere wọnyi ko tun ni awọn idahun ti ko ni imọran.
Bayi, paapaa awọn eniyan ti o ni imọran diẹ ti o ni oye ti o ni oye sii-o le ṣòro lati ṣayẹwo ti o ni idaniloju nitori pe o le ṣoro lati ṣe itisọpọ awọn itumọ ọrọ ni data. Awọn apeere miiran ti awọn itumọ ti o ṣe pataki ti o ṣe pataki ṣugbọn ṣòro lati ṣiṣẹ pẹlu "awọn aṣa," "olubaṣepọ," ati "tiwantiwa." Awọn onimo ijinlẹ awujọ n pe idibaṣepọ laarin awọn idiyele ti iṣan ati imọle data (Cronbach and Meehl 1955) . Gẹgẹbi akojọ kukuru yii ti awọn itumọ ti ni imọran, iṣẹ-ṣiṣe ni imọran jẹ iṣoro ti awọn onimo ijinlẹ awujọ ti ti gbiyanju pẹlu igba pipẹ. Ṣugbọn ninu iriri mi, awọn iṣoro ti ijẹrisi-ṣiṣe ni o tobi julọ nigbati o n ṣiṣẹ pẹlu awọn data ti a ko da fun awọn idi ti iwadi (Lazer 2015) .
Nigba ti o ba nṣe ayẹwo abajade iwadi kan, ọna kan ti o yara ati ọna lati ṣe ayẹwo idiwọ ọṣọ ni lati gba abajade, eyi ti a maa n sọ ni awọn ọna ti awọn itumọ, ati tun ṣe afihan rẹ ni awọn alaye ti awọn data ti a lo. Fún àpẹrẹ, wo àwọn ìwádìí ìbáyẹ méjì tí o sọ pé kí wọn fi hàn pé àwọn ènìyàn tí ó ní ọgbọn jù lọ ní owó diẹ sii. Ninu iwadi akọkọ, oluwadi naa ri pe awọn eniyan ti o ṣafọri daradara lori igbeyewo Ilọsiwaju-Raven-Testing-iwadi daradara ti imọ-imọ-imọ-imọ-imọ-ẹrọ (Carpenter, Just, and Shell 1990) -awoye ti o pọju ti o pọju ti owo-ori wọn pada. Ni iwadi keji, oluwadi naa ri pe awọn eniyan lori Twitter ti wọn lo awọn ọrọ to gun julọ ni o ṣeese lati sọ awọn ẹbun igbadun. Ni awọn mejeji mejeeji, awọn oluwadi yii le beere pe wọn ti fihan pe awọn eniyan ti o ni oye julọ n gba owo diẹ sii. Sibẹsibẹ, ninu iwadi akọkọ ti awọn alaye itumọ ti wa ni ṣiṣe daradara nipasẹ awọn data, lakoko ti o wa ni keji wọn ko. Pẹlupẹlu, bi apẹẹrẹ yi ṣe apejuwe, data diẹ ko ni yanju awọn iṣoro pẹlu iṣawari agbara. O yẹ ki o ṣe iyemeji awọn esi ti iwadi keji ti o ba jẹ pẹlu milionu tweets, tweets bilionu, tabi tweets tillion kan. Fun awọn oluwadi ko mọ pẹlu idaniloju idibajẹ ọṣọ, tabili 2.2 n funni awọn apẹẹrẹ ti awọn ijinlẹ ti o ni awọn ọna itumọ ti iṣelọpọ nipa lilo data ti a fi n ṣalaye.
Orisun data | Ipele ti o tumọ si | Awọn itọkasi |
---|---|---|
Awọn i-meeli Imeeli lati ile-iwe giga (awọn orisun meta-nikan) | Awọn ajọṣepọ | Kossinets and Watts (2006) , Kossinets and Watts (2009) , De Choudhury et al. (2010) |
Awọn iroyin media lori Weibo | Ọdun aladani | Zhang (2016) |
Awọn iforukọsilẹ Imeeli lati ile-iṣẹ kan (awọn alaye-meta ati ipari ọrọ) | Aṣa dara ni agbari | Srivastava et al. (2017) |
Biotilejepe iṣoro ti data ailopin fun ṣiṣe awọn itumọ ti koṣemọ jẹ gidigidi ṣòro lati yanju, awọn solusan ti o wọpọ ni awọn aṣiṣe miiran ti ko ni kikun: alaye ti ara ẹni ati alaye ti ko pari lori ihuwasi lori awọn iru ẹrọ miiran. Ni ojutu akọkọ ni lati gba awọn data ti o nilo; Mo sọ fun ọ nipa eyi ni ori 3 nigbati mo sọ fun ọ nipa awọn iwadi. Ifilelẹ pataki keji ni lati ṣe iru awọn onimọ-ijinlẹ data ti a npe ni aṣiṣe-olumulo ati awọn onimo ijinlẹ awujọ ti n pe idibajẹ . Ni ọna yii, awọn oluwadi lo alaye ti wọn ni lori diẹ ninu awọn eniyan lati awọn ẹda ti awọn eniyan miiran. Igbese kẹta ti o ṣeeṣe ni lati ṣepọ awọn orisun data data pupọ. Ilana yii ni a n pe ni ajọṣepọ . Afafẹfẹ ayanfẹ mi fun ilana yii ni Dunn (1946) ninu paragika akọkọ ti akọkọ iwe akọkọ ti a kọ si akọsilẹ:
"Olukuluku eniyan ni agbaye n ṣẹda Iwe ti iye. Iwe yii bẹrẹ pẹlu ibimọ ati pari pẹlu iku. Awọn oju-ewe rẹ jẹ akosile ti awọn iṣẹlẹ pataki ni aye. Gbigba gbigbasilẹ jẹ orukọ ti a fun si ilana ti n ṣajọ awọn iwe ti iwe yii sinu iwọn didun. "
Nigba ti Dunn kọ iwe yii o ni ero pe Iwe ti iye le ni awọn iṣẹlẹ igbesi aye pataki bi ibimọ, igbeyawo, ikọsilẹ, ati iku. Sibẹsibẹ, nisisiyi pe alaye pupọ nipa awọn eniyan ti wa ni igbasilẹ, Iwe ti iye le jẹ aworan alaye ti iyalẹnu, ti o ba jẹ pe awọn ojuṣiriṣi awọn oju ewe (ie, awọn onibara wa) le di alamọ pọ. Iwe Iwe-aye yii le jẹ ohun-elo nla fun awọn oluwadi. Ṣugbọn, a tun le pe ni ibi ipamọ ti iparun (Ohm 2010) , eyi ti o le ṣee lo fun gbogbo awọn idi ti kii ṣe alaye, bi emi yoo ṣe apejuwe ninu ori 6 (Ethics).