Ora ketompo carane gedhe data gedhe, mbok menawa ora duwe informasi sing dikarepake.
Sumber data sing paling gedhe ora lengkap , amarga ora ana informasi sing bakal dikarepake kanggo riset sampeyan. Iki minangka fitur umum saka data sing digawe kanggo tujuan liyane saka riset. Akeh ilmuwan sosial wis ngalami pengalaman ngatasi ora lengkap, kayata survey sing durung ditemtokake sing mbutuhake pitakonan. Sayange, masalah incompleteness cenderung dadi luwih gedhe ing data amba. Ing pengalaman saya, data amba cenderung ilang telung jinis informasi sing migunani kanggo riset sosial: informasi demografi babagan peserta, prilaku ing platform liyane, lan data kanggo operasionalake konstruksi téoretis.
Saka telung jinis incompleteness, masalah data ora lengkap kanggo operasionalake teori pesawat punika paling angel kanggo ngatasi. Lan pengalaman saya, sengaja ditindakake. Kira-kira, konstruktor teoretis minangka gagasan-gagasan abstrak sing ilmuwan sosial sinau lan operationalising a constructional teoritis tegese ngusulake sawetara cara kanggo njupuk sing mbangun karo data sing bisa diamati. Sayange, proses prasaja iki kerep dadi angel banget. Contone, ayo bayang nyoba kanthi empiris nyoba pratelan sing prasaja yen wong sing luwih pinter entuk dhuwit luwih akeh. Kanggo nguji pratelan iki, sampeyan kudu ngukur "Intelligence." Nanging apa iku Intelligence? Gardner (2011) nyatakake yen ana wolung wangun intelijen sing beda. Lan ana tata cara sing bisa kanthi bener ngukur samubarang wujud intelijen iki? Senadyan akeh karya psikolog sing akeh, pitakonan kasebut isih ora duwe jawaban sing ora jelas.
Mangkono, sanajan pratelan sing relatif prasaja-wong sing luwih cerdas entuk dhuwit luwih akeh-bisa dadi angel kanggo netepke empiris amarga bisa dadi angel kanggo ngoperasikake data-data téoretis ing data. Conto liyane teori konstruksi sing penting nanging hard kanggo operasional kalebu "norma," "ibukutha sosial," lan "demokrasi." Ilmuwan sosial disebut match antarane konstruktor teori lan data nggawe sah (Cronbach and Meehl 1955) . Minangka daftar cendhak kasebut, nerangake validitas minangka masalah sing wis ditindakake para ilmuwan sosial kanggo wektu sing suwe banget. Nanging ing pengalaman aku, masalah-masalah kanggo nggawe validitas luwih gedhe nalika nggarap data sing ora digawe kanggo tujuan riset (Lazer 2015) .
Nalika sampeyan nganilai asil riset, salah sawijining cara sing cepet lan migunani kanggo netepake validitas konstruktif yaiku njupuk asil, sing biasane ditulis ing istilah-istilah konstruksi, lan nyatake maneh ing istilah data sing digunakake. Contone, nimbang rong studi hipotetis sing ngakoni yen wong sing luwih pinter entuk dhuwit luwih akeh. Ing panaliten pisanan, panaliti nemokake wong-wong sing nyorot kanthi apik ing Test Raven Progresif Matriks (Raven Progressive Matrices Test) - tes sing diteliti kanthi apik saka intelijen analitik (Carpenter, Just, and Shell 1990) -dadi luwih dilapurake pangentukan ing pengembalian pajak. Ing panalitene kaloro, panaliti nemokake yen wong Twitter sing nggunakake tembung maneh luwih cetha nyatakake merek mewah. Ing kasus kasebut, panliten iki bisa nyatakake yen dheweke wis nuduhake yen wong sing luwih cerdas entuk dhuwit luwih akeh. Nanging, ing wiwitan panaliten, konstruksi téoretis uga wis dilakoni kanthi data, dene ing urutan kapindho, ora. Salajengipun, minangka tuladha punika nggambaraken, langkung kathah data ingkang mboten saget mecahaken masalah kanthi mbangun validitas. Sampeyan kudu mangu-mangu kanthi asil sinau kapindho manawa ana sing melu tweets yuta, tweets milyar, utawa triliun tweets. Kanggo panaliti sing ora kenal karo gagasan mbangun validitas, tabel 2.2 nyedhiyakake sawetara conto studi sing wis ngoperasikake konstruksi téoretis kanthi nggunakake data jejak digital.
Sumber data | Konstruktor teoritis | Referensi |
---|---|---|
Email log saka universitas (meta-data mung) | Hubungan sosial | Kossinets and Watts (2006) , Kossinets and Watts (2009) , De Choudhury et al. (2010) |
Kiriman media sosial ing Weibo | Keterlibatan Sipil | Zhang (2016) |
Log email saka perusahaan (teks meta-data lan lengkap) | Pas kultural ing organisasi | Srivastava et al. (2017) |
Sanajan masalah data ora lengkap kanggo njupuk konstruktor teoretis cukup angel dipecah, ana solusi sing umum kanggo jinis non-lengkap: informasi demografi sing ora lengkap lan informasi sing ora lengkap babagan perilaku ing platform liyane. Solusi pertama yaiku kanggo ngempalaken data sing sampeyan butuhake; Aku bakal pitutur marang kowe bab sing ing bab 3 nalika aku pitutur marang kowe bab survey. Solusi utama kapindho yaiku kanggo nindakake apa data ilmuwan nyebut kesimpulan atribut pengguna lan ilmuwan sosial ngarani imputasi . Ing pendekatan iki, peneliti nggunakake informasi sing ana ing sawetara wong kanggo ngakibatake atribut saka wong liya. Solusi katelu bisa kanggo nggabungake pirang-pirang sumber data. Proses iki kadhangkala disebut hubungan rekaman . Ketaatan favorit saya kanggo proses iki ditulis dening Dunn (1946) ing paragraf pertama banget saka kertas pisanan pisanan sing ditulis ing link rekaman:
"Saben wong ing donya nggawe kitab urip. Buku iki diwiwiti karo lahir lan pungkasane mati. Kaca-kaca arupa rekaman acara utama ing urip. Rekrut rekaman minangka jeneng sing diwènèhaké marang proses pasinaon kaca-kaca ing buku iki dadi volume. "
Nalika Dunn nyerat ing wacana kasebut, dheweke ngira yen Book of Life bisa nyakup acara-acara utama kaya lair, nikah, cerai, lan pati. Nanging, saiki akeh informasi babagan wong sing dicathet, Kitab Kehidupan bisa dadi potret banget, yen kaca-kaca sing beda (umpamane, jejak digital kita) bisa digabungake. Book of Life iki bisa dadi sumber kanggo peneliti. Nanging, uga bisa diarani database rusak (Ohm 2010) , sing bisa digunakake kanggo kabeh tujuan sing ora etis, kaya ing bab 6 (Etika).