Bisan unsa "dakong" ang imong "dagko nga impormasyon" kini tingali dili sa impormasyon nga imong gusto.
Labing dako nga tinubdan sa data mga dili kompleto, sa diwa nga sila dili makabaton sa impormasyon nga imong gusto alang sa imong research. Kini mao ang usa ka komon nga bahin sa mga data nga gibuhat alang sa mga katuyoan sa uban nga kay sa research. Daghang mga sosyal nga siyentipiko na sa kasinatian sa pagpakig-angot sa sa kakulang, sama sa usa ka kasamtangan nga survey nga wala mangutana sa pangutana nga gusto kaninyo. Ikasubo, ang mga problema sa kakulang tambong nga mahimong mas grabeng sa daku nga impormasyon. Sa akong kasinatian, dako nga data mga kahilig nga missing sa tulo ka mga matang sa impormasyon nga mapuslanon alang sa mga social research: demographics, kinaiya sa uban nga mga platform, ug data sa operationalize theoretical mga tagik.
Ang tanan nga tulo ka mga sa niini nga mga matang sa kakulang sa mga gihulagway sa usa ka pagtuon sa Gueorgi Kossinets ug Duncan Watts (2006) bahin sa ebolusyon sa mga social network sa usa ka unibersidad. Kossinets ug Watts nagsugod uban sa mga logs email gikan sa unibersidad, nga may tukmang impormasyon bahin sa nga nagpadala email kang kinsa sa unsa nga panahon (ang mga tigdukiduki wala access sa mga sulod sa mga email). Kini nga mga email sa mga rekord sa tingog sama sa usa ka talagsaon nga panid, apan, mao ang-bisan pa sa ilang gidak-on ug granularity-fundamentally dili kompleto sila. Kay sa panig-ingnan, sa email logs wala maglakip sa mga datos mahitungod sa demographic nga mga kinaiya sa mga estudyante, sama sa gender ug edad. Dugang pa, sa email logs wala maglakip sa impormasyon mahitungod sa komunikasyon pinaagi sa uban nga mga media, sama sa mga tawag sa telepono, text mensahe, o nawong-sa-nawong sa panag-istoryahanay. Sa katapusan, ang email logs dili direktang maglakip sa impormasyon mahitungod sa mga relasyon, ang theoretical mga tagik sa daghang kasamtangan teoriya. Sa ulahi diha sa kapitulo, sa diha nga ako makig-istorya mahitungod pamaagi sa research, inyong makita kon sa unsang paagi Kossinets ug Watts masulbad kini nga mga problema.
Sa tulo ka mga matang sa kakulang, ang problema sa dili kompleto nga data alang sa pagpalihok theoretical mga tagik mao ang pinakalisud sa pagsulbad sa, ug sa akong kasinatian, kini sa kasagaran aksidenteng mataligam sa datos sa mga siyentipiko. Sa mapintas gayud, theoretical mga tagik mga abstract nga mga ideya nga sosyal nga mga siyentipiko sa pagtuon, apan, Subo, kini nga mga mga tagik dili kanunay unambiguously gihubit ug gisukod. Kay sa panig-ingnan, ang ni handurawa naningkamot sa kasinatianong pagsulay sa dayag yano nga pag-angkon nga ang mga tawo nga labaw pa nga maalamon-angkon sa dugang nga salapi. Aron sa pagsulay niini nga pag-angkon nga kamo kinahanglan nga pagsukod "nga salabutan." Apan, unsa ang ang salabutan? Pananglitan, Gardner (2011) nangatarongan nga sa pagkatinuod adunay walo ka lain-laing mga matang sa salabutan. Ug, may mga pamaagi nga tukma nga pagsukod sa bisan unsa niini nga mga matang sa salabutan? Bisan pa sa dakong kantidad sa buhat pinaagi sa sikologo, kini nga mga pangutana sa gihapon dili tin-awng mga tubag. Busa, bisan ang usa ka medyo yano nga pag-angkon-mga tawo nga labaw pa nga maalamon og dugang nga salapi-mahimong lisud nga sa pagtimbang-timbang kasinatianong tungod kay kini mahimong lisud nga alang sa pagpalihok theoretical mga tagik sa mga data. Ang ubang mga panig-ingnan sa theoretical mga tagik nga importante apan lisud nga sa operationalize maglakip sa "mga lagda," "sa social kaulohan," ug "demokrasya." Social siyentipiko sa pagtawag sa mga duwa tali sa theoretical mga tagik ug data maghimo og balido (Cronbach and Meehl 1955) . Ug, ingon sa listahan sa mga mga tagik nagsugyot, magtukod kabalido mao ang usa ka problema nga sosyal nga mga siyentipiko nakigbisog uban sa sa usa ka hataas nga panahon, bisan pa sa diha nga sila nagtrabaho uban sa mga datos nga nakolekta alang sa katuyoan sa pagsiksik. Sa diha nga nagtrabaho uban sa mga datos nga nakolekta alang sa mga katuyoan sa uban nga kay sa research, ang mga problema sa kabalido maghimo og mas mahagiton (Lazer 2015) .
Kon kamo sa pagbasa sa usa ka research nga papel, usa ka dali ug mapuslanon nga paagi sa pagtimbang-timbang sa mga kabalaka mahitungod kabalido maghimo og mao ang pagkuha sa mga nag-unang pag-angkon sa papel, nga kasagaran gipahayag sa mga termino sa mga mga tagik, ug pag-pagpahayag niini sa mga termino sa mga data nga gigamit. Pananglitan, tagda ang duha ka hypothetical mga pagtuon nga nag-angkon sa pagpakita nga labaw pa nga maalamon nga mga tawo-angkon sa dugang nga salapi:
Sa duha ka mga kaso, ang mga tigdukiduki nga ihingusog nga sila gipakita nga labaw pa nga maalamon nga mga tawo maka kwarta. Apan, diha sa unang pagtuon sa theoretical mga tagik sa mga maayo ang pagpadagan sa mga data, ug sa ikaduha nga sila dili. Dugang pa, ingon nga panig-ingnan niini nga naghulagway, mas data dili awtomatikong pagsulbad sa mga problema uban sa kalig-maghimo og. Ikaw kinahanglan nga magduha-duha sa mga resulta sa Pagtuon 2 kon kini nalambigit sa usa ka milyon nga tweets, usa ka bilyon tweets, o sa usa ka trilyon nga tweets. Kay ang mga tigdukiduki dili pamilyar sa ideya sa kabalido maghimo og, Table 2.2 naghatag og pipila ka mga panig-ingnan sa mga pagtuon nga pagpadagan theoretical mga tagik sa paggamit sa digital data sa pagsubay.
digital pagsubay | theoretical maghimo og | citation |
---|---|---|
email logs gikan sa usa ka unibersidad (meta-data sa lamang) | Social mga relasyon | Kossinets and Watts (2006) , Kossinets and Watts (2009) , De Choudhury et al. (2010) |
sa social haligi sa media sa Weibo | civic engagement | Zhang (2016) |
logs email gikan sa usa ka lig-on (meta-data ug bug-os nga nga teksto) | Cultural angay sa usa ka organisasyon | Goldberg et al. (2015) |
Bisan tuod nga ang problema sa dili kompleto nga data alang sa pagpatuman theoretical mga tagik mao ang pretty malisud sa pagsulbad sa, adunay tulo ka mga komon nga mga solusyon sa mga problema sa dili kompleto nga impormasyon demographic ug dili kompleto nga impormasyon sa kinaiya sa uban nga mga platform. Ang una mao ang tinuoray nga pagkolekta sa mga datos nga imong gikinahanglan; Sultihan ko kamo mahitungod sa usa ka panig-ingnan sa nga sa Kapitulo 3 sa diha nga ako magasaysay kaninyo mahitungod survey. Ikasubo, kini nga matang sa koleksyon datus dili kanunay nga posible. Ang ikaduha nga nag-unang solusyon mao ang pagbuhat unsa nga data mga siyentipiko sa pagtawag sa user-kinaiya pangagpas ug unsa sosyal nga gitawag sa mga siyentipiko ngari kanato. Sa niini nga paagi, ang mga tigdukiduki sa paggamit sa impormasyon nga sila sa pipila ka mga tawo sa gihunahuna mga hiyas sa ubang mga tawo. Ang ikatulo nga posible nga solusyon-ang usa nga gigamit sa Kossinets ug Watts-mao sa combine sa daghang mga tinubdan sa data. Kini nga proseso usahay gitawag paghiusa o nga rekord kalambigitan. Ang akong paborito nga pasumbingay alang sa niini nga proseso mao ang gisugyot sa unang parapo sa unang papel sa walay katapusan nga gisulat sa rekord sa kalambigitan (Dunn 1946) :
"Ang matag tawo sa kalibutan nagmugna sa usa ka Basahon sa Kinabuhi. Kini nga Basahon magsugod uban sa pagkatawo ug natapos uban sa kamatayon. mga pahina niini gihimo sa mga kaagi sa mga baruganan nga mga panghitabo sa kinabuhi. Record kalambigitan mao ang ngalan nga gihatag ngadto sa proseso sa pagtigom sa mga pahina niini nga basahon ngadto sa usa ka volume. "
Kini nga yugto nga nahisulat sa 1946, ug niadtong panahona, ang mga tawo naghunahuna nga ang Basahon sa Kinabuhi mahimong maglakip sa mga mayor nga mga hitabo sa kinabuhi sama sa pagkatawo, kaminyoon, diborsiyo, ug kamatayon. Apan, karon nga daghan kaayo nga impormasyon mahitungod sa mga tawo nga natala, ang Basahon sa Kinabuhi mahimong usa ka hilabihan detalyado nga hulagway, kon ang mga lain-laing mga pahina (ie, ang atong digital timailhan), mahimong gigapos sa tingub. Kini nga Basahon sa Kinabuhi mahimong usa ka dako nga kapanguhaan alang sa mga tigdukiduki. Apan, ang Basahon sa Kinabuhi usab nga gitawag nga usa ka database sa kalaglagan (Ohm 2010) , nga mahimong gamiton alang sa tanan nga matang sa dili maayo nga mga katuyoan, sama sa gihulagway nga mas ubos sa diha nga ako makig-istorya mahitungod sa sensitibo nga kinaiya sa impormasyon nga nakolekta sa dagkong tinubdan sa data sa ubos ug sa Kapitulo 6 (Ethics).