Сіздің үлкен деректеріңіз қаншалықты үлкен болса да, сізде қажетті ақпарат жоқ.
Көптеген үлкен деректер көздері толық емес , яғни сіздің зерттеулеріңіз үшін қажетті ақпарат жоқ екенін білдіреді. Бұл зерттеулерден басқа мақсаттар үшін жасалған деректердің ортақ ерекшелігі. Көптеген әлеуметтанушылар қазірдің өзінде аяқталмаған мәселемен айналысу тәжірибесімен айналысты, мысалы, қажет болған сұрақты қоймаған бұрыннан бар сауалнама. Өкінішке орай, аяқталмаған проблемалар үлкен деректерде аса шеткі болып келеді. Менің тәжірибемдегі үлкен деректер әлеуметтік зерттеулер үшін пайдалы ақпараттың үш түрін: қатысушылар туралы демографиялық мәліметтерді, басқа платформалардағы мінез-құлықты және теориялық конструкцияларды пайдалану үшін деректерді жоғалтуға бейім.
Толықсыздықтың үш түрінің ішінен теориялық конструкцияларды іске асыру үшін толық емес деректерді шешу қиын мәселе болып табылады. Менің тәжірибемде бұл кездейсоқ байқалады. Теориялық конструкциялар - бұл теориялық конструкцияны зерттейтін және іске асыратын әлеуметтік ғалымдардың дереккөз идеялары. Өкінішке орай, бұл қарапайым дыбыстық процесс өте жиі қиын. Мысалға, ақылға қонымды адамдар көбірек ақша табатыны туралы қарапайым талапты эмпирикалық түрде сынап көрейік. Бұл талапты тексеру үшін сіз «ақылдылықты» өлшеуіңіз керек. Бірақ ақыл дегеніміз не? Gardner (2011) сегіз түрлі ақыл-кеңестердің бар екендігін айтады. Және барлаудың бұл нысандарының кез-келгенін дәл өлшеуге болатын рәсімдер бар ма? Көптеген психологтардың жұмысына қарамастан, бұл сұрақтар әлі де айқын жауап бермейді.
Осылайша, қарапайым қарапайым талап - тіпті ақылды адамдар көп ақша табады - эмпирикалық бағалауға қиын, өйткені деректердегі теориялық конструкцияларды іске асыру қиын болуы мүмкін. Теориялық конструкциялардың басқа да мысалдары маңызды, бірақ оларды іске асыру қиын: «нормалар», «әлеуметтік капитал» және «демократия». Социалистік ғалымдар теориялық конструкциялар мен (Cronbach and Meehl 1955) деректердің құрылысы арасындағы матчты (Cronbach and Meehl 1955) деп атайды. Өйткені, конструкциялардың осы қысқа тізімі, шындықты жасау әлеуметтік ғалымдар өте ұзақ уақыт бойы күрескен мәселе болып табылады. Бірақ менің тәжірибемде зерттеулердің мақсаттары үшін жасалмаған мәліметтермен жұмыс істеу кезінде (Lazer 2015) шындықты құру проблемалары одан да көп.
Зерттеу нәтижесін бағалаған кезде, құрылыстың жарамдылығын бағалаудың тез және пайдалы тәсілі әдетте конструкциялардың тұрғысынан көрінетін нәтижені қабылдау болып табылады және оны пайдаланылған деректер бойынша қайта айқындау болып табылады. Мысалы, ақылға қонымды адамдар көп ақша табатындығын дәлелдейтін екі гипотетикалық зерттеулерді қарастырыңыз. Алғашқы зерттеуде зерттеуші Raven Progressive Matrices Test-ға жақсы баға берген адамдар - аналитикалық интеллекттің (Carpenter, Just, and Shell 1990) жақсы зерттелген сынағы - олардың салық декларациялары бойынша жоғары кірістер алғанын анықтады. Зерттеуші екінші зерттеуде ұзын сөздерді пайдаланған Твиттерде адамдардың сәнді брендтер туралы айтуы ықтимал. Екі жағдайда да, бұл зерттеушілер олар ақылға қонымды адамдар көп ақша табатындығын көрсетті. Алайда, бірінші зерттеуде теориялық конструкциялар деректермен жақсы жұмыс істейді, ал екіншісінде олар жоқ. Бұдан басқа, бұл мысалда көрсетілгендей, деректердің көпшілігі автоматты түрде құрылғының жарамдылығымен проблемаларды шешпейді. Сіз екінші зерттеудің нәтижелеріне күмәндансаңыз, ол миллиондаған tweets, миллиард Tweets немесе триллионнан астам tweets. Жарамдылығын құру туралы идеяны білмейтін зерттеушілер үшін 2.2 кесте цифрлы бақылау деректері арқылы теориялық конструкцияларды іске асырған зерттеулердің кейбір мысалдарын береді.
Деректер көзі | Теориялық құрылыс | Әдебиеттер |
---|---|---|
ЖОО-дан электрондық пошта журналдары (тек мета-деректер) | Әлеуметтік қатынастар | Kossinets and Watts (2006) , Kossinets and Watts (2009) , De Choudhury et al. (2010) |
Weibo әлеуметтік медиа-посттары | Азаматтық белсенділік | Zhang (2016) |
Фирмадағы электрондық пошта журналдары (мета-деректер және толық мәтін) | Ұйымда мәдени құндылық | Srivastava et al. (2017) |
Теориялық конструкцияларды басып шығару үшін толық емес деректерді шешу өте қиын болса да, басқа толық емес аяқталудың ортақ түрлеріне ортақ шешім бар: толық емес демографиялық ақпарат және басқа платформалардағы мінез-құлық туралы толық емес ақпарат. Алғашқы шешім - сізге қажетті деректерді жинау; Бұл туралы сізге 3-тарауда сауалнама туралы айтқан кезде айтып беремін. Екінші негізгі шешім - ғалымдардың қолданушы атрибуты деп аталатын деректерді жасау және әлеуметтік ғалымдардың пікірін білдіру . Бұл көзқараста зерттеушілер кейбір адамдарда басқа адамдарға арналған атрибуттар жасайтын ақпаратты пайдаланады. Үшінші ықтимал шешім - көптеген деректер көздерін біріктіру. Бұл процесс кейде жазба байланысы деп аталады. Осы процестің сүйікті метафорасын Dunn (1946) жазды Dunn (1946) жазба сілтемесінде жазылған ең алғашқы құжаттың бірінші абзацында:
«Әлемдегі әр адам өмір кітапын жасайды. Бұл кітап туғаннан басталады және өліммен аяқталады. Оның беті өмірдегі басты оқиғалардың жазбаларынан тұрады. Жазба байланысы - осы кітаптың беттерін томға жинау процесіне берілген атау. «
Данн осы үзіндіді жазған кезде, өмір кітабында туылу, неке, ажырасу және өлім сияқты маңызды оқиғаларды қамтуы мүмкін деп ойлаған. Дегенмен, енді адамдар туралы көп ақпарат жазылғанын, өмір кітабы керемет егжей-тегжейлі портрет болуы мүмкін, егер бұл әртүрлі беттер (яғни біздің цифрлық іздеріміз) біріктірілсе. Бұл өмір кітабы зерттеушілер үшін керемет ресурс болуы мүмкін. Бірақ, ол сондай-ақ бұзылудың дерекқоры (Ohm 2010) деп аталуы мүмкін, ол 6-тарауда (Этика) сипатталғандай, этикалық емес мақсаттардың барлық түрлерінде қолданылуы мүмкін.