పెద్ద డేటా వనరులు అన్నిచోట్లా ఉన్నాయి, కానీ సామాజిక పరిశోధన కోసం వాటిని ఉపయోగించడం గమ్మత్తైనది. నా అనుభవం లో, డేటా కోసం ఒక "ఉచిత భోజనం" పాలన వంటిది ఏదో ఉంది: ఇది మీరు సేకరించిన పనిలో చాలా చాలు లేకపోతే, మీరు బహుశా దాని గురించి చాలా ఆలోచించిన దాని గురించి ఆలోచిస్తారు మరియు విశ్లేషించడం.
నేటి పెద్ద డేటా మూలాలు-మరియు బహుశా రేపు-ఉంటాయి 10 లక్షణాలు కలిగి ఉంటాయి. వీటిలో మూడు సాధారణంగా ఉంటాయి (కానీ ఎల్లప్పుడూ కాదు) పరిశోధనకు ఉపయోగపడతాయి: పెద్దవి, ఎల్లప్పుడు మరియు నరహితమైనవి. ఏడు సాధారణంగా పరిశోధన కోసం సమస్యాత్మకమైనది (కానీ కాదు): అసంపూర్తిగా, అసాధ్యమైనవి, నిరాకరించలేనివి, డ్రిఫ్టింగ్, అల్గారిథమిక్ గందరగోళం, మురికి మరియు సున్నితమైనవి. సాంఘిక పరిశోధన యొక్క ప్రయోజనం కోసం పెద్ద సమాచార వనరులు సృష్టించబడటం లేనందున ఈ లక్షణాలు చాలావరకూ ఉత్పన్నమవుతాయి.
ఈ అధ్యాయంలోని ఆలోచనల ఆధారంగా, సామాజిక పరిశోధన కోసం పెద్ద డేటా మూలాల విలువైనదిగా మూడు ప్రధాన మార్గాలు ఉన్నాయి అని నేను భావిస్తున్నాను. మొదట, వారు పోటీ సిద్ధాంతపు అంచనాలకు మధ్య పరిశోధకులను నిర్ణయిస్తారు. ఈ రకమైన పని యొక్క ఉదాహరణలు Farber (2015) (న్యూయార్క్ టాక్సీ డ్రైవర్లు) మరియు King, Pan, and Roberts (2013) (చైనాలో సెన్సార్షిప్) ఉన్నాయి. రెండవది, ఇప్పుడు పెద్ద సమాచార వనరులు విధానం కోసం మెరుగైన కొలతను ఇప్పుడుకాస్ట్ ద్వారా చేయగలవు. ఈ రకమైన పనికి ఉదాహరణ Ginsberg et al. (2009) (గూగుల్ ఫ్లూ ట్రెండ్స్). చివరగా, పెద్ద సమాచార వనరులు పరిశోధకులు ప్రయోగాలను అమలు చేయకుండా కారకమైన అంచనాలను తయారు చేయటానికి సహాయపడుతుంది. ఈ రకమైన పనిని ఉదాహరణలు Mas and Moretti (2009) (ఉత్పాదకతపై పీర్ ఎఫెక్ట్స్) మరియు Einav et al. (2015) (eBay వద్ద వేలం ప్రారంభ ధర ప్రభావం). అయితే ఈ విధానాల్లో ప్రతి ఒక్కదానిని పరిశోధకులకు డేటాను చాలా వరకు తీసుకురావడానికి అవసరమవుతుంది, అంచనా వేయడానికి ముఖ్యమైనది లేదా పోటీ అంచనాలను తయారు చేసే రెండు సిద్ధాంతాల నిర్వచనం వంటివి. కాబట్టి, పెద్ద డేటా మూలాల ఏమి చేయాలనే దాని గురించి ఆలోచించడానికి ఉత్తమమైన మార్గం ఏమిటంటే ఆసక్తికరమైన మరియు ముఖ్యమైన ప్రశ్నలను అడగగలిగే పరిశోధకులకు సహాయపడుతుంది.
ముగింపుకు ముందు, డేటా మరియు సిద్ధాంతం మధ్య సంబంధంపై పెద్ద డేటా మూలాలపై ఒక ముఖ్యమైన ప్రభావాన్ని కలిగి ఉండవచ్చనే విషయాన్ని నేను భావిస్తున్నాను. ఇప్పటివరకు, ఈ అధ్యాయం సిద్ధాంతం-నడిచే అనుభావిక పరిశోధన యొక్క విధానం తీసుకుంది. కానీ పెద్ద సమాచార వనరులు కూడా పరిశోధకులను ఆమోదయోగ్యంగా సిద్ధాంతీకరించే సిద్ధాంతీకరణను చేస్తాయి . అంటే, అనుభావిక వాస్తవాలు, నమూనాలు మరియు పజిల్స్ యొక్క జాగ్రత్తగా చేరడం ద్వారా, పరిశోధకులు నూతన సిద్ధాంతాలను నిర్మించగలరు. సిద్ధాంతం అంటే ప్రత్యామ్నాయ, డేటా మొదటి పద్ధతి కొత్త కాదు, మరియు అది చాలా బలవంతంగా బార్నే గ్లేసెర్ మరియు యాన్సేల్మ్ స్ట్రాస్ వ్యక్తీకరించిన జరిగినది (1967) గ్రౌన్దేడ్ థియరీ కోసం వారి కాల్ తో. అయితే, డిజిటల్ డేటా (Anderson 2008) లో పరిశోధనకు సంబంధించిన కొన్ని జర్నలిజంలో పేర్కొన్నట్లు ఈ డేటా-మొదటి పద్ధతి, "సిద్ధాంతం యొక్క ముగింపు" కాదు. బదులుగా, డేటా పర్యావరణం మారినప్పుడు, మనము డేటా మరియు సిద్ధాంతం మధ్య సంబంధంలో పునర్సందర్శన చేయాలని ఆశించాలి. సమాచార సేకరణ ఖరీదైన ప్రపంచంలో, సిద్దాంతాలు అత్యంత ఉపయోగకరంగా ఉంటుందని సూచించే డేటాను మాత్రమే సేకరించేందుకు ఇది అర్ధమే. కానీ, ప్రపంచంలోని ఎన్నో రకాల డేటా ఇప్పటికే ఉచితంగా అందుబాటులో ఉన్న ప్రపంచంలో, అది ఒక డేటా-తొలి విధానం (Goldberg 2015) ను కూడా ప్రయత్నించండి.
నేను ఈ అధ్యాయంలో చూపించినట్లు, పరిశోధకులు ప్రజలను చూడటం ద్వారా చాలా నేర్చుకోవచ్చు. తర్వాతి మూడు అధ్యాయాల్లో, మేము మా డేటా సేకరణను సమీకరించి, వ్యక్తులతో నేరుగా ప్రశ్నలతో (అధ్యాయం 3), ప్రయోగాలు (అధ్యాయం 4), మరియు వాటిని పరిశోధన ప్రక్రియలో నేరుగా (అధ్యాయం 5).