यो खण्ड एक कथा रूपमा पढ्नुपर्छ भन्दा, एउटा सन्दर्भ रूपमा प्रयोग गर्न डिजाइन गरिएको छ।
यो अध्यायको विषयवस्तुहरू धेरै पनि हाल राष्ट्रपति जस्तै, सार्वजनिक राय अनुसन्धान अमेरिकी संघ (AAPOR) मा ठेगाना मा झल्काए गरिएको छ Dillman (2002) , Newport (2011) , Santos (2014) , र Link (2015) ।
सर्वेक्षण अनुसन्धान को विकास बारेमा थप ऐतिहासिक पृष्ठभूमि को लागि, Smith (1976) र Converse (1987) । सर्वेक्षण अनुसन्धान तीन eras को विचार मा थप हेर्नुहोस् Groves (2011) र Dillman, Smyth, and Christian (2008) (माथि जो अलिकति फरक तीन eras खण्डन)।
दोस्रो युग पहिलो देखि सर्वेक्षण अनुसन्धान मा संक्रमण भित्र एक चोटी छ Groves and Kahn (1979) बीच विस्तृत टाउको-गर्न-टाउको तुलना गर्छ जो, एक आमने-अनुहार र टेलीफोन सर्वेक्षण। Brick and Tucker (2007) अनियमित अङ्क डायल नमूना विधिहरू को ऐतिहासिक विकास मा फिर्ता देखिन्छ।
थप सर्वेक्षण कसरी अनुसन्धान समाज परिवर्तनको प्रतिक्रिया विगतमा परिवर्तन भएको छ लागि, हेर्न Tourangeau (2004) , Mitofsky (1989) , र Couper (2011) ।
कहिलेकाहीं उत्तरदाताओं आफूलाई आन्तरिक अमेरिका सजग छैनन् किनभने प्रश्न आन्तरिक अमेरिका सिकेर समस्याग्रस्त हुन सक्छ। उदाहरणका लागि, Nisbett and Wilson (1977) लेखक निष्कर्षमा पुग्न कागज मा: "प्रजा कहिलेकाहीं को (क) अनजान हो:" मानसिक प्रक्रियाहरूको मौखिक प्रतिवेदन थप हामी थाहा भन्दा बताउँदा:। "को evocative शीर्षक एक अद्भुत कागज छ महत्वपूर्ण प्रतिक्रिया प्रभावित एक उत्तेजना को अस्तित्व, (ख) प्रतिक्रिया अस्तित्व, र (ग) उत्तेजना प्रतिक्रिया असर गरेको छ कि अनजान अनजान। "
अनुसन्धानकर्ताहरूले रिपोर्ट व्यवहार वा मनोवृत्ति गर्न अवलोकन व्यवहार रुचि गर्नुपर्छ भनेर तर्क को लागि, Baumeister, Vohs, and Funder (2007) (मनोविज्ञान) र Jerolmack and Khan (2014) र प्रतिक्रियाहरू (Maynard 2014; Cerulo 2014; Vaisey 2014; Jerolmack and Khan 2014) (समाजशास्त्र)। सोधेर पनि नियालेर बीच फरक अर्थशास्त्र, अनुसन्धानकर्ताहरूले यसो र प्रकट प्राथमिकताहरू कुरा कहाँ मा उत्पन्न हुन्छ। उदाहरणका लागि, एक शोधकर्ता तिनीहरूले आइसक्रिम (यसो प्राथमिकताहरू) खाने वा जिम जाँदै रुचि कि उत्तरदाताओं सोध्न सक्छ वा अनुसन्धान मान्छे आइसक्रिम खान कति पालन र जिम (प्रकट प्राथमिकताहरू) गर्न जान सक्छ। त्यहाँ अर्थशास्त्र मा भने प्राथमिकताहरू डाटा केहि प्रकारको को गहिरो शंका छ (Hausman 2012) ।
यी विवादहरु मुख्य विषय सूचित व्यवहार सधैं सही छ भनेर छ। तर, स्वचालित रूपमा रेकर्ड व्यवहार सही हुन सक्छ, चासो नमूनामा संकलित हुन सक्छ, र अनुसन्धानकर्ताहरूले गर्न पहुँच नहुन सक्छ। तसर्थ, केही परिस्थितिमा, म सूचित व्यवहार उपयोगी हुन सक्छ भन्ने सोच्छन्। यसबाहेक, यी विवादहरु देखि दोस्रो मुख्य विषय भावना, ज्ञान, आशा, र राय बारेमा रिपोर्ट सधैं सही हो भन्ने छ। तर, यदि यी आन्तरिक अमेरिका बारेमा जानकारी द्वारा आवश्यक अनुसन्धानकर्ताहरूले-या त केही व्यवहार बताउन मदत गर्न वा कुरा बताउनुभयो-त्यसपछि गर्न रूपमा सोधेर उचित हुन सक्छ।
कुल सर्वेक्षण त्रुटि मा पुस्तक लम्बाइ उपचार को लागि, Groves et al. (2009) वा Weisberg (2005) । कुल सर्वेक्षण त्रुटि को विकास को एक इतिहास को लागि, Groves and Lyberg (2010) ।
एक अनुसन्धान कार्यसूची प्रतिनिधित्व मामलामा, गैर-प्रतिक्रिया र गैर-प्रतिक्रिया पूर्वाग्रह को मुद्दाहरू ठूलो परिचय सामाजिक विज्ञान सर्वेक्षण Nonresponse मा राष्ट्रिय अनुसन्धान परिषद रिपोर्ट छ (2013) । अर्को उपयोगी सिंहावलोकन प्रदान गरिएको छ (Groves 2006) । साथै, सरकारी तथ्याङ्क को जर्नल, सार्वजनिक राय त्रैमासिक, र राजनीतिक र सामाजिक विज्ञान को अमेरिकन एकेडेमी को वर्णक्रम देखि लेखएको इतिहास को सम्पूर्ण विशेष मुद्दाहरू गैर-प्रतिक्रिया को विषय मा प्रकाशित गरिएको छ। अन्तमा, प्रतिक्रिया दर गणना को वास्तवमा विभिन्न तरिकामा छन्; यी दृष्टिकोण विस्तार सार्वजनिक राय अनुसन्धानकर्ताहरूले को अमेरिकी संघ (AAPOR) द्वारा एक रिपोर्ट मा वर्णन गरिएको छ (Public Opinion Researchers} 2015) ।
यो 1936 साहित्य डाइजेस्ट पोल विस्तार अध्ययन गरिएको छ (Bryson 1976; Squire 1988; Cahalan 1989; Lusinchi 2012) । यो पनि विरुद्ध haphazard डाटा संग्रह चेतावनी दिन एक दृष्टान्त रूपमा प्रयोग गरिएको छ (Gayo-Avello 2011) । 1936 मा जर्ज गालअप नमूना अझ परिष्कृत रूप प्रयोग र धेरै सानो नमूना संग सही अनुमान उत्पादन गर्न सक्षम थियो। साहित्यिक डाइजेस्ट भन्दा गालअप गरेको सफलता एउटा कोसेढुङ्गो सर्वेक्षण अनुसन्धान को विकास भएको थियो (Converse 1987, Ch 3; Ohmer 2006, Ch 4; Igo 2008, Ch 3) ।
मापन मामलामा, डिजाइन questionnaires लागि ठूलो पहिलो स्रोत छ Bradburn, Sudman, and Wansink (2004) । मनोवृत्ति प्रश्नहरू मा विशेष केन्द्रित एक बढी उन्नत उपचार को लागि, Schuman and Presser (1996) । पूर्व-परीक्षण प्रश्नहरू थप उपलब्ध छ Presser and Blair (1994) , Presser et al. (2004) , र को अध्याय 8 Groves et al. (2009) ।
सर्वेक्षण लागत र सर्वेक्षण त्रुटिहरू बीच व्यापार-बन्द को क्लासिक, पुस्तक-लम्बाइ उपचार छ Groves (2004) ।
मानक सम्भावना नमूना र अनुमान को क्लासिक पुस्तक-लम्बाइ उपचार हो Lohr (2009) (थप परिचयात्मक) र Särndal, Swensson, and Wretman (2003) (बढी उन्नत)। पोस्ट-स्तरीकरण र सम्बन्धित विधिहरू एक क्लासिक पुस्तक-लम्बाइ उपचार छ Särndal and Lundström (2005) । केही डिजिटल उमेर सेटिङमा, अनुसन्धानकर्ताहरूले विगतमा साँचो अक्सर छैन जो गैर-उत्तरदाताओं बारेमा एकदम बिट थाह छ। अनुसन्धानकर्ताहरूले गैर-उत्तरदाताओं बारे जानकारी छ जब गैर-प्रतिक्रिया समायोजन विभिन्न प्रकारका सम्भव छ (Kalton and Flores-Cervantes 2003; Smith 2011) ।
यो को Xbox अध्ययन Wang et al. (2015) भनी अनुसन्धानकर्ताहरू सेल अर्थ त्यहाँ, धेरै कक्षहरू धेरै छन् हुँदा पनि अनुमान गर्न अनुमति दिन्छ बहु प्रतिगमनमा र पोस्ट-स्तरीकरण भनिने प्रविधी (MrP, कहिलेकाहीं "मिस्टर पी" भनिन्छ) प्रयोग गर्दछ। यस प्रविधी बाट अनुमान गुणस्तर बारे केही बहस छ तापनि, यो अन्वेषण गर्न होनहार क्षेत्र जस्तै देखिन्छ। यो प्रविधी पहिलो प्रयोग थियो Park, Gelman, and Bafumi (2004) , र त्यहाँ पछि प्रयोग र बहस भएको छ (Gelman 2007; Lax and Phillips 2009; Pacheco 2011; Buttice and Highton 2013; Toshkov 2015) । व्यक्तिगत वजन र सेल आधारित वजन बीच को सम्बन्ध मा थप हेर्नुहोस् Gelman (2007) ।
भार वेब सर्वेक्षण गर्न अन्य तरीकाहरु को लागि, Schonlau et al. (2009) , Valliant and Dever (2011) , र Bethlehem (2010) ।
नमूना मिल्दो द्वारा प्रस्तावित थियो Rivers (2007) । Bethlehem (2015) नमूना मिल्दो को प्रदर्शन वास्तवमा अन्य नमूना दृष्टिकोण (जस्तै, stratified नमूना) र अन्य समायोजन दृष्टिकोण (जस्तै, पोस्ट-स्तरीकरण) समान हुनेछ भन्ने तर्क छ। अनलाइन प्यानल मा थप हेर्नुहोस् Callegaro et al. (2014) ।
कहिलेकाहीं अनुसन्धानकर्ताहरूले सम्भावना नमूनाहरू र गैर-सम्भावना नमूनाहरू समान गुणस्तर को अनुमान उपज भनेर पाएका छन् (Ansolabehere and Schaffner 2014) , तर अन्य तुलना गरेका छन् गैर-सम्भावना नमूनाहरू बुरा के भनेर (Malhotra and Krosnick 2007; Yeager et al. 2011) । यी मतभेद लागि एक सम्भव कारण गैर-सम्भावना नमूनाहरू समय सुधार गरेको छ। गैर-सम्भावना नमूना विधिहरू बढि निराशावादी दृष्टिकोण लागि गैर-सम्भावना नमूना मा AAPOR टास्क फोर्स हेर्न (Baker et al. 2013) , र म पनि सारांश रिपोर्ट निम्नानुसार कि टिप्पणी पढेर सुझाव दिन्छौं।
गैर-सम्भावना नमूनाहरू मा पूर्वाग्रह कम गर्न भार को प्रभाव मा एक मेटा-विश्लेषण लागि, तालिका 2.4 हेर्न Tourangeau, Conrad, and Couper (2013) जो निष्कर्षमा पुग्न गर्न "समायोजन उपयोगी तर fallible सुधारहरू हुन थाल्छ लेखक जान्छ। । । "
Conrad and Schober (2008) एक सम्पादन मात्रा भविष्य को सर्वेक्षण साक्षात्कार Envisioning शीर्षक प्रदान गर्दछ, र यो यस खण्डको विषयवस्तुहरू धेरै ठेगाना। Couper (2011) समान विषयवस्तुहरू सम्बोधन र Schober et al. (2015) डाटा संग्रह विधिहरू नयाँ सेटिङ अनुकूल छन् कि उच्च गुणवत्ता डाटा परिणाम हुन सक्छ कसरी राम्रो उदाहरण प्रदान गर्दछ।
सामाजिक विज्ञान सर्वेक्षणको लागि फेसबुक अनुप्रयोगहरू प्रयोग अर्को चाखलाग्दो उदाहरणका लागि, Bail (2015) ।
सर्वेक्षण सहभागीहरू लागि रमाइलो र मूल्यवान अनुभव बनाउन थप सल्लाह लागि, Tailored डिजाइन विधि मा काम हेर्न (Dillman, Smyth, and Christian 2014) ।
Stone et al. (2007) , पर्यावरण क्षणिक मूल्यांकन र सम्बन्धित विधिहरू एक पुस्तक लम्बाइ उपचार प्रदान गर्दछ।
Judson (2007) को रूपमा सर्वेक्षण र प्रशासनिक डाटा संयोजन प्रक्रिया वर्णन "जानकारी एकीकरण," यो दृष्टिकोण केही लाभ छलफल र केही उदाहरणहरू प्रदान गर्दछ।
भनी अनुसन्धानकर्ताहरू डिजिटल निशान र प्रशासनिक डाटा प्रयोग गर्न सक्नुहुन्छ अर्को तरिका विशिष्ट विशेषताहरु संग मान्छे को लागि एक नमूना फ्रेम छ। तर, यी रेकर्ड एक नमूना फ्रेम प्रयोग गर्न पनि गोपनीयता सम्बन्धित प्रश्नहरू सिर्जना गर्न सक्नुहुन्छ पहुँच (Beskow, Sandler, and Weinberger 2006) ।
परिलक्षित सोधेर सन्दर्भमा यो दृष्टिकोण रूपमा म यो वर्णन कति देखि देखिन सक्छ छैन रूपमा नयाँ छ। यो दृष्टिकोण तथ्याङ्क-मोडेल आधारित पोस्ट-स्तरीकरण मा तीन ठूलो क्षेत्रमा गहिरो कनेक्शन छ (Little 1993) , imputation (Rubin 2004) , र साना क्षेत्र अनुमान (Rao and Molina 2015) । यो पनि चिकित्सा अनुसन्धान मा अन्यसरोगेट चर को प्रयोग गर्न सम्बन्धित छ (Pepe 1992) ।
डिजिटल ट्रेस डेटा पहुँच सन्दर्भमा नैतिक मुद्दाहरू साथै, परिलक्षित सोधेर पनि मान्छे एक सर्वेक्षणमा प्रकट गर्न छनौट गर्न सक्छ संवेदनशील गुण infer गर्न प्रयोग गर्न सकिएन (Kosinski, Stillwell, and Graepel 2013) ।
मा लागत र समय अनुमान Blumenstock, Cadamuro, and On (2015) यस्तो सफा र कल डाटा प्रशोधन गर्न लागत रूपमा चर लागत-एक अतिरिक्त सर्वेक्षण-र निश्चित समावेश छैन लागत को लागत थप हेर्नुहोस्। सामान्य मा, परिलक्षित सोधेर शायद उच्च निश्चित लागत र डिजिटल प्रयोगहरू (अध्याय 4 हेर्नुहोस्) समान कम लागत चर हुनेछ। प्रयोग डाटा थप विवरण Blumenstock, Cadamuro, and On (2015) कागज मा हो Blumenstock and Eagle (2010) र Blumenstock and Eagle (2012) । धेरै imputuation देखि नजिकिंदै (Rubin 2004) परिलक्षित सोधेर देखि अनुमान मा अनिश्चितता कब्जा मदत गर्न सक्छ। अनुसन्धानकर्ताहरूले मात्र सोधेर समग्र गणना, भन्दा व्यक्तिगत स्तर गुण ख्याल परिलक्षित यसो भने, त्यसपछि मा नजिकिंदै King and Lu (2008) र Hopkins and King (2010) उपयोगी हुन सक्छ। मा मिसिन सिक्ने दृष्टिकोण बारे थप Blumenstock, Cadamuro, and On (2015) , हेर्न James et al. (2013) (थप परिचयात्मक) वा Hastie, Tibshirani, and Friedman (2009) (बढी उन्नत)। अर्को लोकप्रिय मेशिन शिक्षाका पाठयपुस्तक छ Murphy (2012) ।
सार्थक सोधेर सन्दर्भमा Ansolabehere र Hersh मा परिणाम (2012) दुई प्रमुख कदम मा कब्जा: 1) धेरै disparate डाटा स्रोतहरु सही मास्टर datafile उत्पादन गर्न सर्वेक्षण डाटा संयोजन गर्न र 2) Catalist को क्षमता लिङ्क गर्न Catalist को क्षमता यसको मास्टर datafile। तसर्थ, Ansolabehere र Hersh ध्यान यी कदम प्रत्येक जाँच गर्नुहोस्।
मास्टर datafile सिर्जना गर्न, Catalist जोडती र सहित विभिन्न स्रोतबाट जानकारी मेल खान्छ: प्रत्येक राज्य बाट धेरै मतदान रेकर्ड फोटो, ठेगाना रजस्ट्री को डाक राष्ट्रिय परिवर्तन डेटा, र डाटा अन्य नतोकिएको व्यावसायिक प्रदायकहरूबाट। यो सफाई र मर्ज सबै कसरी हुन्छ बारेमा gory विवरण यस पुस्तकको दायरा बाहिर छन्, तर यो प्रक्रिया, कुनै कुरा कसरी सावधान, मूल डाटा स्रोतहरु त्रुटिहरू प्रोपेगेट हुनेछ र त्रुटिहरू परिचय हुनेछ। Catalist यसको डाटा प्रोसेसिंग छलफल र यसको कच्चा डाटा केही प्रदान गर्न इच्छुक भए तापनि, यो अनुसन्धानकर्ताहरूले सम्पूर्ण Catalist डाटा पाइपलाइन समीक्षा गर्न को लागि बस असम्भव थियो। बरु, Catalist डाटा फाइल त्रुटि केही अज्ञात, र सायद unknowable, रकम थियो जहाँ अवस्थामा थिए शोधकर्ताओं। एक आलोचक, को CCES मा सर्वेक्षण प्रतिवेदन र Catalist मास्टर डाटा फाइल मा व्यवहार बीच ठूलो मतभेद मास्टर डाटा फाइल त्रुटिहरू कारण थिए अन्दाज लगाउनु सक्छ किनभने उत्तरदाताओं द्वारा misreporting द्वारा यो एउटा गम्भीर चासो छ।
Ansolabehere र Hersh डाटा गुणस्तर चासो सम्बोधन गर्न दुई फरक दृष्टिकोण लिए। पहिलो, Catalist मास्टर फाइल मा मतदान गर्न आत्म-रिपोर्ट मतदान तुलना गर्न साथै, अनुसन्धानकर्ताहरूले पनि तुलना आत्म-रिपोर्ट पार्टी, जाति, मतदाता दर्ता स्थिति (जस्तै, दर्ता वा दर्ता) र मतदान विधि (जस्तै, व्यक्ति मा, absentee मतपत्र, आदि) को Catalist डेटाबेस मा पाइने मान गर्न। यी चार डेमोग्राफिक चर लागि, शोधकर्ताओं Catalist मास्टर फाइल मतदान लागि भन्दा मा सर्वेक्षण प्रतिवेदन र डाटा बीच सम्झौताको धेरै उच्च स्तर फेला परेन। तसर्थ, Catalist मास्टर डाटा फाइल यो गरिब समग्र गुणस्तर को छैन भनेर सुझाव, मतदान भन्दा अन्य गुण लागि उच्च गुणवत्ता जानकारी देखिन्छ। दोस्रो, Catalist डेटा प्रयोग गरेर भाग मा, Ansolabehere र Hersh काउन्टी मतदान रेकर्ड गुणस्तर को तीन अलग अलग उपाय विकास, र उनि मतदान को भन्दा-रिपोर्टिङ को अनुमानित दर यी डेटा गुणस्तर उपाय कुनै पनि गर्न अनिवार्य असम्बन्धित थियो फेला, एक खोजन कि भनेर भन्दा-प्रतिवेदन को उच्च दर छैन असामान्य कम डाटा गुणवत्ता संग काउंटियहरुलाई द्वारा संचालित भइरहेका छन् सुझाव।
यो मास्टर मतदान फाइल सिर्जना दिइएको सम्भावित त्रुटिहरू को दोस्रो स्रोत यो सर्वेक्षण रेकर्ड लिङ्क छ। उदाहरणका लागि, यो लिंकेज गलत तरिकाले गरेको छ भने यो रिपोर्ट र मान्य मतदान व्यवहार भिन्नता को एक भन्दा बढी-अनुमान लगाउन सक्छ (Neter, Maynes, and Ramanathan 1965) । हरेक व्यक्ति एक स्थिर, अद्वितीय दुवै डाटा स्रोतहरु मा थियो परिचायक थियो भने लिंकेज तुच्छ हुनेछ। अमेरिकी र अन्य देशहरूमा तथापि, कुनै विश्वव्यापी परिचायक हो। यसबाहेक, भने पनि त्यहाँ यस्ता थिए एक परिचायक मान्छे शायद अनुसन्धानकर्ताहरूले सर्वेक्षण यसलाई प्रदान गर्न आनाकानी हुनेछ! नाम, लिङ्ग, जन्म वर्ष, र घर ठेगाना: तसर्थ, Catalist प्रत्येक प्रतिवादीको बारेमा जानकारी को चार टुक्रा, त्रुटिपूर्ण पहिचानकर्ताहरू प्रयोग गरेर यो मामला मा संपर्क गर्न थियो। उदाहरणका लागि, Catalist को CCES मा Homie जे सिम्पसन आफ्नो मास्टर डाटा फाइल मा होमर जे सिम्पसन रूपमा एउटै व्यक्ति थियो भने निर्णय थियो। व्यवहार मा, मिलान मामिलामा शोधकर्ताओं लागि बुरा बनाउन, एक कठिन र गंदा प्रक्रिया छ, र, Catalist स्वामित्व हुन यसको मिल्दो प्रविधी छलफल।
मेल खाने एल्गोरिदम मान्य गर्न, तिनीहरूले दुई चुनौतीहरू मा भरोसा। को Mitre निगम: पहिलो, Catalist एक स्वतन्त्र, तेस्रो-पक्ष द्वारा चलान थियो मेल खाने प्रतियोगिता मा भाग। Mitre सबै सहभागीहरू दुई हल्ला डाटा फाइलहरू प्रदान मिलान गर्न, र विभिन्न टोली Mitre सबै भन्दा राम्रो मिल्दो फर्कन competed। Mitre नै सही मिल्दो थियो किनभने तिनीहरूले टोली स्कोर गर्न सके। competed कि 40 कम्पनीहरु, Catalist दोस्रो स्थानमा आए। स्वतन्त्र, तेस्रो-पक्ष स्वामित्व प्रविधिको मूल्यांकन यस प्रकारको एकदम दुर्लभ र अविश्वसनीय बहुमूल्य छ; यो Catalist गरेको मिल्दो प्रक्रियाहरु राज्य-को-को-कला मा अनिवार्य हो भनेर हामीलाई विश्वस्त दिनुपर्छ। तर राज्य-को-को-कला एकदम राम्रो छ? यो मिल्दो प्रतियोगिता साथै, Ansolabehere र Hersh Catalist लागि आफ्नै मिल्दो चुनौती सिर्जना गरियो। पहिलेको परियोजना देखि, Ansolabehere र Hersh फ्लोरिडा देखि मतदाता रेकर्ड संकलन गरेका थिए। तिनीहरूले यी रेकर्ड केही आफ्नो क्षेत्रहरू Catalist गर्न सम्पादित र त्यसपछि यी आफ्नो वास्तविक मानहरूमा क्षेत्रहरू को Catalist गरेको प्रतिवेदन तुलना केही प्रदान। खुसीको कुरा, Catalist गरेको रिपोर्टहरू Catalist आफ्नो मास्टर डाटा फाइल मा आंशिक मतदाता रेकर्ड मेल सक्ने संकेत पनि बताएनन् मान नजिक थिए। यी दुई चुनौतिहरु तेस्रो-पक्ष द्वारा एक र एक Ansolabehere र Hersh गरेर हामी आफ्नो वास्तविक कार्यान्वयन आफूलाई समीक्षा गर्न सक्नुहुन्छ तापनि छैन भने, Catalist मिल्दो एल्गोरिद्म थप विश्वास हामीलाई दिनुहोस्।
त्यहाँ मतदान मान्य गर्न धेरै अघिल्लो प्रयासहरू भएका छन्। कि साहित्य एक सिंहावलोकन को लागि, Belli et al. (1999) , Berent, Krosnick, and Lupia (2011) , Ansolabehere and Hersh (2012) , र Hanmer, Banks, and White (2014) ।
यो मामला मा अनुसन्धानकर्ताहरूले Catalist डेटा गुणस्तर द्वारा प्रोत्साहन भए तापनि, व्यावसायिक विक्रेताहरु को अन्य मूल्यांकन कम उत्साहित भएका छन् भनेर याद गर्न महत्त्वपूर्ण छ। अनुसन्धानकर्ताहरूले गरिब गुणस्तर पाएका छन् जब मार्केटिङ प्रणाली समूह देखि एक उपभोक्ता-फाइल एक सर्वेक्षण देखि डाटा (नै तीन प्रदायकहरूबाट सँगै डाटा मर्ज जो: Acxiom, Experian, र infoUSA) (Pasek et al. 2014) । त्यो, डाटा फाइल सर्वेक्षण प्रतिक्रियाहरू अनुसन्धानकर्ताहरूले सही हुन अपेक्षित कि मिलेन, को datafile अर्को शब्दमा हराएको डाटा व्यवस्थित थियो मा रिपोर्ट सर्वेक्षण मूल्य छुटेका प्रश्नहरु को एक ठूलो संख्या, र हराएको डाटा ढाँचा लागि डाटा correlated थियो (छ , अनियमित छैन)।
सर्वेक्षण र प्रशासनिक डाटा बीच रेकर्ड लिंकेज थप को लागि, Sakshaug and Kreuter (2012) र Schnell (2013) । सामान्य मा रेकर्ड लिंकेज थप को लागि, Dunn (1946) र Fellegi and Sunter (1969) (ऐतिहासिक) र Larsen and Winkler (2014) (आधुनिक)। समान दृष्टिकोण पनि यस्तो डाटा डिडुप्लीकेशन, उदाहरणका पहिचान, नाम मिलान, नक्कली पत्ता लगाउने रूपमा नाम अन्तर्गत कम्प्युटर विज्ञान मा विकसित गरिएको, र रेकर्ड पत्ता लगाउने नक्कल छन् (Elmagarmid, Ipeirotis, and Verykios 2007) । त्यहाँ व्यक्तिगत जानकारी पहिचान को प्रसारण आवश्यक नगर्ने लिंकेज रेकर्ड गर्न दृष्टिकोण संरक्षण गोपनीयता पनि छन् (Schnell 2013) । फेसबुक मा अनुसन्धानकर्ताहरूले probabilisticsly मतदान व्यवहार गर्न आफ्नो रेकर्ड लिङ्क गर्न प्रक्रिया विकसित (Jones et al. 2013) ; यो लिंकेज म अध्याय 4 मा बारेमा बताउन छौँ कि एक प्रयोग मूल्याङ्कन गर्न गरेको थियो (Bond et al. 2012)
सरकार प्रशासनिक रेकर्ड गर्न एक ठूलो मात्रा सामाजिक सर्वेक्षण लिङ्क अर्को उदाहरण स्वास्थ्य र सेवानिवृत्ति सर्वेक्षण र सामाजिक सुरक्षा प्रशासन आउँछ। भनेर अध्ययन थप लागि, सहमति प्रक्रिया बारे जानकारी सहित हेर्न Olson (1996) र Olson (1999) ।
एक मास्टर datafile-को Catalist केही राष्ट्रिय सरकारको तथ्याङ्क कार्यालय मा साधारण कर्मचारीहरु-छ कि प्रक्रिया मा प्रशासनिक रेकर्ड धेरै स्रोतहरु संयोजन प्रक्रिया। तथ्याङ्क स्वीडेन ले दुई अनुसन्धानकर्ताहरूले विषय मा एक विस्तृत पुस्तक लेखिएको छ (Wallgren and Wallgren 2007) । (Olmstead काउन्टी, मिनेसोटा; को मायो क्लिनिक को घर) संयुक्त राज्य अमेरिका मा एक काउन्टी यो दृष्टिकोण को एक उदाहरणका लागि, Sauver et al. (2011) । प्रशासनिक रेकर्ड देखा पर्न सक्ने गल्ती थप हेर्नुहोस् Groen (2012) ।