ข้อมูลที่ บริษัท และรัฐบาลถือเป็นเรื่องยากสำหรับนักวิจัยที่สามารถเข้าถึงได้
ในเดือนพฤษภาคมปี 2014 US National Security Agency ได้เปิดศูนย์ข้อมูลในชนบทของประเทศยูทาห์โดยใช้ชื่อที่น่าอับอายคือศูนย์ข้อมูลความปลอดภัยทางอินเทอร์เน็ตแห่งชาติของศูนย์ข่าวกรองแห่งชาติอัจฉริยะ (Intelligence Community Comprehensive Cybersecurity Initiative Data Center) อย่างไรก็ตามศูนย์ข้อมูลแห่งนี้ซึ่งมีชื่อว่า Utah Data Center มีรายงานว่ามีความสามารถที่น่าตกใจ รายงานฉบับหนึ่งอ้างว่าสามารถจัดเก็บและประมวลผลรูปแบบการสื่อสารทั้งหมดได้รวมถึง "เนื้อหาที่สมบูรณ์ของอีเมลส่วนตัวโทรศัพท์มือถือและการค้นหาของ Google รวมทั้งข้อมูลเส้นทางต่างๆที่เกี่ยวกับการเดินทาง - รายรับที่จอดรถแผนการท่องเที่ยวการซื้อหนังสือ , และกระเป๋าดิจิทัล 'กระเป๋า litter' " (Bamford 2012) นอกเหนือจากการเพิ่มความกังวลเกี่ยวกับลักษณะที่ละเอียดอ่อนของข้อมูลที่บันทึกไว้ในข้อมูลขนาดใหญ่ซึ่งจะอธิบายด้านล่างต่อไปศูนย์ข้อมูลยูทาห์เป็นตัวอย่างมากของแหล่งข้อมูลที่มีข้อมูลมากมายซึ่งนักวิจัยไม่สามารถเข้าถึงได้ โดยทั่วไปแล้วแหล่งข้อมูลขนาดใหญ่จำนวนมากที่เป็นประโยชน์จะถูกควบคุมและ จำกัด โดยรัฐบาล (เช่นข้อมูลภาษีและข้อมูลทางการศึกษา) หรือ บริษัท ต่างๆ (เช่นข้อความค้นหาไปยังเครื่องมือค้นหาและข้อมูลเมตาโทรศัพท์) ดังนั้นแม้ว่าแหล่งข้อมูลเหล่านี้จะมีอยู่ แต่จะไม่มีประโยชน์สำหรับวัตถุประสงค์ของการวิจัยทางสังคมเนื่องจากไม่สามารถเข้าถึงได้
จากประสบการณ์ของผมนักวิจัยหลายคนจากมหาวิทยาลัยเข้าใจผิดว่าเป็นแหล่งที่มาของการเข้าไม่ถึงนี้ ข้อมูลเหล่านี้ไม่สามารถเข้าถึงได้ไม่ใช่เพราะคนใน บริษัท และรัฐบาลเป็นคนโง่ขี้เกียจหรือไม่ใส่ใจ แต่มีปัญหาด้านกฎหมายธุรกิจและจริยธรรมที่ร้ายแรงที่ทำให้ไม่สามารถเข้าถึงข้อมูลได้ ตัวอย่างเช่นข้อกำหนดในการให้บริการบางข้อสำหรับเว็บไซต์อนุญาตให้พนักงานใช้ข้อมูลหรือปรับปรุงบริการเท่านั้น การเปิดเผยข้อมูลบางรูปแบบอาจทำให้ บริษัท ต่างๆสามารถฟ้องร้องจากลูกค้าได้ นอกจากนี้ยังมีความเสี่ยงทางธุรกิจที่สำคัญสำหรับ บริษัท ที่มีส่วนร่วมในการแชร์ข้อมูล ลองนึกภาพว่าประชาชนจะตอบสนองอย่างไรหากข้อมูลการค้นหาส่วนบุคคลที่ถูกปล่อยออกมาจาก Google โดยไม่ตั้งใจเป็นส่วนหนึ่งของโครงการวิจัยของมหาวิทยาลัย การละเมิดข้อมูลดังกล่าวหากมีความรุนแรงอาจเป็นความเสี่ยงที่เกิดขึ้นกับ บริษัท ดังนั้น Google และ บริษัท ที่ใหญ่ที่สุดจึงมีความเสี่ยงในการแบ่งปันข้อมูลกับนักวิจัย
ในความเป็นจริงเกือบทุกคนที่อยู่ในตำแหน่งเพื่อให้เข้าถึงข้อมูลจำนวนมากรู้เรื่องของ Abdur Chowdhury ในปี 2006 เมื่อเขาเป็นหัวหน้าฝ่ายวิจัยของ AOL เขาได้ปล่อยให้ชุมชนวิจัยทราบโดยเจตนาซึ่งเขาคิดว่าเป็นข้อความค้นหาแบบไม่ระบุชื่อจากผู้ใช้ AOL 650,000 ราย เท่าที่ฉันสามารถบอกได้ว่า Chowdhury และนักวิจัยของ AOL มีเจตนาดีและคิดว่าพวกเขาได้ระบุชื่อข้อมูลไว้ แต่พวกเขาผิด ได้อย่างรวดเร็วพบว่าข้อมูลไม่ได้ระบุว่าเป็นนักวิจัยคิดและผู้สื่อข่าวจาก New York Times สามารถระบุคนในชุดข้อมูลได้อย่างสะดวก (Barbaro and Zeller 2006) เมื่อปัญหาเหล่านี้ถูกค้นพบ Chowdhury ลบข้อมูลออกจากเว็บไซต์ของ AOL แต่มันก็สายเกินไป ข้อมูลดังกล่าวได้รับการโพสต์ไว้ในเว็บไซต์อื่นแล้วและอาจมีให้บริการเมื่อคุณอ่านหนังสือเล่มนี้ Chowdhury ถูกไล่ออกและเจ้าหน้าที่ด้านเทคโนโลยีของ AOL ลาออก (Hafner 2006) ดังตัวอย่างนี้แสดงให้เห็นประโยชน์สำหรับบุคคลเฉพาะภายใน บริษัท เพื่ออำนวยความสะดวกในการเข้าถึงข้อมูลมีขนาดเล็กมากและสถานการณ์สมมติที่เลวร้ายที่สุดน่ากลัว
นักวิจัยสามารถเข้าถึงข้อมูลที่ไม่สามารถเข้าถึงได้ต่อสาธารณชนทั่วไป รัฐบาลบางแห่งมีขั้นตอนที่นักวิจัยสามารถปฏิบัติตามเพื่อขอรับสิทธิ์การเข้าถึงและในตัวอย่างต่อมาในบทนี้นักวิจัยบางคนสามารถเข้าถึงข้อมูลของ บริษัท ได้เป็นครั้งคราว ตัวอย่างเช่น Einav et al. (2015) ร่วมมือกับนักวิจัยของ eBay เพื่อศึกษาการประมูลออนไลน์ ฉันจะพูดคุยเกี่ยวกับงานวิจัยที่มาจากการทำงานร่วมกันนี้ในบทนี้ แต่ตอนนี้ฉันพูดถึงเรื่องนี้เนื่องจากมีส่วนผสมทั้งหมดสี่อย่างที่ฉันเห็นในความร่วมมือที่ประสบความสำเร็จ: ความสนใจของนักวิจัยความสามารถของนักวิจัยความสนใจของ บริษัท และความสามารถของ บริษัท . ฉันได้เห็นความร่วมมือที่อาจเกิดขึ้นหลายครั้งไม่ได้เพราะทั้งนักวิจัยหรือหุ้นส่วนไม่ว่าจะเป็น บริษัท หรือรัฐบาลก็ตามขาดส่วนผสมเหล่านี้
แม้ว่าคุณจะสามารถพัฒนาความร่วมมือกับธุรกิจหรือเข้าถึงข้อมูลของรัฐบาลที่ จำกัด ได้ แต่ก็มีข้อเสียบางประการสำหรับคุณ ขั้นแรกคุณอาจไม่สามารถแชร์ข้อมูลกับนักวิจัยรายอื่นซึ่งหมายความว่านักวิจัยคนอื่น ๆ จะไม่สามารถยืนยันและขยายผลของคุณได้ ประการที่สองคำถามที่คุณถามอาจมีข้อ จำกัด บริษัท ไม่น่าจะอนุญาตให้มีงานวิจัยที่อาจทำให้ดูไม่ดี สุดท้ายพันธมิตรเหล่านี้สามารถสร้างความขัดแย้งทางผลประโยชน์อย่างน้อยที่สุดซึ่งผู้คนอาจคิดว่าผลลัพธ์ของคุณได้รับอิทธิพลจากความเป็นหุ้นส่วนของคุณ ข้อเสียทั้งหมดเหล่านี้สามารถแก้ไขได้ แต่สิ่งสำคัญคือต้องชัดเจนว่าการทำงานกับข้อมูลที่ไม่สามารถเข้าถึงได้ทุกคนมีทั้งข้อดีและข้อเสีย
โดยสรุปข้อมูลจำนวนมากจะไม่สามารถเข้าถึงได้สำหรับนักวิจัย มีปัญหาด้านกฎหมายธุรกิจและจริยธรรมที่ร้ายแรงที่ป้องกันไม่ให้การเข้าถึงข้อมูลและอุปสรรคเหล่านี้จะไม่หายไปเนื่องจากเทคโนโลยีเหล่านี้ไม่เป็นอุปสรรคด้านเทคนิค รัฐบาลแห่งชาติบางแห่งได้กำหนดวิธีการในการเปิดใช้งานการเข้าถึงข้อมูลสำหรับชุดข้อมูลบางอย่าง แต่ขั้นตอนนี้มีเฉพาะกิจโดยเฉพาะในระดับรัฐและระดับท้องถิ่น นอกจากนี้ในบางกรณีนักวิจัยสามารถร่วมมือกับ บริษัท ต่างๆเพื่อขอรับข้อมูลได้ แต่นี่อาจสร้างความหลากหลายให้กับนักวิจัยและ บริษัท