2.3.2.2 ไม่สามารถเข้าถึง

ข้อมูลที่จัดขึ้นโดยธุรกิจและรัฐบาลเป็นเรื่องยากสำหรับนักวิจัยในการเข้าถึง

ในเดือนพฤษภาคมปี 2014, การรักษาความปลอดภัยแห่งชาติสหรัฐวาระเปิดศูนย์ข้อมูลในชนบทของยูทาห์ที่มีชื่อที่น่าอึดอัดใจที่ชุมชนข่าวกรองแห่งชาติที่ครอบคลุม Cyber​​security ริเริ่มศูนย์ข้อมูล อย่างไรก็ตามศูนย์ข้อมูลนี้ซึ่งได้มาเป็นที่รู้จักในฐานะศูนย์ข้อมูลยูทาห์เป็นรายงานที่มีความสามารถที่น่าประหลาดใจ รายงานอ้างว่าศูนย์ข้อมูลยูทาห์มีความสามารถในการจัดเก็บและประมวลผลทุกรูปแบบของการสื่อสารรวมทั้ง "เนื้อหาที่สมบูรณ์แบบของอีเมลส่วนตัวโทรศัพท์มือถือและการค้นหาของ Google เช่นเดียวกับทุกประเภทของข้อมูลส่วนบุคคลของใบเสร็จรับเงินเส้นทางจอดรถ, เส้นทางการเดินทาง ซื้อหนังสือและอื่น ๆ ที่ดิจิตอล `กระเป๋าครอก" (Bamford 2012) นอกจากนี้ยังมีความกังวลเกี่ยวกับการเลี้ยงธรรมชาติที่สำคัญมากของข้อมูลที่บันทึกในฐานข้อมูลขนาดใหญ่ซึ่งจะอธิบายเพิ่มเติมด้านล่างศูนย์ข้อมูลยูทาห์เป็นตัวอย่างมากของแหล่งข้อมูลมากมายที่ไม่สามารถเข้าถึงที่นักวิจัย มากกว่าปกติหลายแหล่งที่มาของข้อมูลขนาดใหญ่ที่จะเป็นประโยชน์กับนักวิจัยจะถูกควบคุมและ จำกัด โดยรัฐบาล (เช่นข้อมูลภาษีและข้อมูลการศึกษา) และ บริษัท (เช่นคำสั่งเพื่อค้นหาและโทร meta ข้อมูลการค้นหา) ดังนั้นข้อมูลเหล่านี้จะไม่สามารถใช้งานได้ทันทีที่นักวิจัยที่มหาวิทยาลัยและส่วนใหญ่จะไม่ได้ให้บริการแก่นักวิจัยในรัฐบาลหรือ บริษัท

จากประสบการณ์ของผมนักวิจัยหลายคนตามที่มหาวิทยาลัยเข้าใจผิดแหล่งที่มาของการเข้าไม่ถึงนี้ ข้อมูลเหล่านี้จะไม่สามารถเข้าถึงได้เพราะคนที่ บริษัท และรัฐบาลจะโง่ขี้เกียจหรือไม่สนใจ แต่มีความร้ายแรงตามกฎหมายทางด้านเทคนิคธุรกิจและอุปสรรคจริยธรรมที่ป้องกันการเข้าถึงข้อมูล ตัวอย่างเช่นบางสัญญาข้อตกลงการให้บริการสำหรับเว็บไซต์เพียง แต่ช่วยให้ข้อมูลที่จะนำมาใช้โดยพนักงานหรือเพื่อปรับปรุงการบริการ ดังนั้นบางรูปแบบของการแบ่งปันข้อมูลสามารถเปิดเผยให้ บริษัท ที่จะฟ้องคดีถูกต้องตามกฎหมายจากลูกค้า นอกจากนี้ยังมีความเสี่ยงทางธุรกิจอย่างมากให้กับ บริษัท ที่เกี่ยวข้องในการแบ่งปันข้อมูล พยายามที่จะคิดว่าประชาชนจะตอบสนองถ้าข้อมูลการค้นหาส่วนบุคคลโดยไม่ได้ตั้งใจรั่วไหลออกจาก Google เป็นส่วนหนึ่งของโครงการวิจัยของมหาวิทยาลัย เช่นการละเมิดข้อมูลถ้ารุ​​นแรงก​​็อาจจะมีความเสี่ยงที่การดำรงอยู่ของ บริษัท เพื่อให้ Google และขนาดใหญ่ส่วนใหญ่ บริษัท -มีไม่ชอบความเสี่ยงเกี่ยวกับการใช้ข้อมูลร่วมกันกับนักวิจัยมาก

ในความเป็นจริงเกือบทุกคนที่อยู่ในตำแหน่งเพื่อให้สามารถเข้าถึงข้อมูลจำนวนมากรู้เรื่องราวของอับดูร์ Chowdhury ในปี 2006 เมื่อเขาเป็นหัวหน้าฝ่ายวิจัย AOL เขาจงใจปล่อยออกมาในสิ่งที่เขาคิดว่าเป็นเรื่องที่ไม่ระบุชื่อคำค้นหาจากผู้ใช้ 650,000 AOL เพื่อการวิจัยชุมชน เท่าที่ผมสามารถบอกได้ก่อสร้างและนักวิจัยที่ AOL มีความตั้งใจที่ดีและพวกเขาคิดว่าพวกเขาได้ข้อมูลที่ไม่ระบุชื่อ แต่พวกเขาผิด มันถูกค้นพบได้อย่างรวดเร็วว่าข้อมูลที่ไม่ได้อยู่ในฐานะที่ไม่ระบุชื่อเป็นนักวิจัยคิดและผู้สื่อข่าวจากนิวยอร์กไทม์สก็สามารถที่จะระบุคนในชุดข้อมูลได้อย่างง่ายดาย (Barbaro and Zeller Jr 2006) เมื่อปัญหาเหล​​่านี้ถูกค้นพบ Chowdhury ลบออกข้อมูลจากเว็บไซต์ของเอโอแอล แต่มันก็สายเกินไป ข้อมูลที่ได้รับการโพสต์ใหม่ในเว็บไซต์อื่น ๆ และมันอาจจะยังคงอยู่เมื่อคุณได้อ่านหนังสือเล่มนี้ เพราะความพยายามของเขาที่จะใช้ข้อมูลร่วมกับการวิจัยชุมชน, การก่อสร้างถูกยิงและเจ้าหน้าที่ฝ่ายเทคโนโลยีของ AOL หัวหน้าลาออก (Hafner 2006) เป็นตัวอย่างนี้แสดงให้เห็นประโยชน์สำหรับบุคคลที่เฉพาะเจาะจงภายในของ บริษัท ที่จะอำนวยความสะดวกในการเข้าถึงข้อมูลที่มีขนาดเล็กสวยและสถานการณ์ที่เลวร้ายที่สุดกรณีเป็นสาหัส

การวิจัยสามารถ แต่ได้รับการเข้าถึงข้อมูลที่ไม่สามารถเข้าถึงได้ให้กับประชาชนทั่วไป รัฐบาลมีวิธีการที่นักวิจัยสามารถปฏิบัติตามเพื่อนำไปใช้สำหรับการเข้าถึงและเป็นตัวอย่างต่อไปในการแสดงบทนี้นักวิจัยบางครั้งสามารถเข้าถึงข้อมูลขององค์กร ยกตัวอย่างเช่น Einav et al. (2015) ร่วมมือกับนักวิจัยที่อีเบย์เพื่อศึกษาร่องรอยดิจิตอลจากการประมูลออนไลน์ ฉันจะพูดคุยเกี่ยวกับการวิจัยที่มาจากการทำงานร่วมกันนี้ในภายหลังในบท (มาตรา 2.4.3.2) แต่ฉันพูดถึงมันในตอนนี้เพราะมันมีทั้งสี่ของส่วนผสมที่ฉันเห็นในความร่วมมือที่ประสบความสำเร็จ: ดอกเบี้ยวิจัยความสามารถในการวิจัย ที่น่าสนใจของ บริษัท และความสามารถของ บริษัท ในคำอื่น ๆ Einav และเพื่อนร่วมงานที่มีความสนใจและความสามารถในการเรียนการประมูลออนไลน์ และอีเบย์ยังเป็น แต่ผมเคยเห็นการทำงานร่วมกันเป็นไปได้มากล้มเหลวเพราะทั้งนักวิจัยหรือ บริษัท ขาดอย่างใดอย่างหนึ่งของส่วนผสมเหล่านี้

แม้ว่าคุณจะสามารถที่จะพัฒนาความร่วมมือกับธุรกิจ แต่มีข้อเสียบางอย่างสำหรับคุณ ครั้งแรกที่คำถามที่ว่าคุณสามารถขอให้มีข้อมูลที่มีแนวโน้มที่จะ จำกัด ; บริษัท ไม่น่าจะช่วยให้การวิจัยที่จะทำให้พวกเขาดูไม่ดี ประการที่สองคุณอาจจะไม่สามารถที่จะแบ่งปันข้อมูลของคุณกับนักวิจัยอื่น ๆ ซึ่งหมายความว่านักวิจัยอื่น ๆ จะไม่สามารถที่จะตรวจสอบและขยายผลของคุณ นอกจากนี้ความร่วมมือเหล่านี้สามารถสร้างอย่างน้อยลักษณะของความขัดแย้งทางผลประโยชน์ที่ผู้คนอาจจะคิดว่าผลลัพธ์ของคุณได้รับอิทธิพลจากความร่วมมือของคุณที่ ทั้งหมดของข้อเสียเหล่านี้สามารถได้รับการแก้ไข แต่มันเป็นสิ่งสำคัญที่จะต้องมีความชัดเจนว่าการทำงานกับข้อมูลที่ไม่สามารถเข้าถึงทุกคนมีทั้ง upsides และข้อเสีย

สรุปจำนวนมากของข้อมูลขนาดใหญ่ไม่สามารถเข้าถึงที่นักวิจัย มีกฎหมายอย่างจริงจังทางด้านเทคนิคธุรกิจและอุปสรรคจริยธรรมที่ป้องกันการเข้าถึงข้อมูลและอุปสรรคเหล่านี้จะไม่หายไป รัฐบาลแห่งชาติโดยทั่วไปมีการจัดตั้งขั้นตอนสำหรับการเปิดใช้การเข้าถึงข้อมูล แต่กระบวนการสามารถเพิ่มเติมเฉพาะกิจในระดับรัฐและท้องถิ่น นอกจากนี้ในบางกรณีนักวิจัยสามารถร่วมเป็นพันธมิตรกับ บริษัท ที่จะได้รับการเข้าถึงข้อมูล แต่นี้สามารถสร้างความหลากหลายของปัญหาสำหรับนักวิจัย