การกระจายข้อมูลเป็นไปได้และในอนาคตอาจเกี่ยวข้องกับเทคโนโลยีและการมีส่วนร่วมแบบพาสซีฟ
ดังที่ eBird แสดงให้เห็นว่าการกระจายข้อมูลสามารถนำไปใช้ในการวิจัยทางวิทยาศาสตร์ได้ นอกจากนี้ PhotoCity ยังแสดงให้เห็นว่าปัญหาที่เกี่ยวข้องกับการสุ่มตัวอย่างและคุณภาพข้อมูลอาจแก้ปัญหาได้ การกระจายข้อมูลสามารถทำงานอย่างไรเพื่อการวิจัยทางสังคม? ตัวอย่างหนึ่งมาจากผลงานของ Susan Watkins และเพื่อนร่วมงานของเธอในโครงการ Malawi Journals Project (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) ในโครงการนี้ผู้อยู่อาศัย 22 รายเรียกว่า "ผู้สื่อข่าว" - เก็บบันทึกการสนทนาซึ่งบันทึกรายละเอียดเกี่ยวกับการสนทนาที่พวกเขาได้ยินเกี่ยวกับโรคเอดส์ในชีวิตประจำวันของคนธรรมดา (ในขณะที่โครงการเริ่มขึ้นประมาณ 15% ของผู้ใหญ่ ในมาลาวีติดเชื้อเอชไอวี (Bello, Chipeta, and Aberle-Grasse 2006) ) เนื่องจากสถานะภายในของพวกเขาผู้สื่อข่าวเหล่านี้จึงสามารถได้ยินเสียงบทสนทนาที่อาจไม่สามารถเข้าถึงได้สำหรับ Watkins และทีมงานวิจัยด้านเวสเทิร์ของเธอ (ฉันจะพูดถึงหลักจริยธรรมของบทนี้ในบทต่อไปนี้เมื่อฉันเสนอคำแนะนำเกี่ยวกับการออกแบบโครงการการทำงานร่วมกันของมวลชนของคุณเอง) . ข้อมูลจากโครงการวารสารมาลาวีได้นำไปสู่การค้นพบที่สำคัญหลายอย่าง ตัวอย่างเช่นก่อนที่โครงการจะเริ่มต้นบุคคลภายนอกหลายคนเชื่อว่ามีความเงียบเกี่ยวกับโรคเอดส์ในทะเลทรายซาฮาราใต้ แต่บทสนทนาในวารสารนี้แสดงให้เห็นอย่างชัดเจนว่ากรณีนี้ไม่ได้เป็นเช่นนั้น: นักข่าวหลายร้อยคนได้พูดคุยในหัวข้อต่างๆ งานศพ, บาร์และโบสถ์ นอกจากนี้ธรรมชาติของการสนทนาเหล่านี้ช่วยให้นักวิจัยเข้าใจถึงความต้านทานต่อการใช้ถุงยางอนามัยบางอย่างได้ดีขึ้น วิธีที่การใช้ถุงยางอนามัยถูกจัดอยู่ในข้อความด้านสาธารณสุขไม่สอดคล้องกับแนวทางที่กล่าวในชีวิตประจำวัน (Tavory and Swidler 2009)
แน่นอนเช่นข้อมูลจาก eBird ข้อมูลจากโครงการวารสารมาลาวีไม่สมบูรณ์แบบประเด็นที่กล่าวถึงในรายละเอียดโดย Watkins และเพื่อนร่วมงาน ตัวอย่างเช่นบทสนทนาที่บันทึกไว้ไม่ใช่ตัวอย่างแบบสุ่มของบทสนทนาที่เป็นไปได้ทั้งหมด ค่อนข้างจะเป็นสำมะเลเทเมาที่ไม่สมบูรณ์ของการสนทนาเกี่ยวกับโรคเอดส์ ในแง่ของคุณภาพข้อมูลนักวิจัยเชื่อว่านักข่าวของพวกเขาคือผู้สื่อข่าวที่มีคุณภาพสูงโดยได้รับการยืนยันจากความสอดคล้องภายในวารสารและวารสารต่างๆ นั่นก็คือเนื่องจากมีนักข่าวมากพอที่จะนำไปใช้ในการตั้งค่าที่เล็กพอและมุ่งเน้นไปที่หัวข้อเฉพาะคุณจึงสามารถใช้ข้อมูลซ้ำซ้อนเพื่อประเมินและตรวจสอบคุณภาพข้อมูลได้ ตัวอย่างเช่นพนักงานทางเพศชื่อ "Stella" ปรากฏตัวขึ้นหลายครั้งในวารสารของผู้สื่อข่าว 4 ราย (Watkins and Swidler 2009) เพื่อที่จะสร้างสัญชาตญาณของคุณต่อไปตารางที่ 5.3 แสดงตัวอย่างอื่น ๆ ของการรวบรวมข้อมูลแบบกระจายเพื่อการวิจัยทางสังคม
รวบรวมข้อมูลแล้ว | การอ้างอิง |
---|---|
การอภิปรายเกี่ยวกับโรคเอดส์ในมาลาวี | Watkins and Swidler (2009) ; Kaler, Watkins, and Angotti (2015) |
ถนนขอทานในลอนดอน | Purdam (2014) |
เหตุการณ์ความขัดแย้งในคองโกตะวันออก | Windt and Humphreys (2016) |
กิจกรรมทางเศรษฐกิจในไนจีเรียและไลบีเรีย | Blumenstock, Keleher, and Reisinger (2016) |
เฝ้าระวังไข้หวัดใหญ่ | Noort et al. (2015) |
ตัวอย่างทั้งหมดที่อธิบายไว้ในส่วนนี้เกี่ยวข้องกับการมีส่วนร่วมอย่างกระตือรือร้น: ผู้สื่อข่าวถ่ายทอดบทสนทนาที่พวกเขาได้ยิน birders อัปโหลดรายการตรวจสอบนก; หรือผู้เล่นอัพโหลดรูปของพวกเขา แต่ถ้าการเข้าร่วมเป็นแบบอัตโนมัติและไม่จำเป็นต้องมีทักษะเฉพาะหรือเวลาที่จะส่ง? นี่คือคำมั่นสัญญาที่นำเสนอโดย "การตรวจจับแบบมีส่วนร่วม" หรือ "การตรวจจับผู้คนเป็นศูนย์กลาง" ตัวอย่างเช่นโครงการ Pothole Patrol ซึ่งเป็นโครงการโดยนักวิทยาศาสตร์ของ MIT ได้ติดตั้งเครื่องวัดความเร่ง GPS ที่ติดตั้งแท็กซี่เจ็ดแท่นในบริเวณบอสตัน (Eriksson et al. 2008) เนื่องจากการขับรถผ่านเพลาใบจะให้สัญญาณอัตราความเร่งที่แตกต่างกันอุปกรณ์เหล่านี้เมื่อวางไว้ภายในแท็กซี่เคลื่อนที่สามารถสร้างแผนที่ Pothole ของบอสตันได้ แท็กซี่แทบจะไม่สุ่มตัวอย่างถนน แต่หากได้รับรถแท็กซี่เพียงพออาจมีข้อมูลเพียงพอที่จะให้ข้อมูลเกี่ยวกับส่วนใหญ่ของเมืองเหล่านี้ ประโยชน์ที่สองของระบบพาสซีฟที่อาศัยเทคโนโลยีคือการลดขั้นตอนการป้อนข้อมูล: ในขณะที่ต้องใช้ทักษะในการมีส่วนร่วมใน eBird (เพราะคุณจำเป็นต้องสามารถระบุชนิดของนกได้อย่างแม่นยำ) จึงไม่จำเป็นต้องมีทักษะพิเศษใด ๆ มีส่วนร่วมใน Pothole Patrol
นับจากนี้ฉันสงสัยว่าหลายโครงการที่จัดเก็บข้อมูลกระจายจะเริ่มใช้ประโยชน์จากความสามารถของโทรศัพท์มือถือที่มีอยู่แล้วโดยพันล้านคนทั่วโลก โทรศัพท์เหล่านี้มีเซ็นเซอร์ขนาดใหญ่อยู่แล้วสำหรับการวัดเช่นไมโครโฟนกล้องอุปกรณ์ GPS และนาฬิกา นอกจากนี้ยังสนับสนุนแอปพลิเคชันของบุคคลที่สามซึ่งช่วยให้นักวิจัยสามารถควบคุมโปรโตคอลการรวบรวมข้อมูลที่อยู่ภายใต้การควบคุมได้ สุดท้ายพวกเขามีการเชื่อมต่ออินเทอร์เน็ตซึ่งทำให้พวกเขาสามารถโหลดข้อมูลที่เก็บรวบรวมได้ มีปัญหาทางเทคนิคมากมายตั้งแต่เซ็นเซอร์ที่ไม่ถูกต้องจนถึงอายุการใช้งานแบตเตอรี่ที่ จำกัด แต่ปัญหาเหล่านี้อาจลดลงเมื่อเวลาผ่านไปเมื่อเทคโนโลยีพัฒนาขึ้น ประเด็นที่เกี่ยวข้องกับความเป็นส่วนตัวและจริยธรรมในทางกลับกันอาจมีความซับซ้อนมากขึ้น ฉันจะกลับไปที่คำถามเรื่องจริยธรรมเมื่อฉันให้คำแนะนำเกี่ยวกับการออกแบบการทำงานร่วมกันของมวลของคุณเอง
ในโครงการกระจายข้อมูลคอลเลกชันอาสาสมัครมีส่วนร่วมในข้อมูลเกี่ยวกับโลก วิธีนี้ได้ถูกนำมาใช้เรียบร้อยแล้วและการใช้งานในอนาคตน่าจะต้องเป็นไปตามข้อกังวลเกี่ยวกับการสุ่มตัวอย่างและข้อมูลคุณภาพ โชคดีที่โครงการที่มีอยู่เช่น PhotoCity และ Pothole Patrol แนะนำแนวทางแก้ไขปัญหาเหล่านี้ เนื่องจากโครงการต่างๆใช้ประโยชน์จากเทคโนโลยีที่ช่วยให้มีส่วนร่วมที่ไม่เอื้ออำนวยและมีส่วนร่วมแบบเรื้อรังโครงการจัดเก็บข้อมูลแบบกระจายควรจะเพิ่มขนาดขึ้นอย่างมากทำให้นักวิจัยสามารถเก็บรวบรวมข้อมูลที่เพิ่งถูก จำกัด ไว้ในอดีต