جمع آوری داده های توزیع شده امکان پذیر است و در آینده احتمالا شامل تکنولوژی و مشارکت منفعل می شود.
همانطور که eBird نشان می دهد، جمع آوری داده های توزیع شده می تواند برای تحقیقات علمی مورد استفاده قرار گیرد. علاوه بر این، PhotoCity نشان می دهد که مشکلات مربوط به نمونه برداری و کیفیت داده بالقوه قابل حل است. چگونه می توان داده های توزیع شده را برای تحقیقات اجتماعی کار کرد؟ یک مثال از کار سوزان واتکینز و همکارانش در پروژه مجلات مالاوی (Watkins and Swidler 2009; Kaler, Watkins, and Angotti 2015) . در این پروژه، 22 نفر از ساکنان محلی، "روزنامه نگاران"، "نشریات مکالمه" را تهیه کرده اند که جزئیات آنها را در مورد ایدز در زندگی روزمره مردم عادی ثبت کرده اند (در زمان آغاز پروژه حدود 15 درصد از بزرگسالان در مالاوی با ویروس HIV (Bello, Chipeta, and Aberle-Grasse 2006) آلوده بودند. به دلیل وضعیت خودی خود، این روزنامه نگاران توانستند مکالماتی را که ممکن است برای واتکینز و همکاران تحقیقاتی غربی خود در دسترس نباشد، ابراز داشته باشند (من درباره اخلاقیات این مقاله در بخش بعد در مورد توصیه های خود در مورد طراحی پروژه همکاری مشترک خود بحث خواهم کرد) . داده های پروژه مجلات مالاوی منجر به تعدادی یافته های مهم شده است. برای مثال، قبل از آغاز پروژه، بسیاری از افراد بیگانه معتقد بودند که سکوت در مورد بیماری ایدز در کشورهای جنوب صحرای آفریقا وجود دارد، اما مجلات مکالمه نشان دادند که این موضوع به وضوح مورد نیست: روزنامه نگاران صدها بحث در مورد موضوع را در مکان هایی که متنوع هستند مراسم تشییع جنازه، کافه ها و کلیساها. علاوه بر این، ماهیت این گفتگوها به پژوهشگران کمک کرد تا برخی از مقاومت در برابر استفاده از کاندوم را درک کنند؛ نحوه استفاده از کاندوم در پیام های سلامت عمومی متناسب با نحوه بحث در زندگی روزمره بود (Tavory and Swidler 2009) .
البته، مانند داده های eBird، داده های پروژه مجلات مالاوی کامل نیستند، موضوعی که توسط واتکینز و همکارانش مورد بحث و بررسی قرار گرفته است. به عنوان مثال، مکالمات ضبط شده یک نمونه تصادفی از تمام مکالمات ممکن نیست. در عوض، آنها یک سرشماری ناقص مکالمات درباره ایدز هستند. با توجه به کیفیت داده ها، محققان معتقد بودند که روزنامه نگارانشان خبرنگاران با کیفیت بالا هستند، که نشان می دهد که هماهنگی در مجلات و مجلات وجود دارد. به همین دلیل است که روزنامه نگاران به اندازه کافی در یک محیط کوچک به کار گرفته شده اند و بر روی یک موضوع خاص متمرکز شده اند، امکان استفاده از افزونگی برای ارزیابی و اطمینان از کیفیت داده ها وجود دارد. به عنوان مثال، یک کارگر جنسی به نام "استلا" چندین بار در مجلات چهار روزنامه نگار متفاوت دیده شده است (Watkins and Swidler 2009) . به منظور ساختن شهود بیشتر، جدول 5.3 نمونه های دیگری از جمع آوری اطلاعات توزیع شده برای تحقیقات اجتماعی را نشان می دهد.
داده های جمع آوری شده | ارجاع |
---|---|
بحث درباره HIV / AIDS در مالاوی | Watkins and Swidler (2009) ؛ Kaler, Watkins, and Angotti (2015) |
خیابان گدایی در لندن | Purdam (2014) |
رویدادهای مناقشه در کنگو شرقی | Windt and Humphreys (2016) |
فعالیت اقتصادی در نیجریه و لیبریا | Blumenstock, Keleher, and Reisinger (2016) |
نظارت بر آنفلوانزا | Noort et al. (2015) |
تمام نمونه هایی که در این بخش توضیح داده شده اند شامل مشارکت فعال: روزنامه نگاران گفتگو هایی را که شنیده اند رونویسی می کنند. birders چک لیست پرنده خود را آپلود کرد؛ یا بازیکنان عکس های خود را آپلود کردند اما اگر مشارکت اتوماتیک بود و نیازی به مهارت خاص یا زمان لازم برای ارسال ندارد، چه؟ این وعده ارائه شده توسط "حساسیت مشارکتی" یا "حساسیت مردم محور" است. برای مثال، Pothole Patrol، یک پروژه توسط دانشمندان MIT، شتاب سنج مجهز به GPS را در داخل هفت تاکسی در منطقه بوستون نصب کرد (Eriksson et al. 2008) از آنجا که رانندگی بیش از یک گلدان یک سیگنال شتاب سنج متمایز را برگزار می کند، این دستگاه ها، هنگامی که در داخل تاکسی های متحرک قرار می گیرند، می توانند نقشه های پوتول بوستون را ایجاد کنند. البته، تاکسی ها به طور تصادفی جاده ها را نمونه نمی کنند، اما با توجه به تاکسی های کافی، پوشش های کافی برای ارائه اطلاعات در مورد قسمت های بزرگ شهرشان وجود دارد. مزیت دوم سیستم های منفعل که بر تکنولوژی تکیه دارند این است که آنها روند پردازش داده ها را درک می کنند: در حالی که این مهارت نیاز به کمک به eBird دارد (زیرا شما باید بتوانید به گونه ای مطمئن از شناسایی گونه های پرنده ها)، نیازی به مهارت خاصی برای کمک به گودال پتول
پیشروی می کنم، متاسفم که بسیاری از پروژه های جمع آوری داده های توزیع شده، از قابلیت های تلفن های همراه استفاده می کنند که قبلا توسط میلیاردها نفر در سراسر جهان انجام می شود. این گوشی ها در حال حاضر تعداد زیادی حسگر برای اندازه گیری مهم هستند، مانند میکروفون، دوربین، دستگاه GPS و ساعت. علاوه بر این، آنها از برنامه های شخص ثالث پشتیبانی می کند که محققان برخی از پروتکل های جمع آوری اطلاعات را تحت کنترل دارند. در نهایت، آنها اتصال به اینترنت دارند، و این امکان را برای آنها فراهم می کند که اطلاعاتی را که جمع آوری می کنند، بارگیری کنند. چالش های فنی زیادی وجود دارد، که شامل سنسورهای نادرست و عمر باتری محدود است، اما با توجه به پیشرفت تکنولوژی، این مشکلات در طول زمان کاهش می یابد. از سوی دیگر، مسائل مربوط به حریم خصوصی و اخلاق، پیچیده تر می شود؛ من وقتی به مشاوره درباره طراحی همکاری جمعی خود می اندیشم به سوالات اخلاقی باز می گردم.
داوطلبان در پروژه های جمع آوری اطلاعات جمع آوری داده ها را در مورد جهان به اشتراک می گذارند. این رویکرد قبلا با موفقیت مورد استفاده قرار گرفته است و استفاده های آینده احتمالا برای رفع نمونه گیری و نگرانی های کیفیت داده است. خوشبختانه، پروژه های موجود مانند Photocity و Pothole Patrol راه حل های این مشکلات را پیشنهاد می دهند. همانطور که پروژه های بیشتری از فناوری استفاده می کنند که مشارکت غیر متخصص و غیرواقعی را ممکن می سازد، پروژه های جمع آوری داده جمع آوری شده باید به طور چشمگیری در مقیاس افزایش یابد و محققان بتوانند داده هایی را که در گذشته محدود شده اند جمع آوری کنند.