যদিও এটা নোংরা হতে পারে, সমৃদ্ধ জিজ্ঞাসা শক্তিশালী হতে পারে.
ডিজিটাল ডেটা ট্রেস অসম্পূর্ণতা মোকাবেলার জন্য একটি ভিন্ন পদ্ধতির জরিপ তথ্য, একটি প্রক্রিয়া যে আমি সমৃদ্ধ জিজ্ঞাসা ডাকবো সঙ্গে সরাসরি এটা সমৃদ্ধ হয়. সমৃদ্ধ থাকাতে একটা উদাহরণ গবেষণা Burke and Kraut (2014) , যা আমি অধ্যায়ে আগে বর্ণিত (অনুচ্ছেদ 3.2) সম্পর্কে ফেসবুকে আলাপচারিতার বন্ধুত্ব শক্তি বৃদ্ধি পায় কিনা. যে ক্ষেত্রে, বার্ক এবং ক্রাউট দেখান ফেসবুক লগের তথ্য দিয়ে জরিপ তথ্য মিলিত.
সেটিং যে বার্ক এবং ক্রাউট দেখান কর্মরত ছিল, কিন্তু, বোঝানো যে তারা দুটি বড় সমস্যার যে করছেন গবেষকরা সমৃদ্ধ জিজ্ঞাসা মুখ দিয়ে মোকাবেলা করতে হবে না. প্রথমত, আসলে একসঙ্গে ডেটা সেট-একটি প্রক্রিয়া বলা রেকর্ড লিংকেজ, অন্যান্য নীচের এই সমস্যা একটি উদাহরণ ডেটাসেটে-করতে কঠিন এবং ত্রুটি-প্রবণ হতে (আমরা দেখতে পাবেন যথাযথ রেকর্ড সঙ্গে এক ডেটাসেটে রেকর্ড ম্যাচিং লিঙ্ক ). সমৃদ্ধ থাকাতে দ্বিতীয় প্রধান সমস্যা যে ডিজিটাল ট্রেস মান প্রায়শই গবেষকরা মূল্যায়ন করার জন্য কঠিন হবে. উদাহরণস্বরূপ, কখনও কখনও প্রক্রিয়া যার মাধ্যমে সংগ্রহ করা হয় মালিকানা এবং অধ্যায় 2. বর্ণিত অন্য কথায় সমস্যার অনেক সমর্থ হতে পারে, সমৃদ্ধ জিজ্ঞাসা ঘনঘন অজানা কালো বক্স তথ্য সূত্র সার্ভে ত্রুটি-প্রবণ লিঙ্ক জড়িত করা হবে গুণমান. উদ্বেগ যে এই দুই সমস্যার প্রবর্তন সত্ত্বেও, এটা যেমন স্টিফেন Ansolabehere এবং Eitan Hersh দ্বারা প্রদর্শিত হয় এই কৌশলের সঙ্গে গুরুত্বপূর্ণ গবেষণা করা সম্ভব হয় (2012) মার্কিন যুক্তরাষ্ট্রে ভোট নিদর্শন তাদের গবেষণায়. এটা কিছু বিস্তারিতভাবে এই গবেষণায় পুনরালোচনা লাভবানই হয় কৌশল যে Ansolabehere এবং Hersh উন্নত সমৃদ্ধ থাকাতে অন্যান্য অ্যাপ্লিকেশনের মধ্যে উপযোগী হতে হবে অনেক কারণ.
ভোটার উপস্থিতি রাজনৈতিক বিজ্ঞানে ব্যাপক গবেষণার বিষয় হয়েছে, এবং অতীতে, যারা ভোট এবং কেন সাধারণত জরিপ তথ্য বিশ্লেষণের উপর ভিত্তি করে করা হয়েছে গবেষক 'বোঝার. মার্কিন যুক্তরাষ্ট্রে ভোট গ্রহণ, তবে যে সরকার রেকর্ড প্রতিটি নাগরিকের ভোট হয়েছে কিনা একটি অস্বাভাবিক আচরণ (অবশ্যই, সরকারের জন্য যারা প্রতিটি নাগরিকের ভোট রেকর্ড না). বহু বছর ধরে, এই সরকারি ভোটিং রেকর্ড কাগজ ফর্মে পাওয়া যেত, দেশের প্রায় বিভিন্ন স্থানীয় সরকারি অফিসে বিক্ষিপ্ত. এই এটা কঠিন, কিন্তু অসম্ভব নয়, রাজনৈতিক বিজ্ঞানীদের নির্বাচকমণ্ডলী একটি সম্পূর্ণ ছবি আছে এবং কি মানুষ তাদের প্রকৃত ভোটিং আচরণের ভোট সম্পর্কে সার্ভে বলে তুলনা করার জন্য তৈরি (Ansolabehere and Hersh 2012) .
কিন্তু, এখন এই ভোট রেকর্ড ডিজিটাইজড করা হয়েছে, এবং বেসরকারী কোম্পানীর একটি সংখ্যা ধারাক্রমে সংগৃহীত আছে এবং এই ভোটিং রেকর্ড মার্জ ব্যাপক মাস্টার ভোটিং ফাইল যে সব আমেরিকানদের ভোট আচরণের রেকর্ড উত্পাদন. Ansolabehere এবং Hersh তাদের মাস্টার ভোটিং ফাইল ব্যবহার করতে সাহায্য করার জন্য ভোটারদের একটি ভালো ধারণা বিকাশ মধ্যে LCC-এই কোম্পানি-Catalist এক সঙ্গে যৌথভাবে কাজ. উপরন্তু, কারণ এটা সংগৃহীত এবং একটি কোম্পানীর দ্বারা সংকলিত ডিজিটাল রেকর্ড উপর নির্ভরশীল, এটা গবেষকরা দ্বারা পূর্ববর্তী প্রচেষ্টা যে কোম্পানি এইড এবং এনালগ রেকর্ড ব্যবহারের ছাড়া সম্পন্ন হয়েছে বেশি সুবিধার মধ্যে একটি সংখ্যা দেওয়া.
অধ্যায় 2 ডিজিটাল ট্রেস সূত্র অনেক ভালো লেগেছে, Catalist মাস্টার ফাইল, ডেমোগ্রাফিক ব্যক্তিগত দৃষ্টিভঙ্গি, এবং আচরণগত তথ্য যে Ansolabehere এবং Hersh প্রয়োজন অনেক অন্তর্ভুক্ত করা হয়নি. এই তথ্য ছাড়াও, Ansolabehere এবং Hersh বিশেষভাবে যাচাই ভোটিং আচরণ (অর্থাৎ, Catalist ডাটাবেসের মধ্যে তথ্য) থেকে উলি্ল্লখিত ভোটিং আচরণ তুলনা আগ্রহী ছিল. তাই গবেষকরা তথ্য যে তারা সমবায় কংগ্রেশনাল নির্বাচন স্টাডি (CCES), একটি বড় সামাজিক জরিপের অংশ হিসেবে চেয়েছিলেন সংগৃহীত. পরবর্তী গবেষণায় Catalist এই তথ্য দিয়েছেন, এবং Catalist গবেষকরা যে যাচাই অন্তর্ভুক্ত (Catalist থেকে) ভোটিং আচরণ একটি মার্জ ডাটা ফাইল, স্ব-রিপোর্ট ভোটিং আচরণ (CCES থেকে) এবং জনমিতি এবং উত্তরদাতাদের মনোভাব ব্যাক (CCES থেকে দিয়েছিলাম ). অন্য কথায়, Ansolabehere এবং Hersh জরিপ তথ্য ভোটের তথ্য সমৃদ্ধ, এবং ফলস্বরূপ মার্জ ফাইল তাদের কিছু যে ত্ত ফাইল স্বতন্ত্রভাবে সক্রিয় করতে সক্ষম হবেন.
জরিপ তথ্য দিয়ে Catalist মাস্টার ডেটা ফাইল সমৃদ্ধ করে, Ansolabehere এবং Hersh তিনটি গুরুত্বপূর্ণ সিদ্ধান্তে আসেন. প্রথমত, ওভার প্রতিবেদনের ভোটের প্রসারণশীল: অ ভোটার প্রায় অর্ধেক ভোট রিপোর্ট. অথবা, এটি এ খুঁজছেন অন্য উপায় যদি কেউ ভোট রিপোর্ট, সেখানে শুধুমাত্র একটি 80% সম্ভাবনা যে তারা আসলে ভোট হয়. দ্বিতীয়ত, ওভার প্রতিবেদনের র্যান্ডম নয়; ওভার প্রতিবেদনের সুশিক্ষিত, উচ্চ আয়ের মধ্যে বেশি দেখা যায় ব্যাপারে যারা পাবলিক অ্যাফেয়ার্স নিযুক্ত করা হয়. অন্য কথায়, যারা অধিকাংশ ভোট পড়ার সম্ভাবনা রয়েছে সবচেয়ে ভোটদান সম্পর্কে মিথ্যা বলতে পারে. তৃতীয়ত, এবং সবচেয়ে গুরুতর, ওভার-রিপোর্টিং, ভোটার ও অ ভোটারদের মধ্যে প্রকৃত পার্থক্য চেয়ে ছোট তারা সার্ভে থেকে শুধু প্রদর্শিত হয় নিয়মানুগ প্রকৃতির কারণে. উদাহরণস্বরূপ, একটি ব্যাচেলার ডিগ্রী সঙ্গীদের সম্পর্কে 22 শতাংশ বেশি ভোট প্রতিবেদন করার সম্ভাবনা বেশি, কিন্তু মাত্র 10 শতাংশ বেশি ভোট আসলে করার সম্ভাবনা বেশি. উপরন্তু, ভোটের বিদ্যমান সম্পদ ভিত্তিক তত্ত্ব অনেক পূর্বাভাসের যারা আসলে যারা ভোট, একটি গবেষণামূলক গবেষনার নতুন তত্ত্ব বুঝতে ও ভোটের ভবিষ্যদ্বাণী করার জন্য আহ্বান করে চেয়ে ভোট রিপোর্ট হবে এ আরও ভাল হয়.
কিন্তু, কত আমরা এই ফলাফল বিশ্বাস করা উচিত? মনে রাখবেন এই ফলাফল ত্রুটির অজানা পরিমাণে কালো বক্স তথ্য ত্রুটির-প্রবণ লিঙ্ক উপর নির্ভর করে. আরো নির্দিষ্টভাবে, ফলাফলে দুই কী সিঁড়িতে কবজা: 1) অনেক অসম তথ্য সূত্র একত্রিত একটি নির্ভুল মাস্টার datafile এবং 2) তার মাস্টার datafile জরিপ তথ্য লিঙ্ক করতে Catalist ক্ষমতা উত্পাদন Catalist ক্ষমতা. প্রতিটি ধাপ বেশ কঠিন হয় এবং উভয় বসিতে ত্রুটি ভুল সিদ্ধান্তে গবেষক পরিচালিত করতে পারে. তবে, উভয় ডাটা প্রসেসিং এবং মেলা তাই এসব সমস্যা সমাধানে সম্পদ বিনিয়োগ করতে পারেন, প্রায়ই একটি স্কেল যে কোন ব্যক্তি একাডেমিক গবেষক বা গবেষকদের গ্রুপ খাপ খাওয়াতে পারে এ একটি কোম্পানি হিসেবে Catalist ক্রমাগত অস্তিত্ব সমালোচনামূলক. অধ্যায়ের শেষে আরো পড়ার, আমি আরো বিস্তারিত এবং কিভাবে Ansolabehere এবং Hersh তাদের ফলাফলে আস্থা গড়ে তুলতে এ সব সমস্যার বর্ণনা. যদিও এই বিবরণ এই গবেষণায় নির্দিষ্ট হয়, এই অনুরূপ বিষয় অন্যান্য কালো বক্স ডিজিটাল ট্রেস তথ্য সূত্র থেকে এই পৃষ্ঠায় সংযোগ মঙ্গলকামী গবেষকদের জন্য উঠা হবে.
সাধারণ পাঠ গবেষক এই গবেষণা থেকে আহরণ করতে পারে কি? প্রথমত, জরিপ তথ্য দিয়ে ডিজিটাল ট্রেস সমৃদ্ধকরণ থেকে অসাধারণ মান. দ্বিতীয়ত, যদিও এই সমষ্টিগত, বাণিজ্যিক তথ্য সূত্র না "মাটিতে সত্য" হিসেবে বিবেচনা করা উচিত, কিছু কিছু ক্ষেত্রে তারা উপযোগী হতে পারে. বস্তুত, এটা এই তথ্য সূত্র পরম সত্য না (যা থেকে তারা সবসময় কমা হবে) তুলনা করা ভাল. বরং এটা তাদের যা সর্বদাই ত্রুটি হিসাবে ভাল আছে অন্যান্য উপলব্ধ তথ্য সূত্র, এর তুলনা করা উত্তম.