2.4.3.2 সমন্বয়

দূরে মামলা ছাঁটাই দ্বারা ন্যায্য তুলনা তৈরি মিলে.

ফেয়ার তুলনা হয় এলোমেলোভাবে নিয়ন্ত্রিত পরীক্ষা বা প্রাকৃতিক পরীক্ষায় থেকে আসতে পারে. কিন্তু, অনেক পরিস্থিতিতে যেখানে আপনি আদর্শ পরীক্ষা না চালাতে পারেন এবং প্রকৃতির একটি স্বাভাবিক পরীক্ষা প্রদান করেনি হয়. এইসব সেটিংস এর সবচেয়ে ভালো উপায় হলো একটি ন্যায্য তুলনা মিলে তৈরি করতে. ম্যাচিং, গবেষক মানুষ যে অনুরূপ ব্যতীত যে এক চিকিত্সা পেয়েছে জোড়া তৈরি করার জন্য অ পরীক্ষামূলক ডেটা মাধ্যমে দেখায় এবং এক না হয়েছে. ম্যাচিং প্রক্রিয়া গবেষকরা আসলে ছাঁটাই করা হয়; যে মামলার ব্যাপারে কোনো সুস্পষ্ট তুলনা আছে খারিজ হয়. সুতরাং, এই পদ্ধতি আরো নিখুঁতভাবে ম্যাচিং-এবং-কেঁটে সাফ বলে অভিহিত করা হবে, কিন্তু আমি প্রথাগত শব্দটি দিয়ে বিদ্ধ করা হবে: মিল.

বৃহদায়তন অ পরীক্ষামূলক ডেটা উৎসের সঙ্গে কৌশল মিলে ক্ষমতার একটি সুন্দর উদাহরণ Liran Einav এবং সহকর্মীদের দ্বারা ভোক্তা আচরণের উপর গবেষণা থেকে আসা (2015) . Einav এবং সহকর্মীদের ইবে উপর স্থান গ্রহণ নিলামে আগ্রহী ছিল, এবং তাদের কাজ বর্ণনা, আমি একটি বিশেষ দৃষ্টিভঙ্গি মনোনিবেশ করব: যেমন বিক্রয় মূল্য বা বিক্রয় সম্ভাব্যতা হিসাবে নিলাম ফলাফল, নিলামে শুরু মূল্য প্রভাব.

বিক্রয় মূল্যের উপর প্রারম্ভিক মূল্য প্রভাব সম্পর্কে প্রশ্নের উত্তর সবচেয়ে সরল পথ কেবল বিভিন্ন শুরুর দামের সঙ্গে নিলাম করার জন্য চূড়ান্ত মূল্য নিরূপণ করা হবে. এই পদ্ধতির জরিমানা হতে যদি আপনি কেবল একটি নির্দিষ্ট আইটেম যে একটি প্রদত্ত প্রারম্ভিক মূল্য সঙ্গে ইবে উপর রাখা হয়েছে বিক্রির মূল্য ভবিষ্যদ্বাণী করতে চাইবেন. কিন্তু, যদি আপনার প্রশ্নের কারণ এটা ন্যায্য তুলনা উপর ভিত্তি করে করা হয় না কাজ করবে না এই পদ্ধতির বাজার ফলাফলের মূল্য শুরু প্রভাব কি; কম শুরুর দামের সঙ্গে নিলাম উচ্চতর প্রারম্ভিক দাম (যেমন, তারা পণ্য বিভিন্ন ধরনের হতে পারে অথবা বিক্রেতাদের বিভিন্ন ধরনের অন্তর্ভুক্ত করা হতে পারে) সঙ্গে নিলাম থেকে পুরোপুরি ভিন্ন হতে পারে.

-Say প্যারামিটারগুলো ইতিমধ্যে ন্যায্য তুলনা সম্পর্কে উদ্বিগ্ন হন, তাহলে আপনি সরল পদ্ধতির লাফালাফি এবং একটি ক্ষেত্র পরীক্ষা আপনি যেখানে একটি নির্দিষ্ট আইটেম-say বিক্রি করবে, একটি গলফ ক্লাব দিয়ে নিলামের একটি নির্দিষ্ট চলমান বিবেচনা করা হতে পারে, বিনামূল্যে শিপিং, নিলাম দুই সপ্তাহের জন্য খোলা ইত্যাদি কিন্তু সঙ্গে এলোমেলোভাবে শুরু দাম সেট. ফলে বাজার ফলাফলের তুলনা করে, এই ফিল্ড পরীক্ষা বিক্রয় মূল্যের উপর মূল্য শুরু প্রভাব খুব স্পষ্ট পরিমাপ অফার করবে. কিন্তু, এই পরিমাপ শুধুমাত্র একটি বিশেষ পণ্য ক্ষেত্রে প্রযোজ্য এবং নিলামের পরামিতি সেট হবে. ফলাফল ভিন্ন হতে পারে, উদাহরণস্বরূপ, পণ্য বিভিন্ন ধরনের জন্য. শক্তিশালী তত্ত্ব ছাড়া, এই একক পরীক্ষা সম্ভব পরীক্ষাগুলির পূর্ণ পরিসীমা যে পারে চালানোর হয়েছে থেকে দূরদর্শন করা কঠিন. উপরন্তু, ক্ষেত্র পরীক্ষায় পর্যাপ্ত ব্যয়বহুল এটি পণ্য এবং নিলামের ধরনের পুরো প্যারামিটার স্থান ঢেকে ফেলার জন্য তাদের যথেষ্ট পর্যন্ত চালানোর infeasible হবে হয়.

সরল পন্থা ও পরীক্ষামূলক পদ্ধতির বিপরীতে, Einav এবং সহকর্মীদের একটি তৃতীয় অভিগমন: মিল. তাদের কৌশলের প্রধান কৌতুক ক্ষেত্র পরীক্ষায় যে ইতিমধ্যে ইবে উপর ঘটেছে অনুরূপ কিছু আবিষ্কার হয়. উদাহরণস্বরূপ, চিত্র 2.6 ঠিক একই গলফ ক্লাব একটি Taylormade দহনকারী 09 চালক-হচ্ছে ঠিক একই seller- "budgetgolfer" দ্বারা বিক্রি 31 তালিকাভুক্তির কিছু দেখায়. যাইহোক, এই তালিকা কিছুটা ভিন্ন বৈশিষ্ট্য আছে. তাদের ইলেভেন $ 124,99 একটি নির্দিষ্ট মূল্য জন্য চালক প্রস্তাব, যখন অন্যান্য 20 বিভিন্ন শেষ তারিখ দিয়ে নিলাম হয়. এছাড়াও, তালিকা, বিভিন্ন শিপিং ফি পারেন $ 7.99 বা $ 9.99. অন্য কথায়, এটা এমন যেন "budgetgolfer" গবেষকদের জন্য পরীক্ষা-নিরীক্ষা চলছে.

Taylormade দহনকারী 09 ড্রাইভার এর তালিকা "budgetgolfer" দ্বারা বিক্রি হচ্ছে তালিকা, যেখানে সঠিক একই আইটেম সঠিক একই বিক্রেতার দ্বারা বিক্রি হচ্ছে একটি মিলেছে সেট কিন্তু কিছুটা ভিন্ন বৈশিষ্ট্য সঙ্গে প্রতিটি সময় এক উদাহরণ. ইবে ব্যাপক লগ মধ্যেই সেখানে আক্ষরিক তালিকা লক্ষ লক্ষ জড়িত মিলেছে সেট শত সহস্রের আছে. সুতরাং, বরং একটি প্রদত্ত প্রারম্ভিক মূল্য মধ্যে সব নিলামের জন্য চূড়ান্ত মূল্য তুলনা চেয়ে, Einav এবং সহকর্মীদের সাথে মিলেছে সেট মধ্যে তুলনা করতে. অর্ডার মিলেছে সেট হাজার হাজার এই শত শত মধ্যে তুলনামূলক আলোচনা ফলাফল একত্রিত করার জন্য, Einav এবং সহকর্মীদের প্রারম্ভিক মূল্য এবং প্রতিটি আইটেমের (যেমন, তার গড় বিক্রয় মূল্য) এর রেফারেন্স মান পদ চূড়ান্ত মূল্য পুনরায় প্রকাশ. উদাহরণস্বরূপ, যদি Taylormade দহনকারী 09 ড্রাইভার $ 100 একটি রেফারেন্স মূল্য আছে (তার বিক্রয় উপর ভিত্তি করে), তারপর $ 10 এর একটি প্রারম্ভিক মূল্য 0.1 হিসাবে প্রকাশ করা হবে এবং $ 120 এর চূড়ান্ত মূল্য 1.2 ​​হিসাবে প্রকাশ করা হবে.

চিত্র 2.6: একটি মিলেছে সেট এর একটি উদাহরণ. এই সঠিক একই গলফ ক্লাব (একটি Taylormade দহনকারী 09 চালক) সঠিক একই ব্যক্তি (budgetgolfer) দ্বারা বিক্রি হচ্ছে, কিন্তু এই বিক্রির কিছু বিভিন্ন শর্ত (যেমন, বিভিন্ন প্রারম্ভিক মূল্য) সঞ্চালিত হয়. Einav এট থেকে নেওয়া চিত্র. (2015).

চিত্র 2.6: একটি মিলেছে সেট এর একটি উদাহরণ. এই সঠিক একই গলফ ক্লাব (একটি Taylormade দহনকারী 09 চালক) সঠিক একই ব্যক্তি ( "budgetgolfer") দ্বারা বিক্রি হচ্ছে, কিন্তু এই বিক্রির কিছু বিভিন্ন শর্ত (যেমন, বিভিন্ন প্রারম্ভিক মূল্য) সঞ্চালিত হয়. থেকে নেওয়া চিত্র Einav et al. (2015) .

পুনরাহ্বান যে Einav এবং সহকর্মীদের নিলাম ফলাফলের শুরুর মূল্য প্রভাব আগ্রহী ছিল. প্রথমত, রৈখিক নির্ভরণ ব্যবহার তারা অনুমান যে উচ্চতর প্রারম্ভিক মূল্য একটি বিক্রয় সম্ভাবনা হ্রাস, এবং উচ্চতর প্রারম্ভিক মূল্য চূড়ান্ত বিক্রয় মূল্য, একটি বিক্রয় ঘটমান শর্তাধীন বৃদ্ধি করে. নিজেরাই, এই অনুমান-যা সব পণ্য বেশি গড় করা হয় প্রারম্ভিক মূল্য এবং চূড়ান্ত মধ্যে একটি রৈখিক সম্পর্ক অনুমান সব যে আকর্ষণীয় না ফলাফলের-হয়. কিন্তু, Einav এবং সহকর্মীরা তাদের ডেটা ব্যাপক আকার ব্যবহার আরো সূক্ষ্ম তথ্যও বিভিন্ন অনুমান করার জন্য. প্রথমত, Einav এবং সহকর্মীদের আলাদাভাবে বিভিন্ন দামের আইটেম জন্য এবং রৈখিক নির্ভরণ ব্যবহার ছাড়া এই অনুমান করেছেন. তাঁরা দেখলেন যে সময় শুরু মূল্য এবং বিক্রয় সম্ভাব্যতা মধ্যে সম্পর্ক রৈখিক হয়, শুরুর মূল্য এবং বিক্রয় মূল্য মধ্যে সম্পর্ক পরিষ্কারভাবে অ রৈখিক (চিত্র 2.7) হয়. বিশেষ করে, 0.05 এবং 0.85 মধ্যে দাম শুরু জন্য, প্রারম্ভিক মূল্য বিক্রয় মূল্য, একটি গবেষনার যে বিশ্লেষণ করে একটি রৈখিক সম্পর্ক অধিকৃত ছিল মিস সম্পন্ন হয়েছে খুব সামান্য প্রভাব রয়েছে.

নিলাম শুরু মূল্য এবং বিক্রয় (বাম প্যানেল) এবং বিক্রয় মূল্য (ডান প্যানেল) সম্ভাব্যতা মধ্যে সম্পর্ক: চিত্র 2.7. সেখানে প্রায় শুরুর মূল্য এবং বিক্রয় সম্ভাব্যতা মধ্যে একটি রৈখিক সম্পর্ক নেই, কিন্তু শুরুর মূল্য এবং বিক্রয় মূল্য মধ্যে একটি অ রৈখিক সম্পর্ক নেই; 0.05 এবং 0.85 মধ্যে দাম শুরু জন্য, প্রারম্ভিক মূল্য বিক্রয় মূল্যের উপর খুব সামান্য প্রভাব রয়েছে. উভয় ক্ষেত্রেই, সম্পর্ক আইটেমটি মান মূলত স্বাধীন হয়. এই গ্রাফ চিত্র 4a এবং 4b Einav এট পুনরুত্পাদন. (2015).

নিলাম শুরু মূল্য এবং বিক্রয় (বাম প্যানেল) এবং বিক্রয় মূল্য (ডান প্যানেল) সম্ভাব্যতা মধ্যে সম্পর্ক: চিত্র 2.7. সেখানে প্রায় শুরুর মূল্য এবং বিক্রয় সম্ভাব্যতা মধ্যে একটি রৈখিক সম্পর্ক নেই, কিন্তু শুরুর মূল্য এবং বিক্রয় মূল্য মধ্যে একটি অ রৈখিক সম্পর্ক নেই; 0.05 এবং 0.85 মধ্যে দাম শুরু জন্য, প্রারম্ভিক মূল্য বিক্রয় মূল্যের উপর খুব সামান্য প্রভাব রয়েছে. উভয় ক্ষেত্রেই, সম্পর্ক আইটেমটি মান মূলত স্বাধীন হয়. এই গ্রাফ চিত্র 4a এবং 4b বংশবৃদ্ধি Einav et al. (2015) .

দ্বিতীয়ত, বরং সব আইটেম উপর গড় চেয়ে, Einav এবং সহকর্মীরা তাদের তথ্য বৃহদায়তন স্কেল আইটেম (যেমন, পোষা সরবরাহ, ইলেকট্রনিক্স, এবং ক্রীড়া স্মারক) (চিত্র 2.8) এর 23 বিভিন্ন বিভাগ জন্য শুরু মূল্য প্রভাব অনুমান করার জন্য ব্যবহার করা. এই হিসাব অনুযায়ী স্বাতন্ত্র্যসূচক জন্য আইটেম যেমন-যেমন স্মারক-সূচনা মূল্য একটি বিক্রয় সম্ভাব্যতা এবং চূড়ান্ত বিক্রয় মূল্য উপর একটি বড় প্রভাব একটি ছোট প্রভাব আছে দেন. উপরন্তু, জন্য আরো commodified আইটেম-যেমন ডিভিডি এবং ভিডিও-সূচনা মূল্য হিসেবে চূড়ান্ত মূল্য প্রায় কোন প্রভাব রয়েছে. অন্য কথায়, একটি গড় যে আইটেম এর 23 বিভিন্ন বিভাগ থেকে ফলাফল সম্মিলন এই আইটেম মধ্যে পার্থক্য সম্পর্কে গুরুত্বপূর্ণ তথ্য লুকিয়ে রাখুন.

চিত্র 2.8: ফলাফল পৃথকভাবে প্রতিটি বিভাগ থেকে আনুমানিক হিসেব দেখিয়েছেন; সব শ্রেণীর জন্য অনুমান কঠিন ডট একসঙ্গে pooled, টেবিল 11 (Einav এট. 2015, টেবিল 11). এই হিসাব অনুযায়ী স্বাতন্ত্র্যসূচক জন্য আইটেম যেমন-যেমন স্মারক-সূচনা মূল্য একটি বিক্রয় (x অক্ষ) এবং চূড়ান্ত বিক্রয় মূল্য (y- অক্ষের) উপর একটি বড় প্রভাব সম্ভাব্যতা উপর একটি ছোট প্রভাব আছে দেন.

চিত্র 2.8: ফলাফল পৃথকভাবে প্রতিটি বিভাগ থেকে আনুমানিক হিসেব দেখিয়েছেন; একসঙ্গে pooled সব শ্রেণীর জন্য অনুমান কঠিন ডট (Einav et al. 2015, Table 11) . এই হিসাব অনুযায়ী স্বাতন্ত্র্যসূচক জন্য আইটেম যেমন-যেমন স্মারক-সূচনা মূল্য একটি বিক্রয় (x অক্ষ) এবং চূড়ান্ত বিক্রয় মূল্য (y- অক্ষের) উপর একটি বড় প্রভাব সম্ভাব্যতা উপর একটি ছোট প্রভাব আছে দেন.

এমনকি আপনি যদি বিশেষ করে ইবে উপর নিলামে আগ্রহী নয়, আপনি উপায় যে 2.7 চিত্র এবং 2.8 অফার সহজ রৈখিক নির্ভরণ অনুমান যে রৈখিক সম্পর্ক অনুমান এবং আইটেম বিভিন্ন বিভাগ একত্রিত চেয়ে ইবে একটি গরীয়ান বোঝার চিত্র তারিফ আছে. এই আরো সূক্ষ্ম হিসেব ব্যাপক তথ্য মিলে শক্তি চিত্রিত; এই অনুমান ক্ষেত্র পরীক্ষায় একটি বিরাট সংখ্যা, যা ব্যয়বহুল হতাম ছাড়া অসম্ভব হত.

অবশ্যই, আমরা একটি তুলনীয় পরীক্ষার ফলাফলে তুলনায় কোনো নির্দিষ্ট ম্যাচিং গবেষণায় ফলাফলে কম আস্থা রাখা উচিত. যখন কোন ম্যাচিং গবেষণা থেকে ফলাফল নির্ধারণে, সেখানে দুটি গুরুত্বপূর্ণ উদ্বেগ আছে. প্রথমত, আমরা মনে রাখতে হবে যে আমরা শুধুমাত্র জিনিস যে মিলের জন্য ব্যবহার করা হয়েছিল ন্যায্য তুলনা নিশ্চিত করতে পারে না. বিক্রেতার আইডি নম্বর, আইটেম বিভাগ, আইটেম শিরোনাম, এবং উপশিরোনাম: তাদের মূল ফলাফলে, Einav এবং সহকর্মীদের সঠিক চার বৈশিষ্ট্যের উপর মিলে হয়নি. যদি আইটেম উপায়ে যে মিলের জন্য ব্যবহার করা হয় নি, যে একটি অন্যায্য তুলনা তৈরী করতে পারে বিভিন্ন ছিল. উদাহরণস্বরূপ, যদি "budgetgolfer" Taylormade দহনকারী 09 ড্রাইভারের থাকার শীতকালে নত (যখন গলফ ক্লাব কম জনপ্রিয়), তারপর, এটা প্রদর্শিত হতে পারে যে নিম্ন প্রারম্ভিক মূল্য চূড়ান্ত দাম খুব কম নেতৃত্ব যখন আসলে এই ঋতু এর একটি হস্তনির্মিত বস্তু হবে চাহিদা প্রকরণ. সাধারণভাবে, এই সমস্যার সবচেয়ে ভালো ম্যাচিং এর বিভিন্ন ধরণের চেষ্টা করা হবে বলে মনে হয়. উদাহরণস্বরূপ, Einav এবং সহকর্মীদের তাদের বিশ্লেষণ যেখানে মিলেছে সেট এক বছরের মধ্যে বিক্রি আইটেম, এক মাসের মধ্যে, এবং contemporaneously ছিল অন্তর্ভুক্ত পুনরাবৃত্তি. সময় জানালা কঠিন মেকিং মিলেছে সেটের সংখ্যা কমে যায়, কিন্তু ঋতু প্রকরণ সম্পর্কে উদ্বেগ কমায়. সৌভাগ্যবসত, তারা এটি যে ফলাফল মিলে বিচার্য বিষয় এই পরিবর্তনগুলি দ্বারা অপরিবর্তিত আছে. ম্যাচিং সাহিত্যে, উদ্বেগের এই ধরনটি observables এবং unobservables পদ প্রকাশ করা হয়, কিন্তু মূল ধারণা সত্যিই যে গবেষকরা শুধুমাত্র ম্যাচিং ব্যবহৃত বৈশিষ্ট্য উপর ন্যায্য তুলনা তৈরি হয়.

দ্বিতীয় প্রধান উদ্বেগের বিষয় যখন মিলে ফলাফল ব্যাখ্যা করে যে, তারা শুধুমাত্র মিলেছে তথ্য প্রয়োগ করা হয়; তারা যে মামলাগুলি মিলেছে করা যায়নি ক্ষেত্রে প্রযোজ্য হবে না. উদাহরণস্বরূপ, যে আইটেম একাধিক তালিকা Einav এবং সহকর্মীদের পেশাদার এবং আধা-পেশাদার বিক্রেতাদের উপর মনোযোগ নিবদ্ধ করা হয় ছিল তাদের গবেষণা সীমিত দ্বারা. সুতরাং, যখন এই তুলনা দোভাষী আমরা অবশ্যই মনে রাখতে হবে যে, তারা শুধুমাত্র ইবে এই উপসেট জন্য প্রযোজ্য.

সমন্বয় বৃহৎ ডেটাসেট ন্যায্য তুলনা খোঁজার জন্য একটি শক্তিশালী কৌশল. অনেক সামাজিক বিজ্ঞানীরা, ম্যাচিং পরীক্ষায় দ্বিতীয় সেরা মত মতানুযায়ী, কিন্তু যে বিশ্বাস করে সংশোধিত করা উচিত, সামান্য. ব্যাপক ডাটা সমন্বয় ক্ষেত্র পরীক্ষায় একটি ছোট সংখ্যা বেশী ভালো হতে পারে যখন: 1) প্রভাব বিষমসত্ত্বতা গুরুত্বপূর্ণ এবং 2) সেখানে মিলের জন্য ভাল observables হয়. ছক 2.4 কিভাবে মিলে বড় তথ্য উৎসের সঙ্গে ব্যবহার করা যেতে পারে অন্য কিছু উদাহরণ প্রদান করে.

ছক 2.4: গবেষণায় যে ডিজিটাল ট্রেস মধ্যে ন্যায্য তুলনা এটি ম্যাচিং ব্যবহার উদাহরণ.
বাস্তব ফোকাস বিগ তথ্য উৎস তলব
পুলিশ সহিংসতা গুলিবর্ষণে প্রভাব বন্ধ করুন-এবং-উল্লম্ফন রেকর্ড Legewie (2016)
পরিবার ও প্রতিবেশীদের উপর সেপ্টেম্বর 11, 2001 এর প্রভাব ভোটিং রেকর্ড ও অনুদান রেকর্ড Hersh (2013)
সামাজিক রোগসংক্রমণ যোগাযোগ ও পণ্য গ্রহণ ডেটা Aral, Muchnik, and Sundararajan (2009)

উপসংহার ইন, অ পরীক্ষামূলক ডেটা থেকে কার্যকারণ প্রভাব আনুমানিক হিসাব থেকে সরল পন্থা বিপজ্জনক. তবে, সবচেয়ে শক্তিশালী থেকে দুর্বলতম একটি কন্টিনাম বরাবর মিথ্যা কার্যকারণ অনুমান করার জন্য কৌশল, এবং গবেষক অ পরীক্ষামূলক ডেটা মধ্যে ন্যায্য তুলনা আবিষ্কার করতে পারেন. প্রাকৃতিক পরীক্ষায় এবং মেলা: সবসময় অন, বিগ ডেটা সিস্টেম বৃদ্ধির কার্যকরভাবে দুই বিদ্যমান পদ্ধতি ব্যবহার করার জন্য আমাদের ক্ষমতা বৃদ্ধি করে.