በዚህ ተጨማሪ አባባል ውስጥ, አንዳንድ ምዕራፎችን አንዳንዶቹን በጥቂቱ ከሂሳብ አከባቢ አቀርባለሁ. እዚህ ያለው ግብ በእነዚህ አርዕስቶች ላይ ወደተካተቱ ጥቂት የቴክኒካዊ ይዘቶች ለመሸጋገር በአሰሳ ጥናት ተመራማሪዎች ጥቅም ላይ በሚውለው በአሳሽ እና በሂሳብ አሠራር ላይ የተመሰረቱትን እንዲያገኙ መርዳት ነው. የፕሮብሌት ናሙናዎችን በማስተዋወዴ, በመቀጠሌ, ወደ እምች መፍትሄዎች በመሄድ ወደ ጥርጣሬ ናሙና እሄዳለሁ, እና በመጨረሻም, የማይ ሆን ሊሆን የሚችል ናሙና.
የመነሻ ቅኝት
እንደ አጥንት ምሳሌ, በዩናይትድ ስቴትስ ውስጥ ያለውን የስራ አጥነት መጠን መገመት ይለግሱ. ይሁን \(U = \{1, \ldots, k, \ldots, N\}\) የዒላማ ህዝብ እና ይሁን \(y_k\) ሰው የሚሆን ውጤት ተለዋዋጭ ዋጋ በ \(k\) . በዚህ ምሳሌ \(y_k\) ማለት ሰው \(k\) ስራ የሌለው ነው. በመጨረሻም, \(F = \{1, \ldots, k, \ldots, N\}\) ሲባል እንደ (ዒላማው) ሕዝብ ከተመሳሳይ ጋር ሲነፃፀር \(F = \{1, \ldots, k, \ldots, N\}\) ነው.
መሰረታዊ ናሙና ንድፍ እንዲሁ ምንም ሳይተካይ ወጥቶ ናሙና ማድረግ ነው. በዚህ ሁኔታ, እያንዳንዱ ሰው ናሙና ውስጥ ( \(s = \{1, \ldots, i, \ldots, n\}\) . ከተመዘገበው የዲጂታል ዲዛይኑ ጋር መረጃ በሚሰበሰብበት ጊዜ ተመራማሪዎቹ የስራ ብዛትን ፍጥነት ከ ናሙና አማካኝ መጠን ይገምታሉ.
\[ \hat{\bar{y}} = \frac{\sum_{i \in s} y_i}{n} \qquad(3.1)\]
በ \(\bar{y}\) \(\hat{\bar{y}}\) " \(\hat{ }\) ትንበያ ለማመልከት ይጠቅማል).
በተጨባጭ ግን ተመራማሪዎች ሳይለወጡ በቀላሉ ያልተለመዱ ናሙናዎችን ይጠቀማሉ. በተለያዩ ምክንያቶች (በአንድ ጊዜ የማየው አንድ ጊዜ), ተመራማሪዎች ብዙውን ጊዜ የመካተት እኩልነት ያላቸው ናሙናዎችን ይፈጥራሉ. ለምሳሌ, ተመራማሪዎቹ በካሊፎርኒያ ውስጥ ከሚገኙ ሰዎች ጋር በከፍተኛ ሁኔታ የመካፈላቸው ከፍሎሪዳ ውስጥ ያሉ ሰዎችን ሊመርጡ ይችላሉ. በዚህ ሁኔታ, ናሙና አማካኝ (eq 3.1) ጥሩ ተመኝ አይደለም. ይልቁንም, ተመሪዎች የማጠቃለል ዕድል ሲኖር ተመራማሪዎቹ ይጠቀማሉ
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} \frac{y_i}{\pi_i} \qquad(3.2)\]
የት \(\hat{\bar{y}}\) ያለውን የሥራ አጥነት መጠን እና ያለውን ግምት ነው \(\pi_i\) ሰው ነው \(i\) 's እንዲካተት ይሁንታ. የልምድ ልምዶችን በመከተል, ትንበያውን በኢ.ኢ.ቲ. 3.2 የሆቨርስ-ቶምሰን ግመታ. የሆቨት-ቶምሰን ግመታ በጣም ጠቃሚ ነው ምክንያቱም ለማንኛውም የንብረት ናሙና ንድፍ (Horvitz and Thompson 1952) ግጭት ያለመሆኑን ግምት ያመጣል. የሆቨርስ-ቶምሰን ትንበያ ብዙ ጊዜ እንደሚመጣ ስለታየው እንደገና ሊፃፍ እንደቻለ ማስታወስ ጠቃሚ ነው
\[ \hat{\bar{y}} = \frac{1}{N} \sum_{i \in s} w_i y_i \qquad(3.3)\]
የት \(w_i = 1 / \pi_i\) . እንደ ኤክ. 3.3 የሚገልፀው የሆቨርስ-ቶምሰን ግመታ ከክብደት ምርጫ ጋር በተዛመደ የሚዛመዱ ናሙና ናሙና ማለት ነው. በሌላ አነጋገር አንድ ግለሰብ ናሙናው ውስጥ መካተት አለበት, ግምቱ በግምቱ ውስጥ መጨመር አለበት.
ቀደም ብሎ እንደተገለፀው, ተመራማሪዎች ብዙውን ጊዜ የመካተት እኩልነት ያላቸውን ሰዎች ይወክላል. ወደ ሚገባው እኩል የመሆን ዕድል ሊያስከትል ከሚችል ንድፍ ውስጥ አንዱ የተዘረዘሩ ናሙናዎች ናቸው , እሱም ሊረዱት የሚገባው, ምክንያቱም ከዳግላይቴጅ ከተሰየመው የግብአት አሰራር ጋር በቅርበት የተገናኘ ነው. በተራቀቀ ናሙና ውስጥ አንድ ተመራማሪ እምቅ ሰዎችን ወደ \(H\) እና \(H\) ሙሉ ለሙሉ ለብቻ እና ተያያዥ ቡድኖች ይለያል. እነዚህ ቡድኖች በኢኮኖሚም ተብለው እና እንደ አመልክተዋል ናቸው \(U_1, \ldots, U_h, \ldots, U_H\) . በዚህ ምሳሌ, ሕብረቱ (ስታንዳዎች) ስቴቶች ናቸው. የቡድኖቹ መጠኖች እንደ \(N_1, \ldots, N_h, \ldots, N_H\) . አንድ ተመራማሪ በክልል ደረጃ በቂ የሥራ እድል እንዳላቸው ለመለየት በእያንዳንዱ ደረጃ ክልል ውስጥ በቂ ሰዎች እንዳሏት ለመለየት በእውቀት የተሞሉ ናሙናዎችን መጠቀም ሊፈልጉ ይችላሉ.
አንዴ የህዝብ ቁጥር ወደ ሽፋኖች ከተከፋፈለ በኋላ, ተመራማሪው ምንም አይነት \(n_h\) ናሙና \(n_h\) ያለ ነባራዊ ናሙና ይመርጣል. በተጨማሪም, በቃ ናሙናው ውስጥ የተመረጡት ሁሉ ምላሽ ሰጪ (አሁን በቀጣዩ ክፍል ላይ እመለከታለሁ) ይባላል. በዚህ ጉዳይ ላይ የመካተት ዕድል
\[ \pi_i = \frac{n_h}{N_h} \mbox{ for all } i \in h \qquad(3.4)\]
ምክንያቱም እነዚህ ናሙናዎች ከአንድ ሰው ሊለያዩ ይችላሉ, ከእዚህ የናሙና ንድፍ ግምታዊ ግምታዊ ግምት በሚሰጡበት ጊዜ, ተመራማሪዎች እያንዳንዱን ምላሽ ሰጭ በሆቨት-ቶምሰን ግምቱ (ኢ.እ. 3.2) ተጠቅመው መጨመር ይጠበቅባቸዋል.
የሆቨርስ-ቶምሰን ትንበያ የማይለዋወጥ ቢሆንም ተመራማሪዎቹ ናሙናውን ከዋነኛ መረጃ ጋር በማጣመር ትክክለኛውን (ማለትም ዝቅተኛ ልዩነት) ግምት መስጠት ይችላሉ. አንዳንድ ሰዎች በትክክል ተፈፃሚነት በሚኖራቸው አጋጣሚዎች እንኳን ቢሆን ናሙና እንኳን ይህ እውነት መሆኑን የሚደንቁ ናቸው. እነዚህ ተጨማሪ ዘዴዎች ተጨማሪ መረጃን መጠቀም አስፈላጊዎች ናቸው, ምክንያቱ, በኋላ እንደምመሌው, ረዳት መረጃን ከማይደግፉት ናሙናዎች እና ከማይጋጩ ናሙናዎች ግምታዊ ግምቶች ለማግኘት ወሳኝ ነው.
ረዳት ላልቻይ መረጃዎችን ለመጠቀም አንድ የተለመደ ቴክኒክ በኋላ የሽርሽር አቀማመጥ ነው . ለምሳሌ አንድ ተመራማሪ በ 50 ግዛቶች ውስጥ ያለውን ወንድና ሴት ቁጥር እንደሚያውቅ አስቡ. እነዚህን የቡድን መጠኖች እንደ \(N_1, N_2, \ldots, N_{100}\) . ይህንን ተጨማሪ መረጃ ከናሙናው ጋር ለማጣመር ተመራማሪው ናሙናውን በ \(H\) ቡድኖች (በዚህ 100 ውስጥ) ሊከፋፍሉት ይችላል, ለእያንዳንዱ ቡድን ግምቱን ይለካሉ እና ከዚያም የእነዚህን ቡድኖች መካከለኛ አማካይ ይጠቀማል ማለት ነው:
\[ \hat{\bar{y}}_{post} = \sum_{h \in H} \frac{N_h}{N} \hat{\bar{y}}_h \qquad(3.5)\]
በእርግጠኝነት, የኢንጂየሉ ኢq. 3.5 ይበልጥ ትክክለኛ ሊሆን ይችላል ምክንያቱም የታወቀው የህዝብ መረጃን - \(N_h\) - ትክክለኛ ያልሆነ ናሙና ከተመረጠ ትክክለኛ ግምቶች. ስለማስብበት አንዱ መንገድ መረጃው ከተሰበሰበ በኋላ በኋላ ከላጣው የፀደቁ በኋላ መምጠሉ ነው.
በመጨረሻም, ይህ ክፍል የተወሰኑ ናሙናዎችን ንድፍ አውጥቷል-ነጠላ ተመርጦ ነጠላ ናሙናዎችን, ያልተጣራ እድል ናሙና, እና የተደረደሩ ናሙናዎች. በተጨማሪም ስለ ግምት ሁለት ዋና ሀሳቦችን ገልጧል. ይህም የሆቨት-ቶምሰን ግመፅ እና ከድል በኋላ መተንተር. ለትላልቅ ናሙና የዲዛይን ናሙናዎች (ዲዛይኖች ቅኝት) ንድፍ የበለጠ ትርጉም ለማግኘት, Särndal, Swensson, and Wretman (2003) የሚለውን ምዕራፍ 2 ይመልከቱ. ለትላልቅ ናሙናዎች ይበልጥ መደበኛ እና የተሟላ ጥንቃቄ ለማድረግ, Särndal, Swensson, and Wretman (2003) ክፍል 3.7 ይመልከቱ. የሆቨት-ቶምፕሰን ግምታዊ Overton and Stehman (1995) መግለጫ ቴክኒካል ገለፃ Overton and Stehman (1995) Horvitz and Thompson (1952) , Overton and Stehman (1995) , ወይም በ 2.8 (@) sarndal_model_2003 ይመልከቱ. Särndal, Swensson, and Wretman (2003) የበለጠ መደበኛ የሆነ ሕክምና ለማግኘት, Holt and Smith (1979) , Särndal, Swensson, and Wretman (2003) Smith (1991) , Little (1993) ወይም Särndal, Swensson, and Wretman (2003) .
በምላሹ ያልተነካ ሙከራ ናሙና
ሁሉም እውነተኛ የዳሰሳ ጥናቶች መልስ አልባ ናቸው. ያም ማለት ናሙናው ውስጥ ያለው እያንዳንዱ ሰው እያንዳንዱን ጥያቄ ይመልሳል. ሁለት አይነት ምላሽ የማይሰጡ ዓይነቶች አሉ- አለመስጠት እና ንጥል አለመታዘዝ . በምላሽ መልሶች ውስጥ, አንዳንድ ምላሽ ሰጪዎች አንዳንድ ነገሮችን አይመልሱም (ለምሳሌ, አንዳንድ ጊዜ ምላሽ ሰጪዎች ለሚሰነሷቸው ጥያቄዎች መመለስ አይፈልጉም). በአካባቢያዊ ምላሽን አለመሳካት ውስጥ ለዜናሙሩ የተመረጡ አንዳንድ ሰዎች ለስብሰባው ምላሽ አይሰጡም. ለተጠያቂነት ሁለት የተለመዱት ምክንያቶች ናሙናውን ማነጋገር አይቻልም, ናሙናው ተገናኝቶ ግን ለመሳተፍ እምቢ ማለት ነው. በዚህ ክፍል ላይ, በአማራዎች ላይ ያለ መልስ (Researance Response) ላይ አተኩራለሁ. መልስ ያልተሰጠበት ንጥል ፍላጎት ያላቸው አንባቢዎች ትንሹን እና ሩቢን (2002) .
ተመራማሪዎች ብዙውን ጊዜ በቢስክሌት ያልታሰበ ጥናት እንደ ሁለት ደረጃ አቀራረብ ቅኝት ጥናቶች ያስባሉ. በመጀመሪያ ደረጃ, ተመራማሪው እያንዳንዱ ሰው ማካተት \(\pi_i\) (እዚህ ላይ \(0 < \pi_i \leq 1\) የተመሰረተ ናሙና \(s\) ይመርጣል. ከዚያም, በሁለተኛው እርከን, ናሙና ውስጥ የተመረጡ ሰዎች በ probability \(\phi_i\) (በ \(0 < \phi_i \leq 1\) ) መልስ ይሰጣሉ. ይህ ሁለት-ደረጃ ሂደት በመጨረሻ መልስ ሰጪዎች ስብስብ \(r\) . በእነዚህ ሁለት ደረጃዎች መካከል ያለው ልዩነት ተመራማሪዎቹ ናሙናውን የመምረጥ ሂደትን ይቆጣጠራሉ, ግን ከነዚህ ውስጥ ናሙናዎች ምላሽ የሚሰጡትን አይቆጣጠሩም. እነዚህ ሁለት ሂደቶች በጋራ ሲሰሩ አንድ ሰው መልስ ሰጪ ሊሆን ይችላል
\[ pr(i \in r) = \pi_i \phi_i \qquad(3.6)\]
ለአነስተኛ ነገሩ, የመጀመሪያው ናሙና ንድፍ እራሱ ምንም ተተኪ ያልተደረገበት ነሲብ ነው. አንድ ተመራማሪ \(n_r\) የምላሽ \(n_r\) ምላሽ ሰጪዎችን \(n_r\) ና እና ተመራማሪው ምላሽ \(n_r\) እና \(n_s\) መጠነ-ሰፊ \(n_s\) ናሙና \(n_s\) ይሆናል:
\[ \mbox{bias of sample mean} = \frac{cor(\phi, y) S(y) S(\phi)}{\bar{\phi}} \qquad(3.7)\]
የት \(cor(\phi, y)\) ምላሽ ዝንባሌ እና ውጤት (ለምሳሌ, አጥነት ሁኔታ) መካከል ያለውን ህዝብ ትሰስር ነው \(S(y)\) ውጤት ያለውን ሕዝብ መደበኛ መዛባት ነው (ለምሳሌ, አጥነት / \(S(\phi)\) \(\bar{\phi}\) ያለው (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) \(\bar{\phi}\) (Bethlehem, Cobben, and Schouten 2011, sec. 2.2.4) .
ኢq. 3.7 የሚያሳየው ከዚህ በታች ከተዘረዘሩት ቅድመ-ሁኔታዎች አንዱን ካላሟላ መስተጋባችንን እንደማያሟላ ነው.
በሚያሳዝን ሁኔታ, ከእነዚህ ሁኔታዎች ውስጥ አንዳቸውም አይደሉም. በሥራ ስምሪት ሁኔታ ውስጥ ምንም ዓይነት ልዩነት አይኖርም ወይም የምላሽ ሀሳብ ልዩነት አይኖርም. ስለዚህም, የቁርአዊው ቃል eq. 3.7 እንግዲህ ቁርኝት: \(cor(\phi, y)\) . ለምሳሌ, ሥራ አጥ ከሆኑ ሰዎች የበለጠ ምላሽ የሚሰጡ ከሆነ, የሥራ አጥነት ምጣኔ ወደ ላይ ይወጣል.
ግምትን ግምት ውስጥ በማስገባት ላልተገመገመ መልስ መስጠት ረዳት ረዳት መረጃን መጠቀም ነው. ለምሳሌ, ረዳት ረዳት መረጃን መጠቀም የምትችልበት አንዱ መንገድ ከሽርሽር በኋላ (ከዚህ በላይ 3.5 ን ተመልከህ). ከዚህ በኋላ የድህረ ምጣኔ ግመፅ-ተመኖች ተቃራኒ-
\[ bias(\hat{\bar{y}}_{post}) = \frac{1}{N} \sum_{h=1}^H \frac{N_h cor(\phi, y)^{(h)} S(y)^{(h)} S(\phi)^{(h)}}{\bar{\phi}^{(h)}} \qquad(3.8)\]
የ \(cor(\phi, y)^{(h)}\) \(S(y)^{(h)}\) \(S(\phi)^{(h)}\) . እና \(\bar{\phi}^{(h)}\) (Bethlehem, Cobben, and Schouten 2011, sec. 8.2.1) የመሳሰሉ ከላይ ተተርጉሟል ግን በቡድን ውስጥ \(h\) ስለሆነም በእያንዳንዱ የድህረ-ግድግዳ ስብስብ ቡድን ውስጥ ያለው አድልዎ ትንሽ ከሆነ, የአጠቃላይ አድሏዊነት አነስተኛ ይሆናል. በእያንዳንዱ የፀደ-ሙቀት ማስተላለፊያ ቡድን ውስጥ አድሏዊነት (ዲዛይን) ለማሟላት ለማሰብ ሁለት አይነት መንገዶች አሉ. በመጀመሪያ, ጥቂት ምላሽ ሰጪ ዝንባሌ ( \(S(\phi)^{(h)} \approx 0\) ) እና ውጤቱ ( \(S(y)^{(h)} \approx 0\) ). ሁለተኛ, የሚያዩዋቸው ሰዎች የሚያዩዋቸው ሰዎች ልክ እንደ እርስዎ የማታዩዋቸው ሰዎች ያሉባቸው ቡድኖችን መፍጠር ያስፈልግዎታል ( \(cor(\phi, y)^{(h)} \approx 0\) ). ኢqን ማወዳደር. 3.7 እና eq. 3.8 ከደመቀ-ሙቀት ውጭ በሚደረጉ ምላሾች ምክንያት የሚከሰተውን የተዛባ አመለካከት ለመቀነስ ይረዳል.
በማጠቃለያም, ይህ ክፍል ምላሽ ሰጪዎችን ከግምት በማስገባት ለሚወክል ቅኝት ሞዴል አቅርቧል, እናም አለመዛባቱ ያለና በኋላ ከሽርሽላ ማስተካከያዎች ጋር ማስተዋወቅ አለመቻሉን አሳይቷል. Bethlehem (1988) ለአጠቃላይ ናሙና ናሙናዎች በመስተጋባጫ ምክንያት የተፈጠረውን አድልኦ ማስቀረት ይቻላል. መልስ ላለመስጠት ከዳግላይቴሽን ጋር በተያያዘ ተጨማሪ መረጃ ለማግኘት Smith (1991) እና Gelman and Carlin (2002) . የድህረ- Särndal and Lundström (2005) አጠቃላይ የቴክኒክ ዘዴዎች ውስጥ አንዱ ነው, የፀረ-ርዝመት ህክምናን Särndal and Lundström (2005) (2000) Zhang (2000) እና Särndal and Lundström (2005) -ርዝመት ህክምና. Kalton and Flores-Cervantes (2003) ሌሎች ማስተካከያዎችን ለማግኘት, Kalton and Flores-Cervantes (2003) , Brick (2013) እና Särndal and Lundström (2005) .
የማይፈተኑ ናሙናዎች
ያልተለወጡ ናሙናዎች በርካታ ልዩ ልዩ ንድፎችን ያካትታሉ (Baker et al. 2013) . በተለይ በ Xbox ተጠቃሚዎችን ናሙናዎች (W. Wang et al. 2015) ላይ በማተኮር, የናሙና ንድፍ ቁልፍ ክፍል \(\pi_i\) ሆኖም ግን \(\phi_i\) (ምላሽ ሰጪዎች ላይ ተመስርቶ ምላሽ ሰጪነት). ይሄ በተለምዶ እንዲህ አይደለም \(\phi_i\) የማይታወቅ. ሆኖም ግን, Wang እና ባልደረቦቹ እንደሚያሳዩት, እንደነዚህ ዓይነቶቹ አማራጮች-ከናሙና ክምችት ጋር በተዛመደ የሽፋን ሽፋን እንኳ ቢሆን, ተመራማሪው ጥሩ ረዳት መረጃዎችን እና ለእነዚህ ችግሮች የሚያስረዳ ጥሩ ስታትስቲክዊ ሞዴል ከሆነ ይህ አሰቃቂ አይሆንም.
Bethlehem (2010) ያለቀጠሮ እና የሽፋን ስህተቶችን ለማካተት ከዳግላይ ስትሪት ላይ ከላይ የተጠቀሱትን ብዙዎቹን ይዘግባል. ከድል-ደረጃ (stratification) በኋላ, (Ansolabehere and Rivers 2013; ??? ) ናሙናዎች ጋር የሚሰሩ ሌሎች ቴክኒኮች - እና (Ansolabehere and Rivers 2013; ??? ) ስህተቶች እና አለመዛመድ-ናሙና ማመሳከሪያዎች (Ansolabehere and Rivers 2013; ??? ) , (Ansolabehere and Rivers 2013; ??? ) ውጤት ነጥብ ክብደትን (Lee 2006; Schonlau et al. 2009) , እና መለካት (Lee and Valliant 2009) . ከነዚህ ዘዴዎች ውስጥ አንድ የጋራ ጭብጥ ረዳት ጋር የተያያዙ መረጃዎችን መጠቀም ነው.