اختبار استقلال كاي مربع

من Arab MM*Stat
اذهب إلى: تصفح، ابحث

اختبار استقلال كاي مربع,المثال الداعم لاستعمال اختبار كاي مربع للاستقلال,مثال أخر: اختبار كاي مربع للاستقلال



H100.gif 9.6 اختبار استقلال كاي مربع


يسمح لنا اختبار كاي مربع للاستقلال لاختبار الاستقلال الاحصائي . نفرض المتغيرين العشوائيين X و Y المشاهدة على العناصر الاحصائية (i=1,\ldots ,n) .

الأزواج المشاهدة مستقلة (العينة العشوائية البسيطة) اذا X و Y متغيرات عشوائية منقطعة , تشاهد بالقيم الحقيقية x_{k}(k=1,\ldots ,K) على التوالي y_{j},\;(j=1,\ldots ,J) اذا X و Y متغيرات مستمرة.

يقسم فضاء العينة لفئات منفصلة (مجالات) في هذه الحالة x_{k},\;(k=1,\ldots ,K) و y_{j},\;(j=1,\ldots ,J)

تشير للقيم الممثلة ضمن الفئات . (عادة مراكز الفئات) و J و K تشير للعدد الاجمالي للفئات.

التمثيل المناسب للتوزيع التكراري المشترك المشاهد هو الجدول التكراري الثنائي البعد .

الجدول التكراري الثنائي البعد:


x\quad y y_{1} \cdots y_{j} \cdots y_{J} RV x
x_{1} h_{11} \cdots h_{1j} \cdots h_{1J} h_{1\bullet}
\vdots \vdots \cdots \vdots \cdots \vdots \vdots
x_{k} h_{k1} \cdots h_{kj} \cdots h_{kJ} h_{k\bullet}
\vdots \vdots \cdots \vdots \cdots \vdots \vdots
x_{K} h_{K1} \cdots h_{Kj} \cdots h_{KJ} h_{K\bullet}
RV x h_{\bullet 1} \cdots h_{\bullet j} cdots h_{\bullet J} h_{\bullet\bullet}=n



هنا \,h_{kj} تشير للتكرار المطلق للزوج المشاهد \left( x_{k},y_{j}\right), بمعنى: X تفرض x_{k} أو القيمة من فئة k و Y تفرض y_{j} أو القيمة من فئة j


h_{kj}=h\left( \left\{ X=x_{k}\right\}\cap\left\{ Y=y_{j}\right\} \right)\; ; \quad k=1, \ldots,K, \quad j=1,\ldots , J



يحتوي العمود الأخير التوزيع الهامشي المشاهد الى X المكون للتكرارات الهامشية المطلقة h_{k\bullet}=h\left(X=x_{k}\right)\;;k=1,\ldots ,K.

نشير للتكرارات مع X شوهد في x_{k}(مركز الفئة) المتعلق بقيمة Y

نجد في السطر الأخير التوزيع الهامشي المشاهد الى Y المعطى بواسطة التكرارات الهامشية المطلقة h_{j\bullet }=h\left( Y=y_{j}\right)\;;j=1,\ldots ,J

تكرارات Y مشاهدة في y_{j} تبعا الى X.

تستخدم التعريفات التالية لبناء الجدول التكراري الثنائي البعد:



h_{k\bullet }=\sum_{j=1}^{J}h_{kj}\;;\quad k=1,\ldots ,K;

h_{\bullet j}=\sum_{k=1}^{K}h_{kj}\;;\quad j=1,\ldots ,J;

h_{\bullet \bullet }=\sum_{k=1}^{K}h_{k\bullet }=\sum_{j=1}^{J}h_{\bullet j}=\sum_{k=1}^{K}\sum_{j=1}^{J}h_{kj}=n.


H100.gif الفرضيات


تفرض الفرضية الصفرية في اختبار كاي مربع للاستقلال أن X و Y مستقلة احصائيا, تنفي الفرضية البديلة هذا.


H_{0}:

X و Y مستقلين احصائيا مقابل :


H_{1}:


X و Y ليسا مستقلين احصائيا .


اذا الفرضية الصفرية صحيحة , تعطى قاعدة الضرب للحوادث المستقلة:


P\left( X=x_{k}\right\}\cap\left\{ Y=y_{j}\right)=P\left( X=x_{k}\right)\cdot P\left( Y=y_{j}\right)=p_{k\bullet}\cdot p_{\bullet j}= p_{kj}


في الصيغة فوق:

p_{kj} تشير لاحتمال X بفرض x_{k} و Y بفرض y_{j} .

p_{k\bullet}هو احتمال X المشاهد في x_{k} على التوالي لفئة k(الاحتمالات الهامشية الى X )

p_{\bullet j} احتمال Y بفرض القيمة Y_{i} أو المشاهدة في فئة j (الاحتمالات الهامشية الى Y


لهذا سيكتب زوج الفرضيات:


Mmengjavaimg3364.gifH


مقابل


Mmengjavaimg3365.gif H


لأجل زوج واحد على الأقل.

بشكل عام مستوى الدلالة \alpha وحجم العينة n يكونان ثابتان قبل تطبيق الاختبار.



H100.gif الاختبار الاحصائي وتوزيعه , مجالات القرار


لما يبنى الاختبار على المقارنة بين التكرارات المطلقة المشاهدة والتكرارات المطلقة المتوقعة تحت فرض الفرضية الصفرية , يبنى الاختبار الاحصائي حول التكرارات المطلقة .

كعينة مشاهدة تلخص في الجدول التقاطعي في عبارات التكرارات المطلقة المشتركة h_{kj}\;(k=1,\ldots ,K\;j=1,\ldots J).

هذه المقادير هي مخرجات للتجربة العشوائية , نشير للمتغيرات العشوائية بواسطة H_{kj}.

اذا الفرضية الصفرية صحيحة , التكرارات المشتركة المتوقعة هي e_{kj}=n\cdot p_{k\bullet}\cdot p_{\bullet j}

الاحتمالات المشتركة p_{kj} و الاحتمالات الهامشية p_{k\bullet } و p_{\bullet j} مجهولة ويجب تقديرها من العينة.

المقدرات غير المتحيزة والفعالة لأجل p_{k\bullet } و p_{\bullet j}

هي التكرارات الهامشية النسبية f_{k\bullet}=h_{k\bullet }/n و f_{\bullet j}=h_{\bullet j}/n.

هذا يتضمن بأننا نفرض التكرارات الهامشية الثابتة في الجدول التقاطعي الثنائي البعد.

تعطى تقديراتنا للتكرارات المطلقة المشتركة المتوقعة تحت الفرضية H_{0} بواسطة:


\widehat{e}_{kj}=n\cdot f_{k\bullet }\cdot f_{\bullet j}=n\cdot \frac{h_{k\bullet}}{n}\cdot \frac{h_{\bullet j}}{n}=\frac{h_{k\bullet }\cdot h_{\bullet j}}{n}


المقارنة بين التكرارات المطلقة المشتركة في العينة والمتوقعة تحت فرض الفرضية الصفرية تبنى على الفروق H_{kj}-\widehat{e}_{kj}\;(k=1,\ldots,K;\;j=1,\ldots J)


الاختبار الاحصائي لهذه الفروق هو مجموع:


V=\sum_{k=1}^{K}\sum_{j=1}^{J}\frac{\left( H_{kj}-\widehat{e}_{kj}\right)^{2}}{\widehat{e}_{kj}}


تحت الفرضية H_{0} يقرب الاختبار الاحصائي V لتوزيع كاي مربع مع درجة الحرية f = (K - 1)(J - 1)

يكون التقريب كافي اذا \widehat{e}_{kj}\geq 5 لأجل أزواج k,\; j .

عندها هذه الشروط غير كافية , نضيف القيم الفعلية (أو الفئات) لنركب مجموعات أكبر من المشاهدات الممكنة.

تشير K و J لأعداد الفئات في كلا المتغيرين.


القيمة الحرجة c عند P(V \leq c) = 1- \alpha , تشاهد في جدول تابع التوزيع لكاي مربع التجميعي مع درجات الحرية (J-1)(K-1)


مجالات القرار هي :


مجال الرفض للفرضية H_{0}:


\;\left\{ v|v>\chi_{1-\alpha ;(K-1)\cdot \left( J-1\right)}^{2}\right\}


مجال القبول للفرضية H_{0}:


\;\left\{ v|v\leq \chi_{1-\alpha ;(K-1)\cdot\left(J-1\right)}^{2}\right\}


تحت الفرضية الصفرية نفرض احتمال الاختبار الاحصائي V القيمة من مجال الرفض للفرضية H_{0} والمساوي لمستوى الدلالة \alpha = P(V > \chi_{1-\alpha}^{2}|f | H_{0})

يشاهد احتمال الاختبار الاحصائي V في مجال القبول للفرضية H_{0}


P(V \leq \chi_{1-\alpha}^{2};f | H_{0})=1-\alpha.


S2 55 7.gif


H100.gif العينة وحساب الاختبار الاحصائي


بعد سحب حجم العينة n ستسحب التكرارات المطلقة h_{kj} لكل الأزواج الفعلية المشاهدة \left( x_{k},y_{j}\right)

يمكننا تعزيز التكرارات الهامشية التجريبية لأجل X و Y ونشتق التكرارات المطلقة المتوقعة \widehat{e}_{kj}

طبقا للصيغة في الأعلى. اذا خالفنا شروط التقريب يتطلب ذلك مزيد من التبويب.

والتكرارات h_{kj}, h_{k\bullet }, h_{\bullet j} و \widehat{e}_{kj} سيعاد حسابها .

بادخال h_{kj} و \widehat{e}_{kj} لصيغة الاختبار الاحصائي تنتج قيمة الاختبار الاحصائية الفعلية V .


H100.gif قرار الاختبار والتعاريف


اذا v تقع في مجال الرفض للفرضية H_{0}. سنرفض الفرضية الصفرية على أساس العينة العشوائية من الحجم n عند مستوى الدلالة \alpha.

في هذه الحالة لا يمكننا اظهار المتغيرات العشوائية X و Y مستقلة احصائيا.

بذلك عمل خطأ النوع الأول احتمال العينات المعادة (الاختبارات) تساوي لمستوى الدلالة \alpha.

اذا v تقع في مجال القبول للفرضية H_{0} سنقبل الفرضية الصفرية على أساس العينة العشوائية من الحجم n

لاتتعارض العينة احصائيا مع فرض الاستقلال عمل خطأ النوع الثاني في هذه الحالة اذا الفرضية البديلة صحيحة .