اختباركاي مربع - اختبار جودة المطابقة

من Arab MM*Stat
اذهب إلى: تصفح، ابحث

اختباركاي مربع - اختبار جودة المطابقة,المثال الداعم لاستعمال توزيع كاي مربع ,مثال أخر لاجراء توزيع كاي مربع – اختبار جودة المطابقة



H100.gif 9.5 اختباركاي مربع - اختبار جودة المطابقة


يسمح لنا اختبار كاي مربع اختبار توزيع المجتمع المجهول للمتغير العشوائي X. افترضنا في

اجراءات الاختبار توزيع X يمكن وصفه (على الأقل بشكل تقريبي) بواسطة التابع الذي يحدد بعض العناصر (مثال: \mu و \sigma أو \pi و n)

نصمم اختباراتنا لنبين فيما اذا القيم النظرية المعينة لهذه العناصر المجهولة ستتطابق مع قيم العينة.

هدفنا الأن لنبين اذا البيانات ستطابق النموذج الاحتمالي المعين .

يبنى اختبار كاي مربع على العينة العشوائية البسيطة ويكون مستوى الدلالة \alpha ثابت قبل اجراء الاختبار.

نلاحظ اختبار كاي مربع يقدم المفهوم الوحيد لاختبار مطابقة النموذج الاحتمالي.

المتغير العشوائي X له التوزيع الاحتمالي F(x) , لا تفرض قيود على مستوى القياس X.

التوزيع الاحتمالي مجهول لكن توجد فرضيات حوله يشار لها بواسطة: F_{0}(x)


اذا X متغير عشوائي منقطع , نشير لمجموعة النتائج الممكنة بواسطة: x_{1}, \ldots, x_{k} , نعرف :


  • h\left( x_{j}\right)=h_{j} التكرار المطلق المشاهد الى x_{j} في العينة,

j=1,\ldots, k


  • P\left(X=x_{j}\right) احتمال X بفرض القيمة: x_{j}

j=1,\ldots , k.

اذا X متغير عشوائي مستمر,علينا تقسيم مجموعة النتائج الممكنة بشكل منفصل.

اذا k \geq 2 عدد الفئات, تعطى الفئات بواسطة التسلسل التالي الشامل للمجالات المنفصلة على التوالي:


Mmengjavaimg3129.gif

Mmengjavaimg3130.gif


نعرف لأجل الحالة المستمرة:


  • h\left(x_{j-1}^* < X\leq x_{j}^*\right)=h_{j} التكرار المطلق المشاهد للفئة j في العينة, j=1,\ldots , k,


  • P\left( x_{j-1}^*<X\leq x_{j}^*\right)احتمال X بفرض القيم ضمن الفئة j , \left(x_{j-1}^*, x_{j}^*\right)

j=1,\ldots , k.


H100.gif الفرضيات


تبين الفرضية الصفرية لاختبار جودة المطابقة بأن النموذج الاحتمالي المفروض يصف بدقة توزيع

البيانات في المجتمع , تحتوي الفرضية البديلة على رفض هذا الادعاء. بتطبيق اختبار كاي مربع

باستعمال المصطلحات فوق, يصاغ الاختبار كالتالي:


X منقطع :


H_{0}:\; P\left(X=x_{j}\right) = p_{j} \quad \forall j=1, \ldots,k


مقابل


H_{1}:\; P\left( X=x_{j}\right) \neq p_{j} \quad \mbox{ for at least one j}


X مستمر :


H_{0}:\; P\left( x_{j-1}^{*}<X\leq x_{j}^{*}\right) = p_{j} \quad \forall j=1, \ldots, k

مقابل

H_{1}:\; P\left(x_{j-1}^{*}<X\leq x_{j}^{*}\right) \neq p_{j}\quad \mbox{ for at least one  j}


في كلا الحالتين يعرف p_{j} احتمال X بفرض القيمة x_{j} (أو تقع في فئة j) \left(x_{j-1}^{*}, x_{j}^{*} \right)

نعطي الفرضية الصفرية لتكون صحيحة وحينئذ F_{0}(x) التوزيع الاحتمالي الصحيح :


p_{j}=P\left( X=x_{j}| H_{0}\right) \quad \mbox{ bzw.} \quad p_{j}=P\left( x_{j-1}^{*}<X\leq x_{j}^{*}| H_{0}\right)




كيف نحسب p_{j}


تابع التوزيع العددي المحدد بشكل كامل:


تحسب القيمة p_{j} بسهولة اذا التوزيع النظري هو التابع المحدد بشكل كامل, اذا F_{0}(x) عنصر في بعض الفئة العددية, تكون كل العناصر معلومة.

مثال: X له توزيع بواسون PO(\lambda) مع العنصر المعطى \lambda


تابع التوزيع العددي المحدد بشكل جزئي:


اذا التوزيع النظري يعود للعائلة العددية التي تتضمن عنصر أو أكثر , أو على الأقل عنصر مجهول , سنقدر قبل حساب p_{j}

مثال: نريد اختبار X اذا له التوزيع الطبيعي N(\mu, \sigma) حيث

التوقع \mu والتباين \sigma مجهولان .


نريد تقدير هذه العناصر باستعمال المعلومات بواسطة العينة للحصول على تابع التوزيع المحدد بشكل كامل ونحسب الاحتمالات النظرية p_{j}


التوزيع التكراري: تبين الفرضية الصفرية أن النموذج الاحتمالي النظري في صيغة التوزيع التكراري العددي.

مثال : سيأخذ المتغير العشوائي X القيم الممكنة الأربعة مع الاحتمالات المرتبطة p_{1}=0,2,\; p_{1}=0,4,\; p_{1}=0,1 و p_{1}=0,3 .


H100.gif الاختبار الاحصائي وتوزيعه , مجالات القرار


مفاهيم الاختبارات لتقارن الاحتمالات النظرية المشتقة من التوزيع النظري المذكور في الفرضية الصفرية مع التكرارات النسبية المشاهدة.

يبنى الاختبار الاحصائي على التكرارات المطلقة المشاهدة h_{j}. نسحب عينة ما من الحجم n , نحسبهم كتكرارات للحوادث \left\{ X=x_{j}\right\} على التوالي \left\{ x_{j-1}^*<X\leq x_{j}^*\right\}

تشكل مجموعة كل التكرارات المطلقة h_{j} توزيع العينات, هي عشوائية لأن العينة العشوائية تنشأ من التجربة العشوائية .

نعتبر لذلك التكرارات المطلقة h_{j} كقيم فعلية للمتغيرات المشاهدة H_{j}.

اذا الفرضية الصفرية صحيحة, تعطى القيم المتوقعة للتكرارات النسبية في العينة بواسطة الاحتمالات p_{j}.

التوقعات للتكرارات المطلقة هي: np_{j}.

المقارنة بين التكرارات المشاهدة والمتوقعة تتركز حول الفروق H_{j}-np_{j},\;(j=1,\ldots ,k)

الطريقة لتعزيز الاختلافات حول النتائج الممكنة (الفئات) تشرح من خلال الاختبار الاحصائي التالي:


V=\sum_{j=1}^{k}\frac{\left( H_{j}-np_{j}\right)^{2}}{np_{j}}


تحت الفرضية H_{0}, V له توزيع كاي مربع مع درجة الحرية f = k - m- 1.


الشروط التقريبية:


يفرض التقريب ليكون كافي اذا:


  • np_{j}\geq 1 لأجل كل j و


  • np_{j}\geq 5 على الأقل 80% من التكرارات المطلقة المتوقعة.


الوسيلة لضمان تطبيق اختبار كاي مربع عندما لا تفي هذه الشروط في المجموعة الأصلية لتجمع الفئات المتجاورة للفئات الكبيرة.

كاحتمالات نظرية ثابتة p_{j}, سينتج دائما الزيادة في حجم العينة n التحسين في دقة التقريب.

لتحديد درجة الحرية نأخذ الحالتين في الاعتبار :


  • k عدد الفئات بعد التركيب الضروري الممكن للفئات.
  • m عدد العناصر التي تقدر من العينة لتحديد التوزيع , اذا التوزيع الاحتمالي يفرض في H_{0} يحدد بشكل كامل, m = 0 هو الصفر.


نلاحظ \left(H_{j}-np_{j}\right)^{2}/np_{j} لا يمكن أن تكون سالبة, الاختبار الاحصائي V كمجموع هذه النسب تفرض فقط قيم موجبة.

تحول الانحرافات الكبيرة (المطلقة) H_{j}-np_{j} لقيم موجبة عالية لقيمة الاختبار الاحصائي , يؤدي ذلك لزيادة الامكانية لرفض H_{0}.

كقيم عالية للاختبار الاحصائي يقود لرفض الفرضية الصفرية , اختبار كاي مربع هو الاختبار الأحادي الجانب الأيمن لأجل القيمة الحرجة c

P(V \leq c) = 1 - \alpha لأجل درجة الحرية المعطاة المأخوذة من جدول تابع التوزيع لكاي مربع .


تكون مجالات القرارات:


مجال الرفض لأجل H_{0}:


\left\{v|v>\chi_{1-\alpha ;f}^{2}\right\}.


مجال القبول لأجلH_{0}:


\left\{ v|v\leq \chi_{1-\alpha ;f}^{2}\right\}.


نفرض احتمال القيمة V من مجال الرفض لأجل H_{0} , باعطاء H_{0} صحيحة ومساوية لمستوى الدلالة \alpha =P\left( V>\chi_{1-\alpha ;k-m-1}^{2}|H_{0}\right)


يقع احتمال V في مجال القبول للفرضية H_{0}

P\left(V\leq \chi_{1-\alpha;k-m-1}^{2}|H_{0}\right)=1-\alpha.


S2 54 2.gif


مجال الرفض H_{0} مجال القبول | H_{0}



H100.gif العينة وحساب الاختبار الاحصائي


لدينا العينة العشوائية من الحجم n , نحسب التكرارات المطلقة h_{j},

ستقدر العناصر المجهولة في التوزيع النظري ونحسب التكرارات المطلقة المتوقعة np_{j}

باستبدال هذه المعطيات في صيغة الاختبار الاحصائي نعطي قيمة الاختبار الاحصائي v.


H100.gif قرار الاختبار والتعاريف


اذا v تقع في مجال الرفض للفرضية H_{0}, سنرفض الفرضية الصفرية على أساس العينة العشوائية من الحجم n ومستوى الدلالة \alpha


في هذه الحالة يظهر الباحث احصائيا بأن توزيع المجتمع للمتغير العشوائي X يعطى بواسطة F_{0}(x)

رفض الفرضية الصفرية يصنع للباحثين موضوع خطر خطأ النوع الأول.


اذا v تشاهد ضمن مجال القبول , نقبل الفرضية الصفرية على أساس العينة الجزئية من الحجم n لأجل مستوى الدلالة المعطاة \alpha.

وهذا يضعنا في حالة عمل خطأ النوع الثاني .