مقاييس التشتت أو التباين

من Arab MM*Stat
اذهب إلى: تصفح، ابحث

المحتويات ,لتمثيل البياني للتوزيع أحادي البعد ,عناصر المقياس ,عناصر المقياس 1

H100.gif 2.6مقاييس التشتت أو التباين


عادة لا تكون مقاييس النزعة المركزية المتنوعة في الأقسام السابقة كافية للتمثيل الجيد للبيانات الأحادية البعد. نوضح كالتالي :

الانفاق الشهري لوقت الفراغ والعطل (بالمارك الألماني):



تعرض البيانات لعشر عائلات من شخصين : 210,250,340,360,400,430,440,450,530,630 على المحور:


Folimg133.gif


تعرض البيانات للعائلات العشر من أربع أشخاص :340,350,360,380,390,410,420,440,460,490 على المحور :



Folimg134.gif




الوسط الحسابي Mmengjavaimg371.gif في كلا الحالتين مساوي الى 404 مارك ألماني , لكن الشكلين البيانيين يظهران اختلافات مرئية ما بين التوزيعين . للعائلات من أربع أشخاص تكون القيم متمركزة أكثر حول المركز (في هذه الحالة الوسط) من العائلات لشخصين , بمعنى الانتشار أو التباين يكون صغير .


تنظم مقاييس التشتت تغير البيانات . بالاضافة الى مقاييس النزعة المركزية (كالوسط , الوسيط والمنوال). تزود الوصف المقبول للبيانات الأحادية البعد, بشكل بديهي ,نريد قياسات التشتت التي لها نفس الخاصة اذا نفس الثابت يضاف لكل من نقاط البيانات, سيكون القياس غير متأثر. الخاصة الثانية اذا البيانات تنتشر بعيدة بشكل مفرد , كمثال عبر الضرب بواسطة ثابت أكبر من 1 , سيزداد القياس.


H100.gif المدى

المدى هو المقياس الأبسط للتشتت :

(1) للبيانات غير المبوبة : يعرف المدى (R) بالفرق مابين القيمة المشاهدة العليا و الصغرى


Mmengjavaimg372.gif


حيث Mmengjavaimg373.gif القيم المرتبة , بمعنى الاحصاءات المرتبة.


(2)البيانات المبوبة : للبيانات المبوبة , يعرف المدى (R) بالفرق مابين الحد الأعلى للفئة الأخيرة (الأعلى)Mmengjavaimg374.gif والحد الأدنى للفئة الأولى (الأصغر) Mmengjavaimg375.gif :


Mmengjavaimg376.gif


الخواص :

للتحويل الخطي لدينا: Mmengjavaimg377.gif


نلاحظ بأن اضافة الثابت Mmengjavaimg378.gif لا تغير البيانات ولا تؤثر على مقاييس التشتت.


H100.gif المدى الربيعي

المدى الربيعي هو الفرق مابين الربيع الثالث Mmengjavaimg379.gif والربيع الأول Mmengjavaimg380.gif:


Mmengjavaimg381.gif


المدى الربيعي : هو عرض المنطقة المركزية التي تستحوذ على 50% من البيانات المشاهدة .

يتعلق المدى الربيعي بالوسيط المعرف كالتالي : Mmengjavaimg382.gif


الخواص


الانحياز نحو القيم المتطرفة


التحويل الخطي: Mmengjavaimg383.gif


اضافة الثابت Mmengjavaimg378.gif ثانية لا يؤثر على مقاييس التشتت.


H100.gif الانحراف المتوسط المطلق (MAD)


يدعى متوسط الانحرافات المطلقة للقيم الملاحظة عن نقطة ثابتة Mmengjavaimg384.gif بالانحراف المتوسط المطلق ويحدد بواسطة Mmengjavaimg385.gif . تكون النقطة الثابتة Mmengjavaimg386.gif أي قيمة. عادة هي مختارة لتكون واحدة من مقاييس النزعة المركزية , بشكل نموذجي الوسط الحسابي Mmengjavaimg312.gif أو الوسيط Mmengjavaimg282.gif.


كما مع المدى والمدى الربيعي , اضافة نفس الثابت لكل البيانات , الضرب بعدد ثابت ينقل القياس بواسطة القيمة المطلقة لنفس الثابت. كل من الصيغ في الأسفل يمكن أن تستخدم للبيانات غير المبوبة. اذا البيانات مبوبة سنستعمل الصيغة الثانية حيث Mmengjavaimg33.gif مراكز الفئات ,Mmengjavaimg387.gif و Mmengjavaimg388.gif التكرارات المطلقة والنسبية :


Mmengjavaimg389.gif


Mmengjavaimg390.gif


الخواص :


تتضمن الخاصة المثالية للوسيط بأن الوسيط هو القيمة التي تصغر الانحراف المتوسط المطلق . لهذا أي قيمة أخرى مستبدلة Mmengjavaimg386.gif فوق , ستنتج قيمة أكبر لهذا القياس .


مثال :


القيم المشاهدة : 2,5,9,20,22,23,29


Mmengjavaimg391.gif


Mmengjavaimg392.gif


للتحويل الخطي للبيانات : Mmengjavaimg393.gif



H100.gif التباين والانحراف المعياري


ندعو متوسط الانحرافات المربعة للقيم المشاهدة عن نقطة ثابتة معينة Mmengjavaimg386.gif بمتوسط خطأ المربعات (MSE) أو الانحراف المتوسط المربع .تكون النقطة Mmengjavaimg386.gif مختارة.


Mmengjavaimg394.gif


Mmengjavaimg395.gif


التباين


اذا اخترنا النقطة Mmengjavaimg386.gif لتكون الوسط الحسابي Mmengjavaimg312.gif , عندئذ يدعى MSE يدعى بالتباين . سيرمز لتباين القيم المشاهدة Mmengjavaimg396.gif ويحسب كالتالي:


Mmengjavaimg397.gif


Mmengjavaimg398.gif


الانحراف المعياري :


يعرف الانحراف المعياري ( Mmengjavaimg399.gif ) بالجذر التربيعي للتباين .


Mmengjavaimg400.gif


Mmengjavaimg401.gif



التباين Mmengjavaimg396.gif (وكذلك أيضا الانحراف المعياري Mmengjavaimg399.gif) دائما أكبر من أو يساوي 0 . يشير التباين الصفري بأن جميع البيانات المشاهدة متطابقة ولهذا لا يوجد أي انتشار .


الخواص:


متوسط خطأ المربعات الى Mmengjavaimg312.gif (التباين) أصغر من متوسط خطأ المربعات الى أي قيمة أخرى Mmengjavaimg386.gif . ستبرهن هذه النتيجة كالتالي :


Mmengjavaimg402.gif


Mmengjavaimg403.gif


Mmengjavaimg404.gif


تختفي العبارة المتوسطة للخط المتوسط بأن Mmengjavaimg405.gif , تضمن هذه الصيغ أن متوسط خطأ المربعات Mmengjavaimg406.gif دائما أكبر من أو يساوي التباين. بوضوح تبقى المساواة فقط اذا Mmengjavaimg407.gif


مثال :


القيم المشاهدة : 2,5,9,20,22,23,29


Mmengjavaimg408.gif


Mmengjavaimg409.gif


للتحويل الخطي يكون لدينا: Mmengjavaimg410.gif


المعياري: بطرح الوسط الحسابي والتقسيم على الانحراف المعياري نخلق مجموعة بيانات جديدة فيها الوسط الحسابي مساوي للصفر والانحراف المعياري مساوي للواحد. لدينا: Mmengjavaimg411.gif , حيث Mmengjavaimg412.gif عندئذ


Mmengjavaimg413.gif


Mmengjavaimg414.gif



النظرية (الاشتراك) :


نفرض أن القيم المشاهدة (البيانات ) مقسمة الى Mmengjavaimg415.gif مجموعات مع Mmengjavaimg416.gif مشاهدات . نفرض الأوساط الحسابية والتباينات في هذه المجموعات معروفة . للحصول على التباين .Mmengjavaimg396.gif للبيانات المركبة نستعمل  :


Mmengjavaimg417.gif


Mmengjavaimg418.gifالأوساط الحسابية في المجموعات


Mmengjavaimg419.gif التباينات في المجموعات


Mmengjavaimg420.gif عدد المشاهدات في المجموعات ,Mmengjavaimg421.gif


تحليل التباين :


توضح الصيغة أعلاه أن التباين ينقسم لجزئيين :

التباين الاجمالي = التباين داخل المجموعات + التباين مابين المجموعات


معامل التباين : لكي نقارن الانحرافات المعيارية للتوزيعات المختلفة , نقدم المقياس النسبي للتباين (النسبة للوسط الحسابي), والذي يدعى بمعامل التباين . يعبر معامل التباين عن التباين كنسبة مئوية للوسط الحسابي :


Mmengjavaimg422.gif


مثال:


لدينا قيم الوسط الحسابي والانحرافات المعيارية لمجموعتين من المشاهدات :


Mmengjavaimg423.gif


Mmengjavaimg424.gif


بمقارنة الانحرافات المعيارية, نقرر أن التباين في مجموعة البيانات الثانية أكبر ثلاث مرات من التباين في المجموعة الأولى. لكن في هذه الحالة سيكون ملائم أكثر مقارنة معاملات التباين, بما أن البيانات لها أوساط حسابية مختلفة جدا :


Mmengjavaimg425.gif


Mmengjavaimg426.gif


الانتشار النسبي (معامل التباين) لكلتا مجموعتي البيانات هو نفسه .