العلاقة بين المتغيرات المستمرة (الارتباط , معاملات الارتباط)

من Arab MM*Stat
اذهب إلى: تصفح، ابحث

العلاقة بين المتغيرات المستمرة (الارتباط , معاملات الارتباط),مثال للعلاقة بين المتغيرين العددين


H100.gif 10.6العلاقة بين المتغيرات المستمرة (الارتباط , معاملات الارتباط)


يحدد التباين المشترك للمتغيرين المستمرين X و Y قوة العلاقة ما بين المتغيرين.

في الخطوة الأولى: نطرح المشاهدات للوسط الحسابي


{x_{i}^*}=x_{i}-\bar{x}

{y_{i}^*}=y_{i}-\bar{y}


التباين المشترك لكلا المتغيرين هو جداء الانحرافات للمشاهدات عن أوساطهم الحسابية.


\sum_{i=1}^{n} {x_{i}^*}{y_{i}^*}=\sum_{k=1}^{n}(x_{i}-\bar{x})(y_{i}- \bar{y})


اذا الوسط الحسابي لواحد من هذه المتغيرات 8 والقيمة المشاهدة 10 وقيمة الوسط الحسابي لمتغير أخر هو 1,008 والقيمة المشاهدة 1,260

بالرغم من انحراف القيمة الأولى هو 2 وانحراف القيمة الثانية 252 .

الانحراف النسبي لقيمة الوسط الحسابي لكلا الحالتين هو 25% في العموم لن يشاهد هذا اذا حسبنا ببساطة التباين المشترك لهذه المشاهدة 504.

لذلك للحصول على الانحرافات المشابهة للمتغيرات نختبر الشرط المعياري (x_{i}-\bar{x})/s_{x} و (y_{i}-\bar{y})/s_{y}.

الأن نغير المعادلة فوق الى:


\sum_{i=1}^{n}\frac{(x_{i}-\bar{x})}{s_{x}}\frac{(y_{i}-\bar{y})}{s_{y}}


نقسم بعد ذلك مجموع الجداء بواسطة عدد المشاهدات لاستبعاد تأثيرها. الأن نحصل على معامل الارتباط البسيط بيرسون الذي يقيس قوة العلاقة الخطية ما بين المتغيرين المستمرين X و Y ويعطى بواسطة :


r_{yx}=r_{xy}=\frac{\sum_{i=1}^{n}\limits(x_{i}-\bar{x})(y_{i}-\bar{y})}{n\cdot s_{x}\cdot s_{y}}=\frac{s_{xy}}{s_{x}\cdot s_{y}}



تظهر الأجزاء النهائية للمعادلة فوق أن معامل الارتباط بيرسون يساوي للتباين المشترك لكلا المتغيرين X و Y مقسما على جداء الانحرافات المعيارية لكل متغير.

يمكن كتابة معامل الارتباط بيرسون بشكل أخر:


r_{yx}=\frac{\sum_{i=1}^{n}\limits(x_{i}-\bar{x})(y_{i}-\bar{y})}{\sqrt{\sum_{i=1}^{n}\limits(x_{i}-\bar{x})^{2}\sum_{i=1}^{n}\limits(y_{i}-\bar{y})^{2}}}


r_{yx}=\frac{n\sum_{i=1}^{n}\limits x_{i}y_{i}-\sum_{i=1}^{n}\limits x_{i}\sum_{i=1}^{n}\limits y_{i}}{\sqrt{\left[ n\sum_{i=1}^{n}\limits{x_{i}}^{2}-{\left( \sum_{i=1}^{n}\limits x_{i}\right) }^{2}\right]\left[ n\sum_{i=1}^{n}\limits{y_{i}}^{2}-{\left(\sum_{i=1}^{n}\limits y_{i}\right) }^{2}\right] }}


خواص معامل الارتباط:


  • يأخذ معامل الارتباط فقط القيم ما بين -1و + 1

-1\leq r_{xy}\leq +1


  • تخبرنا اشارة معامل الارتباط عن اتجاه العلاقة الخطية:


"+" تطابق للارتباط الموجب.

"-" تطابق للارتباط السالب.


  • اذا كل المشاهدات تقع بالضبط على خط مستقيم يكون معامل الارتباط مساوي للواحد.


  • اذا المتغيرين X و Y مستقلين عندئذ معامل الارتباط مساوي للصفر.

من جهة أخرى : اذا معامل الارتباط مساوي للصفر يعني بأنه لا وجود لعلاقة خطية ما بين المتغيرين X و Y (الاستقلال الخطي).

لكنه من الممكن جدا وجود علاقة غير خطية ما بين المتغيرين.


  • معامل الارتباط متناظر: r_{xy}=r_{yx}


علاقة الارتباط والشكل البياني للمتغيرين X و Y


الارتباط التام:

معامل الارتباط = |1|

Folimg250.gif


Folimg251.gif


الارتباط القوي: معامل الارتباط  > |0,5|


Folimg252.gif


Folimg253.gif


الارتباط الضعيف: معامل الارتباط  <|0,5|


Folimg254.gif


Folimg255.gif


لا ارتباط معامل الارتباط = 0.


Folimg256.gif


مثال:


لدينا 15 شركة نشاهد المتغيرات :

Yالربح السنوي مليون يورو و X : الايجار السنوي لتشغيل الكمبيوتر (بالألف يورو).

يمكن مشاهدة قيم متغيراتهم في الجدول التالي ونلخصهم بيانيا في الشكل البياني التالي:



الشركة الربح السنوي الايجار السنوي
i y_{i} x_{i}
1 10 30
2 15 30
3 15 100
4 20 50
5 20 100
6 25 80
7 30 50
8 30 100
9 30 250
10 35 180
11 35 330
12 40 200
13 45 400
14 50 500
15 50 600


Folimg257.gif


REngine.php: <!--- Start of program --->
Error: unexpected '<' in "<"
Execution halted
in

pdf(rpdf, width=7)

x <- c(10, 15, 15, 20, 20, 25, 30, 30, 30,35,35,40,45,50,60)

y <- c(30, 30, 100, 50, 100, 80, 50, 100, 250,180,330,200,400,500,600)

reg <-lm( y ~ x) plot(x,y) abline(reg) </R


من المشاهدات نحصل على النتائج التالية :


{| |<math>\overline{y}=30(Mio.DM)</math>, |<math>\sum_{i=1}^{15}\limits(y_{i}-\overline{y})^{2}=2250</math> |- |<math>\overline{x}=200(1000DM)</math>, |<math>\sum_{i=1}^{15}\limits(x_{i}-\overline{x})^{2}=457000</math> |}

<math>\sum_{i=1}^{15}\limits(x_{i}-\overline{x})(y_{i}-\overline{y})=28100</math>

<math>r_{xy}=\frac{28100}{\sqrt{(457000)\cdot (2250)}}=0,8763</math>


معامل الارتباط البسيط في هذا المثال هو 0,8763 ويشير هذا لعلاقة خطية موجبة قوية .