ضریب همبستگی چیست و چه کاربردی دارد؟
در دنیای کسبوکار پیش میآید که تصمیمگیر به رابطه بین دو متغیر علاقهمند است. در آمار، از کوواریانس (Covariance) و همبستگی (Correlation) برای کمّی کردن رابطه بین متغیرها بهره میبرند. در این مقاله به تعاریف ریاضی این مفاهیم میپردازم. علاوه بر این با یک چگونه محاسبه ضریب همبستگی مثال در حوزه مدیریت کیفیت و اجرای آن در زبان R، کاربرد این مفهوم را در تصمیمگیری نشان خواهم داد.
کوواریانس نمونه آماری
کوواریانس یک شاخص توصیفی است که وجود رابطه خطی بین دو متغیر را سنجش میکند. اگر نمونهای آماری از متغیرهای و دارای مشاهده باشد، آنگاه کوواریانس بین این دو متغیر از رابطه زیر محاسبه میشود:
در فرمول بالا ابتدا فاصله هریک از مقادیر متغیرهای و از میانگین آن محاسبه میشود. این انحرافها از میانگین برای مقادیر متناظر و در هم ضرب و مجموع آن محاسبه شده؛ سپس این مقدار بر تقسیم میگردد.
همبستگی نمونه آماری
واحد کوواریانس تابع واحد متغیرهای و است. به همین دلیل مقایسه این شاخص برای سنجیدن شدت رابطه بین متغیرها دشوار میشود. با تقسیم کوواریانس بر حاصلضرب انحراف معیار متغیرهای و ضریب همبستگی پیرسون (Pearson Correlation Coefficient) به دست میآید که تحت تأثیر واحد متغیرها نیست:
ضریب همبستگی همواره عددی بین ۱ و ۱- است. این ضریب دو بخش دارد: مقدار عددی و علامت. مقدار عددی نشان میدهد چقدر رابطه خطی بین دو متغیر قدرتمند است. علامت نشان میدهد جهت این رابطه مثبت است یا منفی.
اگر ضریب همبستگی مثبت باشد، به این مفهوم است که افزایش در مقادیر یک متغیر با افزایش در مقادیر متغیر دیگر همراه است. همینطور کاهش در مقادیر یک متغیر با کاهش در مقادیر متغیر دیگر همراه است. در این حالت اگر نمودار پراکندگی دو متغیر رسم شود، میتوان خطی با شیب مثبت را از بین نقاط برازش داد (شکل-۱). به همین ترتیب اگر ضریب همبستگی منفی باشد، میتوان خطی با شیب منفی را از بین نقاط برازش داد (شکل-۱).
هرچه مقدار مطلق ضریب همبستگی (صرفنظر از علامت) به ۱ نزدیک باشد، نشان میدهد شدت رابطه خطی بین دو متغیر قویتر است. در مقابل ضریب همبستگی نزدیک صفر نشان میدهد که رابطه خطی بسیار ضعیفی بین متغیرهای و برقرار است. در این حالت اگر نمودار پراکندگی دو متغیر رسم شود، اینطور به نظر میرسد نقاط به شکل تصادفی در صفحه رسم شدهاند (شکل-۱).
شکل-۱
اگر بین دو متغیر رابطه غیرخطی برقرار باشد، همچنان این امکان وجود دارد ضریب همبستگی نزدیک صفر باشد که نشاندهنده نبود رابطه خطی بین دو آن است (شکل-۲). به همین دلیل در هنگام تحلیل بهتر است نمودار پراکندگی بین متغیرها رسم شود تا به وجود این روابط پی برد.
شکل-۲
باید توجه کرد که اگر بین دو متغیر همبستگی دیده شود لزوماً به این معنی نیست که یکی دلیل وجود دیگری است. این امکان وجود دارد این همبستگی جعلی (Spurious Correlations) باشد به این معنی که متغیر پنهان سومی روی هر دو متغیر اثر میگذارد و یا اینکه همبستگی کاملاً تصادفی است.
در نرمافزار اکسل (Excel) از تابع ()CORREL برای محاسبه ضریب همبستگی استفاده میشود. در شکل-۳ در خانه C12 از فرمول زیر برای محاسبه ضریب همبستگی بین متغیرهای X و Y استفاده شده است:
شکل-۳
یک مثال در حوزه مدیریت کیفیت
این مثال مربوط به خط تولید یک نوع ارهبرقی است که در آن از پرچ برای متصل کردن دو قطعه به یکدیگر استفاده میشود. یکی از شاخصهایی که جهت کنترل کیفیت در این خط تولید سنجیده میشود ارتفاع بیرونزدگی سر پرچ است. فرض کنید بهعنوان مدیر خط تولید، با بررسی روند موجود در نمودارهای کنترل کیفیت پی بردید که بهزودی ممکن است این ارتفاع از محدوده استاندارد خارج شود. در جلسهای که با تیم بهبود کیفیت خود دارید، یکی از اعضا پیشنهاد میدهد واریانس مشاهدهشده در فرآیند تولید، به علت ضخامت رنگی است که دور سوراخ پرچ مینشیند. رنگ زدن قطعات قبل از فرآیند پرچ اتفاق میافتد و بعد از آن ارتفاع پرچ سنجش میشود. با جمعآوری نمونه تصمیم میگیرید این فرضیه را بیازمایید که چگونه محاسبه ضریب همبستگی آیا بین ارتفاع پرچ (Rivet Height) و ضخامت رنگ (Paint Thickness) همبستگی وجود دارد یا خیر.
این مثال را در زبان R اجرا کردم. در ابتدا دادهها وارد و نمودار پراکندگی و خط رگرسیون رسم شده است (شکل-۴).
ضریب تعیین (تشخیص)
ضریب تعیین یا ضریب تشخیص Coefficient Of Determination قدرت توضیح دهندگی مدل را نشان میدهد. ضریب تعیین نشان میدهد که چند درصد از تغییرات متغیر وابسته توسط متغیرهای مستقل توضیح داده میشود. تغییرات کل متغیر وابسته برابر است با تغییرات توضیح داده شده توسط رگرسیون بعلاوه تغییرات توضیح داده نشده. این شاخص یکی از شاخصهای برازش مدل است که قدرت پیشبینی متغیر وابسته (ملاک) براساس متغیرهای مستقل (پیشبین) را نشان میدهد. مقدار این شاخص بین صفر تا یک میباشد و اگر از ۰/۶ بیشتر باشد نشان میدهد متغیرهای مستقل تا حد زیادی توانستهاند تغییرات متغیر وابسته را تبیین کنند.
ضریب تشخیص در معادلات رگرسیونی با علامت R 2 نشان داده میشود و بیانگر میزان احتمال همبستگی میان دو دسته داده در آینده میباشد. این ضریب در واقع نتایج تقریبی پارامتر موردنظر در آینده را بر اساس مدل ریاضی تعریف شده که منطبق بر دادههای موجود است، بیان میدارد. در واقع معیاری است از این که خط رگرسیون، چقدر خوب خواندهها را معرفی میکند. اگر خط رگرسیون از تمام نقاط بگذرد توانائی معرفی همه متغیرها را دارد و هرچه از نقاط دورتر باشد نشان دهنده توانائی کمتر است. در این مقاله روش استفاده از این شاخص در رگرسیون، حداقل مربعات جزئی و مدل معادلات ساختاری توضیح داده شده است.
فرمول محاسبه ضریب تعیین (تشخیص) از نظر آماری
با توجه به اینکه
SST: مجموع توان دوم خطاها زمانی که از متغیرهای مستقل (X ها) استفاده نشود.
SSE: مجموع توان دوم خطاها زمانی که از متغیرهای مستقل (X ها) استفاده شود.
پارامتر SSR را مجموع توان دوم رگرسیون نامید و کاهش در مجموع توان دوم خطاها به خاطر استفاده از متغیرهای مستقل (x ها) را نشان میدهد. هر چه SSR بزرگتر باشد بهتر است و اگر SSR = 0 باشد رابطه رگرسیونی اصلا کاربرد نداشته است.
می دانیم SSR کاهش تغییر پذیری (خطا) به خاطر استفاده از متغیرهای مستقل است. نسبت این کاهش را با R 2 نشان داده و ضریب تعیین مینامیم.
بنابراین مقادیری که R 2 میتواند اختیار کند بین صفر و یک میباشد:
اگر R 2 = 1 باشد آن گاه SSR=SST یا به عبارتی SSE = 0 یعنی زمانی که از متغیرهای مستقل استفاده کنید هیچ خطای وجود ندارد که این بهترین حالت ممکن است.
اگر R 2 = 0 باشد آن گاه SSR=0 یا به عبارتی SSE = SSR یعنی استفاده از متغیرهای مستقل هیچ تاثیری بر برآورد خط رگرسیونی ندارد.
محاسبه ضریب تـعیین در SPSS
برای این منظور از رگرسیون خطی استفاده میشود.
از منوی Analyze گزینه Regression فرمان Linear را اجرا کنید.
متغیر وابسته تعهد را به کادر Dependent وارد کنید. در تکنیک رگرسیون خطی فقط میتوان یک متغیر را به کادر Dependent وارد کنید.
متغیر یا متغیرهای مستقل را به کادر Independent وارد کنید.
با تایید این کار چندین جدول در خروجی ظاهر خواهد شد.
برای مشاهده ضریب تعیین از جدول Model Summary استفاده کنید.
جدول ضریب تعیین در SPSS
براساس نتایح این جدول متغیرهای پیش بین توانستهاند ۲۸% از تغییرات در متغیر وابسته را تبیین کنند.
تفاوت ضریب تعیین و ضریب تعیین تعدیلشده
ضریب تعیین فرض میکند که هر متغیر مستقل مشاهده شده در مدل، تغییرات موجود در متغیر وابسته را تبیین میکند. بنابراین درصد نشان داده شده توسط این شاخص با فرض تاثیر همه متغیرهای مستقل بر متغیر وابسته میباشد. در صورتی که درصد نشان داده شده توسط R 2 تعدیل شده فقط حاصل از تاثیر واقعی متغیرهای مستقل مدل بر وابسته ( نه همه متغیرهای مستقل) است. تفاوت دیگراین است که مناسب بودن متغیرها برای مدل توسط R 2 حتی با وجود مقدار بالا قابل مشخص نیست در صورتی که میتوان به مقدار براورد شده ضریب تعیین تعدیل شده اعتماد کرد.
ضریب تعیین تعدیلشده
در این رابطه N تعداد کل مشاهدات، P تعداد متغیرهای پیشبین و R 2 ضریب تعیین است. این شاخص نیز در جدول خلاصه مدل در خروجی رگرسیون قابل مشاهده است.
آیا ضریب تعیین معیار مناسبی برای تبیین میزان تاثیر متغیر مستقل بر متغیر وابسته است؟
خیر. چون با افزایش مشاهدات و هم چنین با افزایش متغیرهای مستقل میزان R 2 افزایش مییابد این افزایش ممکن است کاذب باشد.
برای رفع این مشکل به R2 تعدیل شده نیاز داریم. مقدار تعدیل شده میزان R 2 را با توجه به متغیرهای مستقل اضافه شده به خط رگرسیون و با توجه به عرض از مبداهای جدید، تعدیل و اصلاح میکند. هرچه تفاوت بین R 2 و R 2 تعدیل شده کمتر باشدنشان میدهد که متغیرهای مستقل که به مدل اضافه شدهاند به درستی انتخاب شدهاند.
محاسبه ضریب تعیین در PLS
ضریب تعیین یکی از پنج معیار اصلی برازش مدل در روش حداقل مربعات جزئی است. این شاخص بیانگر میزان تغییرات هر یک از متغیرهای وابسته مدل است که به وسیله متغیرهای مستقل تبیین میشود. گفتنی است که مقدار R 2 تنها برای متغیرهای درونزای مدل ارائه میشود و در مورد سازههای برونزا مقدار آن برابر صفر است. هرچه مقدار R 2 مربوط به سازههای درونزای مدل بیشتر باشد، نشان از برازش بهتر چگونه محاسبه ضریب همبستگی مدل است.
چین (۱۹۹۸) سه مقدار ۰/۱۹، ۰/۳۳ و ۰/۶۷ را به عنوان مقدار ملاک برای مقادیر ضعیف، متوسط و قوی بودن برازش بخش ساختاری مدل به وسیله معیار R2 تعریف کرده است. همچنین در نرمافزار نسخه شماره ۳ این نرمافزار هم ضریب تعیین و هم ضریب تعیین تعدیلشده محاسبه میگردد. برای مطالعه بیشتر به بحث شاخصهای برازش حداقل مجذورات جزئی رجوع کنید.
ضریب همبستگی چیست و چه کاربردی دارد؟
در دنیای کسبوکار پیش میآید که تصمیمگیر به رابطه بین دو متغیر علاقهمند است. در آمار، از کوواریانس (Covariance) و همبستگی (Correlation) برای کمّی کردن رابطه بین متغیرها بهره میبرند. در این مقاله به تعاریف ریاضی این مفاهیم میپردازم. علاوه بر این با یک مثال در حوزه مدیریت کیفیت و اجرای آن در زبان R، کاربرد این مفهوم را در تصمیمگیری نشان خواهم داد.
کوواریانس نمونه آماری
کوواریانس یک شاخص توصیفی است که وجود رابطه خطی بین دو متغیر را سنجش میکند. اگر نمونهای آماری از متغیرهای و دارای مشاهده باشد، آنگاه کوواریانس بین این دو متغیر از رابطه زیر محاسبه میشود:
در فرمول بالا ابتدا فاصله هریک از مقادیر متغیرهای و از میانگین آن محاسبه میشود. این انحرافها از میانگین برای مقادیر متناظر و در هم ضرب و مجموع آن محاسبه شده؛ سپس این مقدار بر تقسیم میگردد.
همبستگی نمونه آماری
واحد کوواریانس تابع واحد متغیرهای و است. به همین دلیل مقایسه این شاخص برای سنجیدن شدت رابطه بین متغیرها دشوار میشود. با تقسیم کوواریانس بر حاصلضرب انحراف معیار متغیرهای و ضریب همبستگی پیرسون (Pearson Correlation Coefficient) به دست میآید که تحت تأثیر واحد متغیرها نیست:
ضریب همبستگی همواره عددی بین ۱ و ۱- است. این ضریب دو بخش دارد: مقدار عددی و علامت. مقدار عددی نشان میدهد چقدر رابطه خطی بین دو متغیر قدرتمند است. علامت نشان میدهد جهت این رابطه مثبت است یا منفی.
اگر ضریب همبستگی مثبت باشد، به این مفهوم است که افزایش در مقادیر یک متغیر با افزایش در مقادیر متغیر دیگر همراه است. همینطور کاهش در مقادیر یک متغیر با کاهش در مقادیر متغیر دیگر همراه است. در این حالت اگر نمودار پراکندگی دو متغیر رسم شود، میتوان خطی با شیب مثبت را از بین نقاط برازش داد (شکل-۱). به همین ترتیب اگر ضریب همبستگی منفی باشد، میتوان خطی با شیب منفی را از بین نقاط برازش داد (شکل-۱).
هرچه مقدار مطلق ضریب همبستگی (صرفنظر از چگونه محاسبه ضریب همبستگی علامت) به ۱ نزدیک باشد، نشان میدهد شدت رابطه خطی بین دو متغیر قویتر است. در مقابل ضریب همبستگی نزدیک صفر نشان میدهد که رابطه خطی بسیار ضعیفی بین متغیرهای و برقرار است. در این حالت اگر نمودار پراکندگی دو متغیر رسم شود، اینطور به نظر میرسد نقاط به شکل تصادفی در صفحه رسم شدهاند (شکل-۱).
شکل-۱
اگر بین دو متغیر رابطه غیرخطی برقرار باشد، همچنان این امکان وجود دارد ضریب همبستگی نزدیک صفر باشد که نشاندهنده نبود رابطه خطی بین دو آن است (چگونه محاسبه ضریب همبستگی شکل-۲). به همین دلیل در هنگام تحلیل بهتر است نمودار پراکندگی بین متغیرها رسم شود تا به وجود این روابط پی برد.
شکل-۲
باید توجه کرد که اگر بین دو متغیر همبستگی دیده شود لزوماً به این معنی نیست که یکی دلیل وجود دیگری است. این امکان وجود دارد این همبستگی جعلی (Spurious Correlations) باشد به این معنی که متغیر پنهان سومی روی هر دو متغیر اثر میگذارد و یا اینکه همبستگی کاملاً تصادفی است.
در نرمافزار اکسل (Excel) از تابع ()CORREL برای محاسبه ضریب همبستگی استفاده میشود. در شکل-۳ در خانه C12 از فرمول زیر برای محاسبه ضریب همبستگی بین متغیرهای X و Y استفاده شده است:
شکل-۳
یک مثال در حوزه مدیریت کیفیت
این مثال مربوط به خط تولید یک نوع ارهبرقی است که در آن از پرچ برای متصل کردن دو قطعه به یکدیگر استفاده میشود. یکی از شاخصهایی که جهت کنترل کیفیت در این خط تولید سنجیده میشود ارتفاع بیرونزدگی سر پرچ است. فرض کنید بهعنوان مدیر خط تولید، با بررسی روند موجود در نمودارهای کنترل کیفیت پی بردید که بهزودی ممکن است این ارتفاع از محدوده استاندارد خارج شود. در جلسهای که با تیم بهبود کیفیت خود دارید، یکی از اعضا پیشنهاد میدهد واریانس مشاهدهشده در فرآیند تولید، به علت ضخامت رنگی است که دور سوراخ پرچ مینشیند. رنگ زدن قطعات قبل از فرآیند پرچ اتفاق میافتد و بعد از آن ارتفاع پرچ سنجش میشود. با جمعآوری نمونه تصمیم میگیرید این فرضیه را بیازمایید که آیا بین ارتفاع پرچ (Rivet Height) و ضخامت رنگ (Paint Thickness) همبستگی وجود دارد یا خیر.
این مثال را در زبان R اجرا کردم. در ابتدا دادهها وارد و نمودار پراکندگی و خط رگرسیون رسم شده است (شکل-۴).
انواع ضرایب همبستگی
استنباط آماری که در واقع یک نوع نتیجه گیری کلی از جزء به کل است، در معرض آزمایش و خطاست. یک جنبه از استنباط آماری محاسبه برآوردهایی (Estimates ) از پارمترهای جامعه مانند میانگین جامعه از طریق آماره های نمونه ها مانند میانگین نمونه است.
فرضیه (hypothesis) :
فرضیه آماری نقطه آغاز آزمون فرض است. فرضیه آماری یک بیان مقداری در باره پارامترهای جامعه است و اصولا بدون داشتن فرضیه آماری امکان انجام یک آزمون دشوار است.فرضیه آماری به دو دسته فرض صفر (H0) و فرض خلاف (H1) بیان میشود . اغلب فرضیه بیانگر این مطلب است که یک ارتباط علیتی بین دو متغیر وجود دارد به شکلی که میزان یکی (متغیر مستقل یاIndependent ) تا حدودی تعیین کننده دیگری متغیر وابسته یا (Dependent) است.
انواع داده :
1) داده های کمی (فاصله ای) Interval اعدادی هستند که بیانگر کمیت به صورت واحدهای عددی و بر اساس یک مقیاس مستقل است .قد و وزن مثالهای بارز دادههای کمی هستند.
2) دادههای رتبه ای Ordinal مشتمل بر رتبه ها، تعلق داشتن به گروههای رتبه بندی شده یا اطلاعات ترتیبی است. به عنوان مثال اگر دو داور به یک مجموعه 10 تایی از نقاشی رتبه یک (برای بهترین) تا رتبه 10 (برای بدترین) بدهند. مجموعه داده ها مشتمل بر 10 جفت رتبه خواهد بود. که هر جفت برای یک نقاشی است.
3) دادههای اسمی (nomial ) که مربوط به متغیر یا خواص کیفی مانند جنس یا گروه خونی است و بیانگر عضویت در یک گروه خاص می باشد.
محاسبه ضرایب همبستگی تا حدود زیادی متاثر از مقیاس اندازه گیری متغیر ها است، بعنوان مثال برای متغیرهای اسمی جهت رابطه اصلا معنی ندارد، چگونه محاسبه ضریب همبستگی بین جنس و معدل تنها میتوان گفت که شدت وابستگی چه مقدار است اما افزایش یا کاهش جنس معنی ندارد.
با توجه به نوع متغیر ها ضریب همبستگی میتواند یکی از حالتهای زیر را داشته باشد.
1- دو متغیر اسمی
2- دو متغیر رتبهای
3- دو متغیر فاصلهای- نسبی
4- متغیر اسمی و متغیر رتبه ای
5- متغیر اسمی و متغیر فاصلهای - نسبی
6- متغیر رتبهای و متغیر فاصلهای – نسبی
برای هر کدام از حالتهای بالا ضرایب همبستگی متفاوتی وجود دارند و محاسبه آنها در نرم افزار های spss ، lisrel و R امکان پذیراست.
از آنجا که انتخاب ضریب همبستگی مناسب برای بررسی روابط بین متغیرها تحت تاثیر مقیاس اندازه گیری متغیرهای مورد بررسی است لذا تناسب بین سطوح اندازه گیری و ضریب همبستگی سازگار از این جدول برای تصمیم گیری مناسب است
آزمون های آماری
سطح سنجش متغیرها
خی دو – فی – وی کرامر – لاندا
خی دو – فی – وی کرامر – لاندا
تحلیل واریانس یکطرفه – تی تست
فاصله ای یا نسبی
خی دو – فی – وی کرامر – لاندا
ضریب همبستگی رتبه ای اسپیرمن
خی دو – فی – وی کرامر – لاندا
ضریب همبستگی پیرسون r
ضریب همبستگی رتبه ای اسپیرمن
هرگاه رابطه بین دو متغیر را بررسی کردیم و بین آن دو رابطه معنی دار وجود داشت می توانیم ضریب همبستگی و میزان شدت همبستگی را نیز محاسبه کنیم .
ضرایب همبستگی در واقع وابستگی دو متغیر را مشخص می کنند:
اگر ضریب همبستگی بین 25/0 تا 35/0 ضریب بسیار پایین است – تنها 4% تغییرات مشترک میان دو متغیر را نشان می دهد
اگر ضریب همبستگی بین 35/0 تا 65/0 ضریب متوسط است – حدود 25% تغییرات مشترک میان دو متغیر را نشان می دهد
اگر ضریب همبستگی بین 65/0 تا 85/0 ضریب بالایی است –تا 72% تغییرات مشترک میان دو متغیر را نشان می دهد
در اصل برای بررسی میزان هماهنگی میان دو متغیر به دنبال شاخصهایی می گردیم که در اصل دو ویژگی زیر را داشته باشند:
1- به واحد دو جامعه وابسته نباشد
به طور مثال در تحولات اقصادی به دنبال رابطه میان تقاضای نفت خام در برابر تقاضای طلا می باشیم. یا در مطالعه تحولات اجتماعی به دنبال رابطه درآمد سرپرست خانواده و میزان تحصیل فرزندان می باشیم و مثالهایی از این دست.
مجموعه اطلاعات (داده های) موجود در انجام یک آزمون همبستگی که شامل اندازه های بدست آمده از دو متغیر X و Y می باشند را می توان به صورت یک نمونه تصادفی دو متغیره (Xn ,Yn), . (X1 ,Y1) بیان کرد
مطالعه رابطه بین متغیرها بوسیله ((تحلیل همبستگی)) ( Analysis Corroletion ) انجام می شود. که بیانگر وجود یک رابطه خطی بین دو متغیر می باشد.
فرمول ضریب همبستگی به صورت زیر می باشد
با توجه به مقدار r در حاتهای مختلف تفسیرهای گوناگونی از رابطه X و Y خواهیم داشت.
حالتهای مختلف برای r
1- r =1 در این حالت همبستگی کامل و مستقیم گوییم. با افزایش مقدار x مقدار y به طور قطعی
زیاد می شود.
2- r = -1 در این حالت همبستگی را کامل و معکوس گوییم. با افزایش مقدار x مقدار y کاهش می یابد.
انواع ضرایب همبستگی:
ضریب همبستگی چوپروف T :ضریب هبستگی چوپروف به منظور تعیین شدت وابستگی بین متغیرهای مورد مطالعه به کار گرفته می شود و مقدار آن همواره بین صفر ویک در نوسان می باشد زمانی از آن استفاده کرده که هر دو متغیر اسمی و یا یکی اسمی و دیگری ترتیبی باشد. اما نباید تعداد سطر و ستون با هم برابر باشند.یعنی در جدول توافقی 2در2 نمی توان از آن استفاده کرد. در چنین مواردی باید از ضریب فی استفاده کرد.
ضریب همبستگی فی: به منظور بررسی شدت همبستگی بین دو متغیر اسمی که جدول توافقی 2 در 2 می باشد مورد استفاده قرار می گیرد.خی دو سطح معنی دار بودن همبستگی بین دو متغیر را تعیین میکند اما ضریب فی شدت همبستگی آنها را نشان می دهد. مقدار آن همواره بین صفر و یک در نوسان است.
ضریب همبستگی پیرسون r : این ضریب میزان همبستگی بین دو متغیر فاصله ای یا نسبی را محاسبه کرده مقدار آن بین 1+ و 1- می باشد اگر مقدار بدست آمده مثبت باشد به معنی این است که تغییرات دو متغیر به طور هم جهت اتفاق می افتد یعنی با افزایش در هر متغیر، متغیر دیگر نیز افزایش می یابد و برعکس اگر مقدار r منفی شد یعنی اینکه دو متغیر در جهت عکس هم عمل می کنند یعنی با افزایش مقدار یک متغیر مقادیر متغیر دیگر کاهش می یابد و برعکس.اگر مقدار بدست آمده صفر شد نشان میدهد که هیچ رابطه ای بین دو متغیر وجود ندارد و اگر 1+ شد همبستگی مثبت کامل و اگر 1- شد همبستگی کامل و منفی است.
ضریب کرامر: این ضریب برای تغیین میزان شدت همبستگی بین دو متغیر اسمی مورد استفاده قرارمی گیرد و آن را با (V 2 ) نشان می دهند و مقدار آن نیز همواره بین صفر ویک در نوسان است.هم جدول توافقی بیشتر از 2 در 2 وهم برای مستطیلی بکار می رود .
ضریب همبستگی رتبه ای اسپیرمن : آن را با علامتP نشان می دهند و همواره بین 1+ و 1- می باشد از لحاظ سطح سنجش ترتیبی است.در صورتی که داده های ما به صورت فاصله ای و نسبی باشند می توانیم آنها را به رتبه تبدیل کنیم.مهم نیست کدام متغیر وابسته و کدام متغیر مستقل است.
نکته مهم : اگر ضریب همبستگی صفر باشد نشاندهنده عدم وجود همبستگی است
ضریب همبستگی همواره بین 1+ و 1- در نوسان است
اگر ضریب همبستگی کمتر از صفر باشد همبستگی ناقص و منفی است یعنی با افزایش یک متغیر دیگری کاهش می یابد
اگر ضریب همبستگی بزرگتر از صفر باشد ناقص و مثبت است یعنی با افزایش یک متغیر، دیگری نیز افزایش می یابد
اگر صفر باشد نشاندهنده عدم وجود همبستگی است
کاربرد آزمون های پارامتری و ناپارامتری در علوم رفتاری
مقایسه داده ها در دو یا بیش از دو گروه وابسته و مستقل
تعداد گروههای تحت مطالعه
متغیر مورد مطالعه
گروههای تحت مطالعه
نوع آزمون مورد انتخاب
1
دو گروه
کمی
مستقل
t مستقل
2
دو گروه
رتبه ای
مستقل
من ویتنی
3
دو گروه
اسمی
مستقل
خی دو
4
دو گروه
کمی
وابسته
t وابسته
5
دو گروه
رتبه ای
وابسته
ویلکاکسون – آزمون نشانه
ضريب همبستگي چيست؟ انواع آن چيست؟
ضریب همبستگی (Correlation Coefficient) ابزاری آماری برای تعیین نوع و درجه رابطهٔ یک متغیر کمی با متغیر کمی دیگر است. ضریب همبستگی، یکی از معیارهای مورد استفاده در تعیین همبستگی دو متغیر است.
ضریب همبستگی شدت رابطه و همچنین نوع رابطه (مستقیم یا معکوس) را نشان میدهد. این ضریب بین ۱ تا ۱- است و در عدم وجود رابطه بین دو متغیر، برابر صفر است.
همبستگی بین دو متغیر تصادفی X و Y به صورت زیر تعریف میشود:
که در آن E عملگر امید ریاضی، cov به معنای کوواریانس، corr نماد معمول برای همبستگی (کورولیشن) پیرسون، و سیگما نماد انحراف معیار است.
امید ریاضی:
در نظریه احتمالات؛ امید ریاضی، میانگین، مقدار مورد انتظار یا ارزش مورد انتظار یک متغیر تصادفی گسسته برابر است با مجموع حاصلضرب احتمال وقوع هر یک از حالات ممکن در مقدار آن حالت. در نتیجه میانگین برابر است با مقداری که بطور متوسط از یک فرایند تصادفی با بینهایت تکرار انتظار میرود.
کواریانس یا هموردایی (Covariance):
در نظریه احتمالات، اندازه تغییرات هماهنگ دو متغیر تصادفی است. (اگر دو متغیر یکی باشند کواریانس برابر واریانس خواهد شد). چنانکه دو متغیر تصادفی ناوابسته باشند کواریانس آنها صفر خواهد بود.
ضریب همبستگی پیرسون ( Pearson Correlation Coefficient):
روشی پارامتری است و برای دادههایی با توزیع نرمال یا تعداد دادههای زیاد استفاده میشود.
ضریب همبستگی اسپیرمن (Spearman Correlation Coefficient):
در صورتی که تعداد دادهها کم و فرض نرمال بودن آنها معقول نباشد، از ضریب همبستگی اسپیرمن استفاده میشود. ضریب همبستگیای که بر اساس رتبهٔ دادهها محاسبه میشود، توسط اسپیرمن محاسبه شدهاست.
انحراف معیار(Standard deviation):
نوعی سنجش پراکندگی برای یک توزیع احتمالی یا متغیر تصادفی است و نمایندهٔ پخششدگی مقادیر آن حول مقدار میانگین است.
ضریب همبستگی پیرسون
ضریب همبستگی پیرسون که به نام های ضریب همبستگی گشتاوری ویا ضریب همبستگی مرتبه ی صفر نیز نامیده می شود ، توسط سرکارل پیرسون معرفی شده است. این ضریب به منظور تعیین میزان رابطه، نوع و جهت رابطه ی بین دو متغیر فاصله ای یا نسبی و یا یک متغیر فاصله ای و یک متغیر نسبی به کار برده می شود. چندین روش محاسباتی معادل می توان برای محاسبه ی این ضریب تعریف نمود.
الف) روش محاسبه با استفاده از اعداد خام :
ب) روش محاسبه از طریق نمره های استاندارد شده :
ضریب همبستگی پیرسون بین -1 و 1 تغییر می کند.اگر r=1 بیانگر رابطه ی مستقیم کامل بین دو متغیر است ، رایطه ی مستقیم یا مثبت به این معناست که اگر یکی از متغیرها افزایش (کاهش) یابد، دیگری نیز افزایش (کاهش) می یابد. مانند رابطه ی بین میزان ساعات مطالعه در روز و معدل محصلین.
r=-1 نیز وجود یک رابطه ی معکوس کامل بین دو متغیر را نشان می دهد. رابطه ی معکوس یا منفی نشان می دهد که اگر یک متغیر افزایش یابد متغیردیگر کاهش می یابد و بالعکس.
زمانی که ضریب همبستگی برابر صفر است نشان می دهد که بین دو متغیر رابطه ی خطی وجود ندارد.
1) صفر بودن ضریب همبستگی تنها عدم وجود رابطه ی خطی بین دو متغیر را نشان می دهد ولی نمی توان مستقل بودن دو متغیر را نیز نتیجه گرفت. هنگامی که ضریب همبستگی پیرسون بین دو متغیر صفر باشد، این متغیرها تنها در صورتی مستقل از یکدیگرند که توزیع متغیرها نرمال باشد.
2) همبستگی بین دو متغیر تنها نشان دهنده ی این است که افزایش یا کاهش یک متغیر چه تاثیری بر افزایش یا کاهش متغیر دیگر دارد ولی این همبستگی ضرورتا دال بر رابطه ی علّی بین متغیرها نمی باشد. به طور مثال اگر در یک تحقیق دو متغیر قد و تحصیلات همبستگی مثبت بالایی داشته باشندنمی توانیم نتیجه بگیریم که افراد قد بلندتر دارای تحصیلات بیشتری هستند. بنابراین باید بین مفاهیم همبستگی و رابطه ی علّت و معلولی تفاوت قائل شد. به بیان دیگر ممکن است دو متغیر همبستگی داشته باشند ولی لزومی ندارد که یکی از متغیرها علت و دیگری معلول باشد، علاوه براین عوامل متعدد دیگری نیز می توانند بر ضریب همبستگی اثرگذار باشند.
مثال : سنوات خدمت و میزان درآمد تعدادی کارمنددر دست است ، به کمک نرم افزار spss ضریب همبستگی پیرسون را محاسبه می کنیم.
دیدگاه شما