آزمون کای دو Chi-Square و مقایسههای چندگانه Pairwise Z-Tests
حتماَ میدانید آزمون استقلال کای دو یا همان Chi-Square Test چیست. اگر دوست داشتید و علاقمند بودید درباره این آزمون بیشتر بدانید، میتوانید در اینجا آموزش آزمون کای دو یا کای اسکوئر را ببینید.
یک توضیح کوتاه اینکه ما از کای اسکوئر به منظور بررسی فرضیه ارتباط و یا استقلال بین دو Variable که خود دارای سطوح و گروههای مختلفی هستند استفاده میکنیم.
به عنوان مثال هنگامی که میخواهیم ببینیم آیا تعداد سالهای خدمت در یک سازمان بر روی میزان رضایت شغلی کارکنان موثر است یا خیر، از آزمون کای دو استفاده میکنیم. لازم است در این مثال سالهای خدمت و همچنین رضایت هر کدام به چند گروه طبقهبندی شوند.
بنابراین ما هرگاه میخواهیم ارتباط و اثرگزاری بین کمیتهای از نوع اسمی Nominal و یا رتبهای Ordinal را بررسی کنیم از آزمون Chi-Square و یا در مواردی آزمون دقیق فیشر Fishers Exact Test استفاده میکنیم. در حالت کلی به این نوع آزمونها، آزمونهای احتمالی و یا Contingency گفته میشود.
برای فهم بهتر، ابتدا بیایید مثال زیر را حل کنیم. پس از آن درباره آنچه که هدف اصلی این متن یعنی بیان Pairwise Z-Tests است، بهتر میتوان صحبت کرد.
مثال
فایل مثال با نام edu-marit.sav را میتوانید از اینجا دانلود کنید.
در این مثال از ۳۰۰ نفر پاسخدهنده دربارهی وضعیت تاهل و سطح تحصیلات آنها سوال شده است. میخواهیم ببینیم آیا تاهل و تحصیلات با یکدیگر ارتباط دارند یا خیر. از آنجا که هم تاهل و هم تحصیلات طبقهبندی شده هستند، بنابراین از آزمون کای اسکوئر استفاده میکنیم.
من در ادامه Syntax نرمافزار SPSS برای Run و اجرا کردن آزمون کای دو را آوردهام.
1 2 3 4 5 6 |
CROSSTABS /TABLES=marit BY educ /FORMAT=AVALUE TABLES /STATISTICS=CHISQ /CELLS=COUNT COLUMN /COUNT ROUND CELL. |
به سادگی با استفاده از Syntax مقابل در محیط برنامهنویسی نرمافزار SPSS، جدول توافقی شامل فراوانی و درصد فراوانی ستونی به دست میآید.
در ادامه نتایج به دست آمده پس از Run کردن این Syntax را مشاهده میکنیم.
در جدول زیر با نام Marital Status * Education Level Crosstabulation فراوانی و درصد فراوانی ستونی به ازای هر کدام از گروههای وضعیت تاهل و تحصیلات آمده است.
به عنوان مثال اعداد مشخص شده در جدول بالا نشان میدهد تعداد ۱۸ نفر که Never married بودهاند، سطح تحصیلات Middle school or lower داشتهاند. این افراد برابر با ۴۶.۲ درصد کل افرادی هستند که تحصیلات آنها Middle school or lower بوده است. به همین ترتیب سایر اعداد را نیز میتوان بیان کرد.
سوال ما در آزمون کای دو این است که آیا تاهل و تحصیلات با یکدیگر ارتباط دارند یا خیر؟ پاسخ به این سوال در نتیجه جدول بعدی با نام Chi-Square Tests آمده است.
نتیجه آزمون Chi-Square در جدول بالا بیانگر آن است که بین تحصیلات و وضعیت تاهل این افراد ارتباط وجود دارد (P-value = 0.023).
به دست آوردن این نتیجه خوب است، اما یک سوال همچنان باقی است که هنوز به آن پاسخی داده نشده است و دلیل اصلی نوشتن این متن است.
سوال وجود ارتباط معنادار بین تحصیلات و تاهل در کدام گروهها وجود دارد؟ به عبارت دیگر آن چیزی که باعث شده است در حالت کلی تحصیلات و تاهل بر روی یکدیگر اثر معنادار بگذارند، در کدام سطوح و گروهها دیده میشود. آیا احیاناَ مواردی بوده است که با یکدیگر اختلاف معنادار نداشتهاند؟
به منظور پاسخ به این سوال لازم است، ما آزمون جدیدی با نام مقایسههای چندگانه Pairwise Z-Tests معرفی کنیم.
Pairwise Z-Tests
اولین موضوعی که مطرح است این است که این آزمون چیست و چه کاری انجام میدهد؟
آزمون مقایسههای Z که نام دقیقتر آن Z-Tests for Independent Proportions است، به مقایسه درصدهای ستونی با یکدیگر میپردازد.
برای درک بهتر یکبار دیگر جدول Marital Status * Education Level Crosstabulation را به صورت زیر نگاه کنید.
ببینید، Z-Tests for Independent Proportions به مقایسه این درصدها با یکدیگر که در جدول بالا برایتان مشخص کردهام، میپردازد.
یعنی به دنبال این است که عدد ۴۶.۲٪ که مربوط به افراد Never married و Middle school or lower را با ۴۰.۰٪ که مربوط به افراد Never married و High school است، با هم مقایسه کند. به همین ترتیب سایر اعداد و درصدها در هر سطر را با هم مقایسه کند.
استفاده از این آزمون به ما کمک میکند بدانیم ارتباط معنادار به دست آمده بین تاهل و تحصیلات در کدام سطوح رخ داده است.
حال بیایید با استفاده از نرمافزار SPSS آزمون Z-Tests for Independent Proportions را انجام دهیم. از مسیر زیر استفاده میکنیم.
Analyze → Tables→ Custom Tables
اگر دقت کنید، مسیر بالا همان مسیری است که از آن جهت رسم انواع جدولهای توافقی و فراوانی در نرمافزار SPSS از آن استفاده میکنیم.
پنجره Custom Tables به صورت زیر برای ما باز خواهد شد. ما در این پنجره، Education Level را در ستون و Marital Status را در سطر قرار میدهیم.
در تنظیمات بالا، جدول فراوانی هر کدام از سطوح تحصیلات و تاهل به دست میآید. با این حال ما به دنبال به دست آوردن درصدهای ستونی نیز هستیم. برای انجام این کار گزینه N% Summary Statistics را انتخاب میکنیم. با انجام این کار پنجره تنظیمات Summary Statistics زیر برای ما باز میشود.
در این پنجره گزینه % Column N را به کادر Display به صورت زیر دراگ میکنیم.
خب، حال در پنجره Summary Statistics گزینه Apply to Selection را میزنیم و سپس Close میکنیم. بار دیگر به پنجره Custom Tables میرویم. تصویر زیر از این پنجره را این بار ببینید.
در این حالت، گزینه % Column N نیز به نتایج جدول اضافه شده است. بنابراین میتوانیم به هنگام مشاهده خروجیها و جداول، درصدهای ستونی را نیز مشاهده کنیم.
در اینجا یک نکته مهم وجود دارد. تب Test Statistics را ببینید. من در تصویر بالا با کادر دور آن را برایتان مشخص کردهام. روی این تب برنید. ما میخواهیم با استفاده از ابزار و امکانات قرار گرفته در این تب آزمون کای اسکوئر و Z را انجام دهیم.
در تصویر زیر این تب و پنجره باز شو آن را برایتان آوردهام.
مواردی را که لازم است انتخاب کنیم در این تصویر مشخص شده است. این موارد شامل مقایسه درصدهای ستونی، به دست آوردن مقادیر احتمال معناداری، استفاده از آزمون بونفرونی و آزمون استقلال Chi-square است.
دیگر در پنجره Custom Tables کاری نداریم. به سادگی میتوانید OK کنید. پس از آن در Output نرمافزار SPSS نتایج و جداول توافقی و معناداریها آمده است.
کار سادهتر
Syntax
کار سادهتر این است که به جای اینکه از مسیر بالا و تنظیمات نوشته شده استفاده کنیم، خیلی ساده در محیط Syntax نویسی نرم افزار SPSS برنامه و دستورات زیر را بنویسیم.
1 2 3 4 5 6 7 8 |
CTABLES /VLABELS VARIABLES=marit educ DISPLAY=LABEL /TABLE marit BY educ [COUNT F40.0, COLPCT.COUNT PCT40.1] /CATEGORIES VARIABLES=marit educ ORDER=A KEY=VALUE EMPTY=INCLUDE /CRITERIA CILEVEL=95 /SIGTEST TYPE=CHISQUARE ALPHA=0.05 INCLUDEMRSETS=YES CATEGORIES=ALLVISIBLE /COMPARETEST TYPE=PROP ALPHA=0.05 ADJUST=BONFERRONI ORIGIN=COLUMN INCLUDEMRSETS=YES CATEGORIES=ALLVISIBLE MERGE=NO SHOWSIG=YES. |
به سادگی با استفاده از Syntax بالا در محیط برنامهنویسی نرمافزار SPSS، جدول توافقی شامل فراوانی و درصد فراوانی ستونی، آزمون استقلال کای دو و از همه مهمتر همان چیزی که به دنبال آن بودیم یعنی مقایسه نسبتها و درصدها که با استفاده از Z-Test انجام شده است، به دست میآید.
در ادامه نتایج و جدولهای به دست آمده پس از Run کردن این Syntax را مشاهده میکنیم. این نتایج در Output نرم افزار SPSS قابل مشاهده است.
به ترتیب آنها را بیان میکنیم.
در ابتدا و در جدول زیر، فراوانی و درصد فراوانی ستونی به ازای هر کدام از گروههای تحصیلات و تاهل، آمده است.
اگر دقت کنید این جدول و در ادامه جدول بعدی یعنی Pearson Chi-Square Tests را در همان تحلیلهای ابتدای متن که به آزمون کای دو میپرداختیم، به دست آورده بودیم.
بر مبنای نتایج جدول Pearson Chi-Square Tests نیز به دست آوردیم که در این مثال ما، تحصیلات و تاهل به یکدیگر وابسته بوده و بر روی هم اثر میگذارند. در واقع نتایجی که تا اینجا به دست آمده چیز جدیدی نیست و با استفاده از یک آزمون کای اسکوئر ساده نیز میتوانستیم به آنها برسیم.
اما هدف از این متن فقط این نتایج نبوده است. بلکه ما به دنبال مقایسه درصدها در هر گروه تحصیلات و تاهل هستیم. در واقع ما میخواهیم بدانیم تاثیرگزاری معنادار بین تحصیل و تاهل در کدام گروهها رخ داده است.
برای انجام این کار گفتیم از آزمون Z-Tests for Independent Proportions استفاده میکنیم. نتیجه به دست آمده از این آزمون را میتوانید در جدول زیر با نام Comparisons of Column Proportions ببینید. در واقع مبنای کار ما همان Syntax بالا و یا مسیر و تنظیمات بیان شده است.
خب، حال بیایید به توضیح جدول Comparisons of Column Proportions بپردازیم.
توضیح جدول
۱
در خانه وضعیت تاهل Never married و وضعیت تحصیلی Middle school or lower عبارت و کلمات D (.020) نوشته شده است. حرف D به معنای آن است که این خانه با گروهی که به تعریف نرمافزار D هستند (یعنی وضعیت تحصیلی Master’s) اختلاف معنادار دارد. به بیان سادهتر یعنی اینکه در بین افرادی که ازدواج نکردهاند، فراوانی افراد دارای سطح تحصیلی راهنمایی یا کمتر با افراد دارای تحصیلات کارشناسی ارشد، اختلاف معنادار دارند. پاسخ به سوال چقدر اختلاف معنادار دارند در پرانتز نوشته شده است. عدد داخل پرانتز به معنای مقدار احتمال یا همان P-value است که برابر با ۰.۰۲۰ به دست آمده است.
۲
در خانه Never married و High school عبارت D (.035) نوشته شده است. درباره D که گفتیم یعنی این افراد با Master’s اختلاف معنادار دارند. مقدار احتمال نیز برابر با ۰.۰۳۵ شده است. این مطلب نیز نشان میدهد بین افرادی که ازدواج نکردهاند، فراوانی افراد دارای سطح تحصیلی دبیرستان با افراد دارای تحصیلات کارشناسی ارشد، اختلاف معنادار دارند.
۳
در خانه Married و Master’s عبارتهای A (.006) و B (.019) نوشته شده است. این به معنای آن است که در بین افراد ازدواج کرده، سطح تحصیلی Master’s با سطح تحصیلی Middle school or lower به اندازه مقدار احتمال P-value = 0.006 اختلاف معنادار دارد. به همین ترتیب در بین افراد ازدواج کرده سطح تحصیلی Master’s با سطح تحصیلی High school به اندازه مقدار احتمال P-value = 0.019 اختلاف معنادار دارد.
سوال بقیه خانههای جدول Comparisons of Column Proportions خالی است. منظور از آنها چیست؟
پاسخ خیلی ساده است.
در این خانهها اختلاف معنادار دیده نمیشود. به عنوان مثال در بین افراد با وضعیت تاهل Divorced و Widowed هیچکدام از گروههای تحصیلی با یکدیگر اختلاف معنادار ندارند.
جالب توجه است که سطح تحصیلی Bachelor’s و PhD or higher با هیچکدام از سطوح تحصیلی دیگر در این مثال ما اختلاف معنادار ندارد.
نکته مهم
سطر و ستون
ما در جدول Comparisons of Column Proportions مقایسه درصدهای ستونی به ازای هر کدام از سطوح وضعیت تاهل را انجام دادیم. به عنوان مثال بررسی کردیم در بین افرادی که هنوز ازدواج نکردهاند، کدامیک از سطوح تحصیلی با یکدیگر متفاوت هستند.
حال فرض کنید، ایده دیگری داریم. ما میخواهیم گروههای مختلف تاهل را هم با یکدیگر مقایسه کنیم. برای انجام این کار لازم است در جدول Comparisons of Column Proportions جای سطر و ستون را با هم عوض کنیم.
من در Syntax زیر این کار را انجام دادهام.
1 2 3 4 5 6 7 8 |
CTABLES /VLABELS VARIABLES=educ marit DISPLAY=LABEL /TABLE educ [COUNT F40.0, COLPCT.COUNT PCT40.1] BY marit /CATEGORIES VARIABLES=educ marit ORDER=A KEY=VALUE EMPTY=INCLUDE /CRITERIA CILEVEL=95 /SIGTEST TYPE=CHISQUARE ALPHA=0.05 INCLUDEMRSETS=YES CATEGORIES=ALLVISIBLE /COMPARETEST TYPE=PROP ALPHA=0.05 ADJUST=BONFERRONI ORIGIN=COLUMN INCLUDEMRSETS=YES CATEGORIES=ALLVISIBLE MERGE=NO SHOWSIG=YES. |
نتایج را نیز در ادامه آوردهام. ابتدا جدول فراوانی و درصد فراوانی آمده است. نتایج با جدول قبلی که در آن سطوح تحصیلی در ستونها قرار داشتند، چندان تفاوتی ندارد. فقط درصدها عوض شدهاند. فراوانیها نیز فرقی نکردهاند.
به عنوان مثال این جدول نشان میدهد ۲۰ درصد افرادی که ازدواج نکردهاند، دارای تحصیلات راهنمایی و کمتر هستند. تعداد این افراد هم که فرقی نکرده و همان ۱۸ نفر جدول فراوانی قبلی است.
جدول Pearson Chi-Square Tests نیز که نتایجی کاملاَ مشابه با حالت قبل دارد. این مطلب نیز واضح است زیرا چیزی عوض نشده و فقط جای سطر و ستون را عوض کردهایم.
اما نتایج جدول Comparisons of Column Proportions عوض شده است. آن را ببینیم.
نتایج جدول Comparisons of Column Proportions به دست آمده در بالا بیانگر آن است که در بین افراد دارای سطح تحصیلات راهنمایی و کمتر، فراوانی افراد ازدواج نکرده با افراد ازدواج کزده، اختلاف معنادار دارد (P-value = 0.039).
در بین افراد دارای تحصیلات کارشناسی ارشد نیز افراد Married با Never married اختلاف معنادار دارند (P-value = 0.043).
در بقیه موارد نیز اختلاف معنادار مشاهده نمیشود.
در پایان اینکه با استفاده از آزمون Chi-square میتوانید فرضیه استقلال و یا وابستگی بین دو Variable سطحبندی و گروهبندی شده را بررسی کنیم. آزمون Z-Tests for Independent Proportions نیز به ما کمک میکند تا بتوانیم به مقایسه چندگانه سطوح با یکدیگر بپردازیم.
چگونه به این مقاله رفرنس دهیم
GraphPad Statistics (2021). Chi-Square and Multiple Comparisons Pairwise Z-Tests. Statistical tutorials and software guides. Retrieved Month, Day, Year, from https://graphpad.ir/spss-chi-square-test-with-pairwise-z-tests/.php
For example, if you viewed this guide on 12th January 2022, you would use the following reference
GraphPad Statistics (2021). Chi-Square and Multiple Comparisons Pairwise Z-Tests. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/spss-chi-square-test-with-pairwise-z-tests/.php
ارایه خدمات تحلیل و مشاوره آماری
گراف پد برای شما خدمات مشاوره و انجام انواع تحلیلهای آماری را ارایه میدهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.