آزمون کای دو Chi-Square

آزمون کای دو Chi-Square و مقایسه‌های چندگانه Pairwise Z-Tests

زمان مطالعه: 20 دقیقه 

 

 
 

 

merci

دریافت آموزش کامل آنالیز واریانس و کوواریانس

شامل ۴۹۵ دقیقه ویدئو، ۲۲۹ اسلاید و فایل‌های دیتا و نتایج SPSS

 

موضوع چیست؟

حتماَ می‌دانید آزمون استقلال کای دو یا همان Chi-Square Test چیست. اگر دوست داشتید و علاقمند بودید درباره این آزمون بیشتر بدانید، می‌توانید در اینجا آموزش آزمون کای دو یا کای اسکوئر را ببینید.

یک توضیح کوتاه اینکه ما از کای اسکوئر به منظور بررسی فرضیه ارتباط و یا استقلال بین دو Variable که خود دارای سطوح و گروه‌های مختلفی هستند استفاده می‌کنیم.

به عنوان مثال هنگامی که می‌خواهیم ببینیم آیا تعداد سال‌های خدمت در یک سازمان بر روی میزان رضایت شغلی کارکنان موثر است یا خیر، از آزمون کای دو استفاده می‌کنیم. لازم است در این مثال سال‌های خدمت و همچنین رضایت هر کدام به چند گروه طبقه‌بندی شوند.

بنابراین ما هرگاه می‌خواهیم ارتباط و اثرگزاری بین کمیت‌های از نوع اسمی Nominal و یا رتبه‌ای Ordinal را بررسی کنیم از آزمون Chi-Square و یا در مواردی آزمون دقیق فیشر Fishers Exact Test استفاده می‌کنیم. در حالت کلی به این نوع آزمون‌ها، آزمون‌های احتمالی و یا Contingency گفته می‌شود.

برای فهم بهتر، ابتدا بیایید مثال زیر را حل کنیم. پس از آن درباره آن‌چه که هدف اصلی این متن یعنی بیان Pairwise Z-Tests است، بهتر می‌توان صحبت کرد.

مثال

 فایل مثال  با نام edu-marit.sav را می‌توانید از اینجا دانلود کنید.

در این مثال از ۳۰۰ نفر پاسخ‌دهنده درباره‌ی وضعیت تاهل و سطح تحصیلات آن‌ها سوال شده است. می‌خواهیم ببینیم آیا تاهل و تحصیلات با یکدیگر ارتباط دارند یا خیر. از آن‌جا که هم تاهل و هم تحصیلات طبقه‌بندی شده هستند، بنابراین از آزمون کای اسکوئر استفاده می‌کنیم.

من در ادامه Syntax نرم‌افزار SPSS برای Run و اجرا کردن آزمون کای دو را آورده‌ام.

 

به سادگی با استفاده از Syntax مقابل در محیط برنامه‌نویسی نرم‌افزار SPSS، جدول توافقی شامل فراوانی و درصد فراوانی ستونی به دست می‌آید.

در ادامه نتایج به دست آمده پس از Run کردن این Syntax را مشاهده می‌کنیم.

 

در جدول زیر با نام Marital Status * Education Level Crosstabulation فراوانی و درصد فراوانی ستونی به ازای هر کدام از گروه‌های وضعیت تاهل و تحصیلات آمده است. 

جدول توافقی بین گروه‌های وضعیت تاهل و تحصیلات

 

به عنوان مثال اعداد مشخص شده در جدول بالا نشان می‌دهد تعداد ۱۸ نفر که Never married بوده‌اند، سطح تحصیلات Middle school or lower داشته‌اند. این افراد برابر با ۴۶.۲ درصد کل افرادی هستند که تحصیلات آن‌ها Middle school or lower بوده است. به همین ترتیب سایر اعداد را نیز می‌توان بیان کرد.

سوال ما در آزمون کای دو این است که آیا تاهل و تحصیلات با یکدیگر ارتباط دارند یا خیر؟ پاسخ به این سوال در نتیجه جدول بعدی با نام Chi-Square Tests آمده است.

جدول آزمون Chi-Square

 

نتیجه آزمون Chi-Square در جدول بالا بیانگر آن است که بین تحصیلات و وضعیت تاهل این افراد ارتباط وجود دارد (P-value = 0.023).

به دست آوردن این نتیجه خوب است، اما یک سوال همچنان باقی است که هنوز به آن پاسخی داده نشده است و دلیل اصلی نوشتن این متن است.

 سوال وجود ارتباط معنادار بین تحصیلات و تاهل در کدام گروه‌ها وجود دارد؟ به عبارت دیگر آن چیزی که باعث شده است در حالت کلی تحصیلات و تاهل بر روی یکدیگر اثر معنادار بگذارند، در کدام سطوح و گروه‌ها دیده می‌شود. آیا احیاناَ مواردی بوده است که با یکدیگر اختلاف معنادار نداشته‌اند؟

به منظور پاسخ به این سوال لازم است، ما آزمون جدیدی با نام مقایسه‌های چندگانه Pairwise Z-Tests معرفی کنیم.

Pairwise Z-Tests

 اولین  موضوعی که مطرح است این است که این آزمون چیست و چه کاری انجام می‌دهد؟

 

آزمون مقایسه‌های Z که نام دقیق‌تر آن Z-Tests for Independent Proportions است، به مقایسه درصدهای ستونی با یکدیگر می‌پردازد.

برای درک بهتر یک‌بار دیگر جدول Marital Status * Education Level Crosstabulation را به صورت زیر نگاه کنید.

مقایسه درصدهای ستونی در جدول توافقی بین تحصیلات و تاهل

 

ببینید، Z-Tests for Independent Proportions به مقایسه این درصدها با یکدیگر که در جدول بالا برایتان مشخص کرده‌ام، می‌پردازد.

یعنی به دنبال این است که عدد ۴۶.۲٪ که مربوط به افراد Never married و Middle school or lower را با ۴۰.۰٪ که مربوط به افراد Never married و High school است، با هم مقایسه کند. به همین ترتیب سایر اعداد و درصدها در هر سطر را با هم مقایسه کند.

استفاده از این آزمون به ما کمک می‌کند بدانیم ارتباط معنادار به دست آمده بین تاهل و تحصیلات در کدام سطوح رخ داده است.

حال بیایید با استفاده از نرم‌افزار SPSS آزمون Z-Tests for Independent Proportions را انجام دهیم. از مسیر زیر استفاده می‌کنیم.

Analyze → Tables→ Custom Tables

 

مسیر رسم انواع جداول توافقی در نرم‌افزار SPSS

 

اگر دقت کنید، مسیر بالا همان مسیری است که از آن جهت رسم انواع جدول‌های توافقی و فراوانی در نرم‌افزار SPSS از آن استفاده می‌کنیم.

پنجره Custom Tables به صورت زیر برای ما باز خواهد شد. ما در این پنجره، Education Level را در ستون و Marital Status را در سطر قرار می‌دهیم.

تنظیمات Custom Tables و انتخاب گزینه N% Summary Statistics

 

در تنظیمات بالا، جدول فراوانی هر کدام از سطوح تحصیلات و تاهل به دست می‌آید. با این حال ما به دنبال به دست آوردن درصدهای ستونی نیز هستیم. برای انجام این کار گزینه N% Summary Statistics را انتخاب می‌کنیم. با انجام این کار پنجره تنظیمات Summary Statistics زیر برای ما باز می‌شود.

انتخاب گزینه % Column N به منظور نمایش درصدهای ستونی

 

در این پنجره گزینه % Column N را به کادر Display به صورت زیر دراگ می‌کنیم.

قرار دادن % Column N در کادر Display

 

خب، حال در پنجره Summary Statistics گزینه Apply to Selection را می‌زنیم و سپس Close می‌کنیم. بار دیگر به پنجره Custom Tables می‌رویم. تصویر زیر از این پنجره را این بار ببینید.

پنجره Custom Tables پس از انتخاب % Column N و تب Test Statistics

 

در این حالت، گزینه % Column N نیز به نتایج جدول اضافه شده است. بنابراین می‌توانیم به هنگام مشاهده خروجی‌ها و جداول، درصدهای ستونی را نیز مشاهده کنیم.

در اینجا یک نکته مهم وجود دارد. تب Test Statistics را ببینید. من در تصویر بالا با کادر دور آن را برایتان مشخص کرده‌ام. روی این تب برنید. ما می‌خواهیم با استفاده از ابزار و امکانات قرار گرفته در این تب آزمون کای اسکوئر و Z را انجام دهیم.

در تصویر زیر این تب و پنجره باز شو آن را برایتان آورده‌ام.

تب Test Statistics در پنجره Custom Tables

 

مواردی را که لازم است انتخاب کنیم در این تصویر مشخص شده است. این موارد شامل مقایسه درصدهای ستونی، به دست آوردن مقادیر احتمال معناداری، استفاده از آزمون بونفرونی و آزمون استقلال Chi-square است.

دیگر در پنجره Custom Tables کاری نداریم. به سادگی می‌توانید OK کنید. پس از آن در Output نرم‌افزار SPSS نتایج و جداول توافقی و معناداری‌ها آمده است.

کار ساده‌تر

 Syntax 

کار ساده‌تر این است که به جای این‌که از مسیر بالا و تنظیمات نوشته شده استفاده کنیم، خیلی ساده در محیط Syntax نویسی نرم افزار SPSS برنامه و دستورات زیر را بنویسیم.

 

 

به سادگی با استفاده از Syntax بالا در محیط برنامه‌نویسی نرم‌افزار SPSS، جدول توافقی شامل فراوانی و درصد فراوانی ستونی، آزمون استقلال کای دو و از همه مهم‌تر همان چیزی که به دنبال آن بودیم یعنی مقایسه نسبت‌ها و درصدها که با استفاده از Z-Test انجام شده است، به دست می‌آید.

در ادامه نتایج و جدول‌های به دست آمده پس از Run کردن این Syntax را مشاهده می‌کنیم. این نتایج در Output نرم افزار SPSS قابل مشاهده است.

به ترتیب آن‌ها را بیان می‌کنیم.

در ابتدا و در جدول زیر، فراوانی و درصد فراوانی ستونی به ازای هر کدام از گروه‌های تحصیلات و تاهل، آمده است.

جدول توافقی فراوانی و درصد ستونی تحصیلات و تاهل

 

اگر دقت کنید این جدول و در ادامه جدول بعدی یعنی Pearson Chi-Square Tests را در همان تحلیل‌های ابتدای متن که به آزمون کای دو می‌پرداختیم، به دست آورده بودیم.

جدول Pearson Chi-Square Tests

 

بر مبنای نتایج جدول Pearson Chi-Square Tests نیز به دست آوردیم که در این مثال ما، تحصیلات و تاهل به یکدیگر وابسته بوده و بر روی هم اثر می‌گذارند. در واقع نتایجی که تا اینجا به دست آمده چیز جدیدی نیست و با استفاده از یک آزمون کای اسکوئر ساده نیز می‌توانستیم به آن‌ها برسیم.

اما هدف از این متن فقط این نتایج نبوده است. بلکه ما به دنبال مقایسه درصدها در هر گروه تحصیلات و تاهل هستیم. در واقع ما می‌خواهیم بدانیم تاثیرگزاری معنادار بین تحصیل و تاهل در کدام گروه‌ها رخ داده است.

برای انجام این کار گفتیم از آزمون Z-Tests for Independent Proportions استفاده می‌کنیم. نتیجه به دست آمده از این آزمون را می‌توانید در جدول زیر با نام Comparisons of Column Proportions ببینید. در واقع مبنای کار ما همان Syntax بالا و یا مسیر و تنظیمات بیان شده است.

جدول Comparisons of Column Proportions و مشخص کردن موارد معنادار

 

خب، حال بیایید به توضیح جدول Comparisons of Column Proportions بپردازیم.

 

توضیح جدول

 ۱ 

در خانه وضعیت تاهل Never married و وضعیت تحصیلی Middle school or lower عبارت و کلمات D (.020) نوشته شده است. حرف D به معنای آن است که این خانه با گروهی که به تعریف نرم‌افزار D هستند (یعنی وضعیت تحصیلی Master’s) اختلاف معنادار دارد. به بیان ساده‌تر یعنی این‌که در بین افرادی که ازدواج نکرده‌اند، فراوانی افراد دارای سطح تحصیلی راهنمایی یا کمتر با افراد دارای تحصیلات کارشناسی ارشد، اختلاف معنادار دارند. پاسخ به سوال چقدر اختلاف معنادار دارند در پرانتز نوشته شده است. عدد داخل پرانتز به معنای مقدار احتمال یا همان P-value است که برابر با ۰.۰۲۰ به دست آمده است.

 ۲ 

در خانه Never married و High school عبارت D (.035) نوشته شده است. درباره D که گفتیم یعنی این افراد با Master’s اختلاف معنادار دارند. مقدار احتمال نیز برابر با ۰.۰۳۵ شده است. این مطلب نیز نشان می‌دهد بین افرادی که ازدواج نکرده‌اند، فراوانی افراد دارای سطح تحصیلی دبیرستان با افراد دارای تحصیلات کارشناسی ارشد، اختلاف معنادار دارند.

 ۳ 

در خانه Married و Master’s عبارت‌های A (.006) و B (.019) نوشته شده است. این به معنای آن است که در بین افراد ازدواج کرده، سطح تحصیلی Master’s با سطح تحصیلی Middle school or lower به اندازه مقدار احتمال P-value = 0.006 اختلاف معنادار دارد. به همین ترتیب در بین افراد ازدواج کرده سطح تحصیلی Master’s با سطح تحصیلی High school به اندازه مقدار احتمال P-value = 0.019 اختلاف معنادار دارد.

 

 سوال بقیه خانه‌های جدول Comparisons of Column Proportions خالی است. منظور از آن‌ها چیست؟

پاسخ خیلی ساده است.

در این خانه‌ها اختلاف معنادار دیده نمی‌شود. به عنوان مثال در بین افراد با وضعیت تاهل Divorced و Widowed هیچ‌کدام از گروه‌های تحصیلی با یکدیگر اختلاف معنادار ندارند.

جالب توجه است که سطح تحصیلی Bachelor’s و PhD or higher با هیچکدام از سطوح تحصیلی دیگر در این مثال ما اختلاف معنادار ندارد.

 

نکته مهم

 سطر و ستون 

ما در جدول Comparisons of Column Proportions مقایسه درصدهای ستونی به ازای هر کدام از سطوح وضعیت تاهل را انجام دادیم. به عنوان مثال بررسی کردیم در بین افرادی که هنوز ازدواج نکرده‌اند، کدامیک از سطوح تحصیلی با یکدیگر متفاوت هستند.

حال فرض کنید، ایده دیگری داریم. ما می‌خواهیم گروه‌های مختلف تاهل را هم با یکدیگر مقایسه کنیم. برای انجام این کار لازم است در جدول Comparisons of Column Proportions جای سطر و ستون را با هم عوض کنیم.

من در Syntax زیر این کار را انجام داده‌ام.

 

 

نتایج را نیز در ادامه آورده‌ام. ابتدا جدول فراوانی و درصد فراوانی آمده است. نتایج با جدول قبلی که در آن سطوح تحصیلی در ستون‌ها قرار داشتند، چندان تفاوتی ندارد. فقط درصدها عوض شده‌اند. فراوانی‌ها نیز فرقی نکرده‌اند.

جدول فراوانی و درصد ستونی سطوح تاهل

 

به عنوان مثال این جدول نشان می‌دهد ۲۰ درصد افرادی که ازدواج نکرده‌اند، دارای تحصیلات راهنمایی و کمتر هستند. تعداد این افراد هم که فرقی نکرده و همان ۱۸ نفر جدول فراوانی قبلی است.

جدول Pearson Chi-Square Tests نیز که نتایجی کاملاَ مشابه با حالت قبل دارد. این مطلب نیز واضح است زیرا چیزی عوض نشده و فقط جای سطر و ستون را عوض کرده‌ایم.

اما نتایج جدول Comparisons of Column Proportions عوض شده است. آن را ببینیم.

جدول Comparisons of Column Proportions وضعیت تاهل در ستون

 

نتایج جدول Comparisons of Column Proportions به دست آمده در بالا بیانگر آن است که در بین افراد دارای سطح تحصیلات راهنمایی و کمتر، فراوانی افراد ازدواج نکرده با افراد ازدواج کزده، اختلاف معنادار دارد (P-value = 0.039).

در بین افراد دارای تحصیلات کارشناسی ارشد نیز افراد Married با Never married اختلاف معنادار دارند (P-value = 0.043).

در بقیه موارد نیز اختلاف معنادار مشاهده نمی‌شود.

در پایان این‌که با استفاده از آزمون Chi-square می‌توانید فرضیه استقلال و یا وابستگی بین دو Variable سطح‌بندی و گروه‌بندی شده را بررسی کنیم. آزمون Z-Tests for Independent Proportions نیز به ما کمک می‌کند تا بتوانیم به مقایسه چندگانه سطوح با یکدیگر بپردازیم.

 

چگونه به این مقاله رفرنس دهیم

GraphPad Statistics (2021). Chi-Square and Multiple Comparisons Pairwise Z-Tests. Statistical tutorials and software guides. Retrieved Month, Day, Yearfrom https://graphpad.ir/spss-chi-square-test-with-pairwise-z-tests/.php

For example, if you viewed this guide on 12th January 2022, you would use the following reference

GraphPad Statistics (2021). Chi-Square and Multiple Comparisons Pairwise Z-Tests. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/spss-chi-square-test-with-pairwise-z-tests/.php

 

ارایه خدمات تحلیل و مشاوره آماری

گراف پد برای شما خدمات مشاوره و انجام انواع تحلیل‌های آماری را ارایه می‌دهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.

گراف پد جمعی از رتبه‌های برتر آزمون دکترا آمار دانشگاه‌های ایران | برجسته در موسسه بین‌المللی تحقیقات | دارای نماد اعتماد الکترونیک از مرکز توسعه تجارت الکترونیکی ایران و مجوز رسمی ثبت به شماره ۴۱۸۸۱ و شناسه ملی ۱۴۰۰۶۸۳۲۳۱۹