آنالیز واریانس چندگانه دو طرفه Two-way MANOVA با SPSS
آنالیز واریانس Analysis of Variance یا همان ANOVA یکی از مهمترین تحلیلهای آماری شناخته میشود. در این نوشتار ما قصد داریم درباره آنالیز واریانس چندگانه دو طرفه با نام Two-way MANOVA صحبت کنیم.
در مبحث قبلی به آنالیز واریانس دو طرفه Two-way ANOVA پرداختیم. از اینجا میتوانید ویدئو و موضوعات مطرح شده آنالیز واریانس دو طرفه را مشاهده کنید.
تحلیل آنالیز واریانس چندگانه دو طرفه یا Two-way MANOVA هنگامی مورد استفاده قرار میگیرد که بخواهیم اندازههای بیش از یک کمیت وابسته Dependent Variable را در بین گروههای مستقل دو فاکتور Factor مورد مقایسه قرار دهیم.
در شکل زیر میتوانید نحوه طراحی آنالیز واریانس چندگانه دو طرفه را مشاهده کنید.
سوال
چرا میگوییم آنالیز واریانس چندگانه دو طرفه؟
پاسخ ساده است. هنگامی که بیش از یک کمیت وابسته Dependent Variable با نام اختصاری D>1 و بیش از یک Factor با نام اختصاری F>1 داشته باشیم، مطالعه ما از نوع آنالیز واریانس دو طرفه خواهد بود.
در این متن، تحلیل آنالیز واریانس چندگانه دو طرفه با استفاده از نرمافزار SPSS و روش مدل خطی عام General Linear Model و یا همان GLM انجام خواهد شد.
فایل دیتا و خروجی نرمافزار مثال را میتوانید از اینجا دانلود کنید. در تصویر زیر نیز توضیحاتی درباره فایل مثال آمده است.
همانگونه که در تصویر بالا مشاهده میکنید، میخواهیم درصد موفقیت Percent و نمرات هر فرد Score را که در اینجا Dependent Variable به حساب میآیند، در بین فاکتورهای Cycle و Age که به ترتیب بیانگر سیکلهای درمان و گروههای سنی هستند، مورد مقایسه قرار دهیم.
از آنجا که ما دارای بیشتر از یک Dependent Variable هستیم، پس مطالعه ما چندگانه یا همان Multivariate است. به همین ترتیب به دلیل اینکه تعداد فاکتورهای مورد مطالعه از یک بیشتر است پس تحلیل ما Two-way خواهد بود. به این ترتیب این مثال یک مثال آنالیز واریانس چندگانه دوطرفه با نام اختصاری Two-way MANOVA خواهد بود.
میتوانیم به اختصار Dependent Variable را DV و فاکتورها را که نقش کمیتهای مستقل یعنی Independent Variable را دارند، IV بیان کنیم.
به نحوه ورود دادهها به نرمافزار SPSS دقت کنید. در یک ستون با نام Percent، همه اعداد درصد موفقیت و در ستون دیگر با نام Score نمرات هر فرد زیر هم نوشته شده است. Measure این ستونها از نوع Scale است و همانگونه که بیان کردیم قرار است نقش Dependent Variable را بازی کنند.
در ستونهای دیگر که در این مثال با نام Cycle و Age هستند، به ازای هر درصد موفقیت و نمره، گروه درمانی و سنی آن فرد آمده است. Measure این ستونها میتواند از نوع Ordinal و یا Nominal باشد. این ستونها نقش Factor یا IV را در یک مطالعه ANOVA خواهتد داشت.
حال بیایید به ارایه و انجام آنالیز واریانس چندگانه دو طرفه Two-way MANOVA با استفاده از روش General Linear Model بپردازیم.
روش تحلیل
General Linear Model , Multivariate
مسیر انجام آنالیز واریانس هنگامی که میخواهیم از روش General Linear Model استفاده کنیم، به صورت زیر خواهد بود.
مسیر نرمافزار
Analyze → General Linear Model → Multivariate
در شکل زیر مسیر و نحوه قرار گرفتن ستون دادهها در نرمافزار SPSS جهت انجام آنالیز واریانس چندگانه دو طرفه با استفاده از Multivariate روش GLM آمده است. همچنین میتوانید فرض صفر و فرض مقابل را مشاهده کنید. همانگونه که مشاهده میکنید فرض صفر بیان میکند که درصد موفقیت و نمرات در گروههای درمانی و سنی (به عنوان فاکتورهای مطالعه)، برابر است و فرض مقابل بر این نظر است که میانگین Percent و Score در گروههای مختلف فاکتورها متفاوت است.
با رفتن به این مسیر، پنجره با نام Multivariate باز میشود. Percent و Score را در کادر Dependent Variable و Cycle و Age را در کادر Fixed Factor قرار میدهیم.
خوب است در همین جا این نکته را بیان کنیم که به دلیل اینکه در کادر Fixed Factor ستونها و Variableهای Cycle و Age قرار گرفتهاند، مطالعه ما آنالیز واریانس چندگانه دوطرفه Two-way MANOVA میباشد.
در پنجره Multivariate تبهای مختلفی دیده میشود. در تب Plot میتوانیم نمودار و گراف درصد موفقیت به ازای هر کدام از فاکتورها را مشاهده کنیم.
در تب Post Hoc انواع مقایسههای دوگانه بین گروههای مختلف Factor مشاهده میشود. با استفاده از این تب میتوانیم درصد موفقیت را بین هر دو سیکل و گروه سنی دلخواه، مقایسه کنیم. در تصویر زیر میتوانید انواع آزمونهای مقایسهای چندگانه برای میانگینهای مشاهده شده را ببینید.
به عنوان مثال آزمونهای LSD و دانکن Duncan را انتخاب کردهایم.
در تب EM Means میتوانیم میانگینهای حاشیهای به ازای هر کدام از گروههای Factor را به دست آوریم. با انتخاب گزینه Compare main effects اثزات اصلی میانگینهای حاشیهای قابل مقایسه با همدیگر هستند.
به همین ترتیب در تب Options آمارههای توصیفی، اندازه اثر effect size و توان power آزمون به همراه آزمونهای همگنی واریانسها را انتخاب میکنیم.
حال OK میکنیم. در فایل Output نرمافزار SPSS نتایج و خروجیهای زیر به دست میآید. به ترتیب آنها را بیان میکنیم. در ابتدا و در جدول Between-Subjects Factors اسامی گروههای هر کدام از Factor ها و تعداد هر گروه بیان شده است.
به همین ترتیب در جدول زیر که حاصل انتخاب گزینه Descriptive Statistics از تب Options در تنظیمات تحلیل Multivariate است، انواع آمارههای توصیفی درصد موفقیت و نمرات به ازای هر کدام از سیکلهای درمانی و گروههای سنی آمده است.
در یک تحلیل چندگانه Multivariate با آزمونی به نام Box’s M روبهرو هستیم. از این آزمون جهت بررسی فرضیه همگنی ماتریس کوواریانس، استفاده میکنیم. در جدول زیر میتوانیم نتیجه آزمون Box’s M را مشاهده کنیم. فرض صفر در این آزمون همگن بودن ماتریس کوواریانس است. نتیجه به دست آمده بیانگر رد فرض صفر و عدم همگن بودن ماتریس کوواریانس است (P-value = 0.006).
با استفاده از نتایج آزمون Box’s M تصمیم میگیریم که در جدول Multivariate Tests از کدام آزمون استفاده کنیم. در جدول زیر نتایج این جدول آمده است. اگر فرضیه همگنی ماتریس کوواریانس تایید شود از آزمون Pillai’s Trace استفاده خواهیم کرد. در غیر این صورت میتوان از سایر آزمونها استفاده کرد.
با توجه به رد فرضیه همگنی ماتریس کوواریانس، در جدول Multivariate Tests از آزمون Wilks’ Lambda استفاده میکنیم.
نتیجه این آزمون نشاندهنده آن است که Cycle و سطوح مختلف آن به عنوان یک Independent Variable یک عامل موثر بر Percent و Score به عنوان Dependent Variables است (P-value < 0.001).
همچنین نتیجه این آزمون نشان میدهد Age و سطوح مختلف آن به عنوان یک Independent Variable یک عامل موثر بر Percent و Score نیست (P-value = 0.728).
اثر متقابل Cycle * Age نیز عامل موثر بر Percent و Score نیست (P-value = 0.117).
همچنین در جدول Levene’s Test of Equality of Error Variances آزمون لوین به منظور بررسی همگن بودن واریانس باقیماندههای مدل، آمده است. همانگونه که مشاهده میکنید به ازای هر کمیت وابسته یعنی Percent و Score نتایج به صورت جداگانه به دست آمده است.
نتیجه به دست آمده نشان میدهد واریانس خطاها در Percent همگن نیست (P-value < 0.001) اما در Score همگن است (P-value = 0.102).
به این کلمه مدل دقت کنید. یک سوال دقیق میتواند این باشد،
سوال
کدام مدل؟ مگر ما قصد مقایسه Dependent Variable در سطوح مختلف Factor ها را نداریم؟ خب، این موضوع یک مبحث مقایسهای است و مدل یک موضوع رگرسیونی و ارتباط سنجی. این دو چه ارتباطی با هم دارند و چگونه میتوان از یک بررسی مقایسهای به مباحث مدلبندی و رگرسیونی رسید؟
موارد بالا سوالات بسیار دقیقی است و ما سعی میکنیم در ادامه به آنها پاسخ دهیم.
حال بیایید به بررسی نتایج جدول مهم Tests of Between-Subjects Effects بپردازیم. در شکل زیر برخی از توضیحات جدول آمده است. در ادامه بیشتر به آن میپردازیم.
در جدول Tests of Between-Subjects Effects هنگامی که مطالعه ما Two way MANOVA است، آزمون معناداری فاکتورها، اثرات اصلی آنها Main Effect و اثرات متقابل Interaction Effect فاکتورها بر روی هر کدام از Dependent Variableها به صورت جداگانه بررسی میشود. در این مثال و از آنجا که ما به موضوع آنالیز واریانس چندگانه دو طرفه پرداختهایم، فاکتورهای Cycle و Age به همراه اثر متقابل آنها وجود دارد. حال به ترتیب به بررسی هر کدام از فاکتورها و تاثیر آن بر Dependent Variable ها میپردازیم.
-
فاکتور Cycle
نتیجه به دست آمده از جدول Tests of Between-Subjects Effects بالا بیانگر وجود تاثیر معنادار فاکتور Cycle بر Percent است (P-value < 0.001). این مطلب به بیان دیگر به معنای آن است که درصد موفقیت در گروههای مختلف سیکل درمانی، به صورت معنادار متفاوت است.
اندازه اثر این فاکتور بر Percent برابر با ۰.۱۲۳ به دست میآید. توضیح اینکه Partial Eta Squared عددی بین صفر تا یک است و مقادیر نزدیک به یک آن نشاندهنده تاثیر بیشتر آن فاکتور بر کمیت پاسخ است.
از آنجا که ما با یک مطالعه Multivariate روبهرو هستیم، بنابراین Dependent دیگری با نام Score نیز وجود دارد.
جدول Tests of Between-Subjects Effects بالا نشان میدهد فاکتور Cycle بر Score تاثیر معنادار در سطح پنج درصد ندارد (P-value = 0.090). این مطلب به معنای آن است که نمرات در گروههای مختلف سیکل درمانی، به صورت معنادار متفاوت نیست.
اندازه اثر این فاکتور بر Score برابر با ۰.۰۲۸ به دست میآید.
-
فاکتور Age
مثال ما آنالیز واریانس دو طرفه Two-way است. پس فاکتور دیگری نیز وجود دارد. در این مثال نام آن را Age گذاشتهایم.
به همین ترتیب نتیجه به دست آمده از جدول Tests of Between-Subjects Effects بالا بیانگر عدم وجود تاثیر معنادار فاکتور Age بر درصد موفقیت است (P-value = 0.825). به معنای این که درصد موفقیت در گروههای مختلف سنی، با یکدیگر اختلاف معنادار ندارد.
اندازه اثر این فاکتور بر Dependent Variable درصد موفقیت برابر با ۰.۰۰۴ به دست میآید. این عدد بسیار پایین است و نشاندهنده تاثیر بسیار ضعیف Age بر درصد موفقیت در این مطالعه است.
در واقع یک رابطه معکوس بین مقدار احتمال و اندازه تاثیر و یا همان Effect Size وجود دارد. به این ترتیب که اگر فاکتوری دارای مقدار احتمال اندک و معنادار باشد، اندازه تاثیر آن در مدل زیاد است و اگر مقدار احتمال بالا به دست بیاید یعنی وجود آن فاکتور در مدل معنادار نباشد، پس اندازه تاثیر پایین به دست میآید.
فاکتور Age بر Dependent نمرات نیز دارای تاثیر غیرمعنادار است (P-value = 0.440). اندازه اثر این فاکتور برابر با ۰.۰۱۲ به دست میآید.
- فاکتور Cycle * Age
نرمافزار SPSS اثر متقابل بین Cycle و Age را نیز بررسی میکند. نتیجه به دست آمده بیانگر عدم تاثیر معنادار اثر متقابل بر هر کدام از Dependent Variable ها در سطح معنیداری آلفای پنج درصد است (P-value = 0.422, P-value = 0.064).
اندازه اثر فاکتور متقابل بر Percent برابر با ۰.۰۴۰ به دست میآید. این میزان نیز اندک است و همان غیرمعنادار بودن اثر Cycle * Age را نشان میدهد.
اندازه اثر فاکتور متقابل Cycle * Age بر Score نیز برابر با ۰.۰۶۹ به دست میآید.
ستونی نیز با نام Observed Power مشاهده میشود. این ستون که از آن با نام توان مشاهده شده نیز نام برده میشود، بیانگر میزان درستی رد فرض صفر است. همانگونه که میدانیم فرض صفر به معنای عدم معناداری و عدم تاثیرگزاری فاکتور بر روی کمیت پاسخ است. پس رد این فرضیه یعنی پذیرش معناداری و اثرگزاری. حال Observed Power بررسی میکند که رد این فرضیه چقدر درست است. توان نیز عددی بین صفر تا یک است و مقادیر نزدیک به یک به معنای درست بودن رد فرض صفر است.
در این مثال Observed Power درصد موفقیت برای Cycle برابر با ۰.۹۹۹ به دست آمده است. به وضوح این عدد به معنای درست بودن رد فرض عدم معناداری و پذیرش معناداری است. به یک نکته اگر دقت کنید این است که Observed Power و Sig در خلاف جهت یکدیگر قرار دارند. یعنی اگر Sig بالا باشد، Power پایین به دست میآید و اگر Sig پایین باشد، Power بالا به دست میآید.
به همبن ترتیب Observed Power برای Age و Cycle * Age و کمیت وابسته درصد موفقیت، به ترتیب برابر با ۰.۱۰۷ و ۰.۵۰۴ به دست آمده است.
در پایین جدول نیز متنی به صورت R Squared = .201 (Adjusted R Squared = .148) برای Percent و R Squared = 0.094 (Adjusted R Squared = 0.034) برای Score دیده میشود. چنانچه با مباحث رگرسیونی آشنا باشید این همان ضریب تعیین R Squared مدل رگرسیونی است. عدد ضریب تعیین نشان میدهد مدل به دست آمده چقدر میتواند کمیت پاسخ را توضیح دهد.
در این مثال به معنای اینکه مدل شامل اثرات اصلی Cycle و Age و اثر متقابل Cycle * Age چقدر میتواند Dependent Variable ها و یا همان درصد موفقیت و نمرات را توضیح دهد. عدد ضریب تعیین مدل درصد موفقیت برابر با ۰.۲۰۱ شده است. به معنای اینکه مدل میتواند فقط حدود ۲۰ درصد، کمیت وابسته یا همان درصد موفقیت را براورد کند. این عدد به وضوح پایین است و عمده دلیل آن عدم معنادار بودن فاکتورهای Age و اثر متقابل Cycle * Age بر درصد موفقیت است.
برای مدل نمرات، عدد ضریب تعیین مدل برابر با ۰.۰۹۴ شده است. به معنای اینکه مدل حتی کمتر از یک درصد، کمیت وابسته Score را براورد میکند. پایین بودن این عدد به دلیل عدم معنادار بودن فاکتورهای Cycle و Age و اثر متقابل Cycle * Age بر Score است.
در بالا سوالی با عنوان کدام مدل؟ پرسیدیم و در اینجا داریم از مدل حرف میزنیم. خوب است حال به پاسخ این سوال بپردازیم و درباره مدل موجود در آنالیز واریانس چندگانه دوطرفه هنگامی که از روش مدل خطی عام یعنی General Linear Model استفاده میکنیم، صحبت کنیم.
در ابتدا تصویر زیر را مشاهده کنید. در این تصویر مدل آماری Two-way MANOVA هنگامی که از روش Multiivariate, GLM استفاده میکنیم، آمده است.
در واقع مدل خطی آنالیز واریانس چندگانه دو طرفه به صورت زیر است.
yijk = µ + αi + ßj + γij + εijk
در این مدل، همانند همه مدلهای آماری دیگر میخواهیم با استفاده از کمیتهای مستقل Independent Variable اندازههای کمیتهای وابسته Dependent Variable را به دست بیاوریم و میزان تاثیر کمیتهای مستقل بر وابسته را مورد ارزیابی قرار دهیم.
در مدل بالا y همان کمیت وابسته Dependent Variable است که در این مثال درصد موفقیت و نمرات بیان شده است. منظور از اندیس i گروه iام Factor آلفا و منظور از اندیس j گروه jام Factor بتا است. همچنین منظور از اندیس k نفر kام مورد بررسی است. مثلاَ وقتی داریم مدل Percent را مینویسیم y۱۳۵ یعنی درصد موفقیت نفر پنجم سیکل درمانی ۱ یا همان سیکل درمانی A و گروه سنی ۳ که همان گروه سنی ۳۰ تا ۴۰ سال میشود.
به ترتیب اجزای این مدل خطی را در ادامه توضیح خواهیم داد.
-
اثر ثابت μ
بیایید برای فهم این مدل از μ شروع کنیم. همانگونه که در شکل بالا نشان داده شده است μ همان Intercept یا اثر ثابت مدل است. μ نشاندهنده این است که بدون در نظر گرفتن فاکتورها یا همان Independent Variables (Cycle و Age)، DV ها اعم از Percent و Score چقدر خواهد بود. در جدول Tests of Between-Subjects Effects آزمون وجود اثر معنادار μ بر Percent و Score انجام شده است (P-value < 0.001, P-value = 0.088). اندازه اثر μ نیز مقدار بالایی گزارش شده است (۰.۲۰۱ = η2) برای Percent و (۰.۰۹۴ = η2) برای Score.
-
اثر اصلی فاکتور α
اما αi چیست؟ α به معنای Factor مورد بررسی (در این مثال سیکل درمان) در مدل خطی است. اندیس i هم بیانگر شماره و نوع سیکل درمان است. مثلاَ α۱ یعنی سیکل A و یا α۳ یعنی سیکل C.
در واقع در مدل خطی تحلیل واریانس دو طرفه (اعم از ساده یا چندگانه)، دو فاکتور خواهیم داشت. ما در این مدل به دنبال پاسخ به این سوال هستیم که آیا α و یا همان Factor سیکل درمان بر y یا همان کمیت وابسته Dependent Variable تاثیر معنادار دارد یا خیر. y نیز در دو کمیت درصد موفقیت و نمرات، تعریف میشود.
به کلمه تاثیر دقت کنید. به طور معمول ما در آنالیز واریانس به دنبال مقایسه گروههای مختلف با یکدیگر هستیم. اما در روش General Linear Model میخواهیم به بررسی تاثیر Factor بر Dependent Variable بپردازیم.
این دو یعنی مقایسه گروههای Factor با یکدیگر و بررسی تاثیر Factor بر روی کمیت وابسته در روش GLM، در امتداد و راستای یکدیگر هستند. در واقع هنگامی که بررسی میکنیم آیا Factor بر y اثر معنادار دارد یا خیر، به معنای این مفهوم است که آیا رفتار و عملکرد گروههای مختلف Factor در بررسی y با یکدیگر متفاوت است یا خیر.
به همین دلیل است که ANOVA در یک جا به مفهوم مقایسه بین گروههای Factor با یکدیگر و در جای دیگر به معنای بررسی وجود تاثیر گروهها بر کمیت وابسته است. چنانچه وجود این تاثیر، تایید شود به معنای این است که رفتار گروهها با یکدیگر متفاوت بوده و اگر وجود تاثیر، تایید نشود به معنای این است که رفتار گروهها با همدیگر همانند است.
در این مثال نتیجهای که از بررسی فاکتور سیکلهای درمانی به دست میآید این است که α یعنی نوع سیکل درمان، یک عامل اثرگزار معنادار بر موفقیت است (P-value < 0.001). به عبارت دیگر بین گروههای مختلف سیکل درمان، درصد موفقیت، متفاوت خواهد بود. اندازه اثر α نیز مقدار برابر با (۰.۱۲۳ = η2) گزارش شده است. اما α بر نمرات تاثیر معنادار ندارد (P-value = 0.090). یعنی بین گروههای مختلف سیکل، نمرات همانند هستند. اندازه اثر α نیز برابر با (۰.۰۲۸ = η2) گزارش میشود.
-
اثر اصلی فاکتور β
از آنجا که مدل ما آنالیز واریانس دو طرفه است، بنابراین دو فاکتور در مطالعه داریم. β بیانگر فاکتور دیگر مورد بررسی در مدل خطی یعنی همان گروههای سنی است. اندیس j هم نشاندهنده شماره گروه سنی است. مثلاَ β۱ یعنی گروه سنی کمتر از ۲۴ سال و یا β۴ یعنی گروه سنی بزرگتر از ۴۰ سال.
ما در این مدل به دنبال پاسخ به این سوال هستیم که آیا β و یا همان Factor سن بر y کمیت وابسته Dependent Variable تاثیر معنادار دارد یا خیر.
در این مثال نتیجهای که از بررسی فاکتور گروههای سنی به دست میآید این است که β یعنی سن، یک عامل اثرگزار معنادار بر درصد موفقیت نیست (P-value = 0.825). به معنای اینکه بین گروههای سنی، درصد موفقیت، مشابه است. اندازه اثر β نیز برابر با (۰.۰۰۴ = η2) به دست آمده است. به همین ترتیب β عامل اثرگزار معنادار بر نمرات نیز نیست (P-value = 0.440). یعنی بین گروههای سنی، Score ها، مشابه هم هستند. اندازه اثر β نیز برابر با (۰.۰۱۲ = η2) به دست آمده است.
-
اثر متقابل فاکتور α و β
همانگونه که گفتیم مدل ما آنالیز واریانس دو طرفه است، بنابراین میتوانیم علاوه بر دو فاکتور اصلی α و β، اثر متقابل آنها را که به صورت γ تعریف میشود را نیز در مدل خطی داشته باشیم. همانگونه که قبلاَ گفتیم اندیس i نوع سیکل درمان و اندیس j شماره گروه سنی را نشان میدهد. مثلاَ γ۴۴ یعنی سیکل درمان نوع D و گروه سنی بزرگتر از ۴۰ سال.
همانند بخشهایی قبلی ما در این مدل نیز به دنبال پاسخ به این سوال هستیم که آیا اثر توام و متقابل فاکتورهای α و β و یا همان سیکل درمان و گروههای سنی بر y کمیت وابسته Dependent Variable تاثیر معنادار دارد یا خیر.
در این مثال نتیجهای که از بررسی فاکتور اثر متقابل سیکل و سن به دست میآید این است که γ، یک عامل اثرگزار معنادار بر درصد موفقیت نیست (P-value = 0.422). به همین ترتیب γ، عامل اثرگزار معنادار بر نمرات نیز نیست (P-value = 0.064).
-
جمله خطا ε
مدل GLM همانند هر مدل آماری دیگری دارای خطا و باقیمانده است. در εijk بخش خطا بیان شده است. در جدول Tests of Between-Subjects Effects نتایج این بخش با نام Error قرار میگیرد. همانگونه که قبلاَ نیز گفتیم منظور از اندیس k نفر kام مورد بررسی است.
سطرهای دیگری نیز در جدول Tests of Between-Subjects Effects دیده میشود. در تصویر زیر درباره ارتباط بین این سطرها با مدل آماری GLM صحبت خواهیم کرد.
سطر Corrected Model یا مدل اصلاحشده، به فاکنورهای موجود در مدل اشاره میکند. از آنجا که این مثال ما آنالیز واریانس چندگانه دو طرفه است، دو فاکتور داشتیم که با نام Cycle و Age در دادهها نامگزاری شده بود و در مدل با علامتهای αi و βj آنها را نشان دادیم. به همین ترتیب فاکتور اثر متقابل آنها یعنی γij نیز در مدل وجود داشت. اگر در جدول Tests of Between-Subjects Effects دقت کنید، مقدار همه آمارههای Corrected Model مانند مجموع و میانگین مربعات، درجه آزادی، مقدار احتمال، اندازه اثر و توان، نوشته شده است. Sig مربوط به این سطر، آزمون کرده است که آیا مدل شامل β ،α و γ معنادار است یا خیر. نتیجه به دست آمده بیانگر معنادار بودن مدل خطی آنالیز واریانس چندگانه دو طرفه برای Percent است (P-value < 0.001). اندازه اثر مدل نیز در حالت کلی برابر با (۰.۲۱۰ = η2) گزارش شده است. اما مدل خطی آنالیز واریانس چندگانه دو طرفه برای Score معنادار نیست (P-value = 0.088). اندازه اثر مدل در حالت کلی برابر با (۰.۰۹۴ = η2) به دست میآید.
مجموع Corrected Model (فاکتورهای β ،α و γ ) و جمله خطا εijk با نام Corrected Total نامیده میشود. چنانچه مجموع مربعات آنها را با هم جمع کتید به همان عدد مجموع مربعات Corrected Total میرسید.
سطر Total نیز به وضوح به مجموع Corrected Total (که خودش مجموع Corrected Model و Error بود) و Intercept اشاره میکند. در واقع مجموع مربعات Total ترکیب مجموع مربعات همه اجزای مدل شامل، اثر ثابت با نام μ، فاکتورهای موجود در مدل که در این مثال αi و βj به همراه γij بود و جمله خطا با نام εik است.
به همین ترتیب R Squared یا ضریب تعیین که آن را میزان توضیح مدل توسط فاکتورها مینامیم، به صورت Corrected Model نقسیم بر Corrected Total تعریف میکنیم. واضح است هر چقدر R Squared بیشتر باشد به معنای توضیح بهتر و بیشتر کمیتهای وابسته Dependent Variables (در این مثال درصد موفقیت و نمرات) توسط فاکتورهای مدل است. برای بیشتر بودن ضریب تعیین باید جمله خطا و یا همان Error که در محرج فرمول ضریب تعیین قرار میگیرد، کمتر باشد.
تا اینجا سعی کردم درباره تمام اجزا و محتویات جدول Tests of Between-Subjects Effects به دلیل اهمیت آن بپردازم. در ادامه درباره سایر خروجیهای نرمافزار در تحلیل Two-way MANOVA (Univariate, GLM) صحبت میکنیم.
خاطرتان باشد در تنظیمات نرمافزار و در تب EM Means به دنبال آن بودیم که میانگینهای حاشیهای هر کدام از گروههای Factor را برحسب گروههای Factor دیگر به دست آوریم. همچنین با انتخاب گزینه Compare main effects میانگینهای حاشیهای گروهها را با یکدیگر مقایسه کنیم. منظور از حاشیهای نیز این است که آمارههای توصیفی یک Factor را برحسب Factor دیگر به دست بیاوریم.
حال در ادامه خروجیهای نرمافزار، نتایج مربوط به تنظیمات تب EM Means آمده است.
در این جدول آمارههای توصیفی حاشیهای Marginal مانند میانگین، خطای معیار و فواصل اطمینان ۹۵٪ برای درصد موفقیت و نمرات به ازای هر کدام از سیکلها آمده است. سوالی که اینجا مطرح میشود این است که این میانگینها چگونه محاسبه میشوند؟ نقش فاکتور دیگر یعنی گروههای سنی در محاسبه میانگینهای حاشیهای هر کدام از سیکلهای درمانی چیست؟ برای یافتن پاسخ این سوالها، اسلاید زیر را ببینید.
همانگونه که در جدول سمت راست اسلاید بالا میبینید، میانگین واقعی و مشاهده شده درصد موفقیت برای سیکل A عدد ۳۱.۷۳ است. این عدد بدون درنظر گرفتن فاکتور دیگر یعنی سن، برای درصد موفقیت سیکل A به دست آمده است.
حال به جدول سمت چپ اسلاید بالا نگاه کنید. میانگین حاشیهای درصد موفقیت برای سیکل A عدد ۳۱.۹۲ به دست آمده است. سوال این است که این عدد چگونه به دست میآید. برای پاسخ به این سوال به فرمول نوشته شده در تصویر بالا نگاه کنید.
همانگونه که میبینید، میانگین حاشیهای درصد موفقیت برای سیکل A در واقع میانگین وزنی به ازای هر کدام از گروههای سنی است. به بیان ساده اینکه نرمافزار نگاه میکند چند نفر از افراد دارای سیکل A دارای گروه سنی کمتر از ۲۴ سال بودهاند و میانگین درصد موفقیت آنها چقدر است؟ به همین ترتیب برای سایر گروههای سنی که سیکل A بر روی آنها انجام شده تعداد افراد و میانگین آنها چقدر بوده است. از حاصلضرب تعداد در میانگین به ازای هر کدام از گروههای سنی و سپس تقسیم نتیجه یر تعداد کل افرادی که دارای سیکل درمانی A بودهاند (۶۰ نفر)، میانگین حاشیهای سیکل A به دست میآید. همین فرایند برای محاسبه میانگین حاشیهای سایر سیکلهای درمانی انجام میشود.
با این حساب به ازای هر کدام از سیکلهای درمانی یک Marginal Mean به دست میآید.
یادتان باشد در تب EM Means با انتخاب گزینه Compare main effects از نرمافزار خواستیم که میانگینهای حاشیهای گروههای هر کدام از فاکتورها را نیز با یکدیگر مقایسه کند. این کار با استفاده از آزمون LSD انجام شده است. نتایج آن را میتوانید در شکل زیر مشاهده کنید. نتایج به تفکیک به ازای هر کدام از Dependent Variable ها انجام شده است.
در جدول Pairwise Comparisons بالا که به مقایسه دو به دو میانگینهای حاشیهای گروههای مختلف فاکتور Cycle با یکدیگر پرداخته است، معناداری یا عدم معناداری این اختلافها به دست آمده است.
به عنوان مثال میتوانیم ببینیم که میانگینهای حاشیهای درصد موفقیت Cycle A و Cycle B با یکدیگر اختلاف معنادار ندارند (P-value = 0.123) اما میانگینهای حاشیهای درصد موفقیت Cycle A و Cycle C با یکدیگر اختلاف معنادار دارند (P-value < 0.001).
برای DV نمرات نیز فقط میتوان یک اختلاف معنادار بین سیکلهای B و D مشاهده کرد (P-value = 0.039).
بقیه نتایج را نیز میتوانید در جدول بالا مشاهده کنید. با این حال به این نکته دقت کنید که این نتایج بر مبنای میانگین حاشیهای هر سیکل درمان به دست آمده است.
پس از جدول Pairwise Comparisons جدول دیگری با نام Multivariate Tests دیده میشود.
این جدول و نتایج آن همان نتایج بخش Cycle جدول Multivariate Tests در ابتدای خروجیهای نرمافزار است. بر مبنای این نتایج بیان کردیم که Factor سیکل، دارای تاثیر معنادار بر Dependent Variables است.
در ادامه خروجیهای نرمافزار جدول دیگری با نام Univariate Tests دیده میشود. بررسی به تفکیک دو کمیت وابسته Percent و Score انجام شده است.
در این جدول و به ازای هر کدام از DV ها، دو سطر با نامهای Contrast و Error وجود دارد. منظور از Error همان جمله خطا در مدل خطی آنالیز واریانس چندگانه دو طرفه است که در متنهای بالاتر به آن اشاره شد. چنانچه دقت کتید آمارههای مربوط به این سطر دقیقاَ برابر با آمارههای سطر Error در جدول Tests of Between-Subjects Effects است.
سطر Contrast نیز به فاکتورهای موجود در مدل خطی اشاره میکند. از آنجا که در حال بررسی میانگینهای حاشیهای فاکتور Cycle هستیم، بنابراین آمارهها و نتایج مربوط به Contrast دقیقاَ برابر با نتایج سطر Cycle در جدول Tests of Between-Subjects Effects است. در بالا نیز درباره این نتایج و معنادار بودن یا نبودن آنها صحبت کردیم که بار دیگر تکرار نمیکنیم. تنها نکته اینکه از آنجا که ما در خروجیهای بخش Estimated Marginal Means هستیم، این نتایج و جدولها به همان دادههای میانگینهای حاشیهای مربوط است.
پاسخ به این سوال. آیا میانگینهای حاشیهای DV ها برای فاکتور سیکل مانند یکدیگر هستند؟ به عبارت دیگر آیا با درنظر گرفتن ردههای سنی، اختلاف معناداری در درصد موفقیت و نمرات سیکلهای مختلف دیده میشود؟
جواب برای درصد موفقا مثبت است (P-value < 0.001. و میانگینهای حاشیهای درصد موفقیت انواع سیکل با یکدیگر متفاوت هستند. اما برای نمرات منفی است (P-value = 0.090. و میانگینهای حاشیهای نمرات در انواع سیکل با یکدیگر مشابه هستند.
تمام مطالبی که در بالا و برای میانگینهای حاشیهای فاکتور Cycle بیان کردیم، برای فاکتور دیگر مطالعه یعنی Age نیز در خروجیهای نرمافزار SPSS آمده است.
در ادامه به بررسی میانگینهای حاشیهای فاکتور Age میپردازیم.
همانند میانگینهای حاشیهای فاکتور سیکلهای درمانی، در این جدول آمارههای توصیفی حاشیهای Marginal مانند میانگین، خطای معیار و فواصل اطمینان ۹۵٪ برای درصد موفقیت و نمرات به ازای هر کدام از گروههای سنی آمده است. در اسلاید زیر درباره نحوه محاسبه این Marginal Means توضیح داده شده است.
همانگونه که در جدول سمت راست اسلاید بالا میبینید، میانگین واقعی و مشاهده شده درصد موفقیت برای گروه سنی کمتر از ۲۴ سال عدد ۲۷.۵۷ است. این عدد بدون درنظر گرفتن فاکتور دیگر یعنی سیکل درمان برای درصد موفقیت گروه سنی کمتر از ۲۴ سال به دست آمده است.
حال به جدول سمت چپ اسلاید بالا نگاه کنید. میانگین حاشیهای درصد موفقیت برای گروه سنی کمتر از ۲۴ سال عدد ۲۸.۱۴ به دست آمده است. سوال این است که این عدد چگونه به دست میآید. برای پاسخ به این سوال به فرمول نوشته شده در تصویر بالا نگاه کنید.
همانگونه که میبینید، میانگین حاشیهای درصد موفقیت برای گروه سنی کمتر از ۲۴ سال در واقع میانگین وزنی به ازای هر کدام از سیکلهای درمانی است. به بیان ساده اینکه نرمافزار نگاه میکند چند نفر از افراد گروه سنی کمتر از ۲۴ سال، دارای سیکل A بودهاند و میانگین درصد موفقیت آنها چقدر است؟ به همین ترتیب برای سایر گروههای فاکتور Cycle که کمتر از ۲۴ سال بودهاند، تعداد افراد و میانگین آنها چقدر بوده است. از حاصلضرب تعداد در میانگین به ازای هر کدام از سیکلهای درمانی و سپس تقسیم نتیجه یر تعداد کل افرادی که دارای کمتر از ۲۴ سال بودهاند (۵۹ نفر)، میانگین حاشیهای گروه سنی کمتر از ۲۴ سال به دست میآید. همین فرایند برای محاسبه میانگین حاشیهای سایر گروههای سنی انجام میشود.
به این ترتیب به ازای هر کدام از گروههای سنی یک Marginal Mean به دست میآید.
در جدول زیر با نام Pairwise Comparisons میانگینهای حاشیهای هر کدام از گروههای سنی با استفاده از آزمون LSD با یکدیگر مقایسه شده است. نتایج آن را میتوانید در شکل زیر مشاهده کنید. نتایج به تفکیک به ازای هر کدام از Dependent Variable ها انجام شده است.
در جدول Pairwise Comparisons بالا که به مقایسه دو به دو میانگینهای حاشیهای گروههای مختلف فاکتور Age با یکدیگر پرداخته است، معناداری یا عدم معناداری این اختلافها به دست آمده است.
به وضوح میتوانیم ببینیم که میانگینهای حاشیهای درصد موفقیت و نمرات هر دو گروه سنی دلخواه، با یکدیگر اختلاف معنادار ندارد. این مطلب و عدم معنادار بودن فاکتور Age را در بخشهای بالاتر و جدول Tests of Between-Subjects Effects نیز توضیح دادیم.
پس از جدول Pairwise Comparisons جدول دیگری با نام Multivariate Tests دیده میشود.
این جدول و نتایج آن همان نتایج بخش Age جدول Multivariate Tests در ابتدای خروجیهای نرمافزار است. بر مبنای این نتایج بیان کردیم که فاکتور گروههای سنی، دارای تاثیر معنادار بر Dependent Variables نیست.
به همین ترتیب و در ادامه خروجیهای نرمافزار، میانگینهای حاشیهای فاکتور Age، جدول دیگری با نام Univariate Tests دیده میشود.
در این جدول دو سطر با نامهای Contrast و Error وجود دارد. منظور از Error همان جمله خطا در مدل خطی آنالیز واریانس دو طرفه است که در متنهای بالاتر به آن اشاره شد. چنانچه دقت کتید آمارههای مربوط به این سطر دقیقاَ برابر با آمارههای سطر Error در جدول Tests of Between-Subjects Effects است.
سطر Contrast نیز به فاکتورهای موجود در مدل خطی اشاره میکند. از آنجا که در حال بررسی میانگینهای حاشیهای فاکتور Age هستیم، بنابراین آمارهها و نتایج مربوط به Contrast دقیقاَ برابر با نتایج سطر Age در جدول Tests of Between-Subjects Effects است. بار دیگر بیان میکنم که ما در خروجیهای بخش Estimated Marginal Means هستیم، این نتایج و جدولها به همان دادههای میانگینهای حاشیهای مربوط است.
در این جدول به سوال آیا میانگینهای حاشیهای سن مانند یکدیگر هستند، پاسخ داده شده است. به عبارت دیگر آیا با درنظر گرفتن انواع سیکل، اختلاف معناداری در درصد موفقیت ردههای مختلف سنی دیده میشود؟
جواب منفی است. میانگینهای حاشیهای ردههای سنی با یکدیگر همانند هستند. مطالعه بر روی هر دو کمیت درصد موفقیت و نمرات انجام شده است.
در پایان بخش Estimated Marginal Means جدول توافقی سیکل و گروههای سنی شامل آمارههای توصیفی میانگین، انحراف معیار از میانگین و فواصل اطمینان، آمده است. این جدول را میتوانید مشاهده کنید.
خب، مواردی که در بالا گفتیم مربوط به میانگینهای حاشیهای یا همان Marginal Means بود. در ادامه دربارهی میانگینهای مشاهده شده Observed Means صحبت میکنیم.
در تنظیمات انجام Two-way MANOVA و در تب Post Hoc به عنوان مثال آزمونهای LSD و دانکن Duncan را انتخاب کردیم. همانگونه که میدانیم با استفاده از این آزمونها میتوانیم به مقایسه دو به دو درصد موفقیت و نمرات در بین گروههای Factor بپردازیم.
در ادامه خروجیهای نرمافزار SPSS نتایج مربوط به این تنظیمات با نام Multiple Comparisons آمده است. به این نکته نیز توجه کنید که نتایج این بخش بر روی میانگینهای حسابی و مشاهده شده خود گروهها است و مانند بخش قبل بر مبنای میانگینهای حاشیهای نیست. بیشتر توصیه میشود جهت مقایسه بین گروهها فاکتورها از همین نوع مقایسات Post Hoc استفاده کنید.
در نتایج جدول زیر ما به مقایسه بین گروههای فاکتور Cycle پرداختهایم. از آزمون LSD نیز استفاده کردهایم.
به عنوان مثال نتایج جدول بالا نشان میدهد که هر چند درصد موفقیت سیکل A حدود ۱.۸ درصد از سیکل B بیشتر است اما از دیدگاه تست آماری، آنها مشابه یکدیگر هستند (P-value = 0.154). با این حال مثلاَ سیکل A حدود ۸.۱ درصد از سیکل C درصد موفقیت بیشتری دارد و از دیدگاه آزمون LSD این بیشتر بودن معنادار نیز هست (P-value < 0.001). به همین ترتیب میتوانیم نتیجه مقایسه بین هر دو گروه سیکل درمانی را در جدول بالا مشاهده کنیم. برای Dependent Variable نمرات نیز میتوانید مقایسه بین گروههای سیکل درمانی را مشاهده کنید.
ما از آزمون دانکن نیز جهت به دست آوردن گروههای دارای درصد موفقیت و نمرات مشابه و همانند یکدیگر، استفاده میکنیم. همانگونه که در جدول زیر میبینید، نتایج به دست آمده از آزمون دانکن، تعداد گروههای سیکل درمان که ۴ گروه بوده است را به سه زیرگروه تقسیمبندی کرده است. در زیرگروه ۱، سیکل C قرار دارد که با بقیه سیکلها اختلاف معنادار درصد موفقیت دارد. در زیرگروه ۲، سیکلهای D و B قرار دارند که میزان موفقیت آنها با یکدیگر از دیدگاه تست دانکن، مشابه است. به همین ترتیب در زیرگروه شماره ۳، سیکلهای B و A هستند که آنها نیز دارای درصد موفقیت مشابه با هم میباشند.
برای کمیت وابسته نمرات، تعداد گروههای سیکل درمان که ۴ گروه بوده است را به دو زیرگروه تقسیمبندی کرده است. در زیرگروه ۱، سیکلهای A ،D و C قرار دارد. در زیرگروه ۲، سیکلهای C ،A و B قرار دارند که میزان موفقیت آنها با یکدیگر از دیدگاه تست دانکن، مشابه است.
به همین ترتیب و در ادامه خروجیهای نرمافزار SPSS نتایج مربوط به Multiple Comparisons فاکتور Age آمده است. همانگونه که قبلاَ نیز گفتیم نتایج این بخش بر مبنای میانگینهای مشاهده شده گروهها است.
در نتایج جدول زیر مقایسه بین گروههای فاکتور Age آمده است. پرداختهایم. از آزمون بونفرونی استفاده کردهایم.
نتایج جدول بالا نشان میدهد درصد موفقیت گروه سنی ۲۴-۳۰ سال با گروه سنی بزرگتر از ۴۰ سال، اختلاف معنادار دارد. در سایر مقایسهها و در سطح معنیداری پنج درصد، اختلاف معنادار درصد موفقیت دیده نمیشود.
در Dependent Variable نمرات نیز، گروههای سنی با هم اختلاف معنادار ندارند.
در جدول زیر نتایج آزمون دانکن برای گروههای سنی آمده است. همانگونه که مشاهده میکنید بر مبنای این نتایج، در Percent چهار گروه سنی به دو زیرگروه تبدیل شدهاند. در زبرگروه شماره ۱، گروههای سنی بزرگتر از ۴۰ سال، کمتر از ۲۰ سال و بین ۳۰ تا ۴۰ سال قرار گرفتهاند، به این معنا که درصد موفقیت این گروههای سنی مشابه یکدیگر است.
به همین ترتیب زیرگروه شماره ۲، شامل گروههای سنی کمتر از ۲۴ سال، ۳۰ تا ۴۰ سال و ۲۴ تا ۳۰ سال است. این گروهها نیز دارای درصد موفقیت مشابه از دیدگاه آزمون دانکن هستند.
با این حال و بر مبنای آزمون Duncan کمیت وابسته Score تنها دارای یک زیر گروه است که به معنای آن است همه گروههای سنی دارای نمرات مشابه هم هستند و بین آنها اختلاف معنادار دیده نمیشود.
در پایان خروجیهای نرمافزار SPSS میتوانید، نمودارها و گرافها را مشاهده کنید. به یاد داشته باشید ما در تنظیمات انجام تحلیل Two-way MANOVA و در تب Plot از نرمافزار خواستیم نمودارهای خطی از درصد موفقیت و نمرات برای هر کدام از فاکتورها و همچنین اثرمتقابل آنها رسم کند. نتیجه را میتوانید در زیر ببینید.
به این نکته توجه کنید که این نمودارها براساس میانگینهای حاشیهای که در بخشهای بالاتر به آنها اشاره کردیم، رسم شده است.
همانگونه که در گراف بالا میبینید نمودار خطی درصد موفقیت برای هر کدام از سیکلهای درمان آمده است. Cycle C با درصد موفقیت ۲۴.۲۴ درصد کمترین میزان موفقیت را داشته است. در بالا نشان دادیم که این سیکل با بقیه سیکلها اختلاف معنادار دارد. بیشترین درصد موفقیت با ۳۱.۹۲ درصد به سیکل A مربوط میشود.
در شکل زیر نمودار درصد موفقیت به ازای هر کدام از گزوههای سنی آمده است.
همانگونه که در این گراف دیده میشود، درصد موفقیت گروههای سنی تقریباَ مشابه با یکدیگر است. ما در جدول Tests of Between-Subjects Effects نیز نشان دادیم که Age یک فاکتور اثرگزار بر درصد موفقیت نیست.
به همین ترتیب در شکل زیر نمودار درصد موفقیت اثر متقاطع سیکل و سن آمده است.
نکتهای که در این گراف دیده میشود این است که به نظر میرسد در سیکل A درصدهای موفقیت گروههای سنی تقریباَ مشابه و هم اندازه است. با این حال گروه سنی بالاتر از ۴۰ سال در سیکل A دارای بالاترین درصد موفقیت است. بنابراین پیشنهاد میشود برای افراد این گروه سنی، سیکل A انجام شود.
اما در سیکل C درصد موفقیت گروههای سنی بالاتر یعنی گروههای سنی ۳۰ سال و بیشتر دارای کمترین درصد موفقیت است. در اینجا پیشنهاد میشود برای افراد این گروه سنی، سیکل C انجام نشود.
از آنجا که ما با مثال آنالیز واریانس چندگانه دو طرفه روبهرو بودیم، بنابراین نمودارهای خطی برای Dependent دیگر یعنی Score نیز به دست آمده است. در ادامه این نمودارها آمده است.
شکل زیر نمودار خطی میانگین حاشیهای نمرات به ازای هر کدام از سیکلهای درمانی است.
همانگونه که در گراف بالا میبینید نمودار خطی نمرات برای هر کدام از سیکلهای درمان آمده است. اعداد تقریباَ مشابه با یکدیگر است و بین آنها نیز اختلاف معناداری مشاهده نمی شود.
در شکل زیر نمودار میانگین حاشیهای نمرات به ازای هر کدام از گزوههای سنی آمده است.
همانگونه که در این گراف دیده میشود، نمرات گروههای سنی تقریباَ مشابه با یکدیگر است. ما در جدول Tests of Between-Subjects Effects نیز نشان دادیم که Age یک فاکتور اثرگزار بر درصد موفقیت نیست.
به همین ترتیب در شکل زیر نمودار میانگین حاشیهای نمرات اثر متقاطع سیکل و سن آمده است.
خب، این هم از توضیحات روش آنالیز واریانس چندگانه دو طرفه که با استفاده از روش General Linear Model , Multivariate در نرم افزار SPSS به آن پرداختیم.
چگونه به این مقاله رفرنس دهیم
GraphPad Statistics (2020). Two-way MANCOVA analysis with SPSS. Statistical tutorials and software guides. Retrieved Month, Day, Year, from https://graphpad.ir/general-linear-models-multivariate-two-way-manova-spss/.php
For example, if you viewed this guide on 12th January 2022, you would use the following reference
GraphPad Statistics (2020). Two-way MANCOVA analysis with SPSS. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/general-linear-models-multivariate-two-way-manova-spss/.php
ارایه خدمات تحلیل و مشاوره آماری
گراف پد برای شما خدمات مشاوره و انجام انواع تحلیلهای آماری را ارایه میدهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.