آنالیز واریانس دو طرفه Two-way ANOVA با SPSS
آنالیز واریانس Analysis of Variance یا همان ANOVA یکی از مهمترین تحلیلهای آماری شناخته میشود. در این نوشتار ما قصد داریم درباره آنالیز واریانس دو طرفه صحبت کنیم.
در مبحث قبلی به آنالیز واریانس یک طرفه One way ANOVA پرداختیم. از اینجا میتوانید ویدئو و موضوعات مطرح شده آنالیز واریانس یک طرفه را مشاهده کنید.
تحلیل واریانس دو طرفه یا Two-way ANOVA هنگامی مورد استفاده قرار میگیرد که بخواهیم اعداد و اندازههای یک کمیت وابسته Dependent Variable را در بین گروههای مستقل دو فاکتور Factor مورد مقایسه قرار دهیم.
در شکل زیر میتوانید نحوه طراحی آنالیز واریانس دو طرفه را مشاهده کنید.

سوال
چرا میگوییم آنالیز واریانس دو طرفه؟
پاسخ ساده است. هنگامی که یک کمیت وابسته Dependent Variable با نام اختصاری D1 و بیش از یک Factor با نام اختصاری F>1 داشته باشیم، مطالعه ما از نوع آنالیز واریانس دو طرفه خواهد بود.
در این متن، تحلیل آنالیز واریانس دو طرفه با استفاده از نرمافزار SPSS و روش مدل خطی عام General Linear Model و یا همان GLM انجام خواهد شد.
فایل دیتا و خروجی نرمافزار مثال را میتوانید از اینجا دانلود کنید. در تصویر زیر نیز توضیحاتی درباره فایل مثال آمده است.
همانگونه که در تصویر بالا مشاهده میکنید، میخواهیم درصد موفقیت را که در اینجا Dependent Variable به حساب میآید، در بین فاکتورهای Cycle و Age که به ترتیب بیانگر سیکلهای درمان و گروههای سنی هستند، مورد مقایسه قرار دهیم.
به نحوه ورود دادهها به نرمافزار SPSS دقت کنید. در یک ستون با نام Percent، همه اعداد درصد موفقیت زیر هم نوشته میشود. Measure این ستون از نوع Scale است و همانگونه که بیان کردیم قرار است نقش Dependent Variable را بازی کند.
در ستونهای دیگر که در این مثال با نام Cycle و Age هستند، به ازای هر درصد موفقیت، گروه درمانی و سنی آن آمده است. Measure این ستونها میتواند از نوع Ordinal و یا Nominal باشد. این ستونها نقش Factor را در یک مطالعه ANOVA خواهتد داشت.
حال بیایید به ارایه و انجام آنالیز واریانس دو طرفه Two-way ANOVA با استفاده از روش General Linear Model بپردازیم.
روش تحلیل
General Linear Model , Univariate
مسیر انجام آنالیز واریانس هنگامی که میخواهیم از روش General Linear Model استفاده کنیم، به صورت زیر خواهد بود.
مسیر نرمافزار
Analyze → General Linear Model → Univariate
در شکل زیر مسیر و نحوه قرار گرفتن ستون دادهها در نرمافزار SPSS جهت انجام آنالیز واریانس دو طرفه با استفاده از Univariate روش GLM آمده است. همچنین میتوانید فرض صفر و فرض مقابل را مشاهده کنید. همانگونه که مشاهده میکنید فرض صفر بیان میکند که درصد موفقیت در گروههای درمانی و سنی (به عنوان فاکتورهای مطالعه)، برابر است و فرض مقابل بر این نظر است که میانگین درصد موفقیت در گروههای مختلف فاکتورها متفاوت است.
با رفتن به این مسیر، پنجره با نام Univariate باز میشود. Percent را در کادر Dependent Variable و Cycle و Age را در کادر Fixed Factor قرار میدهیم.
خوب است در همین جا این نکته را بیان کنیم که به دلیل اینکه در کادر Fixed Factor ستونها و Variableهای Cycle و Age قرار گرفتهاند، مطالعه ما آنالیز واریانس دوطرفه Two-way ANOVA میباشد.
در پنجره Univariate تبهای مختلفی دیده میشود. در تب Plot میتوانیم نمودار و گراف درصد موفقیت به ازای هر کدام از فاکتورها را مشاهده کنیم.

در تب Post Hoc انواع مقایسههای دوگانه بین گروههای مختلف Factor مشاهده میشود. با استفاده از این تب میتوانیم درصد موفقیت را بین هر دو سیکل و گروه سنی دلخواه، مقایسه کنیم. در تصویر زیر میتوانید انواع آزمونهای مقایسهای چندگانه برای میانگینهای مشاهده شده را ببینید.

به عنوان مثال آزمونهای بونفرونی Bonferroni و دانکن Duncan را انتخاب کردهایم.
در تب EM Means میتوانیم میانگینهای حاشیهای به ازای هر کدام از گروههای Factor را به دست آوریم. با انتخاب گزینه Compare main effects این میانگینهای حاشیهای قابل مقایسه با همدیگر هستند.

به همین ترتیب در تب Options آمارههای توصیفی، اندازه اثر effect size و توان power آزمون به همراه آزمونهای همگنی واریانسها را انتخاب میکنیم.

حال OK میکنیم. در فایل Output نرمافزار SPSS نتایج و خروجیهای زیر به دست میآید. به ترتیب آنها را بیان میکنیم. در ابتدا و در جدول Between-Subjects Factors اسامی گروههای هر کدام از Factor ها و تعداد هر گروه بیان شده است.

به همین ترتیب در جدول زیر که حاصل انتخاب گزینه Descriptive Statistics از تب Options در تنظیمات تحلیل Univariate است، انواع آمارههای توصیفی درصد موفقیت به ازای هر کدام از سیکلهای درمانی و گروههای سنی آمده است.

همچنین در جدول Levene’s Test of Equality of Error Variances آزمون لوین به منظور بررسی همگن بودن واریانس باقیماندههای مدل، آمده است. نتیجه به دست آمده نشان میدهد واریانس خطاها، همگن نیست (P-value < 0.001).

به این کلمه مدل دقت کنید. یک سوال دقیق میتواند این باشد،
سوال
کدام مدل؟ مگر ما قصد مقایسه Dependent Variable در سطوح مختلف Factor ها را نداریم؟ خب، این موضوع یک مبحث مقایسهای است و مدل یک موضوع رگرسیونی و ارتباط سنجی. این دو چه ارتباطی با هم دارند و چگونه میتوان از یک بررسی مقایسهای به مباحث مدلبندی و رگرسیونی رسید؟
موارد بالا سوالات بسیار دقیقی است و ما سعی میکنیم در ادامه به آنها پاسخ دهیم.
حال بیایید به بررسی نتایج جدول مهم Tests of Between-Subjects Effects بپردازیم. در شکل زیر برخی از توضیحات جدول آمده است. در ادامه بیشتر به آن میپردازیم.

در جدول Tests of Between-Subjects Effects هنگامی که مطالعه ما Two way ANOVA است، آزمون معناداری فاکتورها، اثرات اصلی آنها Main Effect و اثرات متقابل Interaction Effect فاکتورها بررسی میشود. در این مثال و از آنجا که ما به موضوع آنالیز واریانس دو طرفه پرداختهایم، فاکتورهای Cycle و Age به همراه اثر متقابل آنها وجود دارد. حال به ترتیب به بررسی هر کدام از فاکتورها و تاثیر آن بر Dependent Variable میپردازیم.
-
فاکتور Cycle
نتیجه به دست آمده از جدول Tests of Between-Subjects Effects بالا بیانگر وجود تاثیر معنادار فاکتور Cycle بر Dependent Variable درصد موفقیت است (P-value < 0.001). این مطلب به بیان دیگر به معنای آن است که درصد موفقیت در گروههای مختلف سیکل درمانی، به صورت معنادار متفاوت است.
اندازه اثر این فاکتور بر Dependent Variable برابر با ۰.۱۲۳ به دست میآید. توضیح اینکه Partial Eta Squared عددی بین صفر تا یک است و مقادیر نزدیک به یک آن نشاندهنده تاثیر بیشتر آن فاکتور بر کمیت پاسخ است.
-
فاکتور Age
به همین ترتیب نتیجه به دست آمده از جدول Tests of Between-Subjects Effects بالا بیانگر عدم وجود تاثیر معنادار فاکتور Age بر درصد موفقیت است (P-value = 0.825). به معنای این که درصد موفقیت در گروههای مختلف سنی، با یکدیگر اختلاف معنادار ندارد.
اندازه اثر این فاکتور بر Dependent Variable برابر با ۰.۰۰۴ به دست میآید. این عدد بسیار پایین است و نشاندهنده تاثیر بسیار ضعیف Age بر درصد موفقیت در این مطالعه است.
در واقع یک رابطه معکوس بین مقدار احتمال و اندازه تاثیر و یا همان Effect Size وجود دارد. به این ترتیب که اگر فاکتوری دارای مقدار احتمال اندک و معنادار باشد، اندازه تاثیر آن در مدل زیاد است و اگر مقدار احتمال بالا به دست بیاید یعنی وجود آن فاکتور در مدل معنادار نباشد، پس اندازه تاثیر پایین به دست میآید.
- فاکتور Cycle * Age
نرمافزار SPSS اثر متقابل بین Cycle و Age را نیز بررسی میکند. نتیجه به دست آمده بیانگر عدم تاثیر معنادار این اثر متقابل بر Dependent Variable است (P-value = 0.422).
اندازه اثر این فاکتور متقابل بر Dependent Variable برابر با ۰.۰۴۰ به دست میآید. این میزان نیز اندک است و همان غیرمعنادار بودن اثر Cycle * Age را نشان میدهد.
ستونی نیز با نام Observed Power مشاهده میشود. این ستون که از آن با نام توان مشاهده شده نیز نام برده میشود، بیانگر میزان درستی رد فرض صفر است. همانگونه که میدانیم فرض صفر به معنای عدم معناداری و عدم تاثیرگزاری فاکتور بر روی کمیت پاسخ است. پس رد این فرضیه یعنی پذیرش معناداری و اثرگزاری. حال Observed Power بررسی میکند که رد این فرضیه چقدر درست است. توان نیز عددی بین صفر تا یک است و مقادیر نزدیک به یک به معنای درست بودن رد فرض صفر است.
در این مثال Observed Power برای Cycle برابر با ۰.۹۹۹ به دست آمده است. به وضوح این عدد به معنای درست بودن رد فرض عدم معناداری و پذیرش معناداری است. به یک نکته اگر دقت کنید این است که Observed Power و Sig در خلاف جهت یکدیگر قرار دارند. یعنی اگر Sig بالا باشد، Power پایین به دست میآید و اگر Sig پایین باشد، Power بالا به دست میآید
به همبن ترتیب Observed Power برای Age و Cycle * Age به ترتیب برابر با ۰.۱۰۷ و ۰.۵۰۴ به دست آمده است.
در پایین جدول نیز متنی به صورت R Squared = .201 (Adjusted R Squared = .148) دیده میشود. چنانچه با مباحث رگرسیونی آشنا باشید این همان ضریب تعیین R Squared مدل رگرسیونی است. عدد ضریب تعیین نشان میدهد مدل به دست آمده چقدر میتواند کمیت پاسخ را توضیح دهد.
در این مثال به معنای اینکه مدل شامل اثرات اصلی Cycle و Age و اثر متقابل Cycle * Age چقدر میتواند Dependent Variable و یا همان درصد موفقیت را توضیح دهد. عدد ضریب تعیین برابر با ۰.۲۰۱ شده است. به معنای اینکه مدل میتواند فقط حدود ۲۰ درصد کمیت وابسته یا همان درصد موفقیت را براورد کند. این عدد به وضوح پایین است و عمده دلیل آن عدم معنادار بودن فاکتورهای Age و اثر متقابل Cycle * Age بر درصد موفقیت است.
در بالا سوالی با عنوان کدام مدل؟ پرسیدیم و در اینجا داریم از مدل حرف میزنیم. خوب است حال به پاسخ این سوال بپردازیم و درباره مدل موجود در آنالیز واریانس دوطرفه هنگامی که از روش مدل خطی عام یعنی General Linear Model استفاده میکنیم، صحبت کنیم.
در ابتدا تصویر زیر را مشاهده کنید. در این تصویر مدل آماری Two-way ANOVA هنگامی که از روش Univariate, GLM استفاده میکنیم، آمده است.

در واقع مدل خطی آنالیز واریانس دو طرفه به صورت زیر است.
yijk = µ + αi + ßj + γij + εijk
در این مدل، همانند همه مدلهای آماری دیگر میخواهیم با استفاده از کمیتهای مستقل Independent Variable اندازههای کمیت وابسته Dependent Variable را به دست بیاوریم و میزان تاثیر کمیتهای مستقل بر وابسته را مورد ارزیابی قرار دهیم.
در مدل بالا y همان کمیت وابسته Dependent Variable است که در این مثال درصد موفقیت بیان شده است. منظور از اندیس i گروه iام Factor آلفا و منظور از اندیس j گروه jام Factor بتا است. همچنین منظور از اندیس k نفر kام مورد بررسی است. مثلاَ وقتی مینویسیم y۱۳۵ یعنی درصد موفقیت نفر پنجم سیکل درمانی ۱ یا همان سیکل درمانی A و گروه سنی ۳ که همان گروه سنی ۳۰ تا ۴۰ سال میشود.
به ترتیب اجزای این مدل خطی را در ادامه توضیح خواهیم داد.
-
اثر ثابت μ
بیایید برای فهم این مدل از μ شروع کنیم. همانگونه که در شکل بالا نشان داده شده است μ همان Intercept یا اثر ثابت مدل است. μ نشاندهنده این است که بدون در نظر گرفتن نوع سیکل درمانی و گروه سنی، درصد موفقیت چقدر خواهد بود. در جدول Tests of Between-Subjects Effects آزمون وجود اثر معنادار μ بر درصد موفقیت انجام شده است (P-value < 0.001). اندازه اثر μ نیز مقدار بالایی گزارش شده است (۰.۹۳۸ = η2).
-
اثر اصلی فاکتور α
اما αi چیست؟ α به معنای Factor مورد بررسی (در این مثال سیکل درمان) در مدل خطی است. . اندیس i هم بیانگر شماره و نوع سیکل درمان است. مثلاَ α۱ یعنی سیکل A و یا α۳ یعنی سیکل C.
در واقع در مدل خطی تحلیل واریانس دو طرفه، دو فاکتور خواهیم داشت. ما در این مدل به دنبال پاسخ به این سوال هستیم که آیا α و یا همان Factor سیکل درمان بر y یا همان کمیت وابسته Dependent Variable تاثیر معنادار دارد یا خیر.
به کلمه تاثیر دقت کنید. به طور معمول ما در آنالیز واریانس به دنبال مقایسه گروههای مختلف با یکدیگر هستیم. اما در روش General Linear Model میخواهیم به بررسی تاثیر Factor بر Dependent Variable بپردازیم.
این دو یعنی مقایسه گروههای Factor با یکدیگر و بررسی تاثیر Factor بر روی کمیت وابسته در روش GLM، در امتداد و راستای یکدیگر هستند. در واقع هنگامی که بررسی میکنیم آیا Factor بر y اثر معنادار دارد یا خیر، به معنای این مفهوم است که آیا رفتار و عملکرد گروههای مختلف Factor در بررسی y با یکدیگر متفاوت است یا خیر.
به همین دلیل است که ANOVA در یک جا به مفهوم مقایسه بین گروههای Factor با یکدیگر و در جای دیگر به معنای بررسی وجود تاثیر گروهها بر کمیت وابسته است. چنانچه وجود این تاثیر، تایید شود به معنای این است که رفتار گروهها با یکدیگر متفاوت بوده و اگر وجود تاثیر، تایید نشود به معنای این است که رفتار گروهها با همدیگر همانند است.
در این مثال نتیجهای که از بررسی فاکتور سیکلهای درمانی به دست میآید این است که α یعنی نوع سیکل درمان، یک عامل اثرگزار معنادار بر موفقیت است (P-value < 0.001). به عبارت دیگر بین گروههای مختلف سیکل درمان، درصد موفقیت، متفاوت خواهد بود. اندازه اثر α نیز مقدار برابر با (۰.۱۲۳ = η2) گزارش شده است.
-
اثر اصلی فاکتور β
از آنجا که مدل ما آنالیز واریانس دو طرفه است، بنابراین دو فاکتور در مطالعه داریم. β بیانگر فاکتور دیگر مورد بررسی در مدل خطی یعنی همان گروههای سنی است. اندیس j هم نشاندهنده شماره گروه سنی است. مثلاَ β۱ یعنی گروه سنی کمتر از ۲۴ سال و یا β۴ یعنی گروه سنی بزرگتر از ۴۰ سال.
ما در این مدل به دنبال پاسخ به این سوال هستیم که آیا β و یا همان Factor سن بر y کمیت وابسته Dependent Variable تاثیر معنادار دارد یا خیر.
در این مثال نتیجهای که از بررسی فاکتور گروههای سنی به دست میآید این است که β یعنی سن، یک عامل اثرگزار معنادار بر درصد موفقیت نیست (P-value = 0.825). به معنای اینکه بین گروههای سنی، درصد موفقیت، مشابه است. اندازه اثر β نیز برابر با (۰.۰۰۴ = η2) به دست آمده است.
-
اثر متقابل فاکتور α و β
همانگونه که گفتیم مدل ما آنالیز واریانس دو طرفه است، بنابراین میتوانیم علاوه بر دو فاکتور اصلی α و β، اثر متقابل آنها را که به صورت γ تعریف میشود را نیز در مدل خطی داشته باشیم. همانگونه که قبلاَ گفتیم اندیس i نوع سیکل درمان و اندیس j شماره گروه سنی را نشان میدهد. مثلاَ γ۴۴ یعنی سیکل درمان نوع D و گروه سنی بزرگتر از ۴۰ سال.
همانند بخشهایی قبلی ما در این مدل نیز به دنبال پاسخ به این سوال هستیم که آیا اثر توام و متقابل فاکتورهای α و β و یا همان سیکل درمان و گروههای سنی بر y کمیت وابسته Dependent Variable تاثیر معنادار دارد یا خیر.
در این مثال نتیجهای که از بررسی فاکتور اثر متقابل سیکل و سن به دست میآید این است که γ، یک عامل اثرگزار معنادار بر درصد موفقیت نیست (P-value = 0.422). به معنای اینکه بین ردههای مختلف سیکل و گروههای سنی، درصد موفقیت مشابه است. اندازه اثر β نیز برابر با (۰.۰۴۰ = η2) به دست آمده است.
-
جمله خطا ε
مدل GLM همانند هر مدل آماری دیگری دارای خطا و باقیمانده است. در εijk بخش خطا بیان شده است. در جدول Tests of Between-Subjects Effects نتایج این بخش با نام Error قرار میگیرد. همانگونه که قبلاَ نیز گفتیم منظور از اندیس k نفر kام مورد بررسی است.
سطرهای دیگری نیز در جدول Tests of Between-Subjects Effects دیده میشود. در تصویر زیر درباره ارتباط بین این سطرها با مدل آماری GLM صحبت خواهیم کرد.

سطر Corrected Model یا مدل اصلاحشده، به فاکنورهای موجود در مدل اشاره میکند. از آنجا که این مثال ما آنالیز واریانس دو طرفه است، دو فاکتور داشتیم که با نام Cycle و Age در دادهها نامگزاری شده بود و در مدل با علامتهای αi و βj آنها را نشان دادیم. به همین ترتیب فاکتور اثر متقابل آنها یعنی γij نیز در مدل وجود داشت. اگر در جدول Tests of Between-Subjects Effects دقت کنید، مقدار همه آمارههای Corrected Model مانند مجموع و میانگین مربعات، درجه آزادی، مقدار احتمال، اندازه اثر و توان، نوشته شده است. Sig مربوط به این سطر، آزمون کرده است که آیا مدل شامل β ،α و γ معنادار است یا خیر. نتیجه به دست آمده بیانگر معنادار بودن مدل خطی آنالیز واریانس دو طرفه است (P-value < 0.001). اندازه اثر مدل نیز در حالت کلی برابر با (۰.۲۱۰ = η2) گزارش شده است.
مجموع Corrected Model (فاکتورهای β ،α و γ ) و جمله خطا εijk با نام Corrected Total نامیده میشود. چنانچه مجموع مربعات آنها را با هم جمع کتید به همان عدد مجموع مربعات Corrected Total میرسید.
سطر Total نیز به وضوح به مجموع Corrected Total (که خودش مجموع Corrected Model و Error بود) و Intercept اشاره میکند. در واقع مجموع مربعات Total ترکیب مجموع مربعات همه اجزای مدل شامل، اثر ثابت با نام μ، فاکتورهای موجود در مدل که در این مثال αi و βj به همراه γij بود و جمله خطا با نام εik است.
به همین ترتیب R Squared یا ضریب تعیین که آن را میزان توضیح مدل توسط فاکتورها مینامیم، به صورت Corrected Model نقسیم بر Corrected Total تعریف میکنیم. واضح است هر چقدر R Squared بیشتر باشد به معنای توضیح بهتر و بیشتر کمیت وابسته Dependent Variable (در این مثال درصد موفقیت) توسط فاکتورهای مدل است. برای بیشتر بودن ضریب تعیین باید جمله خطا و یا همان Error که در محرج فرمول ضریب تعیین قرار میگیرد، کمتر باشد.
تا اینجا سعی کردم درباره تمام اجزا و محتویات جدول Tests of Between-Subjects Effects به دلیل اهمیت آن بپردازم. در ادامه درباره سایر خروجیهای نرمافزار در تحلیل Two-way ANOVA (Univariate, GLM) صحبت میکنیم.
خاطرتان باشد در تنظیمات نرمافزار و در تب EM Means به دنبال آن بودیم که میانگینهای حاشیهای هر کدام از گروههای Factor را برحسب گروههای Factor دیگر به دست آوریم. همچنین با انتخاب گزینه Compare main effects میانگینهای حاشیهای گروهها را با یکدیگر مقایسه کنیم. منظور از حاشیهای نیز این است که آمارههای توصیفی یک Factor را برحسب Factor دیگر به دست بیاوریم.
حال در ادامه خروجیهای نرمافزار، نتایج مربوط به تنظیمات تب EM Means آمده است.

در این جدول آمارههای توصیفی حاشیهای Marginal مانند میانگین، خطای معیار و فواصل اطمینان ۹۵٪ برای درصد موفقیت به ازای هر کدام از سیکلها آمده است. سوالی که اینجا مطرح میشود این است که این میانگینها چگونه محاسبه میشوند؟ نقش فاکتور دیگر یعنی گروههای سنی در محاسبه میانگینهای حاشیهای هر کدام از سیکلهای درمانی چیست؟ برای یافتن پاسخ این سوالها، اسلاید زیر را ببینید.

همانگونه که در جدول سمت راست اسلاید بالا میبینید، میانگین واقعی و مشاهده شده درصد موفقیت برای سیکل A عدد ۳۱.۷۳ است. این عدد بدون درنظر گرفتن فاکتور دیگر یعنی سن برای درصد موفقیت سیکل A به دست آمده است.
حال به جدول سمت چپ اسلاید بالا نگاه کنید. میانگین حاشیهای درصد موفقیت برای سیکل A عدد ۳۱.۹۲ به دست آمده است. سوال این است که این عدد چگونه به دست میآید. برای پاسخ به این سوال به فرمول نوشته شده در تصویر بالا نگاه کنید.
همانگونه که میبینید، میانگین حاشیهای درصد موفقیت برای سیکل A در واقع میانگین وزنی به ازای هر کدام از گروههای سنی است. به بیان ساده اینکه نرمافزار نگاه میکند چند نفر از افراد دارای سیکل A دارای گروه سنی کمتر از ۲۴ سال بودهاند و میانگین درصد موفقیت آنها چقدر است؟ به همین ترتیب برای سایر گروههای سنی که سیکل A بر روی آنها انجام شده تعداد افراد و میانگین آنها چقدر بوده است. از حاصلضرب تعداد در میانگین به ازای هر کدام از گروههای سنی و سپس تقسیم نتیجه یر تعداد کل افرادی که دارای سیکل درمانی A بودهاند (۶۰ نفر)، میانگین حاشیهای سیکل A به دست میآید. همین فرایند برای محاسبه میانگین حاشیهای سایر سیکلهای درمانی انجام میشود.
با این حساب به ازای هر کدام از سیکلهای درمانی یک Marginal Mean به دست میآید.
یادتان باشد در تب EM Means با انتخاب گزینه Compare main effects از نرمافزار خواستیم که میانگینهای حاشیهای گروههای هر کدام از فاکتورها را نیز با یکدیگر مقایسه کند. این کار با استفاده از آزمون LSD انجام شده است. نتایج آن را میتوانید در شکل زیر مشاهده کنید.

در جدول Pairwise Comparisons بالا که به مقایسه دو به دو میانگینهای حاشیهای گروههای مختلف فاکتور Cycle با یکدیگر پرداخته است، معناداری یا عدم معناداری این اختلافها به دست آمده است.
به عنوان مثال میتوانیم ببینیم که میانگینهای حاشیهای درصد موفقیت Cycle A و Cycle B با یکدیگر اختلاف معنادار ندارند (P-value = 0.123) اما میانگینهای حاشیهای درصد موفقیت Cycle A و Cycle C با یکدیگر اختلاف معنادار دارند (P-value < 0.001). بقیه نتایج را نیز میتوانید در جدول بالا مشاهده کنید. با این حال به این نکته دقت کنید که این نتایج بر مبنای میانگین حاشیهای هر سیکل درمان به دست آمده است.
در ادامه خروجیهای نرمافزار جدول دیگری با نام Univariate Tests دیده میشود.

در این جدول دو سطر با نامهای Contrast و Error وجود دارد. منظور از Error همان جمله خطا در مدل خطی آنالیز واریانس دو طرفه است که در متنهای بالاتر به آن اشاره شد. چنانچه دقت کتید آمارههای مربوط به این سطر دقیقاَ برابر با آمارههای سطر Error در جدول Tests of Between-Subjects Effects است.
سطر Contrast نیز به فاکتورهای موجود در مدل خطی اشاره میکند. از آنجا که در حال بررسی میانگینهای حاشیهای فاکتور Cycle هستیم، بنابراین آمارهها و نتایج مربوط به Contrast دقیقاَ برابر با نتایج سطر Cycle در جدول Tests of Between-Subjects Effects است. در بالا نیز درباره این نتایج و معنادار بودن یا نبودن آنها صحبت کردیم که بار دیگر تکرار نمیکنیم. تنها نکته اینکه از آنجا که ما در خروجیهای بخش Estimated Marginal Means هستیم، این نتایج و جدولها به همان دادههای میانگینهای حاشیهای مربوط است.
پاسخ به این سوال. آیا میانگینهای حاشیهای سیکل مانند یکدیگر هستند؟ به عبارت دیگر آیا با درنظر گرفتن ردههای سنی، اختلاف معناداری در درصد موفقیت سیکلهای مختلف دیده میشود؟
جواب مثبت است. میانگینهای حاشیهای انواع سیکل با یکدیگر متفاوت هستند.
تمام مطالبی که در بالا و برای میانگینهای حاشیهای فاکتور Cycle بیان کردیم، برای فاکتور دیگر مطالعه یعنی Age نیز در خروجیهای نرمافزار SPSS آمده است.
در ادامه به بررسی میانگینهای حاشیهای فاکتور Age میپردازیم.

همانند میانگینهای حاشیهای فاکتور سیکلهای درمانی، در این جدول آمارههای توصیفی حاشیهای Marginal مانند میانگین، خطای معیار و فواصل اطمینان ۹۵٪ برای درصد موفقیت به ازای هر کدام از گروههای سنی آمده است. در اسلاید زیر درباره نحوه محاسبه این Marginal Means توضیح داده شده است.

همانگونه که در جدول سمت راست اسلاید بالا میبینید، میانگین واقعی و مشاهده شده درصد موفقیت برای گروه سنی کمتر از ۲۴ سال عدد ۲۷.۵۷ است. این عدد بدون درنظر گرفتن فاکتور دیگر یعنی سیکل درمان برای درصد موفقیت گروه سنی کمتر از ۲۴ سال به دست آمده است.
حال به جدول سمت چپ اسلاید بالا نگاه کنید. میانگین حاشیهای درصد موفقیت برای گروه سنی کمتر از ۲۴ سال عدد ۲۸.۱۴ به دست آمده است. سوال این است که این عدد چگونه به دست میآید. برای پاسخ به این سوال به فرمول نوشته شده در تصویر بالا نگاه کنید.
همانگونه که میبینید، میانگین حاشیهای درصد موفقیت برای گروه سنی کمتر از ۲۴ سال در واقع میانگین وزنی به ازای هر کدام از سیکلهای درمانی است. به بیان ساده اینکه نرمافزار نگاه میکند چند نفر از افراد گروه سنی کمتر از ۲۴ سال، دارای سیکل A بودهاند و میانگین درصد موفقیت آنها چقدر است؟ به همین ترتیب برای سایر گروههای فاکتور Cycle که کمتر از ۲۴ سال بودهاند، تعداد افراد و میانگین آنها چقدر بوده است. از حاصلضرب تعداد در میانگین به ازای هر کدام از سیکلهای درمانی و سپس تقسیم نتیجه یر تعداد کل افرادی که دارای کمتر از ۲۴ سال بودهاند (۵۹ نفر)، میانگین حاشیهای گروه سنی کمتر از ۲۴ سال به دست میآید. همین فرایند برای محاسبه میانگین حاشیهای سایر گروههای سنی انجام میشود.
به این ترتیب به ازای هر کدام از گروههای سنی یک Marginal Mean به دست میآید.
در جدول زیر با نام Pairwise Comparisons میانگینهای حاشیهای هر کدام از گروههای سنی با استفاده از آزمون LSD با یکدیگر مقایسه شده است.

در جدول Pairwise Comparisons بالا که به مقایسه دو به دو میانگینهای حاشیهای گروههای مختلف فاکتور Age با یکدیگر پرداخته است، معناداری یا عدم معناداری این اختلافها به دست آمده است.
به وضوح میتوانیم ببینیم که میانگینهای حاشیهای درصد موفقیت هر دو گروه سنی دلخواه با یکدیگر اختلاف معنادار ندارد. این مطلب و عدم معنادار بودن فاکتور Age را در بخشهای بالاتر و جدول Tests of Between-Subjects Effects نیز توضیح دادیم.
به همین ترتیب و در ادامه خروجیهای نرمافزار، مبحث میانگینهای حاشیهای فاکتور Age، جدول دیگری با نام Univariate Tests دیده میشود.

در این جدول دو سطر با نامهای Contrast و Error وجود دارد. منظور از Error همان جمله خطا در مدل خطی آنالیز واریانس دو طرفه است که در متنهای بالاتر به آن اشاره شد. چنانچه دقت کتید آمارههای مربوط به این سطر دقیقاَ برابر با آمارههای سطر Error در جدول Tests of Between-Subjects Effects است.
سطر Contrast نیز به فاکتورهای موجود در مدل خطی اشاره میکند. از آنجا که در حال بررسی میانگینهای حاشیهای فاکتور Age هستیم، بنابراین آمارهها و نتایج مربوط به Contrast دقیقاَ برابر با نتایج سطر Age در جدول Tests of Between-Subjects Effects است. بار دیگر بیان میکنم که ما در خروجیهای بخش Estimated Marginal Means هستیم، این نتایج و جدولها به همان دادههای میانگینهای حاشیهای مربوط است.
در این جدول به سوال آیا میانگینهای حاشیهای سن مانند یکدیگر هستند، پاسخ داده شده است. به عبارت دیگر آیا با درنظر گرفتن انواع سیکل، اختلاف معناداری در درصد موفقیت ردههای مختلف سنی دیده میشود؟
جواب منفی است. میانگینهای حاشیهای ردههای سنی با یکدیگر همانند هستند.
در پایان بخش Estimated Marginal Means جدول توافقی سیکل و گروههای سنی شامل آمارههای توصیفی میانگین، انحراف معیار از میانگین و فواصل اطمینان، آمده است. این جدول را میتوانید مشاهده کنید.

در تنظیمات انجام Two-way ANOVA و در تب Post Hoc به عنوان مثال آزمونهای بونفرونی Bonferroni و دانکن Duncan را انتخاب کردیم. همانگونه که میدانیم با استفاده از این آزمونها میتوانیم به مقایسه دو به دو درصد موفقیت در بین گروههای Factor بپردازیم.
در ادامه خروجیهای نرمافزار SPSS نتایج مربوط به این تنظیمات با نام Multiple Comparisons آمده است. به این نکته نیز توجه کنید که نتایج این بخش بر روی میانگینهای حسابی و مشاهده شده خود گروهها است و مانند بخش قبل بر مبنای میانگینهای حاشیهای نیست. بیشتر توصیه میشود جهت مقایسه بین گروهها فاکتورها از همین نوع مقایسات Post Hoc استفاده کنید.
در نتایج جدول زیر ما به مقایسه بین گروههای فاکتور Cycle پرداختهایم. از آزمون بونفرونی نیز استفاده کردهایم.

به عنوان مثال نتایج جدول بالا نشان میدهد که هر چند درصد موفقیت سیکل A حدود ۱.۸ درصد از سیکل B بیشتر است اما از دیدگاه تست آماری، آنها مشابه یکدیگر هستند (P-value = 0.924). با این حال مثلاَ سیکل A حدود ۸.۱ درصد از سیکل C درصد موفقیت بیشتری دارد و از دیدگاه آزمون بونفرونی این بیشتر بودن معنادار نیز هست (P-value = 0.006). به همین ترتیب میتوانیم نتیجه مقایسه بین هر دو گروه سیکل درمانی را در جدول بالا مشاهده کنیم.
ما از آزمون دانکن نیز جهت به دست آوردن گروههای دارای درصد موفقیت مشابه و همانند یکدیگر، استفاده میکنیم. همانگونه که در جدول زیر میبینید، نتایج به دست آمده از آزمون دانکن، تعداد گروههای سیکل درمان که ۴ گروه بوده است را به سه زیرگروه تقسیمبندی کرده است. در زیرگروه ۱، سیکل C قرار دارد که با بقیه سیکلها اختلاف معنادار درصد موفقیت دارد. در زیرگروه ۲، سیکلهای D و B قرار دارند که میزان موفقیت آنها با یکدیگر از دیدگاه تست دانکن، مشابه است. به همین ترتیب در زیرگروه شماره ۳، سیکلهای B و A هستند که آنها نیز دارای درصد موفقیت مشابه با هم میباشند.

به همین ترتیب و در ادامه خروجیهای نرمافزار SPSS نتایج مربوط به Multiple Comparisons فاکتور Age آمده است. همانگونه که قبلاَ نیز گفتیم نتایج این بخش بر مبنای میانگینهای مشاهده شده گروهها است.
در نتایج جدول زیر مقایسه بین گروههای فاکتور Age آمده است. پرداختهایم. از آزمون بونفرونی استفاده کردهایم.

به وضوح نتایج جدول بالا نشان میدهد که درصد موفقیت هیچکدام از گروههای سنی دارای اختلاف معنادار با یکدیگر نیست. این مطلب را ما در جدول Tests of Between-Subjects Effects هنگامی که به بررسی تاثیر فاکتور Age بر Dependent Variable یعنی درصد موفقیت میپرداختیم، بیان کردیم. در آن جدول نیز به این نتیجه رسیدیم که فاکتور Age یک مولفه اثرگزار معنادار بر درصد موفقیت نیست. در اینجا و در جدول Multiple Comparisons نیز ما بار دیگر به همان نتیجه رسیدیم. بر این مبنا که بین هیچکدام از گزوههای سنی اختلاف معنادار درصد موفقیت دیده نمیشود.
در جدول زیر نتایج آزمون دانکن آمده است. همانگونه که مشاهده میکنید بر مبنای این نتایج، چهار گروه سنی به دو زیرگروه تبدیل شدهاند. در زبرگروه شماره ۱، گروههای سنی بزرگتر از ۴۰ سال، کمتر از ۲۰ سال و بین ۳۰ تا ۴۰ سال قرار گرفتهاند، به این معنا که درصد موفقیت این گروههای سنی مشابه یکدیگر است.
به همین ترتیب زیرگروه شماره ۲، شامل گروههای سنی کمتر از ۲۴ سال، ۳۰ تا ۴۰ سال و ۲۴ تا ۳۰ سال است. این گروهها نیز دارای درصد موفقیت مشابه از دیدگاه آزمون دانکن هستند.

در پایان خروجیهای نرمافزار SPSS میتوانید، نمودارها و گرافها را مشاهده کنید. به یاد داشته باشید ما در تنظیمات انجام تحلیل Two-way ANOVA و در تب Plot از نرمافزار خواستیم نمودارهای خطی از درصد موفقیت برای هر کدام از فاکتورها و همچنین اثرمتقابل آنها برای ما رسم کند. نتیجه را میتوانید در زیر ببینید.
به این نکته توجه کنید که این نمودارها براساس میانگینهای حاشیهای که در بخشهای بالاتر به آنها اشاره کردیم، رسم شده است.

همانگونه که در گراف بالا میبینید نمودار خطی درصد موفقیت برای هر کدام از سیکلهای درمان آمده است. Cycle C با درصد موفقیت ۲۴.۲۴ درصد کمترین میزان موفقیت را داشته است. در بالا نشان دادیم که این سیکل با بقیه سیکلها اختلاف معنادار دارد. بیشترین درصد موفقیت با ۳۱.۹۲ درصد به سیکل A مربوط میشود.
در شکل زیر نمودار درصد موفقیت به ازای هر کدام از گزوههای سنی آمده است.

همانگونه که در این گراف دیده میشود، درصد موفقیت گروههای سنی تقریباَ مشابه با یکدیگر است. ما در جدول Tests of Between-Subjects Effects نیز نشان دادیم که Age یک فاکتور اثرگزار بر درصد موفقیت نیست.
به همین ترتیب در شکل زیر نمودار اثر متقاطع سیکل و سن آمده است.

نکتهای که در این گراف دیده میشود این است که به نظر میرسد در سیکل A درصدهای موفقیت گروههای سنی تقریباَ مشابه و هم اندازه است. با این حال گروه سنی بالاتر از ۴۰ سال در سیکل A دارای بالاترین درصد موفقیت است. بنابراین پیشنهاد میشود برای افراد این گروه سنی، سیکل A انجام شود.
اما در سیکل C درصد موفقیت گروههای سنی بالاتر یعنی گروههای سنی ۳۰ سال و بیشتر دارای کمترین درصد موفقیت است. در اینجا پیشنهاد میشود برای افراد این گروه سنی، سیکل C انجام نشود.
خب، این هم از توضیحات روش آنالیز واریانس دو طرفه که با استفاده از روش General Linear Model , Univariate در نرم افزار SPSS به آن پرداختیم.
چگونه به این مقاله رفرنس دهیم
GraphPad Statistics (2020). Two-way ANOVA with SPSS. Statistical tutorials and software guides. Retrieved Month, Day, Year, from https://graphpad.ir/general-linear-models-univariate-two-way-anova-spss/.php
For example, if you viewed this guide on 12th January 2022, you would use the following reference
GraphPad Statistics (2020). Two-way ANOVA with SPSS. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/general-linear-models-univariate-two-way-anova-spss/.php
ارایه خدمات تحلیل و مشاوره آماری
گراف پد برای شما خدمات مشاوره و انجام انواع تحلیلهای آماری را ارایه میدهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.