آنالیز واریانس دو طرفه

آنالیز واریانس دو طرفه Two-way ANOVA با SPSS

زمان مطالعه: ۵۰ دقیقه 

 

 
 

 

merci

دریافت آموزش کامل آنالیز واریانس دو طرفه

شامل ۵۰ دقیقه ویدئو، ۲۷ اسلاید آموزشی، فایل دیتا و نتایج SPSS

آنالیز واریانس Analysis of Variance یا همان ANOVA یکی از مهمترین تحلیل‌های آماری شناخته می‌شود. در این نوشتار ما قصد داریم درباره آنالیز واریانس دو طرفه صحبت کنیم. در مبحث قبلی به آنالیز واریانس یک طرفه One way ANOVA پرداختیم. از اینجا می‌توانید ویدئو و موضوعات مطرح شده آنالیز واریانس یک طرفه را مشاهده کنید.

تحلیل واریانس دو طرفه یا Two-way ANOVA هنگامی مورد استفاده قرار می‌گیرد که بخواهیم اعداد و اندازه‌های یک کمیت وابسته Dependent Variable را در بین گروه‌های مستقل دو فاکتور Factor مورد مقایسه قرار دهیم.

در شکل زیر می‌توانید نحوه طراحی آنالیز واریانس دو طرفه را مشاهده کنید.

طراحی آنالیز واریانس دو طرفه
 
سوال

چرا می‌گوییم آنالیز واریانس دو طرفه؟

پاسخ ساده است. هنگامی که یک کمیت وابسته Dependent Variable با نام اختصاری D1 و بیش از یک Factor با نام اختصاری F>1 داشته باشیم، مطالعه ما از نوع آنالیز واریانس دو طرفه خواهد بود.

در این متن، تحلیل آنالیز واریانس دو طرفه با استفاده از نرم‌افزار SPSS و روش مدل خطی عام General Linear Model و یا همان GLM انجام خواهد شد.

فایل دیتا و خروجی نرم‌افزار مثال را می‌توانید از اینجا دانلود کنید. در تصویر زیر نیز توضیحاتی درباره فایل مثال آمده است.

 

همان‌گونه که در تصویر بالا مشاهده می‌کنید، می‌خواهیم درصد موفقیت را که در اینجا Dependent Variable به حساب می‌آید، در بین فاکتورهای Cycle و Age که به ترتیب بیانگر سیکل‌های درمان و گروه‌های سنی هستند، مورد مقایسه قرار دهیم.

به نحوه ورود داده‌ها به نرم‌افزار SPSS دقت کنید. در یک ستون با نام Percent، همه اعداد درصد موفقیت زیر هم نوشته می‌شود. Measure این ستون از نوع Scale است و همان‌گونه که بیان کردیم قرار است نقش Dependent Variable را بازی کند.

در ستون‌های دیگر که در این مثال با نام Cycle و Age هستند، به ازای هر درصد موفقیت، گروه درمانی و سنی آن آمده است. Measure این ستون‌ها می‌تواند از نوع Ordinal و یا Nominal باشد. این ستون‌ها نقش Factor را در یک مطالعه ANOVA خواهتد داشت.

حال بیایید به ارایه و انجام آنالیز واریانس دو طرفه Two-way ANOVA با استفاده از روش General Linear Model بپردازیم.

 روش تحلیل 

General Linear Model , Univariate

مسیر انجام آنالیز واریانس هنگامی که می‌خواهیم از روش General Linear Model استفاده کنیم، به صورت زیر خواهد بود.

 مسیر نرم‌افزار 
Analyze → General Linear Model → Univariate

در شکل زیر مسیر و نحوه قرار گرفتن ستون داده‌ها در نرم‌افزار SPSS جهت انجام آنالیز واریانس دو طرفه با استفاده از Univariate روش GLM آمده است. همچنین می‌توانید فرض صفر و فرض مقابل را مشاهده کنید. همان‌گونه که مشاهده می‌کنید فرض صفر بیان می‌کند که درصد موفقیت در گروه‌های درمانی و سنی (به عنوان فاکتورهای مطالعه)، برابر است و فرض مقابل بر این نظر است که میانگین درصد موفقیت در گروه‌های مختلف فاکتورها متفاوت است.

 

با رفتن به این مسیر، پنجره با نام Univariate باز می‌شود. Percent را در کادر Dependent Variable و Cycle و Age را در کادر Fixed Factor قرار می‌دهیم.

خوب است در همین جا این نکته را بیان کنیم که به دلیل این‌که در کادر Fixed Factor ستون‌ها و Variableهای Cycle و Age قرار گرفته‌اند، مطالعه ما آنالیز واریانس دوطرفه Two-way ANOVA می‌باشد.

در پنجره Univariate تب‌های مختلفی دیده می‌شود. در تب Plot می‌توانیم نمودار و گراف درصد موفقیت به ازای هر کدام از فاکتورها را مشاهده کنیم.

رسم نمودار در تحلیل Two-way ANOVA

 

در تب Post Hoc انواع مقایسه‌های دوگانه بین گروه‌های مختلف Factor مشاهده می‌شود. با استفاده از این تب می‌توانیم درصد موفقیت را بین هر دو سیکل و گروه سنی دلخواه، مقایسه کنیم. در تصویر زیر می‌توانید انواع آزمون‌های مقایسه‌ای چندگانه برای میانگین‌های مشاهده شده را ببینید.

آزمون‌های مقایسه‌ای چندگانه برای میانگین‌های مشاهده شده در روش GLM

 

به عنوان مثال آزمون‌های بونفرونی Bonferroni و دانکن Duncan را انتخاب کرده‌ایم.

در تب EM Means می‌توانیم میانگین‌های حاشیه‌ای به ازای هر کدام از گروه‌های Factor را به دست آوریم. با انتخاب گزینه Compare main effects این میانگین‌های حاشیه‌ای قابل مقایسه با همدیگر هستند.

آزمون‌های مقایسه‌ای چندگانه برای میانگین‌های حاشیه‌ای

 

به همین ترتیب در تب Options آماره‌های توصیفی، اندازه اثر effect size و توان power آزمون به همراه آزمون‌های همگنی واریانس‌ها را انتخاب می‌کنیم.

تب Options در تحلیل Univariate

 

حال OK می‌کنیم. در فایل Output نرم‌افزار SPSS نتایج و خروجی‌های زیر به دست می‌آید. به ترتیب آن‌ها را بیان می‌کنیم. در ابتدا و در جدول Between-Subjects Factors اسامی گروه‌های هر کدام از Factor ها و تعداد هر گروه‌ بیان شده است.

جدول Between-Subjects Factors

 

به همین ترتیب در جدول زیر که حاصل انتخاب گزینه Descriptive Statistics از تب Options در تنظیمات تحلیل Univariate است، انواع آماره‌های توصیفی درصد موفقیت به ازای هر کدام از سیکل‌های درمانی و گروه‌های سنی آمده است.

جدول Descriptive Statistics و آماره‌های توصیفی درصد موفقیت برحسب فاکتورها

 

همچنین در جدول Levene’s Test of Equality of Error Variances آزمون لوین به منظور بررسی همگن بودن واریانس باقیمانده‌های مدل، آمده است. نتیجه به دست آمده نشان می‌دهد واریانس خطاها، همگن نیست (P-value < 0.001).

آزمون لوین جهت بررسی فرضیه همگنی واریانس خطاهای مدل

 

به این کلمه مدل دقت کنید. یک سوال دقیق می‌تواند این باشد،

سوال 

کدام مدل؟ مگر ما قصد مقایسه Dependent Variable در سطوح مختلف Factor ها را نداریم؟ خب، این موضوع یک مبحث مقایسه‌ای است و مدل یک موضوع رگرسیونی و ارتباط سنجی. این دو چه ارتباطی با هم دارند و چگونه می‌توان از یک بررسی مقایسه‌ای به مباحث مدل‌بندی و رگرسیونی رسید؟

موارد بالا سوالات بسیار دقیقی است و ما سعی می‌کنیم در ادامه به آن‌ها پاسخ دهیم.

حال بیایید به بررسی نتایج جدول مهم Tests of Between-Subjects Effects بپردازیم. در شکل زیر برخی از توضیحات جدول آمده است. در ادامه بیشتر به آن می‌پردازیم.

جدول Tests of Between-Subjects Effects در آنالیز واریانس دوطرفه

 

در جدول Tests of Between-Subjects Effects هنگامی که مطالعه ما Two way ANOVA است، آزمون معناداری فاکتورها، اثرات اصلی آن‌ها Main Effect و اثرات متقابل Interaction Effect فاکتورها بررسی می‌شود. در این مثال و از آن‌جا که ما به موضوع آنالیز واریانس دو طرفه پرداخته‌ایم، فاکتورهای Cycle و Age به همراه اثر متقابل آن‌ها وجود دارد. حال به ترتیب به بررسی هر کدام از فاکتورها و تاثیر آن بر Dependent Variable می‌پردازیم.

  • فاکتور Cycle

 

نتیجه به دست آمده از جدول Tests of Between-Subjects Effects بالا بیانگر وجود تاثیر معنادار فاکتور Cycle بر Dependent Variable درصد موفقیت است (P-value < 0.001). این مطلب به بیان دیگر به معنای آن است که درصد موفقیت در گروه‌های مختلف سیکل درمانی، به صورت معنادار متفاوت است.

اندازه اثر این فاکتور بر Dependent Variable برابر با ۰.۱۲۳ به دست می‌آید. توضیح اینکه Partial Eta Squared عددی بین صفر تا یک است و مقادیر نزدیک به یک آن نشان‌دهنده تاثیر بیشتر آن فاکتور بر کمیت پاسخ است.

  • فاکتور Age

 

به همین ترتیب نتیجه به دست آمده از جدول Tests of Between-Subjects Effects بالا بیانگر عدم وجود تاثیر معنادار فاکتور Age بر درصد موفقیت است (P-value = 0.825). به معنای این که درصد موفقیت در گروه‌های مختلف سنی، با یکدیگر اختلاف معنادار ندارد.

اندازه اثر این فاکتور بر Dependent Variable برابر با ۰.۰۰۴ به دست می‌آید. این عدد بسیار پایین است و نشان‌دهنده تاثیر بسیار ضعیف Age بر درصد موفقیت در این مطالعه است.

در واقع یک رابطه معکوس بین مقدار احتمال و اندازه تاثیر و یا همان Effect Size وجود دارد. به این ترتیب که اگر فاکتوری دارای مقدار احتمال اندک و معنادار باشد، اندازه تاثیر آن در مدل زیاد است و اگر مقدار احتمال بالا به دست بیاید یعنی وجود آن فاکتور در مدل معنادار نباشد، پس اندازه تاثیر پایین به دست می‌آید.

  • فاکتور Cycle * Age

 

نرم‌افزار SPSS اثر متقابل بین Cycle و Age را نیز بررسی می‌کند. نتیجه به دست آمده بیانگر عدم تاثیر معنادار این اثر متقابل بر Dependent Variable است (P-value = 0.422).

اندازه اثر این فاکتور متقابل بر Dependent Variable برابر با ۰.۰۴۰ به دست می‌آید. این میزان نیز اندک است و همان غیرمعنادار بودن اثر Cycle * Age را نشان می‌دهد.

ستونی نیز با نام Observed Power مشاهده می‌شود. این ستون که از آن با نام توان مشاهده شده نیز نام برده می‌شود، بیانگر میزان درستی رد فرض صفر است. همان‌گونه که می‌دانیم فرض صفر به معنای عدم معناداری و عدم تاثیرگزاری فاکتور بر روی کمیت پاسخ است. پس رد این فرضیه یعنی پذیرش معناداری و اثرگزاری. حال Observed Power بررسی می‌کند که رد این فرضیه چقدر درست است. توان نیز عددی بین صفر تا یک است و مقادیر نزدیک به یک به معنای درست بودن رد فرض صفر است.

در این مثال Observed Power برای Cycle برابر با ۰.۹۹۹ به دست آمده است. به وضوح این عدد به معنای درست بودن رد فرض عدم معناداری و پذیرش معناداری است. به یک نکته اگر دقت کنید این است که Observed Power و Sig در خلاف جهت یکدیگر قرار دارند. یعنی اگر Sig بالا باشد، Power پایین به دست می‌آید و اگر Sig پایین باشد، Power بالا به دست می‌آید

به همبن ترتیب  Observed Power برای Age و  Cycle * Age به ترتیب برابر با ۰.۱۰۷ و ۰.۵۰۴ به دست آمده است. 

در پایین جدول نیز متنی به صورت R Squared = .201 (Adjusted R Squared = .148) دیده می‌شود. چنانچه با مباحث رگرسیونی آشنا باشید این همان ضریب تعیین R Squared مدل رگرسیونی است. عدد ضریب تعیین نشان می‌دهد مدل به دست آمده چقدر می‌تواند کمیت پاسخ را توضیح دهد.

در این مثال به معنای این‌که مدل شامل اثرات اصلی Cycle و Age و اثر متقابل Cycle * Age چقدر می‌تواند Dependent Variable و یا همان درصد موفقیت را توضیح دهد. عدد ضریب تعیین برابر با ۰.۲۰۱ شده است. به معنای اینکه مدل می‌تواند فقط حدود ۲۰ درصد کمیت وابسته یا همان درصد موفقیت را براورد کند. این عدد به وضوح پایین است و عمده دلیل آن عدم معنادار بودن فاکتورهای Age و اثر متقابل Cycle * Age بر درصد موفقیت است.

در بالا سوالی با عنوان کدام مدل؟ پرسیدیم و در اینجا داریم از مدل حرف می‌زنیم. خوب است حال به پاسخ این سوال بپردازیم و درباره مدل موجود در آنالیز واریانس دوطرفه هنگامی که از روش مدل خطی عام یعنی General Linear Model استفاده می‌کنیم، صحبت کنیم.

در ابتدا تصویر زیر را مشاهده کنید. در این تصویر مدل آماری Two-way ANOVA هنگامی که از روش Univariate, GLM استفاده می‌کنیم، آمده است.

مدل آماری Two-way ANOVA (Univariate, GLM)

 

در واقع مدل خطی آنالیز واریانس دو طرفه به صورت زیر است.

yijk = µ + αi  + ßj  +  γij + εijk

در این مدل، همانند همه مدل‌های آماری دیگر می‌خواهیم با استفاده از کمیت‌های مستقل Independent Variable اندازه‌های کمیت وابسته Dependent Variable را به دست بیاوریم و میزان تاثیر کمیت‌های مستقل بر وابسته را مورد ارزیابی قرار دهیم.

در مدل بالا y همان کمیت وابسته Dependent Variable است که در این مثال درصد موفقیت بیان شده است. منظور از اندیس i گروه iام Factor آلفا و منظور از اندیس j گروه jام Factor بتا است.  همچنین منظور از اندیس k نفر kام مورد بررسی است. مثلاَ وقتی می‌نویسیم y۱۳۵ یعنی درصد موفقیت نفر پنجم سیکل درمانی ۱ یا همان سیکل درمانی A و گروه سنی ۳ که همان گروه سنی ۳۰ تا ۴۰ سال می‌شود.

به ترتیب اجزای این مدل خطی را در ادامه توضیح خواهیم داد.

  • اثر ثابت μ

 

بیایید برای فهم این مدل از μ شروع کنیم. همان‌گونه که در شکل بالا نشان داده شده است μ همان Intercept یا اثر ثابت مدل است. μ نشان‌دهنده این است که بدون در نظر گرفتن نوع سیکل درمانی و گروه سنی، درصد موفقیت چقدر خواهد بود. در جدول Tests of Between-Subjects Effects آزمون وجود اثر معنادار μ بر درصد موفقیت انجام شده است (P-value < 0.001). اندازه اثر μ نیز مقدار بالایی گزارش شده است (۰.۹۳۸ = η2). 

  • اثر اصلی فاکتور α

 

اما αi چیست؟ α به معنای Factor مورد بررسی (در این مثال سیکل درمان) در مدل خطی است. . اندیس i هم بیانگر شماره و نوع سیکل درمان است. مثلاَ α۱ یعنی سیکل A و یا α۳ یعنی سیکل C.

در واقع در مدل خطی تحلیل واریانس دو طرفه، دو فاکتور خواهیم داشت. ما در این مدل به دنبال پاسخ به این سوال هستیم که آیا α و یا همان Factor سیکل درمان بر y یا همان کمیت وابسته Dependent Variable تاثیر معنادار دارد یا خیر.

به کلمه تاثیر دقت کنید. به طور معمول ما در آنالیز واریانس به دنبال مقایسه گروه‌های مختلف با یکدیگر هستیم. اما در روش General Linear Model می‌خواهیم به بررسی تاثیر Factor بر Dependent Variable بپردازیم.

این دو یعنی مقایسه گروه‌های Factor با یکدیگر و بررسی تاثیر Factor بر روی کمیت وابسته در روش GLM، در امتداد و راستای یکدیگر هستند. در واقع هنگامی که بررسی می‌کنیم آیا Factor بر y اثر معنادار دارد یا خیر، به معنای این مفهوم است که آیا رفتار و عملکرد گروه‌های مختلف Factor در بررسی y با یکدیگر متفاوت است یا خیر.

به همین دلیل است که ANOVA در یک جا به مفهوم مقایسه بین گروه‌های Factor با یکدیگر و در جای دیگر به معنای بررسی وجود تاثیر گروه‌ها بر کمیت وابسته است. چنانچه وجود این تاثیر، تایید شود به معنای این است که رفتار گروه‌ها با یکدیگر متفاوت بوده و اگر وجود تاثیر، تایید نشود به معنای این است که رفتار گروه‌ها با همدیگر همانند است.

در این مثال نتیجه‌ای که از بررسی فاکتور سیکل‌های درمانی به دست می‌آید این است که α یعنی نوع سیکل درمان، یک عامل اثرگزار معنادار بر موفقیت است (P-value < 0.001). به عبارت دیگر بین گروه‌های مختلف سیکل درمان، درصد موفقیت، متفاوت خواهد بود. اندازه اثر α نیز مقدار برابر با (۰.۱۲۳ = η2) گزارش شده است.

  • اثر اصلی فاکتور β

 

از آن‌جا که مدل ما آنالیز واریانس دو طرفه است، بنابراین دو فاکتور در مطالعه داریم. β بیانگر فاکتور دیگر مورد بررسی در مدل خطی یعنی همان گروه‌های سنی است. اندیس j هم نشان‌دهنده شماره گروه سنی است. مثلاَ β۱ یعنی گروه سنی کمتر از ۲۴ سال و یا β۴ یعنی گروه سنی بزرگتر از ۴۰ سال.

ما در این مدل به دنبال پاسخ به این سوال هستیم که آیا β و یا همان Factor سن بر y کمیت وابسته Dependent Variable تاثیر معنادار دارد یا خیر.

در این مثال نتیجه‌ای که از بررسی فاکتور گروه‌های سنی به دست می‌آید این است که β یعنی سن، یک عامل اثرگزار معنادار بر درصد موفقیت نیست (P-value = 0.825). به معنای اینکه بین گروه‌های سنی، درصد موفقیت، مشابه است. اندازه اثر β نیز برابر با (۰.۰۰۴ = η2) به دست آمده است.

  • اثر متقابل فاکتور α و β

 

همان‌گونه که گفتیم مدل ما آنالیز واریانس دو طرفه است، بنابراین می‌توانیم علاوه بر دو فاکتور اصلی α و β، اثر متقابل آن‌ها را که به صورت γ تعریف می‌شود را نیز در مدل خطی داشته باشیم. همان‌گونه که قبلاَ گفتیم اندیس i نوع سیکل درمان و اندیس j شماره گروه سنی را نشان می‌دهد. مثلاَ γ۴۴ یعنی سیکل درمان نوع D و گروه سنی بزرگتر از ۴۰ سال.

همانند بخش‌هایی قبلی ما در این مدل نیز به دنبال پاسخ به این سوال هستیم که آیا اثر توام و متقابل فاکتورهای α و β و یا همان سیکل درمان و گروه‌های سنی بر y کمیت وابسته Dependent Variable تاثیر معنادار دارد یا خیر.

در این مثال نتیجه‌ای که از بررسی فاکتور اثر متقابل سیکل و سن به دست می‌آید این است که γ، یک عامل اثرگزار معنادار بر درصد موفقیت نیست (P-value = 0.422). به معنای اینکه بین رده‌های مختلف سیکل و گروه‌های سنی، درصد موفقیت مشابه است. اندازه اثر β نیز برابر با (۰.۰۴۰ = η2) به دست آمده است.

  • جمله خطا ε

 

مدل GLM همانند هر مدل آماری دیگری دارای خطا و باقیمانده است. در εijk بخش خطا بیان شده است. در جدول Tests of Between-Subjects Effects نتایج این بخش با نام Error قرار می‌گیرد. همان‌گونه که قبلاَ نیز گفتیم منظور از اندیس k نفر kام مورد بررسی است.

سطرهای دیگری نیز در جدول Tests of Between-Subjects Effects دیده می‌شود. در تصویر زیر درباره ارتباط بین این سطرها با مدل آماری GLM صحبت خواهیم کرد.

بررسی مدل آماری Two-way ANOVA (Univariate, GLM)

 

سطر Corrected Model یا مدل اصلاح‌شده، به فاکنورهای موجود در مدل اشاره می‌کند. از آن‌جا که این مثال ما آنالیز واریانس دو طرفه است، دو فاکتور داشتیم که با نام Cycle و Age در داده‌ها نام‌گزاری شده بود و در مدل با علامت‌های αi و βj آن‌ها را نشان دادیم. به همین ترتیب فاکتور اثر متقابل آن‌ها یعنی γij نیز در مدل وجود داشت. اگر در جدول Tests of Between-Subjects Effects دقت کنید، مقدار همه آماره‌های Corrected Model مانند مجموع و میانگین مربعات، درجه آزادی، مقدار احتمال، اندازه اثر و توان، نوشته شده است. Sig مربوط به این سطر، آزمون کرده است که آیا مدل شامل β ،α و γ معنادار است یا خیر. نتیجه به دست آمده بیانگر معنادار بودن مدل خطی آنالیز واریانس دو طرفه است (P-value < 0.001). اندازه اثر مدل نیز در حالت کلی برابر با (۰.۲۱۰ = η2) گزارش شده است.

مجموع Corrected Model (فاکتورهای β ،α و γ ) و جمله خطا εijk با نام Corrected Total نامیده می‌شود. چنانچه مجموع مربعات آنها را با هم جمع کتید به همان عدد مجموع مربعات Corrected Total می‌رسید.

سطر Total نیز به وضوح به مجموع Corrected Total (که خودش مجموع Corrected Model و Error بود) و Intercept اشاره می‌کند. در واقع مجموع مربعات Total ترکیب مجموع مربعات همه اجزای مدل شامل، اثر ثابت با نام μ، فاکتورهای موجود در مدل که در این مثال αi و βj به همراه γij بود و جمله خطا با نام εik است.

به همین ترتیب R Squared یا ضریب تعیین که آن را میزان توضیح مدل توسط فاکتورها می‌نامیم، به صورت Corrected Model نقسیم بر Corrected Total تعریف می‌کنیم. واضح است هر چقدر R Squared بیشتر باشد به معنای توضیح بهتر و بیشتر کمیت وابسته Dependent Variable (در این مثال درصد موفقیت) توسط فاکتورهای مدل است. برای بیشتر بودن ضریب تعیین باید جمله خطا و یا همان Error که در محرج فرمول ضریب تعیین قرار می‌گیرد، کمتر باشد.

تا اینجا سعی کردم درباره تمام اجزا و محتویات جدول Tests of Between-Subjects Effects به دلیل اهمیت آن بپردازم. در ادامه درباره سایر خروجی‌های نرم‌افزار در تحلیل Two-way ANOVA (Univariate, GLM) صحبت می‌کنیم.

خاطرتان باشد در تنظیمات نرم‌افزار و در تب EM Means به دنبال آن بودیم که میانگین‌های حاشیه‌ای هر کدام از گروه‌های Factor را برحسب گروه‌های Factor دیگر به دست آوریم. همچنین با انتخاب گزینه Compare main effects میانگین‌های حاشیه‌ای گروه‌ها را با یکدیگر مقایسه کنیم. منظور از حاشیه‌ای نیز این است که آماره‌های توصیفی یک Factor را برحسب Factor دیگر به دست بیاوریم.

حال در ادامه خروجی‌های نرم‌افزار، نتایج مربوط به تنظیمات تب EM Means آمده است.

آماره‌های توصیفی براورد شده در EM Means برای فاکتور Cycle

 

در این جدول آماره‌های توصیفی حاشیه‌ای Marginal مانند میانگین، خطای معیار و فواصل اطمینان ۹۵٪ برای درصد موفقیت به ازای هر کدام از سیکل‌ها آمده است. سوالی که اینجا مطرح می‌شود این است که این میانگین‌ها چگونه محاسبه می‌شوند؟ نقش فاکتور دیگر یعنی گروه‌های سنی در محاسبه میانگین‌های حاشیه‌ای هر کدام از سیکل‌های درمانی چیست؟ برای یافتن پاسخ این سوال‌ها، اسلاید زیر را ببینید.

نحوه محاسبه میانگین حاشیه‌ای Cycle

 

همان‌گونه که در جدول سمت راست اسلاید بالا می‌بینید، میانگین واقعی و مشاهده شده درصد موفقیت برای سیکل A عدد ۳۱.۷۳ است. این عدد بدون درنظر گرفتن فاکتور دیگر یعنی سن برای درصد موفقیت سیکل A به دست آمده است.

حال به جدول سمت چپ اسلاید بالا نگاه کنید. میانگین حاشیه‌ای درصد موفقیت برای سیکل A عدد ۳۱.۹۲ به دست آمده است. سوال این است که این عدد چگونه به دست می‌آید. برای پاسخ به این سوال به فرمول نوشته شده در تصویر بالا نگاه کنید.

همان‌گونه که می‌بینید، میانگین حاشیه‌ای درصد موفقیت برای سیکل A در واقع میانگین وزنی به ازای هر کدام از گروه‌های سنی است. به بیان ساده اینکه نرم‌افزار نگاه می‌کند چند نفر از افراد دارای سیکل A دارای گروه سنی کمتر از ۲۴ سال بوده‌اند و میانگین درصد موفقیت آن‌ها چقدر است؟ به همین ترتیب برای سایر گروه‌های سنی که سیکل A بر روی آن‌ها انجام شده تعداد افراد و میانگین آن‌ها چقدر بوده است. از حاصل‌ضرب تعداد در میانگین به ازای هر کدام از گروه‌های سنی و سپس تقسیم نتیجه یر تعداد کل افرادی که دارای سیکل درمانی A بوده‌اند (۶۰ نفر)، میانگین حاشیه‌ای سیکل A به دست می‌آید. همین فرایند برای محاسبه میانگین حاشیه‌ای سایر سیکل‌های درمانی انجام می‌شود.

با این حساب به ازای هر کدام از سیکل‌های درمانی یک Marginal Mean به دست می‌آید.

یادتان باشد در تب EM Means با انتخاب گزینه Compare main effects از نرم‌افزار خواستیم که میانگین‌های حاشیه‌ای گروه‌های هر کدام از فاکتورها را نیز با یکدیگر مقایسه کند. این کار با استفاده از آزمون LSD انجام شده است. نتایج آن را می‌توانید در شکل زیر مشاهده کنید.

نتایج جدول Pairwise Comparisons بر مبنای میانگین‌های حاشیه‌ای فاکتور سیکل

 

در جدول Pairwise Comparisons بالا که به مقایسه دو به دو میانگین‌های حاشیه‌ای گروه‌های مختلف فاکتور Cycle با یکدیگر پرداخته است، معناداری یا عدم معناداری این اختلاف‌ها به دست آمده است.

به عنوان مثال می‌توانیم ببینیم که میانگین‌های حاشیه‌ای درصد موفقیت Cycle A و Cycle B با یکدیگر اختلاف معنادار ندارند (P-value = 0.123) اما میانگین‌های حاشیه‌ای درصد موفقیت Cycle A و Cycle C با یکدیگر اختلاف معنادار دارند (P-value < 0.001). بقیه نتایج را نیز می‌توانید در جدول بالا مشاهده کنید. با این حال به این نکته دقت کنید که این نتایج بر مبنای میانگین حاشیه‌ای هر سیکل درمان به دست آمده است.

در ادامه خروجی‌های نرم‌افزار جدول دیگری با نام Univariate Tests دیده می‌شود.

نتایج جدول Univariate Tests فاکتور Cycle

 

در این جدول دو سطر با نام‌های Contrast و Error وجود دارد. منظور از Error همان جمله خطا در مدل خطی آنالیز واریانس دو طرفه است که در متن‌های بالاتر به آن اشاره شد. چنانچه دقت کتید آماره‌های مربوط به این سطر دقیقاَ برابر با آماره‌های سطر Error در جدول Tests of Between-Subjects Effects است.

سطر Contrast نیز به فاکتورهای موجود در مدل خطی اشاره می‌کند. از آنجا که در حال بررسی میانگین‌های حاشیه‌ای فاکتور Cycle هستیم، بنابراین آماره‌ها و نتایج مربوط به Contrast دقیقاَ برابر با نتایج سطر Cycle در جدول Tests of Between-Subjects Effects است. در بالا نیز درباره این نتایج و معنادار بودن یا نبودن آن‌ها صحبت کردیم که بار دیگر تکرار نمی‌کنیم. تنها نکته اینکه از آنجا که ما در خروجی‌های بخش Estimated Marginal Means هستیم، این نتایج و جدول‌ها به همان داده‌های میانگین‌های حاشیه‌ای مربوط است.

پاسخ به این سوال. آیا میانگین‌های حاشیه‌ای سیکل مانند یکدیگر هستند؟ به عبارت دیگر آیا با درنظر گرفتن رده‌های سنی، اختلاف معناداری در درصد موفقیت سیکل‌های مختلف دیده می‌شود؟

جواب مثبت است. میانگین‌های حاشیه‌ای انواع سیکل با یکدیگر متفاوت هستند.

تمام مطالبی که در بالا و برای میانگین‌های حاشیه‌ای فاکتور Cycle بیان کردیم، برای فاکتور دیگر مطالعه یعنی Age نیز در خروجی‌های نرم‌افزار SPSS آمده است.

در ادامه به بررسی میانگین‌های حاشیه‌ای فاکتور Age می‌پردازیم.

آماره‌های توصیفی براورد شده در EM Means برای فاکتور Age

 

همانند میانگین‌های حاشیه‌ای فاکتور سیکل‌های درمانی، در این جدول آماره‌های توصیفی حاشیه‌ای Marginal مانند میانگین، خطای معیار و فواصل اطمینان ۹۵٪ برای درصد موفقیت به ازای هر کدام از گروه‌های سنی آمده است. در اسلاید زیر درباره نحوه محاسبه این Marginal Means توضیح داده شده است.

نحوه محاسبه میانگین حاشیه‌ای فاکتور Age

 

همان‌گونه که در جدول سمت راست اسلاید بالا می‌بینید، میانگین واقعی و مشاهده شده درصد موفقیت برای گروه سنی کمتر از ۲۴ سال عدد ۲۷.۵۷ است. این عدد بدون درنظر گرفتن فاکتور دیگر یعنی سیکل درمان برای درصد موفقیت گروه سنی کمتر از ۲۴ سال به دست آمده است.

حال به جدول سمت چپ اسلاید بالا نگاه کنید. میانگین حاشیه‌ای درصد موفقیت برای گروه سنی کمتر از ۲۴ سال عدد ۲۸.۱۴ به دست آمده است. سوال این است که این عدد چگونه به دست می‌آید. برای پاسخ به این سوال به فرمول نوشته شده در تصویر بالا نگاه کنید.

همان‌گونه که می‌بینید، میانگین حاشیه‌ای درصد موفقیت برای گروه سنی کمتر از ۲۴ سال در واقع میانگین وزنی به ازای هر کدام از سیکل‌های درمانی است. به بیان ساده اینکه نرم‌افزار نگاه می‌کند چند نفر از افراد گروه سنی کمتر از ۲۴ سال، دارای سیکل A بوده‌اند و میانگین درصد موفقیت آن‌ها چقدر است؟ به همین ترتیب برای سایر گروه‌های فاکتور Cycle که کمتر از ۲۴ سال بوده‌اند، تعداد افراد و میانگین آن‌ها چقدر بوده است. از حاصل‌ضرب تعداد در میانگین به ازای هر کدام از سیکل‌های درمانی و سپس تقسیم نتیجه یر تعداد کل افرادی که دارای کمتر از ۲۴ سال بوده‌اند (۵۹ نفر)، میانگین حاشیه‌ای گروه سنی کمتر از ۲۴ سال به دست می‌آید. همین فرایند برای محاسبه میانگین حاشیه‌ای سایر گروه‌های سنی انجام می‌شود.

به این ترتیب به ازای هر کدام از گروه‌های سنی یک Marginal Mean به دست می‌آید.

در جدول زیر با نام Pairwise Comparisons میانگین‌های حاشیه‌ای هر کدام از گروه‌های سنی با استفاده از آزمون LSD با یکدیگر مقایسه شده است.

نتایج جدول Pairwise Comparisons بر مبنای میانگین‌های حاشیه‌ای فاکتور Age

 

در جدول Pairwise Comparisons بالا که به مقایسه دو به دو میانگین‌های حاشیه‌ای گروه‌های مختلف فاکتور Age با یکدیگر پرداخته است، معناداری یا عدم معناداری این اختلاف‌ها به دست آمده است.

به وضوح می‌توانیم ببینیم که میانگین‌های حاشیه‌ای درصد موفقیت هر دو گروه سنی دلخواه با یکدیگر اختلاف معنادار ندارد. این مطلب و عدم معنادار بودن فاکتور Age را در بخش‌های بالاتر و جدول Tests of Between-Subjects Effects نیز توضیح دادیم.

به همین ترتیب و در ادامه خروجی‌های نرم‌افزار، مبحث میانگین‌های حاشیه‌ای فاکتور Age، جدول دیگری با نام Univariate Tests دیده می‌شود.

نتایج جدول Univariate Tests فاکتور Age

 

در این جدول دو سطر با نام‌های Contrast و Error وجود دارد. منظور از Error همان جمله خطا در مدل خطی آنالیز واریانس دو طرفه است که در متن‌های بالاتر به آن اشاره شد. چنانچه دقت کتید آماره‌های مربوط به این سطر دقیقاَ برابر با آماره‌های سطر Error در جدول Tests of Between-Subjects Effects است.

سطر Contrast نیز به فاکتورهای موجود در مدل خطی اشاره می‌کند. از آنجا که در حال بررسی میانگین‌های حاشیه‌ای فاکتور Age هستیم، بنابراین آماره‌ها و نتایج مربوط به Contrast دقیقاَ برابر با نتایج سطر Age در جدول Tests of Between-Subjects Effects است. بار دیگر بیان می‌کنم که ما در خروجی‌های بخش Estimated Marginal Means هستیم، این نتایج و جدول‌ها به همان داده‌های میانگین‌های حاشیه‌ای مربوط است.

در این جدول به سوال آیا میانگین‌های حاشیه‌ای سن مانند یکدیگر هستند، پاسخ داده شده است. به عبارت دیگر آیا با درنظر گرفتن انواع سیکل، اختلاف معناداری در درصد موفقیت رده‌های مختلف سنی دیده می‌شود؟

جواب منفی است. میانگین‌های حاشیه‌ای رده‌های سنی با یکدیگر همانند هستند.

در پایان بخش Estimated Marginal Means جدول توافقی سیکل و گروه‌های سنی شامل آماره‌های توصیفی میانگین، انحراف معیار از میانگین و فواصل اطمینان، آمده است. این جدول را می‌توانید مشاهده کنید.

جدول توافقی آماره‌های توصیفی Cycle و Age

 

در تنظیمات انجام Two-way ANOVA و در تب Post Hoc به عنوان مثال آزمون‌های بونفرونی Bonferroni و دانکن Duncan را انتخاب کردیم. همان‌گونه که می‌دانیم با استفاده از این آزمون‌ها می‌توانیم به مقایسه دو به دو درصد موفقیت در بین گروه‌های Factor بپردازیم.

در ادامه خروجی‌های نرم‌افزار SPSS نتایج مربوط به این تنظیمات با نام Multiple Comparisons آمده است. به این نکته نیز توجه کنید که نتایج این بخش بر روی میانگین‌های حسابی و مشاهده شده خود گروه‌ها است و مانند بخش قبل بر مبنای میانگین‌های حاشیه‌ای نیست. بیشتر توصیه می‌شود جهت مقایسه بین گروه‌ها فاکتورها از همین نوع مقایسات Post Hoc استفاده کنید.

در نتایج جدول زیر ما به مقایسه بین گروه‌های فاکتور Cycle پرداخته‌ایم. از آزمون بونفرونی نیز استفاده کرده‌ایم.

جدول Multiple Comparisons در Post Hoc Tests برای فاکنور سیکل‌های درمانی

 

به عنوان مثال نتایج جدول بالا نشان می‌دهد که هر چند درصد موفقیت سیکل A حدود ۱.۸ درصد از سیکل B بیشتر است اما از دیدگاه تست آماری، آن‌ها مشابه یکدیگر هستند (P-value = 0.924). با این حال مثلاَ سیکل A حدود ۸.۱ درصد از سیکل C درصد موفقیت بیشتری دارد و از دیدگاه آزمون بونفرونی این بیشتر بودن معنادار نیز هست (P-value = 0.006). به همین ترتیب می‌توانیم نتیجه مقایسه بین هر دو گروه سیکل درمانی را در جدول بالا مشاهده کنیم.

ما از آزمون دانکن نیز جهت به دست آوردن گروه‌های دارای درصد موفقیت مشابه و همانند یکدیگر، استفاده می‌کنیم. همان‌گونه که در جدول زیر می‌بینید، نتایج به دست آمده از آزمون دانکن، تعداد گروه‌های سیکل درمان که ۴ گروه بوده است را به سه زیرگروه تقسیم‌بندی کرده است. در زیرگروه ۱، سیکل C قرار دارد که با بقیه سیکل‌ها اختلاف معنادار درصد موفقیت دارد. در زیرگروه ۲، سیکل‌های D و B قرار دارند که میزان موفقیت آن‌ها با یکدیگر از دیدگاه تست دانکن، مشابه است. به همین ترتیب در زیرگروه شماره ۳، سیکل‌های B و A هستند که آن‌ها نیز دارای درصد موفقیت مشابه با هم می‌باشند.

نتایج آزمون دانکن در مقایسه بین گروه‌های فاکنور Cycle

 

به همین ترتیب و در ادامه خروجی‌های نرم‌افزار SPSS نتایج مربوط به Multiple Comparisons فاکتور Age آمده است. همان‌گونه که قبلاَ نیز گفتیم نتایج این بخش بر مبنای میانگین‌های مشاهده شده گروه‌ها است.

در نتایج جدول زیر مقایسه بین گروه‌های فاکتور Age آمده است. پرداخته‌ایم. از آزمون بونفرونی استفاده کرده‌ایم.

جدول Multiple Comparisons در Post Hoc Tests برای فاکنور گروه‌های سنی

 

به وضوح نتایج جدول بالا نشان می‌دهد که درصد موفقیت هیچکدام از گروه‌های سنی دارای اختلاف معنادار با یکدیگر نیست. این مطلب را ما در جدول Tests of Between-Subjects Effects هنگامی که به بررسی تاثیر فاکتور Age بر Dependent Variable یعنی درصد موفقیت می‌پرداختیم، بیان کردیم. در آن جدول نیز به این نتیجه رسیدیم که فاکتور Age یک مولفه اثرگزار معنادار بر درصد موفقیت نیست. در اینجا و در جدول Multiple Comparisons نیز ما بار دیگر به همان نتیجه رسیدیم. بر این مبنا که بین هیچ‌کدام از گزوه‌های سنی اختلاف معنادار درصد موفقیت دیده نمی‌شود.

در جدول زیر نتایج آزمون دانکن آمده است. همان‌گونه که مشاهده می‌کنید بر مبنای این نتایج، چهار گروه سنی به دو زیرگروه تبدیل شده‌اند. در زبرگروه شماره ۱، گروه‌های سنی بزرگتر از ۴۰ سال، کمتر از ۲۰ سال و بین ۳۰ تا ۴۰ سال قرار گرفته‌اند، به این معنا که درصد موفقیت این گروه‌های سنی مشابه یکدیگر است. 

به همین ترتیب زیرگروه شماره ۲، شامل گروه‌های سنی کمتر از ۲۴ سال، ۳۰ تا ۴۰ سال و ۲۴ تا ۳۰ سال است. این گروه‌ها نیز دارای درصد موفقیت مشابه از دیدگاه آزمون دانکن هستند.

نتایج آزمون دانکن در مقایسه بین گروه‌های فاکنور Age

 

در پایان خروجی‌های نرم‌افزار SPSS می‌توانید، نمودارها و گراف‌ها را مشاهده کنید. به یاد داشته باشید ما در تنظیمات انجام تحلیل Two-way ANOVA و در تب Plot از نرم‌افزار خواستیم نمودارهای خطی از درصد موفقیت برای هر کدام از فاکتورها و همچنین اثرمتقابل آن‌ها برای ما رسم کند. نتیجه را می‌توانید در زیر ببینید.

به این نکته توجه کنید که این نمودارها براساس میانگین‌های حاشیه‌ای که در بخش‌های بالاتر به آن‌ها اشاره کردیم، رسم شده است.

نمودار خطی درصد موفقیت به ازای هر کدام از سیکل‌های درمان

 

همان‌گونه که در گراف بالا می‌بینید نمودار خطی درصد موفقیت برای هر کدام از سیکل‌های درمان آمده است. Cycle C با درصد موفقیت ۲۴.۲۴ درصد کمترین میزان موفقیت را داشته است. در بالا نشان دادیم که این سیکل با بقیه سیکل‌ها اختلاف معنادار دارد. بیشترین درصد موفقیت با ۳۱.۹۲ درصد به سیکل A مربوط می‌شود.

در شکل زیر نمودار درصد موفقیت به ازای هر کدام از گزوه‌های سنی آمده است.

نمودار خطی درصد موفقیت برای هر کدام از گروه‌های سنی

 

همان‌گونه که در این گراف دیده می‌شود، درصد موفقیت گروه‌های سنی تقریباَ مشابه با یکدیگر است. ما در جدول Tests of Between-Subjects Effects نیز نشان دادیم که Age یک فاکتور اثرگزار بر درصد موفقیت نیست.

به همین ترتیب در شکل زیر نمودار اثر متقاطع سیکل و سن آمده است.

نمودار خطی درصد موفقیت برحسب اثر متقابل سیکل و گروه‌های سنی

 

نکته‌ای که در این گراف دیده می‌شود این است که به نظر می‌رسد در سیکل A درصدهای موفقیت گروه‌های سنی تقریباَ مشابه و هم اندازه است. با این حال گروه سنی بالاتر از ۴۰ سال در سیکل A دارای بالاترین درصد موفقیت است. بنابراین پیشنهاد می‌شود برای افراد این گروه سنی، سیکل A انجام شود.

اما در سیکل C درصد موفقیت گروه‌های سنی بالاتر یعنی گروه‌های سنی ۳۰ سال و بیشتر دارای کمترین درصد موفقیت است. در اینجا پیشنهاد می‌شود برای افراد این گروه سنی، سیکل C انجام نشود.

خب، این هم از توضیحات روش آنالیز واریانس دو طرفه که با استفاده از روش General Linear Model , Univariate در نرم افزار SPSS به آن پرداختیم.

 

چگونه به این مقاله رفرنس دهیم

GraphPad Statistics (2020). Two-way ANOVA with SPSS. Statistical tutorials and software guides. Retrieved Month, Day, Yearfrom https://graphpad.ir/general-linear-models-univariate-two-way-anova-spss/.php

For example, if you viewed this guide on 12th January 2022, you would use the following reference

GraphPad Statistics (2020). Two-way ANOVA with SPSS. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/general-linear-models-univariate-two-way-anova-spss/.php

 

ارایه خدمات تحلیل و مشاوره آماری

گراف پد برای شما خدمات مشاوره و انجام انواع تحلیل‌های آماری را ارایه می‌دهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.

گراف پد جمعی از رتبه‌های برتر آزمون دکترا آمار دانشگاه‌های ایران | برجسته در موسسه بین‌المللی تحقیقات | دارای نماد اعتماد الکترونیک از مرکز توسعه تجارت الکترونیکی ایران و مجوز رسمی ثبت به شماره ۴۱۸۸۱ و شناسه ملی ۱۴۰۰۶۸۳۲۳۱۹