Selection Variable در مدل های رگرسیونی
Selection Variable
به هنگام بیان مدل رگرسیون خطی (رگرسیون خطی Linear Regression در نرمافزار SPSS) اشاره کردیم که چنانچه بخواهیم تحلیل رگرسیون خطی فقط بر روی محدوده و یا اعداد خاصی از یک Variable انجام شود، میتوانیم از گزینهای به نام Selection Variable در تنظیمات نرمافزار استفاده کنیم. من در این مقاله به دنبال آن هستم که به بیان این گزینه در یک مدل رگرسیونی و با استفاده از نرمافزار SPSS بپردازم.
به دادههای این مثال که مربوط به متوسط آلودگی هوا در فصل پاییز برحسب واحد PSI در 21 شهر کشور است، توجه کنید. فایل دیتا این مقاله را میتوانید از اینجا Selection Variable دریافت کنید.
در این بررسی چند عامل موثر در آلودگی هوای این شهرها مورد مطالعه قرار گرفته است. عواملی که مورد بررسی قرار گرفتهاند عبارتند از تعداد کارخانههای بزرگ (بیشتر از 25 کارگر)، کارخانههای کوچک (کمتر از 25 کارگر)، تعداد وسایل نقلیه و وضعیت سیستم حمل و نقل عمومی در این 21 شهر. به طور حتم عوامل تاثیرگذار دیگری نیز بر روی آلودگی هوا، وجود دارند. با اینحال ما بررسی خود را بر روی این چند عامل انجام دادهایم.
ما مدل رگرسیون خطی زیر را به دادهها برازش دادهایم. در این زمینه میتوانید لینک (رگرسیون خطی Linear Regression در نرمافزار SPSS) را ببینید.
$ \displaystyle y=42.91+12.77{{x}_{1}}+8.03{{x}_{2}}+4.59{{x}_{3}}-6.18{{x}_{4}}$
همانطور که بیان کردم، هدف من در این مقاله توضیح گزینهای به نام انتخاب کمیتها Selection Variable در بین X های این مدل رگرسیونی است.
برای انجام این کار در نرمافزار SPSS از مسیر زیر استفاده میکنیم.
Analyze → Regression → Linear
تنظیمات نرمافزار
Setting
هنگامی که به مسیر بالا در SPSS میرویم، پنجره زیر با نام Linear Regression برای ما باز میشود. در آنجا میتوانیم گزینه Selection Variable را مشاهده کنیم.
از آنجا که به دنبال پیشبینی میزان آلودگی هوا هستیم، آلودگی بر حسب PSI به عنوان کمیت وابسته Dependent و کمیتهای تعداد وسایل نقلیه، کارخانههای بزرگ، کارخانههای کوچک و وضعیت سیستم حمل و نقل عمومی، به عنوان کمیتهای مستقل Independent تعریف میشوند.
فرض کنید من میخواهم تحلیل رگرسیونی خود را بر روی شهرهایی انجام دهم که عدد Transport آنها بزرگتر از 3.2 باشد. برای این منظور کمیت Transport را در کادر Selection Variable قرار میدهیم. سپس بر روی دکمه Rule میزنیم.
در پنجره Set Rule عدد 3.2 را وارد میکنیم و کادر بازشو را نیز بر روی greater than قرار میدهیم. با انجام این کار تحلیلهای رگرسیونی فقط بر روی نمونههایی انجام میشود که عدد Transpose آنها بزرگتر از 3.2 است. Continue میکنیم و بار دیگر به پنجره Linear Regression بر میگردیم.
نتایج Selection Variable
Output & Results
نرمافزار SPSS نتایج و خروجیهای زیادی در یک تحلیل رگرسیونی در اختیار ما قرار میدهد. با این حال من در این مقاله صرفاً قصد داشتم تحلیل بر مبنای شرط خاصی (Transpose>3.2) انجام شود.
در جدول زیر با نام Model Summary میتوانید اندازههای خوب بودن مدل رگرسیونی به ویژه ضریب تعیین را ببینید.
بر مبنای جدول بالا به دست میآید ضریب تعیین مدل با وجود شرط (Transpose>3.2) برابر با 97.1 درصد است.
همچنین میتوانید جدول ANOVA در این مدل رگرسیونی شرطی را مشاهده کنید.
نتایج جدول ANOVA بیانگر معنادار بودن مدل رگرسیونی به دست آمده است. جدول ضرایب رگرسیونی Coefficients نیز در ادامه دیده میشود.
بر مبنای نتایج این جدول به دست میآوریم که چنانچه بخواهیم مطالعه خود را محدود به نمونههایی با Transpose>3.2 کنیم، فقط کمیت Lfactory با سطح معنیداری 0.05، دارای تاثیر معنادار بر روی PSI است (P-value = 0.041).
چگونه به این مقاله رفرنس دهیم
GraphPad Statistics (2022). Selection Variable in regression models. Statistical tutorials and software guides. Retrieved Month, Day, Year, from https://graphpad.ir/selection-variable-regression/.php
For example, if you viewed this guide on 12th January 2022, you would use the following reference
GraphPad Statistics (2022). Selection Variable in regression models. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/selection-variable-regression/.php
ارایه خدمات تحلیل و مشاوره آماری
گراف پد برای شما خدمات مشاوره و انجام انواع تحلیلهای آماری را ارایه میدهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.