انتخاب موردها

انتخاب موردها Select Cases در نرم‌افزار SPSS

زمان مطالعه: 25 دقیقه 

 

 

انتخاب موردها

 Select Cases 

در یک مطالعه و طرح تحقیقاتی بسیار اتفاق می‌افتد که فقط می‌خواهیم بر روی بخشی از داده‌ها تحلیل انجام دهیم. در واقع هدف ما این است که در فایل دیتا، تعدادی از موردها (سطرها) را انتخاب کنیم و در مرحله‌ی بعد بر روی این موردهای انتخاب شده، آنالیز و تحلیل دلخواه خود را انجام دهیم.

در این نوشتار قصد دارم با استفاده از نرم‌افزار SPSS و ابزاری با نام Select Cases روشی را جهت انتخاب داده‌های مورد نظر خود، بیان کنم.

 فایل دیتای این مثال را می‌توانید از اینجا دریافت کنید.

در تصویر زیر می‌توانید بخشی از داده‌های این مثال را مشاهده کنید. داده‌ها مربوط به اطلاعات فردی 10000 نفر از مشتریان یک شرکت است.

داده های مثال Select Cases

 

در ابتدا بیان می‌کنیم که از مسیر زیر در نرم‌افزار SPSS استفاده می‌کنیم.

Data→ Select Cases

 

مسیر انتخاب موردها Select Cases در نرم افزار SPSS

 

البته در اغلب ورژن‌های نرم افزار SPSS گزینه Select Cases در نوار ابزار پنجره Data View به صورت پیش‌فرض قرار گرفته است.

ابزار Select Cases در نرم‌افزار SPSS

 

بر مبنای ابزارهای موجود در Select Cases ما می‌خواهیم حالت‌ها و گزینه‌های مختلف انتخاب افراد و مشتریان در این مثال را انجام دهیم.

در کادر Select از پنجره Select Cases این گزینه‌ها و روش‌های مختلف انتخاب نمونه‌ها، آمده است.

  • انتخاب موردها تحت یک یا چند شرط خاص

 

فرض کنید ما می خواهیم تحلیل را فقط بر روی مردان کمتر از 30 سال انجام دهیم. بنابراین لازم است این افراد را در فایل دیتا انتخاب کنیم.

برای انجام این کار با استفاده از مسیرهای بالا که نام بردیم، ابزار Select Cases در نرم‌افزار را باز می‌کنیم. پنجره زیر برای ما باز می‌شود.

پنجره Select Cases و انتخاب گزینه شرطی

 

در پنجره Select Cases گزینه If condition is satisfied را انتخاب می‌کنیم و بر روی تب If می‌زنیم. با انجام این کار پنجره زیر با نام Select Cases If برای ما باز می‌شود.

پنجره Select Cases If و نوشتن عبارت شرطی در آن

 

در این پنجره عبارت شرطی خود را می‌نویسیم. این عبارت شرطی شامل افرادی است که قرار است در تحلیل و انتخاب مشتریان قرار گیرند. به این نکته مهم دقت کنید، هنگامی که بیش از یک شرط در انتخاب افراد داریم از کاراکتر & استفاده می‌کنیم.

از آن‌جا که ما می‌خواهیم مردان کمتر از 30 سال در مطالعه ما قرار گیرند، عبارت شرطی به صورت Gender = 0 & Age < 30 را می‌نویسیم. حال Continue کنید تا به پنجره قبلی باز گردید.

عبارت شرطی نوشته شده در جلوی تب If

 

همان‌گونه که مشاهده می‌کنید عبارت شرطی نوشته شده در مقابل تب If ظاهر می‌شود.

در کادر Output، نرم‌افزار سه راه‌حل جهت نمایش رکوردها و افراد قرار گرفته (مردان زیر 30 سال) یا قرار نگرفته در شرط، به ما پیشنهاد می‌کند.

  • گزینه Filter out unselected cases
گزینه Filter out unselected cases در پنجره Select Cases

 

با انتخاب گزینه Filter out unselected cases در همان فایل دیتایی که مشغول کار با آن هستیم، بر روی شماره سطرهایی که در شرط فیلتر قرار نمی‌گیرند خط می‌خورد و از تحلیل‌های بعدی خارج می‌شوند. همچنین سطرها و افرادی نیز که در شرط قرار می‌گیرند یعنی مردان کمتر از 30 سال، همچنان در تحلیل و آنالیزها قرار می‌گیرند.

من همین گزینه Filter out unselected cases را انتخاب کرده و OK می‌کنم. چه اتفاقی می‌افتد؟ به فایل دیتا بروید و ببینید.

فیلتر شدن سطرها پس از انتخاب گزینه Filter out unselected cases

 

همان گونه که در تصویر بالا مشاهده می کنید بر روی شماره سطر افرادی که در شرط قرار نمی گیرند، خط خورده است. فقط افراد با برقرار بودن شرط (مردان کمتر از 30 سال) در مطالعه باقی مانده و خط نخورده اند.

به همین ترتیب در فایل دیتا و در آخرین ستون، Variable جدیدی با نام $_filter ساخته شده است. این ستون دارای کدهای صفر و یک است. کد صفر به معنای این است که آن سطر در فیلتر قرار نگرفته و از فایل دیتا حذف شده است. کد یک نیز به معنای آن است که سطر در انتخاب و شرط Select Cases قرار گرفته و در تحلیل‌های آینده قرار دارد. تصویر زیر را ببینید.

ستون $_filter بعد از انجام Select Cases

 

حال اگر یک آنالیز ساده مثلاً بر روی سطح درآمد انجام دهیم، مشاهده می کنیم که تحلیل فقط بر روی افراد و سطرهای خط نخورده (دارای شرط) انجام می شود.

تحلیل فراوانی بر روی درآمد مردان کمتر از 30 سال (شرط)

 

یادتان باشد بیان کردیم که تعداد کل افراد مورد بررسی در این مطالعه 10000 نفر بوده است. با این حال بعد از اینکه بر روی فایل دیتا شرط قرار دادیم، تعداد افراد مورد بررسی یعنی مردان کمتر از 30 سال به 697 نفر کاهش پیدا کرد. از این به بعد هر تحلیلی بر روی این داده‌ها انجام دهیم فقط بر روی همین 697 نفر انجام می‌شود.

  • گزینه Copy selected cases to a new dataset
گزینه Copy selected cases to a new dataset

 

با انتخاب گزینه Copy selected cases to a new dataset یک فایل دیتا جدید با نامی دلخواه که ما در کادر Dataset name می‌نویسیم، تشکیل می‌شود. این فایل دیتا فقط شامل سطرها و مشتریانی است که در شرط (یعنی مردان کمتر از 30 سال) قرار می‌گیرند. یک فایل جدید فقط شامل همان 697 نفر مشتریانی که هم مرد هستند و هم کمتر از 30 سال دارند.

  • گزینه Delete unselected cases
 
گزینه Delete unselected cases

 

اگر در کادر Output نیز گزینه Delete unselected cases را انتحاب کنیم، به جای خط خوردن بر روی سطرها و مشتریانی که در فیلتر قرار نمی‌گیرند، آن‌ها از فایل دیتا حذف می شوند. با انتخاب این گزینه در فایل دیتا به جای اطلاعات 10000 مشتری، فقط داده‌ها و سطرهای مربوط به همان 697 فردی که در شرط قرار دارند، باقی می‌ماند و بقیه سطرها حذف می شوند.

خب حال که درباره‌ی کادر Output و گزینه‌های موجود در آن به منظور نحوه نمایش خروجی‌های نرم‌افزار در فایل دیتا صحبت کردیم، به ادامه بحث یعنی سایر روش‌ها و گزینه‌های انتخاب موردها با استفاده از نرم‌افزار SPSS می‌پردازیم.

  • انتخاب موردها به صورت تصادفی

 

گاهی اوقات تمایل داریم بدون در نظر گرفتن هیچگونه شرطی بر روی داده‌ها، به انتخاب تعدادی تصادفی از افراد و موردها بپردازیم. به عنوان مثال می‌خواهیم 15 درصد افراد موجود در فایل دیتا را به صورت تصادفی انتخاب کرده و سپس بر روی آن‌ها تحلیل انجام دهیم.

این کار با استفاده از گزینه Random sample of cases انجام می‌شود. در تصویر زیر می‌توانید آن را ببینید.

پنجره Select Cases و گزینه انتخاب تصادفی

 

در گزینه Random sample of cases بر روی تب Sample کلیک می‌کنیم. با انجام این کار به پنجره Select Cases: Random Sample می‌رویم.

پنجره Select Cases: Random Sample

 

در این پنجره با دو گزینه Approximately و Exactly روبه‌رو هستیم. با استفاده از گزینه Approximately می‌توانیم به صورت تقریبی انتخاب کنیم که چه حجم و درصدی از افراد و موردها به صورت تصادفی در فیلتر ما قرار گیرد. به عنوان مثال من از نرم‌افزار خواسته‌ام 15 درصد از نمونه‌ها به صورت تصادفی جهت انجام تحلیل‌های آینده انتخاب شوند.

با انجام این کار، نرم‌افزار به صورت تصادفی 15 درصد از مشتریان را انتخاب می‌کند. چنانچه در کادر Output گزینه Copy selected cases to a new dataset را نیز انتخاب کنیم، یک فایل جدید با حجم 15 درصدی از این فایل 10000 نفری خواهیم داشت.

گزینه Exactly این امکان را به ما می‌دهد تا بتوانیم دقیقاً به تعداد دلخواه مورد، از تعداد مشخصی سطر، نمونه‌های خود را انتخاب کنیم.

گزینه Exactly جهت انتخاب نمونه تصادفی از فایل دیتا

 

به عنوان مثال من از نرم‌افزار خواسته‌ام تعداد 100 فرد از 500 فرد اول فایل دیتا، برایم انتخاب کند. در این صورت از بین سطرهای شماره 1 تا 500، به تصادف 100 نفر انتخاب می‌شود.

پس از Continue و سپس OK کردن در پنجره Select Cases می‌توانیم در فایل دیتا، نتیجه به دست آمده را مشاهده کنیم.

  • انتخاب موردها از یک محدوده خاص

 

چنانچه علاقمند باشیم افراد و نمونه ها را از یک محدوده خاص، یعنی شروع از یک شماره سطر و اتمام در یک شماره سطر دیگر انجام دهیم، در پنجره Select Cases گزینه Based on time or case range را انتخاب می‌کنیم.

گزینه Based on time or case range

 

هنگامی که بر روی تب Range کلیک می‌کنیم، پنجره زیر برای ما باز می‌شود.

پنجره Select Cases: Range

به عنوان مثال من در اینجا از نرم‌افزار خواسته‌ام همه مشاهدات و افراد از سطر شماره 1000 تا 1500 را انتخاب کند. با انجام این کار فقط این افراد در تحلیل‌های بعدی مورد استفاده قرار می‌گیرند و سایر افراد و موردها از تحلیل کنار گذاشته می شوند.

  • انتخاب موردها بر مبنای یک Variable

 

چنانچه بخواهیم فیلتر و انتخاب افراد فقط براساس یک کمیت و Variable خاص باشد ما از گزینه Use filter variable استفاده می کنیم.

گزینه Use filter variable

 

به عنوان مثال من از نرم‌افزار خواسته‌ام بر مبنای کمیت Married نمونه‌ها و افراد را انتخاب کند. با انجام این کار در فایل دیتا فقط افراد دارای کد 1 یعنی متاهل‌ها جهت تحلیل و آنالیز باقی می‌مانند. به عبارت دیگر تنها متاهل‌ها انتخاب می شوند و مابقی افراد یعنی افراد مجرد از تحلیل کنار گذاشته می شوند.

 

به این ترتیب ما با استفاده از ابزار Select Cases در نرم‌افزار SPSS می‌توانیم به انتخاب موردها، افراد و سطرهای دلخواه خود بپردازیم. پس از آن در مرحله بعد می‌توانیم تحلیل خود را محدود به افراد انتخاب شده کرده و صرفاً بر روی آن‌ها آنالیزهای خود را انجام دهیم.

 

 ارایه خدمات تحلیل آماری

ما در گراف پد به ارایه و انجام انواع تحلیل‌های آماری اقدام می‌کنیم. جهت دریافت نکات بیشتر و نحوه کار می‌توانید مختصری از کار خود را ارسال نمایید. به سرعت تقاضای شما را بررسی و نتایج را ارسال خواهیم کرد. جهت سفارش کار می‌توانید با ما تماس بگیرید.

گراف پد جمعی از رتبه‌های برتر آزمون دکترا آمار دانشگاه‌های ایران | برجسته در موسسه بین‌المللی تحقیقات | دارای نماد اعتماد الکترونیک از مرکز توسعه تجارت الکترونیکی ایران و مجوز رسمی ثبت به شماره ۴۱۸۸۱ و شناسه ملی ۱۴۰۰۶۸۳۲۳۱۹