گروه بندی با SPSS

گروه بندی و طبقه بندی داده‌ها با استفاده از نرم‌افزار SPSS

زمان مطالعه: 25 دقیقه 

 

SPSS از بهترین نرم‌افزارهای تحلیل‌های توصیفی و استنباطی آماری است، که با ارایه روش‌ها، مدل‌ها و آزمون‌های آماری و رسم گراف‌ها و نمودارهای مقالات و پایان‌نامه‌ها، کاربرد فراوانی در علوم مختلف دارد. در ویدئو آموزشی زیر به نحوه گروه‌بندی و طبقه‌بندی داده‌های Scale با استفاده از نرم‌افزار SPSS پرداخته‌ایم. مشاهده آن را به شما توصیه می‌کنیم.

 

 

طبقه‌بندی داده‌ها

 Data Classification 

 

در نرم‌افزار SPSS داده‌ها و مشاهدات در سه نوع و Measure با نام‌های اسمی Nominal ، رتبه ای Ordinal و عددی Scale قرار می‌گیرند. هنگامی که با داده‌های عددی که دارای اندازه‌های حسابی مثبت، منفی و یا اعشار هستند، مواجه می‌شویم، لزوم طبقه‌بندی و دسته‌بندی آن‌ها در چند گروه احساس می‌شود.

ما در این آموزش به دنبال این هستیم که به بیان روش‌های مختلف دسته‌بندی داده‌ها در چند طبقه و گروه بپردازیم.

جهت گروه‌بندی داده‌ها از مسیر زیر در نرم‌افزار استفاده می‌کنیم.

Transform → Recode into Different (Same) Variables

 

مسیر گروه بندی داده‌ها در نرم‌افزار SPSS

 

لازم به توضیح است که فرایند و روش کار گزینه‌های Recode into Different (Same) Variables همانند یکدیگر است. با این تفاوت که در گزینه Different یک Variable و ستون جدید در فایل دیتا ایجاد می شود اما گزینه Same بر روی همان Variable، گروه‌بندی را انجام می‌دهد.

ما در این نوشتار درباره‌ی Recode into Different Variables صحبت می‌کنیم. بیان کردیم که این روش تفاوتی با گزینه Recode into Same Variables ندارد.

فایل دیتا این مثال را می‌توانید از اینجا دریافت کنید.

 

تنظیمات نرم‌افزار

 Recode into Different Variables 

 

هنگامی که بر روی گزینه Recode into Different Variables می‌زنیم، پنجره زیر با نام با همان نام Recode into Different Variables برای ما باز می‌شود.

پنجره Recode into Different Variables

 

پنجره بالا دارای کادرها و بخش‌های مختلفی است. در ادامه درباره‌ی آن‌ها حرف می‌زنیم.

  • Input Variable -> Output Variable

 

در این بخش Variable یا Variableهایی را که می‌خواهیم گروه‌بندی کنیم، قرار می‌دهیم. به عنوان مثال فرض کنید من می‌خواهم سن افراد این مطالعه را به چند گروه دسته‌بندی کنم. برای انجام این کار کمیت age را به این کادر انتقال می‌دهم.

انتخاب age جهت گروه‌بندی آن

 

  • Output Variable

 

از آن‌جا که کار ما انجام روش Recode into Different Variables است، نرم‌افزار در کادر Output Variable از ما می‌خواهد برای ستون جدیدی که قرار است بیانگر گروه‌های سن باشد، نام و برچسب قرار دهیم. در این کادر ما یک Name و Label دلخواه برای ستونی که دسته‌های مختلف سنی را نشان خواهد داد، انتخاب می‌کنیم.

پس از آن تب Change را کلیک می‌کنیم. تصویر زیر را مشاهده کنید.

نامگزاری کمیت جدید گروه‌بندی سن در کادر Output Variable

 

در این صورت از نرم‌افزار می‌خواهیم age را به کمیت جدیدی با نام AgeC که نشان‌دهنده گروه‌های مختلف سنی خواهد بود، تبدیل کند.

 

  • Old and New Values

 

نکته و موضوع بسیار بااهمیتی که وجود دارد این است که ما در مرحله‌ی بعد باید گروه‌ها و رده‌های مختلف سنی را برای نرم‌افزار تعریف کنیم. این کار با استفاده از تب Old and New Values انجام می‌شود. هنگامی که بر روی آن کلیک می‌کنیم به پنجره زیر می‌رویم.

پنجره Recode into Different Variables: Old and New Values

 

پنجره Recode into Different Variables: Old and New Values دارای دو بخش اصلی با نام‌های Old Value و New Value است.

ما در بخش Old Value مقادیر و اندازه‌های قبلی که می‌خواهیم آن‌ها را در یک یا چند گروه و رده قرار دهیم، وارد می‌کنیم و در بخش New Value اعداد و کدهای بیانگر گروه‌ها و دسته‌های جدید.

در ادامه سعی می‌کنیم به جزئیات درباره هر کدام از کادرها و گزینه‌ها صحبت کنیم.

  • Value

در سمت چپ پنجره Recode into Different Variables: Old and New Values و در بخش Old Value کادری با نام Value دیده می‌شود. گاهی اوقات ما می‌خواهیم فقط یک عدد خاص را به عدد دلخواه دیگری تبدیل کنیم.

به عنوان مثال ما می‌خواهیم افرادی که دارای سن 50 سال هستند، در کمیت جدید که نام آن را AgeC قرار دادیم، به صورت 99 به نمایش دربیایند.

برای این منظور ما در کادر Value از بخش Old Value عدد 50 را می‌نویسیم و در کادر Value از بخش New Value عدد 99 را می‌نویسیم. در مرحله بعد نیز دکمه Add را کلیک می‌کنیم. با انجام این کار در کادر Old -> New عبارت 99 <- 50 قرار می‌گیرد.

انتخاب یک عدد خاص و قرار دادن آن به عنوان عددی دیگر یا Missing

 

همچنین به عنوان مثال فرض کنید ما می‌خواهیم افرادی که دارای سن 60 سالگی هستند در Variable جدید به صورت داده گمشده و Missing قرار گیرند.

برای انجام این کار عدد 60 را در کادر Value بخش Old Value می‌نویسیم و در بخش New Value گزینه System-missing را انتخاب می‌کنیم. در مرحله بعد نیز دکمه Add را کلیک می‌کنیم. با انجام این کار در کادر Old -> New عبارت 60 -> SYSMIS قرار می‌گیرد.

به این ترتیب ما از نرم‌افزار می‌خواهیم که عدد 50 را به 99 و عدد 60 را به عنوان Missing در Variable جدید (AgeC) قرار دهد.

 
  • System-missing

اگر هدف ما این باشد افرادی که سن آن‌ها وارد نشده است و به هر دلیلی گمشده و Miss هستند، در Variable جدید دارای کد یا عدد خاصی باشند، در بخش Old Value گزینه‌های System-missing و یا System- or user-missing را انتخاب می‌کنیم.

گزینه System-missing و قرار دادن یک عدد یا کد خاص به جای داده‌های گمشده

 

به عنوان مثال من در تصویر بالا از نرم‌افزار خواسته‌ام، همه افرادی که عدد Age آن‌ها Miss بوده است در Variable جدید به صورت کد 1 نمایش داده شوند.

  • Range

چنانچه بخواهیم افراد در یک محدوده سنی خاص را یک گروه قرار دهیم، از گزینه Range استفاده می‌کنیم. به عنوان مثال ما می‌خواهیم افراد 20 تا 30 سال در یک گروه و افراد 31 تا 40 سال در گروه دیگر قرار بگیرند.

انتخاب گزینه Range

 

برای این منظور گزینه Range را انتخاب کرده و ابتدا اعداد 20 تا 30 را در کادرهای آن وارد می‌کنیم. در کادر Value بخش New Value نیز کد 2 را وارد کرده و سپس Add می‌کنیم. همین کار را برای سنین 31 تا 40 سال انجام داده و در کادر Value کد 3 را می‌نویسیم.

با انجام این کار ما از نرم‌افزار خواسته‌ایم همه افراد دارای سنین بین 20 تا 30 سال را در Variable جدید یعنی همان AgeC به کد 2 تبدیل کند. همچنین افراد 31 تا 40 سال را به کد 3 تبدیل نماید.

 

  • Range, LOWEST through value

با انتخاب این گزینه به سادگی می‌توانیم افرادی که دارای سن کمتر از یک عدد دلخواه هستند را در یک کد دلخواه (و یا حتی به عنوان Missing) قرار دهیم. به عنوان مثال من می‌خواهم همه افراد کمتر از 20 سال در Variable جدید، Miss شوند.

Miss کردن افراد کمتر از 20 سال

 

برای انجام این کار، من در گزینه Range, LOWEST through value عدد 20 را نوشته‌ام. در بخش New Value نیز گزینه System-missing را انتخاب کرده‌ام. به این ترتیب نرم‌افزار همه افراد کمتر از 20 سال را به عنوان داده گمشده و Missing در نظر می‌گیرد و از مطالعه کنار می‌گزارد.

 

  • Range, value through HIGHEST

چنانچه بخواهیم افراد بزرگتر از یک سن خاص را در یک کد دلخواه (و یا حتی به عنوان Missing) قرار دهیم از گزینه Range, value through HIGHEST استفاده می‌کنیم. به عنوان مثال می‌خواهیم همه افراد بیشتر از 70 سال در Variable جدید، به عنوان کد 10 در نظر گرفته شوند.

قرار دادن افراد بزرگتر از یک عدد خاص در یک کد

 

برای انجام این کار، در گزینه Range, value through HIGHEST عدد 70 را نوشته‌ام. در بخش New Value و گزینه Value کد 10 نوشته شده است. به این ترتیب نرم‌افزار همه افراد بزرگتر از 70 سال را در کمیت جدید AgeC به صورت کد 10 نمایش می‌دهد.

 

  • All other values

گزینه دیگری که در بخش Old Value وجود دارد، گزینه All other values است. با استفاده از این گزینه می‌توانیم برای همه افراد در سنین دیگر، که برای آن‌ها دسته‌ و رده‌ای مشخص نکرده‌ایم، در یک کد و یا به عنوان Missing در بخش New Value تعریف کنیم.

به عنوان مثال اگر بخواهیم سایر سنین که در رده‌بندی‌های قبلی نامی از آن‌ها نبرده‌ایم در کد 5 قرار گیرند، این کار با استفاده از گزینه All other values انجام می‌شود.

قرار دادن سایر افراد در یک کد دلخواه

 

برای انجام این کار، گزینه All other values را انتخاب کرده و در کادر Value از بخش New Value عدد 5 را وارد می‌کنیم. سپس Add می‌کنیم. با این تنظیمات نرم‌افزار همه افرادی که در سنین دیگری غیر از مواردی که تا به حال در بخش‌های بالاتر از آن‌ها نام بردیم را در کد 5 قرار می‌دهد.

حال Continue کنید تا به پنجره Recode into Different Variables بازگردید.

در این پنجره کادر و گزینه دیگری با نام If (optional case selection condition) دیده می‌شود.

  • If (optional case selection condition)

 

کادر If (optional case selection condition)

 

توضیح این‌که زمانی از این تب استفاده می‌کنیم که بخواهیم گروه‌بندی و دسته‌بندی داده‌های خود را بر مبنای یک یا چند شرط و یا فیلتر خاص انجام دهیم. به عبارت دیگر می‌خواهیم همه کارهایی که در بخش Old and New Values تعریف کرده و انجام دادیم، فقط بر روی تعداد خاصی از افراد مطالعه انجام شود و نه بر روی همه افراد مطالعه.

مثلاً ما می‌خواهیم دسته‌بندی‌های تعریف شده فقط بر روی مردان و آن‌هایی که عامل بهبودی (Improvement) آن‌ها فاکتورهای فردی یعنی individual بوده است، انجام شود.

برای انجام این کار و قرار دادن شرط بر روی گروه‌بندی داده‌ها، بر روی تب If کلیک کنید. پنجره زیر برای ما باز می‌شود.

قرار دادن عبارت شرطی بر روی فرایند گروه‌بندی داده‌ها

 

در پنجره Recode into Different Variables If Cases ابتدا گزینه Include if case satisfies condition را انتخاب می‌کنیم. در مرحله بعد و با فعال شدن Fieldها و ستون‌ها، عبارت  genus = 2 & improvment = 1 را در کادر وارد می‌کنیم. با Continue کردن بار دیگر به پنجره Recode into Different Variables باز می‌گردیم.

قرار گرفتن عبارت شرطی

 

به این ترتیب عبارت شرطی genus = 2 & improvment = 1 در جلوی تب If قرار می‌گیرد. از این به بعد همه تعاریف و کدهای قرار داده شده در تب Old and New Values فقط بر روی افرادی که شرط برای آن‌ها برقرار است (مردان با عامل بهبودی فردی)، انجام می‌شود.

حال اگر در پنجره Recode into Different Variables، دکمه OK را بزنیم، همه تنظیمات اعمال شده و در انتهای فایل دیتا ستون جدیدی با نام AgeC قرار می‌گیرد.

 

ستون AgeC پس از انجام تنظیمات پنجره Recode into Different Variables

 

در این ستون کدها همان اعداد و مقادیری است که ما در تب Old and New Values آن‌ها را تعریف کردیم. برای درک بهتر خوب است به تب Variable View برویم و با استفاده از ابزار Values این کدها را مطابق با همان تعاریف در تب Old and New Values، معرفی کنیم.

به این نکته نیز توجه کنید، از آن‌جا ما عبارت شرطی خود را محدود به مردان و بیماران بهبود یافته با عامل فردی کرده‌ایم، کدگزاری‌ها فقط بر روی سنین همین افراد یعنی مردان با عامل بهبودی فردی انجام شده است و برای سایر افراد این مطالعه، کدگزاری و تعریفی انجام نشده است.

نکته

 

در پایان بار دیگر این نکته را بیان می‌کنیم که استفاده از روش طبقه‌ای داده‌ها به صورت Recode into Same Variables تفاوتی با روش توضیح داده شده در بالا یعنی Recode into Different Variables ندارد و کاملاً مانند همین روش است. تنها تفاوت آن در این است که روش Same کمیت و Variable جدیدی مثلاً با نام همان AgeC نمی‌سازد و همه این کدگزاری‌ها و تعاریف را بر روی همان کمیت و ستون Age انجام می‌دهد. از آن‌جا که ما معمولاً علاقمند هستیم یافته‌ها و اعداد قبلی همچنان در فایل دیتا وجود داشته باشد و حذف نشوند، بنابراین روش Different نسبت به Same بهتر و کاربردی‌تر است.

 

ارایه خدمات تحلیل آماری با SPSS

گراف پد ارایه خدمات تحلیل‌های آماری با نرم‌افزار SPSS در تحقیقات و مطالعات را انجام می‌دهد. جهت دریافت نکات بیشتر و نحوه کار می‌توانید مختصری از کار خود را ارسال نمایید. به سرعت تقاضای شما را بررسی و نتایج تحلیل داده‌ها را به صورت اختصاصی و کامل ارسال خواهیم کرد.

گراف پد جمعی از رتبه‌های برتر آزمون دکترا آمار دانشگاه‌های ایران | برجسته در موسسه بین‌المللی تحقیقات | دارای نماد اعتماد الکترونیک از مرکز توسعه تجارت الکترونیکی ایران و مجوز رسمی ثبت به شماره ۴۱۸۸۱ و شناسه ملی ۱۴۰۰۶۸۳۲۳۱۹