داده های گمشده در SPSS
توضیحات نوشتار آموزشی (Missing Value) داده های گمشده در SPSS برگرفته شده از کتاب روش های پیشرفته آماری و کاربردهای آن- انتشارات جامعهنگر
در یک بررسی و مطالعه بسیار اتفاق میافتد که مقادیر برخی از کمیتها اندازهگیری نشدهاند و یا قابل اندازهگیری و مشاهده نبودهاند. به عنوان مثال در یک پرسشنامه که از سوالشونده درخواست میشود اطلاعات شخصی خود را بیان کند، گاهی اوقات پاسخی به برخی از سوالات داده نمیشود. در اینگونه موارد با نتایجی تحت عنوان داده های گمشده روبهرو هستیم. در این نوشتار آموزشی میخواهیم با استفاده از نرمافزار SPSS روشهایی را برای جایگزین کردن برخی مقادیر خاص به جای Missing Value در SPSS بیان کنیم.
داده های گمشده خوب
به این نکته توجه کنید ما مقادیر متفاوت و مختلفی را میتوانیم به ازای داده های گمشده در یک تحقیق، قرار دهیم که به ماهیت و نوع تحقیق بستگی تمام دارد، ما با برخی از این مقادیر در ادامه آشنا خواهیم شد. با اینحال همواره توصیه نمیشود که به ازای داده های گمشدهی یک مطالعه، مقادیر مرتبط جایگزاری شود بلکه گاهی اوقات وجود این داده های گمشده و حجم آنها میتواند خود حامل موارد و اطلاعات مفیدی باشد.
مثال آموزشی جایگزاری داده های گمشده در SPSS
در یک تحقیق بر روی درآمد 24 نفر از کارکنان یک موسسه دانشگاهی مشاهده شده است که 7 نفر به سوال میزان درآمد ماهیانه خود پاسخ ندادهاند. نحوه ورود اطلاعات و داده های گمشده در SPSS آمده است. داده های گمشده در SPSS تحت عنوان Missing Values و با نقطه نشان داده میشوند.
در پی آن هستیم که بتوانیم به منظور ادامه تحلیلها، جایگزین مناسب عددی برای موارد عدم پاسخ و یا همان دادههای گمشدهی میزان درآمد بیابیم. برای این منظور از مسیر زیر استفاده میکنیم.
Transform → Replace Missing Values
در ابتدا کمیت (هایی) را که دارای مقادیر گمشده هستند و برخی از اطلاعات آنها در دسترس نمیباشد، انتخاب میکنیم. در کادر New Variables عبارت Revenue_1= SMEAN(Revenue) نشان داده میشود که به معنای آن است که کمیت جدیدی با عنوان Revenue_1 ایجاد میشود که در آن به جای مقادیر گمشده درآمد، میانگین دادههای موجود در کمیت درآمد را جایگزین میکند.
به این ترتیب در فایل دادهها و پنجره Data View کمیت جدیدی به صورت زیر ساخته میشود.
همانگونه که مشاهده میشود به ازای هر داده گمشده درآمد، مقدار 3.72 که همان میانگین دادههای موجود میباشد، قرار داده شده است.
استفاده از چندین روش جایگزاری داده های گمشده در SPSS
در کادر Name and Method و در کادر متنی Name میتوانیم نام دیگری به جای Revenue_1 در کمیت جدید ساخته شده، قرار دهیم. به عنوان مثال ما نام MeanN را برگزیدهایم. چنانچه بر روی گزینهی Method کلیک کنیم، میتوانیم مقادیر خاص دیگری جهت جایگزینی با دادههای گمشده بیابیم.
با انتخاب گزینهی Series Mean میانگین کل دادههای موجود کمیت درآمد، جایگزین مقادیر گمشده خواهد شد. ما این انتخاب را در بالا انجام دادیم که مقدار 3.72 جایگزین مقادیر گمشده قرار گرفت.
با انتخاب گزینهی Mean of nearby points میانگین دادههای چند خانه از بالا و پایین که در همسایگی داده گمشده قرار دارند، جایگزین مقدار گمشده خواهد شد. تعداد خانههای همسایگی را نیز میتوان با نوشتن یک عدد در کادر Number تعیین کرد. ما عدد 2 را انتخاب کردهایم.
میدانید چرا پس از استفاده از این روش و در ردیف 23 درآمد فرد همچنان به عنوان یک داده گمشده محسوب میشود؟ با انتخاب گزینهی Median of nearby points میانه دادههای چند خانه از بالا و پایین همسایگی داده گمشده، جایگزین آن خواهد شد. تعداد خانههای همسایگی را میتوان با نوشتن عدد در کادر Number تعیین کرد.
انتخاب گزینهی Linear interpolation سبب میشود که میانگین دو خانهای که قبل و بعد از داده گمشده قرار دارند، جایگزین خود داده گمشده شوند. ما نام ستون جدید براساس این روش را LinearI قرار دادهایم.
با انتخاب گزینهی Linear trend at point مقداری که از روند خطی دادههای موجود به دست میآید، به ازای Missing Value قرار میگیرد. نام ستون جدید براساس این روش را LinearT قرار دادهایم.
توجه شما را به این نکته جلب میکنیم که استفاده از روشها و Method های بالا بستگی به ماهیت دادهها و نحوه جمعآوری آنها دارد و نمیتوان هیچکدام را نسبت به دیگری بهتر و مناسبتر دانست.
چگونه به این مقاله رفرنس دهیم
GraphPad Statistics (2018). Missing data in SPSS. Statistical tutorials and software guides. Retrieved Month, Day, Year, from https://graphpad.ir/missing-value-spss/.php
For example, if you viewed this guide on 12th January 2022, you would use the following reference
GraphPad Statistics (2018). Missing data in SPSS. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/missing-value-spss/.php
ارایه خدمات تحلیل و مشاوره آماری
گراف پد برای شما خدمات مشاوره و انجام انواع تحلیلهای آماری را ارایه میدهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.