داده های گمشده در SPSS

داده های گمشده در SPSS

زمان مطالعه: 7 دقیقه 

 

توضیحات نوشتار آموزشی (Missing Value) داده های گمشده در SPSS برگرفته شده از کتاب روش های پیشرفته آماری و کاربردهای آن- انتشارات جامعه‌نگر

داده های گمشده چیست؟

در یک بررسی و مطالعه بسیار اتفاق می‌افتد که مقادیر برخی از کمیت‌ها اندازه‌گیری نشده‌اند و یا قابل اندازه‌گیری و مشاهده نبوده‌اند. به عنوان مثال در یک پرسش‌نامه که از سوال‌شونده درخواست می‌شود اطلاعات شخصی خود را بیان کند، گاهی اوقات پاسخی به برخی از سوالات داده نمی‌شود. در این‌گونه موارد با نتایجی تحت عنوان داده های گمشده روبه‌رو هستیم. در این نوشتار آموزشی می‌خواهیم با استفاده از نرم‌افزار SPSS روش‌هایی را برای جایگزین کردن برخی مقادیر خاص به جای Missing Value در SPSS بیان کنیم.

داده های گمشده خوب

به این نکته توجه کنید ما مقادیر متفاوت و مختلفی را می‌توانیم به ازای داده های گمشده در یک تحقیق، قرار دهیم که به ماهیت و نوع تحقیق بستگی تمام دارد، ما با برخی از این مقادیر در ادامه آشنا خواهیم شد. با این‌حال همواره توصیه نمی‌شود که به ازای داده های گمشده‌ی یک مطالعه، مقادیر مرتبط جایگزاری شود بلکه گاهی اوقات وجود این داده های گمشده و حجم آن‌ها می‌تواند خود حامل موارد و اطلاعات مفیدی باشد.

مثال آموزشی جایگزاری داده های گمشده در SPSS

 در یک تحقیق بر روی درآمد 24 نفر از کارکنان یک موسسه دانشگاهی مشاهده شده است که 7 نفر به سوال میزان درآمد ماهیانه خود پاسخ نداده‌اند. نحوه ورود اطلاعات و داده های گمشده در SPSS آمده است. داده های گمشده در SPSS تحت عنوان Missing Values و با نقطه نشان داده می‌شوند.

داده های گمشده در SPSS

در پی آن هستیم که بتوانیم به منظور ادامه تحلیل‌ها، جایگزین مناسب عددی برای موارد عدم پاسخ و یا همان داده‌های گمشده‌ی میزان درآمد بیابیم. برای این منظور از مسیر زیر استفاده می‌کنیم.

Transform → Replace Missing Values

در ابتدا کمیت (هایی) را که دارای مقادیر گمشده هستند و برخی از اطلاعات آن‌ها در دسترس نمی‌باشد، انتخاب می‌کنیم. در کادر New Variables عبارت Revenue_1= SMEAN(Revenue) نشان داده می‌شود که به معنای آن است که کمیت جدیدی با عنوان Revenue_1 ایجاد می‌شود که در آن به جای مقادیر گمشده درآمد، میانگین داده‌های موجود در کمیت درآمد را جایگزین می‌کند.

missing-value-spss-2-astat.ir

به این ترتیب در فایل داده‌ها و پنجره Data View کمیت جدیدی به صورت زیر ساخته می‌شود.

missing-value-spss-3-astat.ir

همان‌گونه که مشاهده می‌شود به ازای هر داده گمشده درآمد، مقدار 3.72 که همان میانگین داده‌های موجود می‌باشد، قرار داده شده است.

استفاده از چندین روش جایگزاری داده های گمشده در SPSS

در کادر Name and Method و در کادر متنی Name می‌توانیم نام دیگری به جای Revenue_1 در کمیت جدید ساخته شده، قرار دهیم. به عنوان مثال ما نام MeanN را برگزیده‌ایم. چنانچه بر روی گزینه‌ی Method کلیک کنیم، می‌توانیم مقادیر خاص دیگری جهت جایگزینی با داده‌های گمشده بیابیم.

با انتخاب گزینه‌ی Series Mean میانگین کل داده‌های موجود کمیت درآمد، جایگزین مقادیر گمشده خواهد شد. ما این انتخاب را در بالا انجام دادیم که مقدار 3.72 جایگزین مقادیر گمشده قرار گرفت.

با انتخاب گزینه‌ی Mean of nearby points میانگین داده‌های چند خانه از بالا و پایین که در همسایگی داده گمشده قرار دارند، جایگزین مقدار گمشده خواهد شد. تعداد خانه‌های همسایگی را نیز می‌توان با نوشتن یک عدد در کادر Number تعیین کرد. ما عدد 2 را انتخاب کرده‌ایم.

missing-value-spss-4-astat.ir

missing-value-spss-5-astat.ir

می‌دانید چرا پس از استفاده از این روش و در ردیف 23 درآمد فرد همچنان به عنوان یک داده گمشده محسوب می‌شود؟ با انتخاب گزینه‌ی Median of nearby points میانه داده‌های چند خانه از بالا و پایین همسایگی داده گمشده، جایگزین آن خواهد شد. تعداد خانه‌های همسایگی را می‌توان با نوشتن عدد در کادر Number تعیین کرد.

انتخاب گزینه‌ی Linear interpolation سبب می‌شود که میانگین دو خانه‌ای که قبل و بعد از داده گمشده قرار دارند، جایگزین خود داده گمشده شوند. ما نام ستون جدید براساس این روش را LinearI قرار داده‌ایم.

missing-value-spss-6-astat.ir

missing-value-spss-7-astat.ir

با انتخاب گزینه‌ی Linear trend at point مقداری که از روند خطی داده‌های موجود به دست می‌آید، به ازای Missing Value قرار می‌گیرد. نام ستون جدید براساس این روش را LinearT قرار داده‌ایم.

missing-value-spss-8-astat.ir

missing-value-spss-9-astat.ir

توجه شما را به این نکته جلب می‌کنیم که استفاده از روش‌ها و Method های بالا بستگی به ماهیت داده‌ها و نحوه جمع‌آوری آن‌ها دارد و نمی‌توان هیچ‌کدام را نسبت به دیگری بهتر و مناسب‌تر دانست.

 

ارایه خدمات جایگزینی (Missing Value) داده های گمشده در SPSS

ما در گراف پد ارایه خدمات جایگزاری داده های گمشده در SPSS را انجام می‌دهیم. جهت دریافت نکات بیشتر و نحوه کار می‌توانید مختصری از کار خود را برای ما ارسال نمایید. به سرعت تقاضای شما را بررسی و نتایج آنالیز جایگزاری داده های گمشده در SPSS را به صورت اختصاصی و کامل ارسال خواهیم کرد.

گراف پد جمعی از رتبه‌های برتر آزمون دکترا آمار دانشگاه‌های ایران | برجسته در موسسه بین‌المللی تحقیقات | دارای نماد اعتماد الکترونیک از مرکز توسعه تجارت الکترونیکی ایران و مجوز رسمی ثبت به شماره ۴۱۸۸۱ و شناسه ملی ۱۴۰۰۶۸۳۲۳۱۹