قبلی
داده های گمشده در SPSS

داده های گمشده در SPSS

توضیحات نوشتار آموزشی (Missing Value) داده های گمشده در SPSS برگرفته شده از کتاب روش های پیشرفته آماری و کاربردهای آن- انتشارات جامعه‌نگر

در یک بررسی و مطالعه بسیار اتفاق می‌افتد که مقادیر برخی از کمیت‌ها اندازه‌گیری نشده‌اند و یا قابل اندازه‌گیری و مشاهده نبوده‌اند. به عنوان مثال در یک پرسش‌نامه که از سوال‌شونده درخواست می‌شود اطلاعات شخصی خود را بیان کند، گاهی اوقات پاسخی به برخی از سوالات داده نمی‌شود. در این‌گونه موارد با نتایجی تحت عنوان داده های گمشده روبه‌رو هستیم. در این نوشتار آموزشی می‌خواهیم با استفاده از نرم‌افزار SPSS روش‌هایی را برای جایگزین کردن برخی مقادیر خاص به جای Missing Value در SPSS بیان کنیم.

 

داده های گمشده خوب

به این نکته توجه کنید ما مقادیر متفاوت و مختلفی را می‌توانیم به ازای داده های گمشده در یک تحقیق، قرار دهیم که به ماهیت و نوع تحقیق بستگی تمام دارد، ما با برخی از این مقادیر در ادامه آشنا خواهیم شد. با این‌حال همواره توصیه نمی‌شود که به ازای داده های گمشده‌ی یک مطالعه، مقادیر مرتبط جایگزاری شود بلکه گاهی اوقات وجود این داده های گمشده و حجم آن‌ها می‌تواند خود حامل موارد و اطلاعات مفیدی باشد.

مثال آموزشی جایگزاری داده های گمشده در SPSS

 در یک تحقیق بر روی درآمد 24 نفر از کارکنان یک موسسه دانشگاهی مشاهده شده است که 7 نفر به سوال میزان درآمد ماهیانه خود پاسخ نداده‌اند. نحوه ورود اطلاعات و داده های گمشده در SPSS آمده است. داده های گمشده در SPSS تحت عنوان Missing Values و با نقطه نشان داده می‌شوند.

داده های گمشده در SPSS

 

در پی آن هستیم که بتوانیم به منظور ادامه تحلیل‌ها، جایگزین مناسب عددی برای موارد عدم پاسخ و یا همان داده‌های گمشده‌ی میزان درآمد بیابیم. برای این منظور از مسیر زیر استفاده می‌کنیم.

Transform → Replace Missing Values

در ابتدا کمیت (هایی) را که دارای مقادیر گمشده هستند و برخی از اطلاعات آن‌ها در دسترس نمی‌باشد، انتخاب می‌کنیم. در کادر New Variables عبارت Revenue_1= SMEAN(Revenue) نشان داده می‌شود که به معنای آن است که کمیت جدیدی با عنوان Revenue_1 ایجاد می‌شود که در آن به جای مقادیر گمشده درآمد، میانگین داده‌های موجود در کمیت درآمد را جایگزین می‌کند.

missing-value-spss-2-astat.ir

 

به این ترتیب در فایل داده‌ها و پنجره Data View کمیت جدیدی به صورت زیر ساخته می‌شود.

missing-value-spss-3-astat.ir

 

همان‌گونه که مشاهده می‌شود به ازای هر داده گمشده درآمد، مقدار 3.72 که همان میانگین داده‌های موجود می‌باشد، قرار داده شده است.

 

استفاده از چندین روش جایگزاری داده های گمشده در SPSS

در کادر Name and Method و در کادر متنی Name می‌توانیم نام دیگری به جای Revenue_1 در کمیت جدید ساخته شده، قرار دهیم. به عنوان مثال ما نام MeanN را برگزیده‌ایم. چنانچه بر روی گزینه‌ی Method کلیک کنیم، می‌توانیم مقادیر خاص دیگری جهت جایگزینی با داده‌های گمشده بیابیم.

با انتخاب گزینه‌ی Series Mean میانگین کل داده‌های موجود کمیت درآمد، جایگزین مقادیر گمشده خواهد شد. ما این انتخاب را در بالا انجام دادیم که مقدار 3.72 جایگزین مقادیر گمشده قرار گرفت.

با انتخاب گزینه‌ی Mean of nearby points میانگین داده‌های چند خانه از بالا و پایین که در همسایگی داده گمشده قرار دارند، جایگزین مقدار گمشده خواهد شد. تعداد خانه‌های همسایگی را نیز می‌توان با نوشتن یک عدد در کادر Number تعیین کرد. ما عدد 2 را انتخاب کرده‌ایم.

missing-value-spss-4-astat.ir

missing-value-spss-5-astat.ir

 

می‌دانید چرا پس از استفاده از این روش و در ردیف 23 درآمد فرد همچنان به عنوان یک داده گمشده محسوب می‌شود؟ با انتخاب گزینه‌ی Median of nearby points میانه داده‌های چند خانه از بالا و پایین همسایگی داده گمشده، جایگزین آن خواهد شد. تعداد خانه‌های همسایگی را می‌توان با نوشتن عدد در کادر Number تعیین کرد.

انتخاب گزینه‌ی Linear interpolation سبب می‌شود که میانگین دو خانه‌ای که قبل و بعد از داده گمشده قرار دارند، جایگزین خود داده گمشده شوند. ما نام ستون جدید براساس این روش را LinearI قرار داده‌ایم.

missing-value-spss-6-astat.ir

missing-value-spss-7-astat.ir

 

با انتخاب گزینه‌ی Linear trend at point مقداری که از روند خطی داده‌های موجود به دست می‌آید، به ازای Missing Value قرار می‌گیرد. نام ستون جدید براساس این روش را LinearT قرار داده‌ایم.

missing-value-spss-8-astat.ir

missing-value-spss-9-astat.ir

 

توجه شما را به این نکته جلب می‌کنیم که استفاده از روش‌ها و Method های بالا بستگی به ماهیت داده‌ها و نحوه جمع‌آوری آن‌ها دارد و نمی‌توان هیچ‌کدام را نسبت به دیگری بهتر و مناسب‌تر دانست.

چگونه به این مقاله رفرنس دهیم

GraphPad Statistics (2018). Missing data in SPSS. Statistical tutorials and software guides. Retrieved Month, Day, Yearfrom https://graphpad.ir/missing-value-spss/.php

For example, if you viewed this guide on 12th January 2022, you would use the following reference

GraphPad Statistics (2018). Missing data in SPSS. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/missing-value-spss/.php

ارایه خدمات تحلیل و مشاوره آماری

گراف پد برای شما خدمات مشاوره و انجام انواع تحلیل‌های آماری را ارایه می‌دهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.

    گراف پد جمعی از رتبه‌های برتر آزمون دکترا آمار دانشگاه‌های ایران | برجسته در موسسه بین‌المللی تحقیقات | دارای نماد اعتماد الکترونیک از مرکز توسعه تجارت الکترونیکی ایران و مجوز رسمی ثبت به شماره ۴۱۸۸۱ و شناسه ملی ۱۴۰۰۶۸۳۲۳۱۹