تشخیص داده پرت با استفاده از Grubbs’ Test در Minitab
گاهی اوقات در یک مطالعه با اعداد متفاوتی روبهرو میشویم که با سایر اعداد هماهنگی ندارند و اصطلاحاً به آنها داده پرت Outlier Data میگوییم. این اعداد به هر دلیلی مثلاً اشتباه سیستمی، اشتباه در اندازهگیری، دستکاری دادهها و یا بر اثر پدیدهای خارج از کنترل به دست آمدهاند که سایر نتایج را تحت تاثیر خود قرار داده و آنالیز و تحلیل را با مشکل دچار میکنند.
تشخیص دادههای پرت و تصمیم به حذف آنها از موارد با اهمیت در هر مطالعهای به حساب میآید.
در نرمافزار Minitab آزمونی با نام Grubbs وجود دارد که به فهم ما در شناسایی دادههای پرت کمک میکند. این آزمون را میتوانیم در مسیر زیر مشاهده کنیم.
با انتخاب این آزمون پنجره زیر برای ما باز میشود.
در کادر Variables اسامی ستون یا ستونهایی را که میخواهیم، آزمون وجود داده پرت Grubbs را انجام دهیم، قرار میدهیم. در کادر By variables نیز میتوانیم نام ستونی را قرار دهیم که میخواهیم Grubbs Test بر مبنای آن انجام شود.
به عنوان مثال به دنبال پاسخ به این سوال هستیم که آیا در تمام روزهای کاری بورس تهران، اتفاق عجیب و یا همان داده پرت رخ داده است؟ آیا روز یا روزهایی بوده است که درصد افزایش و یا کاهش آن روز نسبت به سایر روزها، پرت به حساب بیایید.
نتایج Grubbs Test که بر روی تمام روزهای کاری بورس تهران از تاریخ 14 آذرماه سال 87 تا امروز یعنی 9 تیرماه سال 99 انجام شده است به صورت زیر خواهد بود. مطالعه به تفکیک سال انجام شده است.
در سالهای که مقدار P آنها (که براساس همان آزمون Grubbs به دست میآید) کمتر از 0.1 باشد، آن سال دارای داده یا دادههای پرت بوده است. روزهای به عنوان داده پرت، میتوانند هم به عنوان یک روز با رشد مثبت و هم با درصد منفی، شناسایی شوند. با شناسایی دادهها و روزهای پرت میتوانیم درباره رشد بیش از حد بازار و یا حتی ریزش بازار، فهم بهتری داشته باشیم.
در جدول زیر میتوانید روزهایی که از دیدگاه نرمافزار و Grubbs Test پرت هستند را مشاهده کنید. نام سطر آنها در فایل دیتا نوشته شده است.
این روزها به شرح زیر هستند.
-
26 اسفند سال 1387 با درصد منفی 1.76 برای سال 87 عددی پرت بوده است.
-
3 شهریور سال 1388 با درصد مثبت 2.78 برای سال 88 عددی پرت بوده است.
-
21 مهر سال 1389 با درصد منفی 2.08 برای سال 89 عددی پرت بوده است.
-
21 بهمن سال 1391 با درصد مثبت 3.50 برای سال 91 عددی پرت بوده است.
-
24 فروردین سال 1393 با درصد منفی 2.07 برای سال 93 عددی پرت بوده است.
-
16 فروردین سال 1394 با درصد مثبت 3.59 برای سال 94 عددی پرت بوده است.
-
28 فروردین سال 1395 با درصد منفی 2.01 برای سال 95 عددی پرت بوده است.
-
10 دی سال 1396 با درصد منفی 1.70 برای سال 96 عددی پرت بوده است.
-
14 دی سال 1398 با درصد منفی 4.36 برای سال 98 عددی پرت بوده است.
گراف مربوط به هر سال و داده پرت آن سال را میتوانید مشاهده کنید. دادههای پرت با رنگ قرمز مشخص شدهاند.
یک نکته جالب توجه در این بررسی و آزمون Grubbs این است که سال 1399 و تمام روزهای کاری آن تا تاریخ 9 تیرماه، فاقد داده پرت بوده است. این مطلب به معنای آن است که هیچکدام از روزهای سال 99، اتفاق عجیب، خارقالعاده و خارج از روند سال 1399 چه در جهت مثبت و چه در جهت منفی بازار را نشان نمیدهد.
چگونه به این مقاله رفرنس دهیم
GraphPad Statistics (2020). Detected the Outliear Data using Grubbs’ Test in Minitab. Statistical tutorials and software guides. Retrieved Month, Day, Year, from https://graphpad.ir/grubbs-test-minitab/.php
For example, if you viewed this guide on 12th January 2022, you would use the following reference
GraphPad Statistics (2020). Detected the Outliear Data using Grubbs’ Test in Minitab. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/grubbs-test-minitab/.php
ارایه خدمات تحلیل و مشاوره آماری
گراف پد برای شما خدمات مشاوره و انجام انواع تحلیلهای آماری را ارایه میدهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.