Grubbs Test

تشخیص داده پرت با استفاده از Grubbs’ Test در Minitab

زمان مطالعه: 5 دقیقه 

 

گاهی اوقات در یک مطالعه با اعداد متفاوتی روبه‌رو می‌شویم که با سایر اعداد هماهنگی ندارند و اصطلاحاً به آن‌ها داده پرت Outlier Data می‌گوییم. این اعداد به هر دلیلی مثلاً اشتباه سیستمی، اشتباه در اندازه‌گیری، دستکاری داده‌ها و یا بر اثر پدیده‌ای خارج از کنترل به دست آمده‌اند که سایر نتایج را تحت تاثیر خود قرار داده و آنالیز و تحلیل را با مشکل دچار می‌کنند.

تشخیص داده‌های پرت و تصمیم به حذف آن‌ها از موارد با اهمیت در هر مطالعه‌ای به حساب می‌آید.

در نرم‌افزار Minitab آزمونی با نام Grubbs وجود دارد که به فهم ما در شناسایی داده‌های پرت کمک می‌کند. این آزمون را می‌توانیم در مسیر زیر مشاهده کنیم.

با انتخاب این آزمون پنجره زیر برای ما باز می‌شود.

 

 

در کادر Variables اسامی ستون یا ستون‌هایی را که می‌خواهیم، آزمون وجود داده پرت Grubbs را انجام دهیم، قرار می‌دهیم. در کادر By variables نیز می‌توانیم نام ستونی را قرار دهیم که می‌خواهیم Grubbs Test بر مبنای آن انجام شود.

به عنوان مثال به دنبال پاسخ به این سوال هستیم که آیا در تمام روزهای کاری بورس تهران، اتفاق عجیب و یا همان داده پرت رخ داده است؟ آیا روز یا روزهایی بوده است که درصد افزایش و یا کاهش آن روز نسبت به سایر روزها، پرت به حساب بیایید.

نتایج Grubbs Test که بر روی تمام روزهای کاری بورس تهران از تاریخ 14 آذرماه سال 87 تا امروز یعنی 9 تیرماه سال 99 انجام شده است به صورت زیر خواهد بود. مطالعه به تفکیک سال انجام شده است.

در سال‌های که مقدار P آن‌ها (که براساس همان آزمون Grubbs به دست می‌آید) کمتر از 0.1 باشد، آن سال دارای داده یا داده‌های پرت بوده است. روزهای به عنوان داده پرت، می‌توانند هم به عنوان یک روز با رشد مثبت و هم با درصد منفی، شناسایی شوند. با شناسایی داده‌ها و روزهای پرت می‌توانیم درباره رشد بیش از حد بازار و یا حتی ریزش بازار، فهم بهتری داشته باشیم.

در جدول زیر می‌توانید روزهایی که از دیدگاه نرم‌افزار و Grubbs Test پرت هستند را مشاهده کنید. نام سطر آن‌ها در فایل دیتا نوشته شده است.

این روزها به شرح زیر هستند.

  • 26 اسفند سال 1387 با درصد منفی 1.76 برای سال 87 عددی پرت بوده است.

  • 3 شهریور سال 1388 با درصد مثبت 2.78 برای سال 88 عددی پرت بوده است.

  • 21 مهر سال 1389 با درصد منفی 2.08 برای سال 89 عددی پرت بوده است.

  • 21 بهمن سال 1391 با درصد مثبت 3.50 برای سال 91 عددی پرت بوده است.

  • 24 فروردین سال 1393 با درصد منفی 2.07 برای سال 93 عددی پرت بوده است.

  • 16 فروردین سال 1394 با درصد مثبت 3.59 برای سال 94 عددی پرت بوده است.

  • 28 فروردین سال 1395 با درصد منفی 2.01 برای سال 95 عددی پرت بوده است.

  • 10 دی سال 1396 با درصد منفی 1.70 برای سال 96 عددی پرت بوده است.

  • 14 دی سال 1398 با درصد منفی 4.36 برای سال 98 عددی پرت بوده است.

 

گراف مربوط به هر سال و داده پرت آن سال را می‌توانید مشاهده کنید. داده‌های پرت با رنگ قرمز مشخص شده‌اند.

 

یک نکته جالب توجه در این بررسی و آزمون Grubbs این است که سال 1399 و تمام روزهای کاری آن تا تاریخ 9 تیرماه، فاقد داده پرت بوده است. این مطلب به معنای آن است که هیچ‌کدام از روزهای سال 99، اتفاق عجیب، خارق‌العاده و خارج از روند سال 1399 چه در جهت مثبت و چه در جهت منفی بازار را نشان نمی‌دهد.

 

چگونه به این مقاله رفرنس دهیم

GraphPad Statistics (2020). Detected the Outliear Data using Grubbs’ Test in Minitab. Statistical tutorials and software guides. Retrieved Month, Day, Yearfrom https://graphpad.ir/grubbs-test-minitab/.php

For example, if you viewed this guide on 12th January 2022, you would use the following reference

GraphPad Statistics (2020). Detected the Outliear Data using Grubbs’ Test in Minitab. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/grubbs-test-minitab/.php

 

ارایه خدمات تحلیل و مشاوره آماری

گراف پد برای شما خدمات مشاوره و انجام انواع تحلیل‌های آماری را ارایه می‌دهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.

 

گراف پد جمعی از رتبه‌های برتر آزمون دکترا آمار دانشگاه‌های ایران | برجسته در موسسه بین‌المللی تحقیقات | دارای نماد اعتماد الکترونیک از مرکز توسعه تجارت الکترونیکی ایران و مجوز رسمی ثبت به شماره ۴۱۸۸۱ و شناسه ملی ۱۴۰۰۶۸۳۲۳۱۹