خوشه بندی سوالات

خوشه بندی سوالات (Variables) با نرم‌افزار Minitab

زمان مطالعه: 20 دقیقه 

 

*** توضیحات خوشه بندی سوالات (Variables Clustering) برگرفته شده از کتاب روش های پیشرفته آماری و کاربردهای آن- انتشارات جامعه‌نگر***

 

 
 

 

merci

دریافت مجموع آموزش تحلیل خوشه‌ای با Minitab

شامل 60 دقیقه ویدئو، فایل‌های مثال، دیتا و نتایج Minitab

 

هدف از خوشه‌بندی سوالات (Variables)

هدف از خوشه بندی در این آموزش آن است که سوالات و یا همان Variableها را در گروه‌های همانند دسته‌بندی کنیم، به گونه‌ای که کمیت‌ها و سوالات هر گروه، بیشترین شباهت و کمیت‌های گروه‌های مختلف، کمترین شباهت را با هم داشته باشند.

در این آموزش به چگونگی انجام تحلیل خوشه بندی Variables با استفاده از نرم‌افزار Minitab می‌پردازیم.

مثال آموزشی خوشه بندی سوالات (Variables)

در یک بررسی به منظور سنجش رضایت خریداران یک نوع ماشین، 750 نفر مورد پرسش‌گری قرار گرفته‌اند. 24 سوال و یا همان Variable مربوط به خصوصیات و ویژگی‌های فنی و ظاهری ماشین، از هر فرد پرسیده شده است. می‌خواهیم این سوالات را در چند گروه خوشه بندی کنیم. سوالات به شرح زیر هستند.

 

 

فایل داده این آموزش را می‌توانید از اینجا Cluster Variables Car دریافت کنید.

جهت خوشه‌بندی Variableها، ابتدا از مسیر زیر در نرم‌افزار Minitab استفاده می‌کنیم.

Stat → Multivariate → Cluster Variables

cluster variables Minitab 1 spss-analysis.ir

 

در این آموزش به تفکیک و با بیان جزئیات به شرح منوها و گزینه‌های نرم‌افزار Minitab جهت خوشه‌بندی Variableها می‌پردازیم.

 

تنظیمات خوشه بندی سوالات (Cluster Variables)

در پنجره باز شده، تمام کمیت‌ها را انتخاب و در کادر Variables or distance matrix قرار دهید.

 

cluster variables Minitab 2 spss-analysis.ir

 

Linkage method روش خوشه‌بندی کمیت‌ها و نحوه قرار گرفتن در هر خوشه را مشخص می‌کند.

cluster variables Minitab 3 spss-analysis.ir

در جدول زیر به شرح گزینه‌های مختلف آن می‌پردازیم. گزینه‌ها به فاصله بین دو خوشه اشاره می‌کنند.

 

 

جهت به دست آوردن فرمول هر کدام از روابط می‌توانید به لینک https://support.minitab.com/en-us/minitab/18/help-and-how-to/modeling-statistics/multivariate/how-to/cluster-variables/methods-and-formulas/linkage-methods/ مراجعه کنید.

 

تنظیمات بخش Distance measure در Cluster Variables

در بخش Distance measure نحوه انتخاب اندازه فاصله بین سوالات قرار دارد.

cluster variables Minitab 4 spss-analysis.ir

انتخاب دکمه Correlation سبب می‌شود، فاصله بین دو سوال i و j از رابطه زیر به دست آید.

  dij = 1 – ρij

که در آن ρij ماتریس ضرایب همبستگی پیرسون بین variable به نام i و j است.

انتخاب دکمه Absolute correlation همان فرمول بالا را به صورت قدرمطلق ρij، معرفی می‌کند.

 

تنظیمات بخش Specify final partition by در Cluster Variables

در بخش Specify final partition by معیارهای مورد نظر برای تعیین گروه‌بندی نهایی را مشخص کنید.

cluster variables Minitab 5 spss-analysis.ir

گزینه Number of clusters به ما این امکان را می‌دهد تا تعداد خوشه‌های نهایی Variableها را خودمان انتخاب کنیم. به عنوان مثال اگر پیش‌فرض عدد یک نرم‌افزار را بپذیریم، در این مثال تمام 24 سوال در یک خوشه اصلی جمع می‌شوند.

گزینه Similarity level به ما امکان انتخاب تعداد خوشه‌ها را بر مبنای مشابهت و اصطلاحاً سطح همانندی بین Variableها می‌دهد. توجه کنید که Similarity level می‌تواند همانند یک Cut off در خوشه‌بندی سوالات عمل کند. در این زمینه در ادامه بیشتر توضیح خواهیم داد.

 

گزینه Show dendrogram در Cluster Variables

 در انتهای تنظیمات خوشه‌بندی با نرم‌افزار Minitab گزینه Show dendrogram وجود دارد.

cluster variables Minitab 6 spss-analysis.ir

انتخاب این گزینه سبب طراحی یک گراف درختی مفید از نحوه و فرایند گام به گام خوشه‌بندی Variableها خواهد شد.

به منظور اعمال برخی اصلاحات دلخواه می‌توانید با دکمه Customize کار کنید.

 

حل مثال آموزشی خوشه بندی سوالات (Variables)

حال بیایید به مثال مطرح شده در این نوشتار بپردازیم. همان‌گونه که در ابتدا بیان کردیم 24 Variable مربوط به خصوصیات و ویژگی‌های فنی و ظاهری ماشین، از 750 فرد پرسیده شده است. می‌خواهیم این سوالات را در چند گروه خوشه بندی کنیم. مراحل زیر را گام به گام طی می‌کنیم.

1- فایل آموزشی Cluster Variables Car را در نرم‌افزار Minitab باز کنید.

2- از مسیر زیر در نرم‌افزار Minitab استفاده می‌کنیم.

Stat → Multivariate → Cluster Variables

3- تمام کمیت‌ها را انتخاب و در کادر Variables or distance matrix قرار دهید.

 4- از کادر Linkage method گزینه Average را انتخاب کنید.

5- در بخش Distance measure گزینه Correlation را برگزینید.

6- فعلاً در این مرحله، تعداد 1 خوشه اصلی پیش‌فرض نرم‌افزار در بخش Number of clusters را بپذیرید.

7- گزینه Show dendrogram را به منظور نمایش گراف خوشه بندی سوالات انتخاب کنید.

 

cluster variables Minitab 7 spss-analysis.ir

 

تحلیل نتایج مثال آموزشی خوشه بندی سوالات (Variables)

هنگامی که تنظیمات نرم‌افزار را OK می‌کنید، نتایج زیر به دست می‌آید. ما به بررسی آن‌ها می‌پردازیم.

cluster variables Minitab 8 spss-analysis.irدر خط اول، درباره سوالات و Variableهایی که بر روی آن‌ها خوشه بندی انجام شده است، صحبت می‌کند.

خط بعدی درباره گزینه‌های انتخاب شده Linkage method و Distance measure می‌باشد.

نتایج تحت عنوان جدولی به نام Amalgamation Steps بیان شده است. تفسیر آن‌ها ساده و البته دقیق خواهد بود. در جدول زیر تفسیر نام ستون‌ها را بیان کرده‌ایم.

 

 

به عنوان مثال نتایج به دست امده نشان می‌دهد در گام 1، Variableهای 16 و 17 با یکدیگر ترکیب شده و یک خوشه جدید به نمایندگی V16 را ساخته‌اند. در این صورت 23 خوشه وجود دارد (22 سوال به همراه یک خوشه شامل سوالات V16 و V17). Similarity level در این خوشه‌ها برابر با 74.67 و Distance level برابر با 0.506 است.

فرایند خوشه بندی سوالات ادامه پیدا کرده است تا در نهایت، یک خوشه کلی از تمام Variableها ساخته شده است.

سطح تشابه در این خوشه برابر با 61.1 درصد به دست آمده است.

 به همین ترتیب گراف Show dendrogram که نشان‌دهنده نحوه خوشه‌بندی سوالات است، دیده می‌شود.

 

cluster variables Minitab 9 spss-analysis.ir

 

تشکیل تعداد خوشه‌های بیشتر در Cluster Variables

حال فرض کنید بخواهیم به جای ترکیب تمام سوالات و Variableهای تحقیق در یک خوشه، آن‌ها را در تعداد خوشه‌های بیشتری دسته‌بندی کنیم. برای انجام این کار در تنظیمات نرم‌افزار در بخش Number of clusters تعداد خوشه‌ها را به عنوان مثال 3 انتخاب می‌کنیم.

 

cluster variables Minitab 10 spss-analysis.ir

 

در این صورت نتایج به دست آمده همانند قبل خواهد بود، با این تفاوت که در خروجی نرم‌افزار یک بخش جدید با عنوان Final partition قرار گرفته است.

cluster variables Minitab 11 spss-analysis.irهمان‌گونه که در Final partition مشخص است، Variableها به همراه شماره آن‌ها در سه خوشه قرار گرفته‌اند.

 گراف Show dendrogram نیز جایگاه سه خوشه و سوالات تشکیل‌دهنده آن‌ها را نشان می‌دهد.

 

cluster variables Minitab 12 spss-analysis.ir

 

استفاده از گزینه Similarity level به عنوان Cut off در Cluster Variables

سطح تشابه و یا همان Similarity level درخوشه بندی سوالات، می‌تواند به عنوان یک Cut off به ما کمک کند چه تعداد خوشه در تحلیل خود داشته باشیم.

برای این منظور لازم است، یکبار نتایج را همانند مرحله اول همین مثال با یک خوشه به دست آوریم.

توجه به مقدار Similarity level که در کدام مرحله به یکباره و نسبت به گام‌های دیگر، کاهش می‌یابد، کمک خواهد کرد آن مقدار سطح تشابه را به عنوان Cut off در تنظیمات و در مقابل کادر Similarity level وارد کنیم.

در نتایج خوشه بندی به دست آمده در مرحله اول این مثال مشاهده می‌شود که در گام شماره 4 مقدار Similarity level، نسبت به گام‌های دیگر کاهش بیشتری دارد. سطح تشابه در این Step برابر با 70.56 درصد به دست آمده است.

cluster variables Minitab 14 spss-analysis.ir

بنابراین پیش‌بینی می‌شود تعداد خوشه‌های صحیح در این مثال بین 20 تا 21 خوشه باشد.

برای این منظور در تنظیمات نرم‌افزار مقدار 71 را در برابر کادر Similarity level وارد می‌کنیم.

cluster variables Minitab 13 spss-analysis.ir

با OK کردن نتایج جدید در Final partition مشاهده می‌شود.

cluster variables Minitab 15 spss-analysis.irهمان‌گونه که دیده می‌شود چنانچه مقدار 71 درصد را به عنوان Cut off در نظر بگیریم، تعداد 21 خوشه برای این مثال به دست می‌آید.

گراف Show dendrogram در این نحوه تحلیل جدید نیز خوشه‌های تشکیل شده را نشان می‌دهد.

 

cluster variables Minitab 16 spss-analysis.ir

 

بنابراین با استفاده از نرم‌افزار Minitab به سادگی می‌توانیم به خوشه بندی سوالات بپردازیم.

 

چگونه به این مقاله رفرنس دهیم

GraphPad Statistics (2018). Cluster Variables using Minitab. Statistical tutorials and software guides. Retrieved Month, Day, Yearfrom https://graphpad.ir/clustering-analysis-with-minitab/.php

For example, if you viewed this guide on 12th January 2022, you would use the following reference

GraphPad Statistics (2018). Cluster Variables using Minitab. Statistical tutorials and software guides. Retrieved January, 12, 2022, from https://graphpad.ir/clustering-analysis-with-minitab/.php

 

ارایه خدمات تحلیل و مشاوره آماری

گراف پد برای شما خدمات مشاوره و انجام انواع تحلیل‌های آماری را ارایه می‌دهد. جهت دریافت نکات بیشتر بهتر است با ما تماس بگیرید.

گراف پد جمعی از رتبه‌های برتر آزمون دکترا آمار دانشگاه‌های ایران | برجسته در موسسه بین‌المللی تحقیقات | دارای نماد اعتماد الکترونیک از مرکز توسعه تجارت الکترونیکی ایران و مجوز رسمی ثبت به شماره ۴۱۸۸۱ و شناسه ملی ۱۴۰۰۶۸۳۲۳۱۹