۳۷۳/۰
۳۲/۶
۱۸۸
تابستان
۰۰۰/۰
۳۲۵/۲
۵۸۸/۰
۴۶/۳
۱۸۸
پاییز
۲۷۵/۰
۹۹۵/۰
۵۶۹/۰
۸۹/۳
۱۸۸
زمستان
۰۱۱/۰
۶۰۹/۰
۴۴۱/۰
۰۳/۵
۱۸۸
سالانه
۴- ۳- خوشهبندی
خوشهبندی[۱۸۶]، گروهبندی یک جمعیت ناهمگن[۱۸۷] به زیرمجموعههای همگن[۱۸۸] است، که به آنها خوشه[۱۸۹] گفته می شود. هدف خوشهبندی یافتن گروههایی است که با یکدیگر متفاوتند، ولی بیشترین شباهت[۱۹۰] درونگروهی بین متغیرها یا نمونههای هر گروه وجود دارد (علویِمجد و همکاران، ۱۳۸۶: ۲۱).
برای خوشهبندی یک جامعه، باید نحوه محاسبهی درجه همگنی و شباهت متغیرها[۱۹۱] یا نمونهها[۱۹۲] با یکدیگر و همچنین نحوه پیوند متغیرها و نمونهها با توجه به درجه همگنی و شباهت محاسبهشده تعیین شود. به بیان دیگر، برای خوشهبندی یک جامعه باید به دو پرسش زیر پاسخ داده شود:
- چگونه باید درجه همگنی و شباهت متغیرها یا نمونههای یک جامعه را محاسبه کرد؟
- چگونه میتوان متغیرها یا نمونههای همگن و مشابه را در یک گروه یا خوشه قرار داد؟ (کلانتری، ۱۳۸۷: ۳۳۲).
روشهای مختلفی برای محاسبهی همگنی و شباهت متغیرها یا نمونههای یک جامعه وجود دارد. یکی از پرکاربردترین روشهای مذکور، محاسبهی مربع فاصله اُقلیدسی[۱۹۳] بین متغیرها یا نمونههاست، که به صورت زیر محاسبه می شود:
: فاصلهی بین متغیر یا نمونه x و y .
x : متغیر یا نمونه x .
y : متغیر یا نمونه y .
n : تعداد متغیرها یا نمونههای جامعه (Johnson & Wichern; 2007:674).
روشهای مختلفی برای قرار دادن متغیرها یا نمونههای همگن و مشابه در یک خوشه وجود دارد. یکی از روشهای مذکور، روش سلسلهمراتبی[۱۹۴] است. روش سلسلهمراتبی خود به دو روش تراکمی[۱۹۵] و تقسیمی [۱۹۶] تفکیک می شود (کلانتری، ۱۳۸۶: ۳۳۷).
در روش تراکمی، هر نمونه یا متغیر در یک خوشه قرار میگیرد. سپس خوشههای مشابه به تدریج باهم ترکیب میشوند تا در پایان کلیه متغیرها یا نمونهها در یک خوشه قرار گیرند (منبع پیشین: ۳۳۷).
در روش تقسیمی، کلیه متغیرها یا نمونهها در یک خوشه قرار میگیرند، سپس به تدریج متغیرها یا نمونههایی که دارای همگنی و شباهت کمتری هستند، از خوشهی مذکور تفکیک میشوند، تا در پایان هر یک از متغیرها یا نمونهها در یک خوشه قرار گیرند (منبع پیشین: ۳۳۸). در روش تراکمی، ضریب تشابه و در روش تقسیمی، همگنی درونگروهی ملاک خوشهبندی است (مسعودیان و عطایی، ۱۳۸۴: ۲). نتایج روشهای خوشهبندی تراکمی و تقسیمی قطعی و برگشتناپذیر است؛ یعنی در روش تراکمی، در صورتی که دو متغیر یا نمونه در یک خوشه قرار گیرند، هرگز با خوشههای دیگر ترکیب نمیشوند و در روش تقسیمی نیز در صورتی که دو متغیر یا نمونه در یک خوشه قرار گیرند، هرگز از یکدیگر تفکیک نمیشوند (علویِمجد و همکاران، ۱۳۸۶: ۲۱). در مجموع، روش تراکمی نسبت به روش تقسیمی رایجتر است.
روشهای مختلفی برای پیوند خوشههای تراکمی وجود دارد. یکی از روشهای مذکور، روش وارد[۱۹۷] است. در این روش، نسبت مجموع مربعات فاصلهی هر متغیر یا نمونه در یک خوشه، به میانگین کلیه متغیرها یا نمونهها، مبنای فاصلهی بین دو خوشه محسوب می شود (حبیبپور و صفری، ۱۳۸۸: ۷۷۸). در واقع، روش وارد از تحلیل واریانس[۱۹۸] برای تعیین فاصلهی بین خوشه ها یا گروه های همگن استفاده می کند. در تحلیل واریانس، تفاوتهای موجود بین میانگینهای جوامع یا گروه های مورد بررسی، از طریق بررسی میزان واریانس بین گروه ها نسبت به واریانس درون آنها آزمون می شود (کلانتری، ۱۳۸۶: ۱۲۵). در مجموع، روش وارد، مجموع مربعات فاصلهی هر دو خوشه را - که ممکن است در هر مرحله شکل گیرد - به کمینه میرساند (فرجزاده، ۱۳۸۸: ۱۰۳). این روش به صورت زیر محاسبه می شود: