خوشه بندی فازی

خوشه بندي فازی

 

در این مطلب قصد داریم در مورد خوشه بندي فازی صحبت کنیم، لطفا با ما همراه باشید.

در خوشه بندي کلاسيک، هر نمونه ورودي متعلق به يک و فقط يک خوشه است و نمي­تواند عضو دو خوشه و يا بيشتر باشد. به عبارتي خوشه‌ها همپوشاني ندارند، در حالي که در خوشه بندي فازي يک نمونه مي‌تواند متعلق به بيش از يک خوشه باشد. خوشه بندي فازي به کشف مدل‌هاي فازي از داده‌ها مي­پردازد.

ايده بنيادين در خوشه بندي فازي به اين ترتيب است که فرض کنيم هر خوشه مجموعه اي از عناصر است، سپس با تغيير در تعريف عضويت عناصر در اين مجموعه از حالتي که يک عنصر فقط بتواند عضو يک خوشه باشد( حالت افرازي)، به حالتي که هر عنصر مي‌تواند با درجه عضويت‌هاي مختلف داخل چندين خوشه قرار بگيرد، دسته بندي‌هايي منطبق­تر با واقعيت ارائه کنيم.

براي روشن شدن مطلب شکل زير را در نظر بگيريد:

 

خوشه بندي فازی

شکل: مجموعه داده پروانه‌ای

 

اگر نمونه هاي ورودي مطابق شکل فوق باشند مشخص است که مي‌توان داده­ها را به دو خوشه تقسيم کرد اما مشکلي که پيش مي‌آيد اين است که داده مشخص شده در وسط مي‌تواند عضو هر دو خوشه باشد بنابراين بايد تصميم گرفت که داده مورد نظر متعلق به کدام خوشه است، خوشه سمت راست يا خوشه سمت چپ. اما اگر از خوشه بندي فازي استفاده کنيم داده مورد نظر با تعلق ۲/۱ عضو خوشه سمت راست و با تعلق مشابه عضو خوشه سمت چپ است.

از الگوريتم‌هاي پايه‌اي خوشه بندي فازي مي‌توان الگوريتم‌ Fuzzy C-Means را نام برد.

 

الگوريتم FCM:

خوشه بندي مهمترين روش يادگيري بدون نظارت است.خوشه به مجموعه­اي از داده­ها گفته مي­شود كه به هم شباهت داشته باشند. در خوشه­بندي سعي مي­شود تا داده ها به خوشه‌هايي تقسيم شوند كه شباهت بين داده‌هاي درون هر خوشه حداكثر و شباهت بين داده­هاي درون خوشه‌هاي متفاوت حداقل شود. در اينجا به دليل حل مشكلي كه هر داده به يك خوشه خاص در هر تكرار نسبت داده مي شود. روش خوشه بنديFCM  پيشنهاد شده است.

در اين روش هدف كمينه كردن تابع زیر است:

 

خوشه بندي فازی

 

كه در آن بايستي شرط زير رعايت شود.

 

خوشه بندي فازی

 

روال كامل اين الگوريتم بدين صورت است:

1- تعيين مقدار اوليه C (تعداد خوشه ها) ، m (مقدار فازي بودن الگوريتم) و V (مراکز اوليه براي هرخوشه )

2- محاسبه مقدار تعلق هر داده به خوشه مورد نظر با توجه به رابطه 2

 

خوشه بندي فازی

 

3- محاسبه مقدار مراكز جديدي براي هر خوشه با توجه به رابطه 3

 

خوشه بندي فازی

تكرار مراحل 2 و 3 تا زمانيكه مقدار تفاوت بين u ها (ميزان تعلق داده ها به خوشه ها) در مرحله جديد با مقدار u ها در مرحله قبل تفاوتي كمتر از يك مقدار آستانه داشته باشد.

 

تهیه کننده: مهندس محمد طالبی
منبع
سایر مطالب اکادمی