شکل ۳-۴: مراحل اصلی الگوریتم ژنتیک.
منبع: (Gonzales, & et. al., 2010)
بهینهسازی خوشهبندی فازی با بهره گرفتن از الگوریتم ژنتیک
علم ژنتیک براساس منطق زیستی استوار است و چیزی به عنوان عملگر تصادفی وجود ندارد، یکی از مشکلات اصلی در سیستم فازی، تنظیم صحیح مقادیر پارامترهای این الگوریتم است؛ از همین رو در اکثر مواقع تنظیم مقادیر این پارامترها فرایند بسیار وقتگیر و مشکل خواهد بود.
پارامترهای ژنتیک برای تعیین اکثر پارامترهای کنترلر فازی، به عنوان نمونه، متغیرهای ورودی و تابع عضویت به کار برده میشود. این پارامترها داخل کروموزومها قرار میگیرند. این روش، وقتی دانش کنترلی قبلی در دسترس باشد، خیلی قدرتمند است. به عبارت دیگر زمانی که پارامترهای میزانسازی تابع عضویت برای بهبود کارایی کنترلرها استفاده شود، این روش کارایی بالایی دارد (Tang, & Qin, 2010).
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
طول کروموزومها مطابق با تعداد ویژگی ها می باشد. که در این پایان نامه، منظور از ویژگی ها، ویژگیهای صفحات وب نظیر رنگ پسزمینه یا نوشته های صفحات وب و …. می باشد. طول کروموزومها با عملیات کراس اور[۷] ممکن است تغییر کند. عملیات دیگر ژنتیک مانند selection و reproduction برای همه کروموزومها در جمعیت اجرا میشود. سرانجام عملیات کراس اور انجام میشود. نقاط کراس اور در کروموزوم پدر و مادر میتواند متفاوت باشد، طول کوروموزومها برای زادو ولد از پدر و مادرشان متفاوت است.
برای تعیین پارامترهای مناسب برای توابع عضویت با بهره گرفتن از الگوریتم ژنتیک، ابتدا باید نوع بازنمایی کروموزومها تعیین گردند. شایان ذکر است که هر کروموزوم (انفردای) یک جواب برای مسئله خواهد بود، بدین معنی که هر کروموزوم شامل پارامترهای توابع عضویت برای تمامی ویژگیها خواهد بود. به دلیل این که پارامترهای توابع عضویت میتوانند اعداد اعشاری باشند، در نتیجه بازنمایی هر کروموزوم به صورت آرایهای از اعداد اعشاری در نظر گرفته شد. از آنجایی که میانگین (µ) و انحراف معیار (σ) برای توابع عضویت گوسین، و مقادیر ابتدا و انتهای شیب (a، b) برای توابع S شکل و Z شکل، به عنوان پارامترهای این توابع میباشند. در ادامه باید دامنه مقادیر هر یک از توابع عضویت تعیین گردد. برای این منظور با بررسی پایگاه های تصویری متفاوت و مقادیر مختلف ویژگیها ، دامنه هر یک از توابع عضویت تعیین گردید. حال میتوان آماده سازی الگوریتم ژنتیک را آغاز نمود.
پس از تعیین نوع بازنمایی و طول هر کروموزوم، نوبت به ایجاد جمعیت اولیه برای الگوریتم ژنتیک میرسد. الگوریتم تولید جمعیت اولیه بدین گونه طراحی شد که هر پارامتر به صورت تصادفی در بازهی مربوط به آن پارامتر مقداردهی میشود. یکی از موارد مهم در تولید جمعیت اولیه، عدم ایجاد تَکالهای (کروموزومهای) ناصحیح است، بدین معنی که تکال ایجاد شده که به عنوان یک کاندید برای جواب مسئله میباشد باید شرایط یک جواب صحیح برای مسئله را داشته باشد. برای رسیدگی به این موضوع شرایطی در الگوریتم تولید جمعیت اولیه درنظر گرفته شد تا در نتیجه پارامترهای توابع عضویت به گونهای انتخاب گردند که برای یک مقدار از ویژگی، دو تابع عضویت درجه تعلق “یک” را گزارش ننمایند. البته از ایجاد پارامترهایی که باعث توی همرفتگی بیش از حد توابع عضویت میشوند نیز جلوگیری میشود.
روش پیشنهادی در این تحقیق
همانطور که اندازه خوشه در طی افزایش کاربران وب افزایش مییابد، نیاز به بهینه سازی خوشهها اجتناب ناپذیر خواهد بود. در این بخش یک متدولوژی بهینه سازی خوشه بر اساس خوشهبندی فازی K-Means ارائه خواهد شد. از آنجا که در سیستم استنتاج فازی تعیین پارامترهای توابع عضویت، تأثیر مهمی در دقت نهایی خوشهبندی دارد. بنابراین در این سیستم برای تنظیم پارامترهای توابع عضویت از الگوریتم ژنتیک استفاده میشود. با این کار، دقت خوشهبندی صفحات وب نیز تا حد زیادی افزایش خواهد یافت.
شمای کلی سیستم پیشنهادی
با توجه به توضیحات بیان شده در بخش ۳-۴-، شمای کلی سیستم پیشنهادی شخصیسازی صفحات وب در شکل ۳-۵ نشان داده شده است.
یافتن مقادیر مناسب برای پارامترهای توابع عضویت با بهره گرفتن از الگوریتم ژنتیک
خوشه بندی صفحات وب با بهره گرفتن از خوشه بندی فازی k-means
ویژگیهای استخراج شده
فایل ثبت وقایع
صفحات وب استخراج شده
شکل ۳-۵: شمای کلی سیستم پیشنهادی
مثالی از سیستم پیشنهادی
در این پایان نامه همانطور که در بخش قبلی گفته شد از روش خوشهبندی فازی- سیمینز برای خوشهبندی صفحات وب استفاده میشود. همچنین الگوریتم ژنتیک را برای بهینه کردن پارامترهای توابع عضویت به کار برده میشود. برای درک بهتر ،روش پیشنهادی بر روی مثال زیر اجرا می شود.
ابتدا داده های آموزشی وارد مرحله خوشه بندی فازی می شوند. یک مثال از داده آموزشی در زیر آورده شده است:
۱۰۰۰۰۰۰
۱۵
۲۸
۱۰۰
۳۴۵۷۳۶۳۰
۱۰۵۰۹۸۱۳
۰
۲۰
۰
۳۴۵۷۳۶۳۰
۳۴۱۷۵۲۶۷
۰
۳۱
۶
۳۴۵۷۳۶۳۰
۲۳۳۸۸۲۳
۱
۴۰
۲۵۰
۳۴۵۷۳۶۳۰
۱۰۰۰۰۰۰
۲۲
۲۹
۱۰۰
۳۴۵۷۳۶۳۴