AIcode مرجع تخصصی هوش مصنوعی

<aicode>

 

 

 

 

 

ماشین پشتیبان بردار (SVM) دسته‌ای از الگوریتم‌های یادگیر ماشینی می‌باشند که از توانایی آن‌ها برای کلاس‌بندی و رگرسیون در مجموعه داده‌ها می‌توان بهره‌جست. اساس این متد بر مبنای تئوری یادگیری آماری بناشده است. به‌عبارتی‌دیگر با استفاده از مجموعه‌ایی از داده‌های برچسب‌گذاری شده و آموزش SVM به‌وسیله آن‌ها، مدل مناسبی برای پیش‌بینی نوع طبقه‌بندی داده‌های جدید، بدست می‌آید. SVM، روش مؤثری برای مدل‌سازی داده‌ها می‌باشد. این الگوریتم با افزایش ابعاد مسئله و با استفاده از نگاشت کرنل، یک چهارچوب کاری یکپارچه را برای اکثر مدل‌ها فراهم می‌کنند. استفاده از این روش برای مجموعه داده‌هایی با ابعاد بالا و حجم داده‌های پایین، کارایی بالایی از خود نشان می‌دهد[1].

جهت توضیح نحوه عملکرد SVM و جهت ساده‌سازی، مسئله طبقه‌بندی توسط این الگوریتم را برای مجموعه‌ای از داده‌ها که در دو کلاس مجزا قرار دارند، مورد بررسی قرار می‌دهیم. با توجه به شکل زیر، تعداد زیادی معیار طبقه‌بندی خطی برای مجموعه داده‌های مورد نمایش، وجود دارد که می‌تواند داده‌ها را جداسازی نماید ولی فقط یکی از آن‌ها حاشیه (فاصله بین آن و نزدیک‌ترین نقطه داده هر رده) را بیشینه می‌نماید. این طبقه‌کننده خطی، ابرصفحه (HyperPlane) جداساز بهینه، درنظر گرفته می‌شود. به‌صورت شهودی انتظار داریم، مرز بدست آمده را بتوانیم به‌کل محدوده‌های ممکن تعمیم دهیم.

 1

ابرصفحه جداساز

ابر صفحه جداساز بهینه

مسئله جداسازی مجموعه بردار‌های آموزش‌دهنده D، را که متعلق به دو کلاس جداگانه هستند را درنظر می‌گیریم:

 2

که داریم:

3

که در رابطه فوق، <>، نشان دهنده ضرب داخلی است.
مجموعه بردارهایی که به‌صورت بهینه توسط ابرصفحه جداسازی شوند، باید دارای کمترین میزان خطا باشند و از سویی فاصله بین نزدیک‌ترین نقطه به ابر صفحه باید بیشینه گردد. برای بیان کلی‌تر مسئله معادله ابرصفحه مجازی را که تابعی از b و w است را به‌صورت زیر بیان می‌نماییم:

 4

زمانی گفته می‌شود یک مجموعه از نقاط به‌صورت بهینه به‌وسیله یک صفحه جداکننده، جداسازی شده‌اند که:
1. بدون اشتباه در گروه‌های مربوط قرار بگیرند.
2. فاصله بین نزدیک‌ترین نقاط تا صفحه جداکننده بیشینه باشد.

5

کمترین فاصله نقاط تا خط جداکننده

که به w، بردار وزن و به b، بردار بایاس گویند.
یک ابرصفحه جداساز در حالت مجاز خود باید شرط زیر را محقق کند:

6

فاصله (d(w,b;x بین نقطه x و (w,b) برابر است با:

7
ابرصفحه بهینه توسط بیشینه حاشیه rho، داده می‌شود و در عین حال شروط معادله فوق، باید رعایت شود. مرز مذکور توسط رابطه زیر محاسبه می‌شود:

8بنابراین ابرصفحه که به‌صورت بهینه داده‌ها را از یکدیگر جدا می‌سازد، باید کمینه‌سازی زیر را انجام دهد:

9این رابطه مستقل از b است. حل مسئله بهینه‌سازی معادله فوق با توجه به‌شرطهای فوق با استفاده از نقطه زینی تابع لاگرانژ به‌صورت زیر به دست می‌آید:

10
در رابطه فوق آلفا ضریب لاگرانژ می‌باشد. عامل لاگرانژی باید نسبت به متغیرهای w و b به‌صورت مینیمم و نسبت به مقادیر مثبت آلفا به‌صورت ماکزیمم درآید. با استفاده از ضریب لاگرانژ کلاسیک، می‌توان مسئله اولیه مربوط به معادله فوق را به مسئله دوگانه آن تبدیل نمود که حل آن آسان‌تر خواهد بود:

11

کمینه نسبت به w و b، برای عامل لاگرانژی Φ، به‌صورت روابط زیر خواهد بود:

12
با حل دو معادله فوق و یافتن مقادیر b و w بهینه برای مسئله فوق، ابرصفحه بهینه موردنظر را می‌توان محاسبه نمود. الگوریتم توصیف شده فوق، راهکاری مناسب برای طبقه‌بندی داده‌ها و استخراج ویژگی از آن‌ها می‌باشد.

[1] Mohammad Asrardel, "Prediction of Combustion Dynamics in An Experimental Turbulent Swirl Stabilized Combustor with Secondary Fuel Injection", University of Tehran, 2015.

تبلیغات AIcodeMahak

AIcode مرجع تخصصی آموزش مهندسی کامپیوتر و هوش مصنوعی

تماس با ما

ايميل: info@aicode.ir

عضویت در خبرنامه AIcode