AIcode مرجع تخصصی هوش مصنوعی

<aicode>

 

 

 

 

 

جهت خصوصی‌سازی و سفارشی‌سازی پروژه‌ها یا دریافت توضیحات و اطلاعات بیشتر از طریق فرم یا شماره تماس در صفحه تماس با ما اقدام کنید.

در این پروژه هدف تشخیص (دسته‌بندی) گوینده صوت ورودی است. برای این منظور از ویژگی‌های MFCC و مدل دسته‌بند ماشین بردار پشتیبان استفاده شده است. در روش پیاده‌سازی شده برای تشخیص گوینده، ابتدا صوت فریم بندی شده و از هر فریم ویژگی‌های MFCC استخراج می‌شود. این مرحله در اکثر پژوهش‌های پردازش گفتار رایج است و در واقع توصیفی فرکانسی از فریم را مدل می‌کند. در واقع ما انتظار داریم فریم‌های متناظر با بخش خاصی از یک واج (مثلا فریم‌های مربوط به بخش انفجاری واج انفجاری "ب") برای یک گوینده خاص، بردار ویژگی MFCC مشابهی داشته ‌باشند. به عبارت دیگر اختلاف آنها ناچیز باشد. ویژگی‌های MFCC هر فریم از یک صوت مربوط به یک گوینده، با برچسب آن گوینده (1 تا 10) به دسته‌بند ماشین بردار پشتیبان داده می‌شود. برای مثال فرض کنید یک صوت گوینده "پنج" ، شامل 100 فریم ‌باشد. از این 100 فریم، 100 بردار ویژگی MFCC به دست می‌آید. هرکدام از این 100 بردار (13- بعدی) به دست آمده برچسب "پنج" می‌خورند و به دسته‌بند داده می‌شوند. در هنگام آزمون مدل آموزش دیده شده همین فرآیند تکرار می‌شود با این تفاوت که 100 برچسب توسط مدل SVM پیش‌بینی می‌شود. برای به دست آوردن برچسب، بین 100 پیش‌بینی به دست آمده رای اکثریت گرفته می‌شود.

مطالب عنوان شده در فایل گزارش پروژه:

  • پیش‌پردازش و استخراج ویژگی

  • ماشین بردار پشتیبان مبتنی بر کرنل با حاشیه نرم

  • مفهوم کرنل (هسته)

  • ماشین بردار پشتیبان با حاشیه نرم مبتنی بر هسته

  • بلوک دیاگرام روش

  • کد آموزش مدل دسته بند SVM

  • کد آزمون مدل دسته بند SVM

 

محتویات فایل قابل خرید: سورس کد متلب، فایل گزارش ورد، مجموعه داده (قابل تغییر)
زبان برنامه نویسی: متلب

پروژه تشخیص صدای گوینده (دسته بندی صوت) با استفاده از ویژگی‌های MFCC و مدل دسته‌بند ماشین بردار پشتیبان
850,000ریال

تبلیغات AIcodeMahak

AIcode مرجع تخصصی آموزش مهندسی کامپیوتر و هوش مصنوعی

تماس با ما

ايميل: info@aicode.ir

عضویت در خبرنامه AIcode