AIcode مرجع تخصصی هوش مصنوعی

<aicode>

 

 

 

 

 

جهت خصوصی‌سازی و سفارشی‌سازی پروژه‌ها یا دریافت توضیحات و اطلاعات بیشتر از طریق فرم یا شماره تماس در صفحه تماس با ما اقدام کنید.

در این پروژه قصد داریم چهار روش دسته‌بندی KNN، Distance Weigted KNN، RBF و Decision Tree را بر روی سه مجموعه داده معتبر Glass ،Statlog Heart و Breast Cancer که از مجموعه دادگان UCI انتخاب شده‌اند، آزمایش کنیم. در در این پروژه عملکرد این الگوریتم‌ها در دو حالت موردبررسی قرار گرفته‌اند: 1. کارآیی الگوریتم دسته‌بندی روی مجموعه داده اصلی 2. کارآیی این الگوریتم‌ها پس از کاهش بعد داده‌ها به روش PCA.
برای پیاده‌سازی‌ درخت تصمیم از فراخوانی توابع WEKA که توابع جاوا می‌باشند در محیط متلب (MATLAB) استفاده شده است. برای این منظور از درخت تصمیم J48 این کتابخانه استفاده شده است. برای روش RBF از متد newrb متلب استفاده شده است. برای دسته‌بند KNN ساده و وزن‌دار نیز از توابع متلب استفاده کرده‌ایم.
برای ارزیابی مناسب و معتبر، هرکدام از روش‌ها روی هر مجموعه داده 10 بار روش 10-fold Cross Validation اجرا شده است. در هربار معیارهای ارزیابی روی 10-fold موردنظر میانگین‌گیری شده است. از اینرو در هر اجرا این معیارها محاسبه می‌شوند. مقدار بهترین و بدترین دقت به همراه مقدار انحراف معیار "دقت دسته‌بندی" در این آزمایش‌ها به دست آمده است.

پروژه مقایسه چهار روش دسته‌بندی نزدیکترین همسایه KNN، نزدیکترین همسایه وزن‌دار، تابع شعاعی گوسی RBF و درخت تصمیم Decision Tree به همراه ارزیابی تاثیر کاهش بعد PCA
300,000ریال

در این برنامه نحوه استفاده از روش PCA برای کاهش بعد و آموزش یک مدل دسته‌بند SVM (ماشین بردار پشتیبان) روی مجموعه داده آموزش و استفاده از آن برای داده‌های آزمون را می‌بینید. این برنامه روی مجموعه داده هدی در زمینه ارقام دست نویس فارسی ارزیابی شده است که به راحتی می‌توان داده‌ها را عوض کرد، کافی است در سطرهای trainX، trainY، testX و testY داده‌های موردنظر خود را قرار داده باشید. هر سطر این ماتریس‌ها مربوط به بردار ویژگی یا برچسب یکی از داده های اموزش یا آزمون است. برای مثال اگر 9 ویژگی داشته باشیم و 200 داده آموزش در دسترس باشد، سایز trainX برابر 200 سطر و 9 ستون خواهد بود.

کتابخانه LiBSVM یک کتابخانه کارا و سریع برای مدل ماشین بردار پشتیبان (SVM) می‌باشد که استفاده گسترده‌ای در اکثر پژوهش‌ها دارد. این پروژه با هدف آشنایی با این کتابخانه برای مسایل دسته‌بندی تهیه شده است. یک مرحله استخراج ویژگی مرسوم در داده‌های با ابعاد بالا انتقال داده‌ها به فضای PCA و کاهش بعد است. این مرحله داده‌ها را به یک فضای با ابعاد پایین‌تر نگاشت می‌کند و جلوی مسایلی هم‌چون Overfitting در آموزش مدل را می‌گیرد.(https://en.wikipedia.org/wiki/Overfitting)

محتویات فایل قابل دانلود: کتابخانه LiBSVM نسخه 64 بیتی، مجموعه داده هدی، برنامه PCA، قطعه کد لود داده‌ها در برنامه، کد یادگیری تبدیل خطی PCA و مدل دسته‌بند SVM

زبان برنامه‌نویسی: متلب

سایر کلمات کلیدی: 

تبدیل خطی PCA

مجموعه داده هدی ارقام دست نویس فارسی

نحوه استفاده از دسته‌بند SVM (ماشین بردار پشتیبان) و کاهش بعد PCA
200,000ریال

در این پروژه الگوریتم‌های ویتربی، الگوریتم رو به جلو و رو به عقب برای مدل HMM پیاده‌سازی شده است. الگوریتم ویتربی دنباله مشاهدات و پارامترهای مدل HMM را به عنوان ورودی دریافت می‌کند و دنباله حالاتی که بیشترین احتمال را دارند به عنوان خروجی بر می‌گرداند. برای ارزیابی برنامه‌های نوشته شده یک مساله به صورت دستی حل شده است و با نتایج برنامه مقایسه شده است.

الگوریتم ویتربی که به منظور کدگشایی به کار می‌رود به فرم زیر پیاده‌سازی شده است:
function [ maxP,maxProbableState ] = Viterbi(pi,P,B,obs)
ورودی‌ها به ترتیب احتمال آغازین حالات، احتمال انتقال حالات، احتمال مشاهدات و دنباله مشاهدات است. خروجی شامل یک احتمال و دنباله حالات متناظر است.
الگوریتم رو به جلو و رو به عقب هرکدام یک احتمال برمی‌گردانند که احتمال کلی مشاهده می‌باشند:
(function [ prob ] = Forward( pi,P,B,obs
(function [ prob ] = Backward( pi,P,B,obs

جواب تمرین زیر برای ارزیابی برنامه ها نیز آورده شده است.
یک مولکول DNA را که از intronها و exonها تشکیل شده است را در نظر بگیرید. در این مولکول ترکیبات مختلفی از intronها و exonها روی می دهد. هدف این است که با مشاهده دنباله nucleotideها دنباله intron/exon را مشخص نماییم. فرض می کنیم می توان دنباله nucleotideها را با مدل مخفی مارکوف زیر مدلسازی نمود. فرض کنید دو حالت (I (intron و (E (exon داریم و مشاهدات nucleotideها می تواند از مجموعه {A, C, G, T} باشد.

الف) دنباله intro/exon به ازای دنباله nucleotideی AAGCATCG را مشخص نمایید.
ب) پاسخ قسمت الف را اگر ماتریس مشاهدات به تغییر یابد بدست آورید. مشخص کنید تفاوت در نتایج از کجا ناشی شده است.

محتویات فایل قابل خرید: سورس‌کد شبیه‌سازی، گزارش شبیه‌سازی (تحلیل نتایج برنامه‌ها با استفاده از یک مساله)
زبان برنامه‌نویسی: متلب

پیاده‌سازی الگوریتم‌های رو به جلو، رو به عقب و ویتربی برای مدل HMM
200,000ریال

تشخیص خودکار حروف و اعداد دست نویس یکی از زمینه های پرکاربرد در پردازش تصویر و بینایی ماشین می باشد که از کاربردهای آن می توان به انجام کارهای بانکی، فرم های مختلف اتوماتیک، سیستم های تشخیص پلاک، نرم افزارهای تبدیل تصویر به متن و ... اشاره کرد. این پروژه بر روی دسته بندی اعداد منقطع فارسی تمرکز دارد و برای آموزش دسته بند خود که از نوع svm می باشد از 10000 نمونه مجموعه داده اعداد فارسی هدی استفاده می کند. در این مجموعه داده نمونه ها بصورت باینری بوده و نواحی اضافی آنها از 4 طرف حذف شده است. این مجموعه داده دارای 10 کلاس می باشد. پروژه دارای 5 مرحله اصلی می باشد که عبارت اند از: خواندن مجموعه داده، پیش پردازش کردن نمونه ها، استخراج ویژگی، آموزش دسته بند و مرحله تست. این 5 مرحله به همین ترتیب باید انجام شوند.
مجموعه داده هدی
مجموعه داده هدی شامل 60000 نمونه آموزش و 20000 نمونه آزمایش است. این مجموعه داده از 11942 فرم پرشده توسط افراد دیپلم شرکت‌کننده در کنکور سراسری استخراج شده و قدرت تفکیک‌پذیری نمونه‌های این مجموعه 200 نقطه بر اینچ است. شایان ذکر است که ارقام این پایگاه به صورت باینری و بدون حاشیه هستند. تنها پیش‌پردازش مورد نیاز برای تصاویر ارقام این پایگاه داده نرمالسازی اندازه تصویر است.

محتویات فایل قابل خرید: فایل ورد گزارش، سورس کد، کتابخانه livsvm

زبان برنامه نویسی: متلب

تشخیص اعداد دست نویس فارسی به صورت آفلاین و آنلاین (آموزش با استفاده از مجموعه داده هدی)
590,000ریال

در این پروژه که پیاده سازی یک مقاله است از یک روش پر کاربرد یادگیری ماشین و شناسایی الگو برای دسته بندی استفاده شده است. در بسیاری از مواقع نیاز است تا بعد ورودی کاهش پیدا کند. در این گزارش از روش تحلیل تمایز هسته برای کاهش بعد ورودی استفاده شده است. دسته بندی یکی از متداولترین مسائل در دنیای یادگیری ماشین و شناسایی الگو است که برای این کار از روش نزدیکترین همسایگی استفاده شده است.
روش تحلیل تمایز هسته سعی دارد زیر فضایی از فضای ورودی را به دست آورد که در فضای جدید داده‌هایی که متعلق به یک دسته هستند به هم نزدیک شوند و داده‌هایی که به یک دسته تعلق ندارند از هم دور شوند. به طور خلاصه سعی دارد بیشترین تمایز را میان داده‌های غیر هم دسته ایجاد کند. برای به دست آوردن فاصله در روش توصیف شده از توابع غیر خطی مانند توابع پایه شعاعی (RBF) استفاده می‌شود.

لینک مقاله: http://courses.cs.tamu.edu/rgutier/csce666_f13/mika1999kernelLDA.pdf

 محتویات فایل: فایل‌های متلب، فایل‌های داده‌های آموزش و آزمایش، گزارش، مقاله پیاده سازی شده
زبان برنامه نویسی: متلب

پیاده سازی مقاله دسته بندی به کمک روش کاهش بعد تحلیل تمایز هسته و نزدیکترین همسایگی
700,000ریال

در این پروژه آموزشی از یک روش پر کاربرد یادگیری ماشین و شناسایی الگو برای دسته بندی استفاده شده است. در بسیاری از مواقع نیاز است تا بعد ورودی کاهش پیدا کند. در این پروژه از روش تحلیل تمایز خطی برای کاهش بعد ورودی استفاده شده است. دسته بندی یکی از متداولترین مسائل در دنیای یادگیری ماشین و شناسایی الگو است که برای این کار از روش نزدیکترین همسایگی استفاده شده است.

دسته بندی به کمک تحلیل تمایز خطی و نزدیکترین همسایگی
250,000ریال

ادامه مطلب...

در این پروژه آموزشی از روشهای ساده ولی پر کاربرد یادگیری ماشین و شناسایی الگو برای دسته بندی استفاده شده است. در بسیاری از مواقع نیاز است تا بعد ورودی کاهش پیدا کند. در این گزارش از روش تحلیل مولفه اصلی برای کاهش بعد ورودی استفاده شده است. دسته بندی یکی از متداولترین مسائل در دنیای یادگیری ماشین و شناسایی الگو است که برای این کار از روش نزدیکترین همسایگی استفاده شده است. 

دسته بندی به کمک تحلیل مولفه اصلی (PCA) و نزدیکترین همسایگی
250,000ریال

ادامه مطلب...

تبلیغات AIcodeMahak

AIcode مرجع تخصصی آموزش مهندسی کامپیوتر و هوش مصنوعی

تماس با ما

ايميل: info@aicode.ir

عضویت در خبرنامه AIcode