تحلیل مقایسه ای طبقه بندهای یادگیری ماشین بر روی مجموعه داده MNIST

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 20

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

TSTACON02_154

تاریخ نمایه سازی: 26 بهمن 1404

چکیده مقاله:

تشخیص ارقام دست نویس یکی از وظایف کلیدی در حوزه بینایی ماشین و یادگیری ماشین است که کاربردهایی در شناسایی نوری کاراکترها، اتوماسیون پستی و پردازش اسناد دارد. این مطالعه سه طبقه بند کلاسیک یادگیری ماشین K-نزدیک ترین همسایه (KNN)، ماشین بردار پشتیبان (SVM) و رگرسیون لجستیک را بر روی مجموعه داده MNIST ارزیابی می کند. این مجموعه شامل ۷۰,۰۰۰ تصویر خاکستری از ارقام دست نویس با ابعاد ۲۸×۲۸ پیکسل است. داده ها با تبدیل تصاویر به بردارهای ۷۸۴ بعدی پیش پردازش شدند. مدل ها روی ۶۰,۰۰۰ نمونه آموزشی و ۱۰,۰۰۰ نمونه آزمایشی ارزیابی شدند. نتایج نشان داد که SVM با دقت آزمایشی ۹۷.۹۲٪ بهترین عملکرد را دارد، پس از آن KNN با ۹۶.۸۸٪ و رگرسیون لجستیک با ۹۲.۵۵٪ قرار گرفتند. زمان آموزش SVM (۵۳۷.۲۳ ثانیه) به طور قابل توجهی طولانی تر از KNN (۰ ثانیه) و رگرسیون لجستیک (۸.۲۴ ثانیه) بود. این مطالعه تعادل بین دقت، کارایی محاسباتی و پیچیدگی مدل را بررسی کرده و با استناد به مقالات معتبر از سال ۲۰۲۲ به بعد، زمینه های بهینه سازی اخیر را تحلیل می کند.

کلیدواژه ها:

SVM ، KNN ، MNIST ، رگرسیون لجستیک ، تشخیص ارقام دست نویس ، یادگیری ماشین

نویسندگان

متین نهاوندی

دانش آموز دبیرستان دوره اول استعدادهای درخشان علامه امینی تبریز