یادگیری آماری و تعمیم پذیری مدلهای یادگیری ماشین رویکردی مبتنی بر نظریه VC و کرانهای پیچیدگی

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 6

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CICTC04_038

تاریخ نمایه سازی: 21 بهمن 1404

چکیده مقاله:

در سالهای اخیر مفهوم تعمیم پذیری به یکی از اصول بنیادین در یادگیری ماشین تبدیل شده است؛ چرا که عملکرد مدل ها در مواجهه با داده های جدید به شدت به توانایی آنها در تعمیم از داده های آموزشی وابسته است. این مقاله با رویکردی مروری، به بررسی نظریه های آماری تعمیم پذیری می پردازد و مفاهیم کلیدی همچون تابع زیان، ریسک تجربی، ریسک واقعی و ظرفیت مدل را تشریح می کند. تمرکز اصلی بر بعد VC (VC-dimension) است که معیاری برای سنجش ظرفیت مدل ها در یادگیری آماری محسوب می شود، همچنین ارتباط این مفهوم با پدیده های بیش برازش و کم برازش و نقش آن در کران های پیچیدگی نظیر PAC Bound، پیچیدگی نمونه و پیچیدگی رادماخر تحلیل می گردد. هدف این مقاله فراهم آوردن درکی عمیق تر از سازوکارهای ریاضیاتی و نظری نهفته در عملکرد مدل های یادگیری و کمک به انتخاب مناسب ساختار مدل در مسائل عملی است.

نویسندگان

امیر محمد جلدی

دانشجوی مقطع ارشد دانشگاه آزاد اسلامی واحد تهران غرب