یادگیری برخط متریک محلی مبتنی بر روش فعال/غیرفعال

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 526

فایل این مقاله در 19 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CONFITC04_162

تاریخ نمایه سازی: 6 مهر 1397

چکیده مقاله:

تعیین شباهت/ فاصله داده ها در بسیاری از الگوریتم های یادگیری ماشین، شناسایی الگو و داده کاوی استفاده می شود.معیار شباهت/فاصله بستگی به دادهها دارد، بنابراین ممکن است یک معیار برای یک کاربرد مناسب ولی برای کاربرددیگر نامناسب باشد، همین مسیله منجر به پیدایش روشهای یادگیری متریک شده است. در بسیاری از مجموعه داده هاکه میزان تمایز ویژگی ها در نواحی مختلف داده متفاوت است، استفاده از روش های سراسری یادگیری متریک، کاراییمطلوبی ندارد از این رو روشهای محلی ارایه شده اند که چندین نگاشت خطی یا غیرخطی در نواحی مختلف فضای دادهیاد می گیرند. از مزایای این روشها می توان به انعطافپذیری بالا، یادگیری نگاشت های غیرخطی، مناسب بودن برایمسایل پیچیده مانند داده های ناهمگن اشاره کرد. با این وجود بدلیل تعداد زیاد پارامترهای یادگیری، باید برای مشکلاتبیش برازش و مقیاس پذیری اندازه مجموعه داده های آموزشی راه کارهای مناسب در نظر گرفته شود. همچنین مشکلنامتوازن بودن داده های کلاس های مختلف وجود دارد که باید راه کار مناسب برای این مساله ارایه داد. در این مقالهبرای حل این مشکلات، روشی برخط یادگیری متریک محلی ارایه شده است، که با یادگیری متریک سراسری و محلی بصورت توام، سعی می کند از مشکل عدم توازن داده ها در نقاط مختلف جلوگیری کند. روش پیشنهادی مبتنی بر PA(Passive/Aggressive) است و در هر مرحله با دریافت نمونه آموزشی، متریک های محلی لازم و متریک سراسری را بهنگام می کند. برای تعیین فاصله بین دو شی از ترکیب متریک محلی و سراسری استفاده می شود. نتایج آزمایشهابر روی مجموعه وسیعی از داده های مورد آزمایش تایید می کند که روش پیشنهادی کارایی نسبت به روشهای همتا درمرزهای دانش برتری دارد.

نویسندگان

بیدا حمدان

دانشجوی کارشناسی ارشد گروه کامپیوتر دانشکده فنی و مهندسی دانشگاه فردوسی مشهد

داود ذبیح زاده

عضو هیات علمی گروه کامپیوتر موسسه آموزش عالی اسرار مشهد

رضا منصفی

دانشیار گروه کامپیوتر دانشکده فنی و مهندسی دانشگاه فردوسی مشهد