مروری بر رویکردهای بهینه سازی مدل های زبانی بزرگ چندزبانه برای زبان فارسی

سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 45

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NCAEC07_051

تاریخ نمایه سازی: 17 خرداد 1405

چکیده مقاله:

مدل های زبانی بزرگ چندزبانه با بهره گیری از معماری ترنسفورمر پیشرفت چشمگیری در پردازش زبان های انسانی داشته اند. با این حال، زبان فارسی به عنوان یکی از زبان های کم منبع از نظر کیفیت و حجم داده های آموزشی با محدودیت های جدی مواجه است. این مقاله مروری به بررسی رویکردهای اصلی بهینه سازی مدل های چندزبانه برای فارسی پرداخته و بر دو محور یادگیری انتقالی و داده سازی خودکار متمرکز شده است. بخش های مختلف مقاله با مرور پژوهش های داخلی و بین المللی، دسته بندی رویکردها، تحلیل نقاط قوت و ضعف، بررسی چالش های فنی و زبانی فارسی را پوشش می دهند، همچنین مسیرهای آینده برای توسعه مدل های چندزبانه سازگار با فارسی معرفی شده اند. نتایج این مرور نشان می دهد که ترکیب روش های انتقال دانش بین زبانی با تولید داده های مصنوعی کنترل شده، رویکردی موثر برای ارتقای عملکرد مدل های فارسی است و زمینه را برای کاربردهای گسترده تر در حوزه های ترجمه، جست وجو و تولید متن فراهم می سازد.

نویسندگان

زهرا بهمنی

عضو هیات علمی گروه مهندسی کامپیوتر؛ دانشگاه صنعتی خاتم النبیاء بهبهان