مروری بر رویکردهای بهینه سازی مدل های زبانی بزرگ چندزبانه برای زبان فارسی
سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 45
فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCAEC07_051
تاریخ نمایه سازی: 17 خرداد 1405
چکیده مقاله:
مدل های زبانی بزرگ چندزبانه با بهره گیری از معماری ترنسفورمر پیشرفت چشمگیری در پردازش زبان های انسانی داشته اند. با این حال، زبان فارسی به عنوان یکی از زبان های کم منبع از نظر کیفیت و حجم داده های آموزشی با محدودیت های جدی مواجه است. این مقاله مروری به بررسی رویکردهای اصلی بهینه سازی مدل های چندزبانه برای فارسی پرداخته و بر دو محور یادگیری انتقالی و داده سازی خودکار متمرکز شده است. بخش های مختلف مقاله با مرور پژوهش های داخلی و بین المللی، دسته بندی رویکردها، تحلیل نقاط قوت و ضعف، بررسی چالش های فنی و زبانی فارسی را پوشش می دهند، همچنین مسیرهای آینده برای توسعه مدل های چندزبانه سازگار با فارسی معرفی شده اند. نتایج این مرور نشان می دهد که ترکیب روش های انتقال دانش بین زبانی با تولید داده های مصنوعی کنترل شده، رویکردی موثر برای ارتقای عملکرد مدل های فارسی است و زمینه را برای کاربردهای گسترده تر در حوزه های ترجمه، جست وجو و تولید متن فراهم می سازد.
کلیدواژه ها:
نویسندگان
زهرا بهمنی
عضو هیات علمی گروه مهندسی کامپیوتر؛ دانشگاه صنعتی خاتم النبیاء بهبهان