مروری بر رویکردهای بهینه سازی مدل های زبانی بزرگ چندزبانه برای زبان فارسی

زهرا بهمنی

مروری بر رویکردهای بهینه سازی مدل های زبانی بزرگ چندزبانه برای زبان فارسی

محل انتشار: هفتمین کنفرانس ملی دستاوردهای نوین در برق، کامپیوتر و صنایع

سال انتشار: 1404

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 45

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/2623810

شناسه ملی سند علمی:

NCAEC07_051

تاریخ نمایه سازی: 17 خرداد 1405

چکیده مقاله:

مدل های زبانی بزرگ چندزبانه با بهره گیری از معماری ترنسفورمر پیشرفت چشمگیری در پردازش زبان های انسانی داشته اند. با این حال، زبان فارسی به عنوان یکی از زبان های کم منبع از نظر کیفیت و حجم داده های آموزشی با محدودیت های جدی مواجه است. این مقاله مروری به بررسی رویکردهای اصلی بهینه سازی مدل های چندزبانه برای فارسی پرداخته و بر دو محور یادگیری انتقالی و داده سازی خودکار متمرکز شده است. بخش های مختلف مقاله با مرور پژوهش های داخلی و بین المللی، دسته بندی رویکردها، تحلیل نقاط قوت و ضعف، بررسی چالش های فنی و زبانی فارسی را پوشش می دهند، همچنین مسیرهای آینده برای توسعه مدل های چندزبانه سازگار با فارسی معرفی شده اند. نتایج این مرور نشان می دهد که ترکیب روش های انتقال دانش بین زبانی با تولید داده های مصنوعی کنترل شده، رویکردی موثر برای ارتقای عملکرد مدل های فارسی است و زمینه را برای کاربردهای گسترده تر در حوزه های ترجمه، جست وجو و تولید متن فراهم می سازد.

کلیدواژه ها:

مدل های زبانی ، بزرگ ، یادگیری انتقالی ، داده سازی خودکار ، زبان فارسی ، چندزبانه ، بهینه سازی مدل

نویسندگان

زهرا بهمنی

عضو هیات علمی گروه مهندسی کامپیوتر؛ دانشگاه صنعتی خاتم النبیاء بهبهان