ترجمه ماشینی مبتنی بر مدل مبدل برای گویش های لری بویراحمدی و یزدی به فارسی معیار و گسترش منابع زبانی رایانشی مرتبط

سال انتشار: 1402
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 179

فایل این مقاله در 20 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_LSI-19-37_007

تاریخ نمایه سازی: 21 شهریور 1403

چکیده مقاله:

با وجود تلاش های گسترده رایانشی بر روی گویش معیار فارسی، سایر لهجه ها و گویش ها و زبان های ایرانی کمتر مورد توجه محققین حوزه زبان شناسی رایانشی قرار گرفته اند. یکی از مهم ترین چالش های کار رایانشی بر روی این تمایز های زبانی، نبود یک مجموعه داده دیجیتال و استاندارد است. در این پژوهش اولین مجموعه داده تک زبانه و نیز داده موازی بر روی گویش های لری و یزدی که گویش هایی با منابع محدود محسوب می شوند، در مقابل فارسی معیار ارائه شده است. در ادامه مدل های یادگیری ژرف ترجمه ماشینی کدگذار-کدگشا در دو نوع مدل شبکه عصبی بازگشتی و مدل ژرف مبدل برای این گویش ها به فارسی معیار توسعه یافته و ارزیابی گردیده است. در این پژوهش که اولین تلاش محاسباتی روی این دو گویش محسوب می شود، برای ترجمه لری به فارسی و فارسی به لری به امتیاز BLEU به ترتیب ۳۹/۷ و ۲۹/۳ رسیدیم. این امتیاز برای گویش یزدی به فارسی معیار و برعکس به ۷۳/۰ و ۷۷/۰ رسید. که نشان می دهند پژوهش های فراتری برای توسعه منابع زبانی برای این زبان نیاز است.

کلیدواژه ها:

پردازش زبان طبیعی ، گویش لری ، گویش یزدی ، ترجمه تمایزهای زبانی ایرانی ، مدل یادگیری ژرف ترجمه ماشینی

نویسندگان

زهرا بهمنی

۱PhD. Student, Department of Computer Engineering, Sharif University of Technology, AI Group

محدثه میربیگی

دانشجوی دکتری، دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر، گروه هوش مصنوعی

نگین هاشمی دیجوجین

دانشجوی کارشناسی ارشد، دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر، گروه هوش مصنوعی

مرضیه نوری

پژوهشگر، دانشگاه صنعتی شریف، آزمایشگاه پردازش هوشمند متن و زبان، گروه هوش مصنوعی

مهسا امانی

دانشجوی کارشناسی، دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر، گروه هوش مصنوعی

احسان الدین عسگری

آزمایشگاه پردازش هوشمند متن و زبان و علوم انسانی محاسباتی

مهدیه سلیمانی باغشاه

دانشیار، دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر، گروه هوش مصنوعی

حمید بیگی

دانشیار، دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر، گروه هوش مصنوعی

علی موقر

استاد، دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر، گروه هوش مصنوعی