مروری بر شناسایی زبان برای ترجمه ماشینی چند زبانه

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 63

فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

SMARTCITYC03_113

تاریخ نمایه سازی: 20 فروردین 1403

چکیده مقاله:

ترجمه ماشین، فرایند ترجمه متنی از یک زبان طبیعی به زبان طبیعی دیگر با استفاده از سیستم کامپیوتری است. ترجمه یک سند حاوی محتوای یک زبان مبدا، آسان است، اما زمانی که اطلاعات در سند مبدا به صورت چند زبانه ارائه می شود، نیاز به شناسایی زبان های موجود در این سند چند زبانه وجود دارد. شناسایی زبان، وظیفه پردازش زبان طبیعی است که به صورت خودکار زبان طبیعی را که در محتوای سند داده شده، با آن نوشته شده است را شناسایی می کند. شناسایی زبان، مرحله بنیادی و حیاتی در بسیاری از برنامه های پردازش زبان طبیعی است. در این مقاله، شناسایی کننده های زبان مبتنی بر n-gram و یادگیری ماشین به کار گرفته شده اند تا سه زبان هندی، مراتی و سانسکریت موجود در یک سند برای ترجمه ماشین شناسایی شوند. مشاهده می کنید که شناسایی کننده زبان مبتنی بر ماشین پشتیبانی دقت بیشتری نسبت به هر تکنیک دیگری دارد و دقت آن ۸۹ درصد است که ۱۸ درصد بیشتر از رویکرد سنتی مبتنی بر n-gram است. اضافه کردن مولفه شناسایی زبان به ترجمه ماشینی، کیفیت ترجمه را بهبود می بخشد.

نویسندگان

زهرا ذبیحی

دانشجوی کارشناسی ارشد ناپیوسته هوش مصنوعی، موسسه آموزش عالی آپادانا شیراز، ایران

هاله همایونی

استادیار و عضو هیات علمی گروه مهندسی کامپیوتر موسسه آموزش عالی آپادانا شیراز، ایران

شیما اکبری

مربی بخش کامپیوتر،موسسه آموزش عالی آپادانا شیراز، ایران