دفاعیه ارشد: بررسی ترجمه انگلیسی هم نویسه های هم آوای فارسی در موتور ترجمه گوگل

An Investigation into the English Translation of Persian Homographic homophones in Google Translate

بررسی ترجمه انگلیسی هم نویسه های هم آوای فارسی در موتور ترجمه گوگل روز شنبه، 30 بهمن، 1400 توسط موسسه آموزش عالی زند شیراز در شهر شیراز استان فارس برگزار می شود.

حوزه های تحت پوشش: زبان و زبان شناسی

برگزار کننده: موسسه آموزش عالی زند شیراز

 چکیده فارسی به همراه واژگان کلیدی: پیشرفت کامپیوترها در نیمه دوم قرن بیستم زمینه را برای اختراع ترجمه ماشینی فراهم کرد. یکی از متداول ترین سیستم های ترجمه ماشینی موتور ترجمه گوگل است که در حال حاضر از ۶۴ زبان از جمله فارسی پشتیبانی می کند. با توجه به اینکه گوگل ترنسلیت به راحتی در دسترس است، تقریبا همیشه اولین سیستم ترجمه ماشینی است که کاربران ایرانی برای رفع نیازهای ترجمه خود به آن متوسل می شوند، به همین دلیل محقق را بر آن داشت تا مطالعه ای در مورد کیفیت خروجی ترجمه انگلیسی به انجام دهد. -ترجمه های فارسی تولید شده توسط این سامانه. مطالعه حاضر با هدف بررسی نحوه ترجمه هم نویسه های هم آوا با موتور ترجمه گوگل و دستیابی به نتایج آماری در مورد دقت موتور ترجمه گوگل در ترجمه هم نویسه های هم آوا انجام شد. در جستجوی چنین هدفی، درصد ترجمه موفقیت آمیز هم نویسه های هم آوا توسط گوگل ترنسلیت یکی از مهم ترین اهداف مطالعه بود. به طور کلی، مطالعه حاضر با هدف تعیین اینکه آیا گوگل ترنسلیت در ترجمه این نوع از کلمات قابل اعتماد است یا خیر، انجام شد. به منظور تحقق اهداف این پژوهش، روش های توصیفی کیفی انتخاب شدند. مجموعه این پژوهش از فرهنگ دایره المعارف معین تهیه و استخراج شده است. مجموعه شامل ۱۱۴ هم نویسه ی هم‌آوا بود که از فرهنگ لغت معین انتخاب شدند. به منظور ارزیابی کیفیت ترجمه این کلمات از نظر دقت و ارزش صدق، چارچوب کیفیت ترجمه پیشنهاد شده توسط نبابان، نورائنی و سوماردیونو (۲۰۱۲) اتخاذ شد. آمار توصیفی حاوی فراوانی، درصد و مجموع برای مقوله‌های هم‌ نویسه های هم آوا ارائه شد. نتایج به‌دست‌آمده از تجزیه و تحلیل هم نویسه های هم‌آوا فارسی استخراج‌شده نشان داد که از ۱۱۴ مورد از پیش تعیین‌شده این واژه، تنها حدود ۶ درصد از واژه‌ها به طور دقیق و مطابقت کامل با ترجمه واقعی کلمات مورد نظر در بافت‌های مختلف ترجمه شده‌اند. با این حال، ۶۴.۹ درصد از کلمات ترجمه شده کاملا نادرست و ناسازگار با معنای مورد نظر بافت (جمله) مشخص شد. یافته‌ها حاکی از آن است که از میان ۲۶۰ زمینه مختلف که در آن هم نویسه ی هم‌آوا آورده شده است، موتور ترجمه گوگل ترجمه این کلمات را در هفت دسته ارائه کرده است. بر اساس نتایج، این موتور ترجمه تنها توانست بین معنایی ۲۱.۱۵ درصد از این کلمات هم آوا و هم نویسه تمایز قائل شود. عبارات کلیدی: ترجمه ماشینی، همنام، کیفیت، دقت، قابل اعتماد، موتور ترجمه گوگل، Abstract / Key Words: The advancement of computers in the second half of the twentieth century paved the way for the invention of machine translation (MT). One of the most commonly used MT systems is Google Translate, which currently supports ۶۴ languages, including Persian. Due to the fact that Google Translate is easily accessible, it is almost always the first MT system to which Iranian users resort to meet their translation needs. This prompted the researcher to conduct a study on the output quality of the Persian-to-English translations produced by this MT system. The present study was conducted to investigate how Google translates homographic homophones, in the first place and to reach the statistical results about Google translator engine accuracy in translating homographic homophones. In seeking such a goal, the percentage of successful translating of homographic homophones by Google Translate was one of the most important objectives of the study. Generally, the present study aimed to determine whether Google Translate was trustworthy in translating homographic homophones or not. In order to fulfill the objectives of this study, descriptive qualitative methods were selected. The corpus of this study was extracted from Mo’in Encyclopedic dictionary (۲۰۱۵). The corpus consisted of ۱۱۴ homographic homophones selected from the dictionary. In order to evaluate the translation quality of the homographic homophones in terms of the accuracy and truth worthiness, the translation quality framework proposed by Nababan, Nuraeni and Sumardiono (۲۰۱۲) was adopted. Descriptive statistics containing frequency, percentage and sum was provided for the gathered data. The obtained results showed that out of ۱۱۴ predetermined cases of the words only about ۶% were translated accurately and in complete correspondence with the real translation of the intended words in different contexts. However, ۶۴.۹% of the translated words were found to be completely inaccurate and incompatible with the intended meaning of the given context (sentence). It was found that among ۲۶۰ different contexts in which the intended homographic homophones used, Google Translate could only differentiate between the semantics of ۲۱.۱۵% of these homographic homophones. Key terms: Machine translation, Homonymy, Quality, Accuracy, Trustworthy, Google Translate,

نگارنده: سحرناز صابری استاد راهنما: دکتر مرتضی یمینی استاد مشاور: دکتر مریم شریف استاد داور: دکتر شیوا صدیقی

 Abstract / Key Words: The advancement of computers in the second half of the twentieth century paved the way for the invention of machine translation (MT). One of the most commonly used MT systems is Google Translate, which currently supports 64 languages, including Persian. Due to the fact that Google Translate is easily accessible, it is almost always the first MT system to which Iranian users resort to meet their translation needs. This prompted the researcher to conduct a study on the output quality of the Persian-to-English translations produced by this MT system. The present study was conducted to investigate how Google translates homographic homophones, in the first place and to reach the statistical results about Google translator engine accuracy in translating homographic homophones. In seeking such a goal, the percentage of successful translating of homographic homophones by Google Translate was one of the most important objectives of the study. Generally, the present study aimed to determine whether Google Translate was trustworthy in translating homographic homophones or not. In order to fulfill the objectives of this study, descriptive qualitative methods were selected. The corpus of this study was extracted from Mo’in Encyclopedic dictionary (2015). The corpus consisted of 114 homographic homophones selected from the dictionary. In order to evaluate the translation quality of the homographic homophones in terms of the accuracy and truth worthiness, the translation quality framework proposed by Nababan, Nuraeni and Sumardiono (2012) was adopted. Descriptive statistics containing frequency, percentage and sum was provided for the gathered data. The obtained results showed that out of 114 predetermined cases of the words only about 6% were translated accurately and in complete correspondence with the real translation of the intended words in different contexts. However, 64.9% of the translated words were found to be completely inaccurate and incompatible with the intended meaning of the given context (sentence). It was found that among 260 different contexts in which the intended homographic homophones used, Google Translate could only differentiate between the semantics of 21.15% of these homographic homophones. Key terms: Machine translation, Homonymy, Quality, Accuracy, Trustworthy, Google Translate,

درج در سایت: 18 بهمن 1400 - تعداد مشاهده 496 بار