شناسایی جملات هم ترجمه با استفاده از طبقهبند آنتروپی بیشینه
محل انتشار: دوازدهمین کنفرانس ملی سیستم های هوشمند ایران
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 574
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICS12_115
تاریخ نمایه سازی: 11 مرداد 1393
چکیده مقاله:
منبع اصلی رویکردهای رایج امروزی در ترجمه ماشینی، متون دوزبانه در انداز ههای بسیار بزرگ است که اصطلاحا پیکره موازی خوانده می شوند. اما اکثر زبان های طبیعی با کمبود پیکره های موازی روبه رو هستند. بنابراین تلاش برای ساخت پیکره های موازیبیش تر همچنان یک ضرورت مهم در حوزه ترجمه ماشینی محسوب می شود. شناسایی جملات هم ترجمه که جملات موازی نیز خوانده می شوند، رکن مشترک در اکثر تلاش ها برای ساخت خودکار پیکره های موازی است. ما در اینجا از طبقه بند آنتروپی بیشینه جهت شناسایی جملات همترجمه استفاده می کنیم. همچنین برای این طبقه بند از ویژگی های عمومی جمله و ویژگی های مبتنی برهمترازی در سطح کلمه بین دو جمله استفاده می کنیم. همترازی در سطح کلمه جملات با استفاده از ابزار متن بازGiza++ انجام می شود. این ویژگی ها به تفکیک شرح داده می شوند و تأثیری که بر نتیجه طبقه بند می گذارند، بررسی می شود. نتایج ارزیابی نشان می دهد که طبقه بند آنتروپی بیشینه طراحی شده می تواند با دقت بالایی جملات را به جملات موازی و جملات غیر موازی طبقه بن دی کند.
کلیدواژه ها:
نویسندگان
علیمه زاری
دانشجوی کارشناسی ارشد، بخش مهندسی کامپیوتر، دانشگاه شیراز ، شیراز،
محمدهادی صدرالدینی
دانشیار، بخش مهندسی کامپیوتر، دانشگاه شیراز ، شیراز
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :