ترجمه ماشینی آماری با استفاده از برچسب های کم عمق نحوی

  • سال انتشار: 1395
  • محل انتشار: هشتمین کنفرانس بین المللی فناوری اطلاعات ودانش
  • کد COI اختصاصی: ICIKT08_052
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1123
دانلود فایل این مقاله

نویسندگان

شهرام سلامی

دانشگاه شهید بهشتی، دانشکده مهندسی و علوم کامپیوتر

مهرنوش شمس فرد

دانشگاه شهید بهشتی، دانشکده مهندسی و علوم کامپیوتر

چکیده

این مقاله مدل سلسله مراتبی جدیدی را برای ترجمه ماشینی آماری پیشنهاد می دهد که غیرپایانه ها را با تطابق مرز عبارات مقصد با برچسب هایکم عمق نحوی در سمت مقصد پیکره آموزش، نامگذاری می کند. در جایی که برچسبی برای کل عبارت موجود نباشد، نام غیرپایانه از اتصالبرچسب های مرزی تعریف می شود. برچسب گذاری با کلاس کلمات مرزی عبارات قبلا معرفی گردیده است که می تواند شکل مبنای مدلپیشنهادی درنظر گرفته شود. ما این شکل مبنا را در مقاله حاضر با استفاده از برچسب قطعات توسعه می دهیم. در این توسعه، اگر برچسب قطعهدر مرز عبارت وجود نداشته باشد، از برجسب POS کلمه مرزی استفاده می شود. با استفاده از برچسب عبارات به جای کلاس کلمات، قواعد مدلپیشنهادی تعمیم داده می شود. تعدادی آزمایش در ترجمه فارسی به انگلیسی انجام شد. با استفاده از معیار BLEU در قیاس با مدل SAMTکه از درخت تجزیه نحوی برای برچسب گذاری استفاده می کند، مدل پیشنهادی بهبود قابل توجهی به دست آورد.

کلیدواژه ها

ترجمه ماشینی آماری، مدل سلسله مراتبی، برچسب کلمه، برچسب قطعه

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.