بهبود روش رفع ابهام معنایی بر پایه شباهت مفهومی متون

  • سال انتشار: 1392
  • محل انتشار: همایش ملی کاربرد سیستم های هوشمند (محاسبات نرم) در علوم و صنایع
  • کد COI اختصاصی: AISST01_057
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1217
دانلود فایل این مقاله

نویسندگان

صادق والی پور

گروه کامپیوتر دانشگاه آزاد اسلامی واحد دزفول

سید مصطفی فخراجمد

گروه کامپیوتر دانشگاه آزاد اسلامی واحد شیراز

مهدی محرابی

گروه کامپیوتر دانشگاه آزاد اسلامی واحد شیراز

عرفانه جمالی جهرمی

گروه کامپیوتر دانشگاه غیرانتفاعی علامه محدث نوری

چکیده

یکی از مسائل مهم و اساسی در فرآیند و روند ترجمه ماشینی، مشخص کردن معنای کلمه (WSD) است که به عنوان انتخاب معنی صحیح کلمه چند معنایی تعریف شده است. روش های دیگر یادیگری نظارت شده، معمولا برای حل این مشکل استفاده می شوند. کار مشخص کردن معنای کلمه با استفاده از اسناد ترجمه شده (به عنوان داده ها آموزشی و رابطه دو زبان) است. در این مقاله ما روش یادیگری نظارت شده را برای WSD ارائه می دهیم که بر اساس فاصله اقلیدسی و شباهت cosine است. به عنوان اولین منبع، ما به دو مجموعه از ویژگی ها را استخراج می کنیم. مجموعه کلماتی که در متن تکرار می شوند و کلماتی که کلمه مبهم را احاطه می کنند. ما نتایج ارزشیابی برنامه های پیش بینی شده را ارائه خواهیم داد و تاثیرات سنجش استراتژی های پیشنهاد شده را مشخص خواهیم کرد. نتایج حاصله در مقایسه با روش های موجود در این مقاله نوید بخش هستند.

کلیدواژه ها

ترجمه ماشینی، روش های نظارت شده، فاصله اقلیدسی، شباهت cosine

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.