CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

یک رویکرد مفهومی- زبانی برای بازیابی اطلاعات دو زبانه

عنوان مقاله: یک رویکرد مفهومی- زبانی برای بازیابی اطلاعات دو زبانه
شناسه ملی مقاله: ACCSI13_066
منتشر شده در سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1386
مشخصات نویسندگان مقاله:

سولماز پورمحمود - کارشناس ارشد دانشگاه آزاد اسلامی واحد خوی
مهرنوش شمس فرد - استادیار دانشگاه شهید بهشتی

خلاصه مقاله:
در این مقاله یک رویکرد ترکیبی به منظور بازیابی مفهوم ی اسناد در دو زبان فارسی و انگلیسی برای پرس و جوهای مطرح شده به زبان فارسی ارائه میشود. مزیت عمده این رویکرد، ترکیب ویژگیها ی زبانی، مفهومی و آماری اسناد و پرس و جوها میباشد. در این رویکرد ترکیبی، برای استخراج مفاه یم از اسناد و پرس و جوها، از هستان شناسیهای دو زبانه وزن دار و برای یکسان ساز ی زبان ها ی مبدا و مقصد، از عملیات ترجمه پرس و جو توسط ی ک دیکشنر ی دو زبانه استفاده میشود. ترجمه پرس و جو با استفاده از دیکشنر ی، ی ک امر متداول در سیستمهای بازیابی اطلاعات چندزبانه میباشد. اما چون یک کلمه ممکن است با چندین کلمه در دیکشنری معادل باشد با مسئله ابهام در ترجمه مواجه میشویم. بعلاوه، ترجمه کلمه به کلمه پرس و جو نمیتواند دارای دقت کافی باشد. به همین منظور ما چند ین روش مختلف را برای بهبود ترجمه مبتنی بر د یکشنر ی و کاهش ابهام در ترجمه بکار میگیریم که عبارتند از: تشخیص عبارات و ترجمه آنها با استفاده از الگوی ترجمه عبارات، گسترش پرس و جو در قبل و بعد از ترجمه و انتخاب بهترین ترجمههای ممکن. سرانجام رتبه هر سند با استفاده از مدل زبانی آماری با چندین مرحله تبدیل محاسبه میشود و اسناد مرتبط بازیابی میشوند. نتایج نشان میدهند که با استفاده از این رویکرد ترکیبی، کارایی سیستم بازیابی اطلاعات دو زبانه افزایش می یابد.

کلمات کلیدی:
بازیابی اطلاعات دو زبانه، ابهام زدایی در ترجمه، رتبهبندی اسناد، هستان شناسی، حاشیه نویسی، مدل زبانی آماری

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/41660/