CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

یک ریشه یاب برای واژگان عاریتی زبان فارسی

عنوان مقاله: یک ریشه یاب برای واژگان عاریتی زبان فارسی
شناسه (COI) مقاله: ACCSI14_092
منتشر شده در چهاردهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1387
مشخصات نویسندگان مقاله:

علیرضا صفائی - دانشگاه آزاد اسلامی واحد ماهشهر
کامبیز بدیع - مرکز تحقیقات مخابرات
عبدالحسین عباسیان - مرکز تحقیقات فیزیک نظری و ریاضیات

خلاصه مقاله:
در پردازش زبان های طبیعی، استخراج ریشۀ واژگان از اهمیت زیادی برخوردار است و یکی از اساسی ترین نیازهای موتورهای جستجو، نرم افزارهای تبدیل متن به گفتار و مترجم های ماشینی می باشد. ریشه یاب های طراحی شده برای زبان فارسی، قادر به ریشه یابی واژگان وام گیری شده (عاریتی) نمی باشند. در این مقاله یک ریشه یاب خودکاربرای واژگان عاریتی زبان فارسی که ساختار و ریشۀ عربی دارند طراحی گردیده. این ریشه یاب می تواند مکمّل خوبی برای ریشه یاب های زبان فارسی باشد . ریشه یاب مذکور مورد آز مایش قرار گرفته و نتایج بسیار خوبی را تولید نموده است.

کلمات کلیدی:
ریشه یلب، تحلیل ریشه ای، پردازش زبان طبیعی، stemmer

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/60840/