مروری برالگوریتم ریشه یابی Stemming در پردازش زبان طبیعی

سال انتشار: 1402
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 24

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

SMARTCITYC03_122

تاریخ نمایه سازی: 20 فروردین 1403

چکیده مقاله:

الگوریتم استیمینگ رویکردی است که برای کاهش یک کلمه به ساقه کلمه استفاده می شود. از منظر زبان شناسی , سازه ای که ضمیمه ندارد و معنی به آن وابسته است و بین تمام کلمات خویشاوند وهم زمینه مشترک است , ریشه یا بن نامیده می شود. بر این اساس فرآیند ریشه یابی ,فرآیند تعیین کننده ریشه های بدست آمده از یک لغت است به عبارت دیگر , هدف از ریشه گیری کاهش فرم های لغتی متغیر جهت دست یابی به یک ریشه تک واژه ای می باشد(۱.)ریشه جزئی از کلمه است که پس از حذف تمام عناصر الحاقی یا وندهای کلمه « پسوند , پیشوند , میانوند» بر جای می ماند. یکی از مهمترین موضوعات در پردازش زبان طبیعی (nlp) و بازیابی اطلاعات (ir) یافتن ریشه کلمات است , علاوه بر آن به منظور افزایش کارایی سیستم های بازیابی اطلاعات استفاده از روش ریشه یابی کلمات مفید است زیرا اشتقاقات مختلف یک کلمه به ریشه آن کلمه باز می گردند. در نتیجه جستجو بر اساس ریشه کلمات انجام خواهد شد و اندازه ساختار ایندکس کاهش می یابد .

نویسندگان

معصومه ابراهیمی

دانشجوی کارشناسی ارشد ناپیوسته هوش مصنوعی ، موسسه آموزش عالی آپادانا شیراز، ایران