مروری برالگوریتم ریشه یابی Stemming در پردازش زبان طبیعی

معصومه ابراهیمی

مروری برالگوریتم ریشه یابی Stemming در پردازش زبان طبیعی

محل انتشار: سومین کنفرانس بین المللی شهر هوشمند، چالش ها و راهبردها

سال انتشار: 1402

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 727

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > پردازش زبان طبیعی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1950375

شناسه ملی سند علمی:

SMARTCITYC03_122

تاریخ نمایه سازی: 20 فروردین 1403

چکیده مقاله:

الگوریتم استیمینگ رویکردی است که برای کاهش یک کلمه به ساقه کلمه استفاده می شود. از منظر زبان شناسی , سازه ای که ضمیمه ندارد و معنی به آن وابسته است و بین تمام کلمات خویشاوند وهم زمینه مشترک است , ریشه یا بن نامیده می شود. بر این اساس فرآیند ریشه یابی ,فرآیند تعیین کننده ریشه های بدست آمده از یک لغت است به عبارت دیگر , هدف از ریشه گیری کاهش فرم های لغتی متغیر جهت دست یابی به یک ریشه تک واژه ای می باشد(۱.)ریشه جزئی از کلمه است که پس از حذف تمام عناصر الحاقی یا وندهای کلمه « پسوند , پیشوند , میانوند» بر جای می ماند. یکی از مهمترین موضوعات در پردازش زبان طبیعی (nlp) و بازیابی اطلاعات (ir) یافتن ریشه کلمات است , علاوه بر آن به منظور افزایش کارایی سیستم های بازیابی اطلاعات استفاده از روش ریشه یابی کلمات مفید است زیرا اشتقاقات مختلف یک کلمه به ریشه آن کلمه باز می گردند. در نتیجه جستجو بر اساس ریشه کلمات انجام خواهد شد و اندازه ساختار ایندکس کاهش می یابد .

کلیدواژه ها:

الگوریتم استیمینگ ، ریشه ، ریشه یابی ، بازیابی اطلاعات ، nlp

نویسندگان

معصومه ابراهیمی

دانشجوی کارشناسی ارشد ناپیوسته هوش مصنوعی ، موسسه آموزش عالی آپادانا شیراز، ایران