CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

چالش های ریشهیابی متون فارسی در سیستمهای بازیابی اطلاعات

عنوان مقاله: چالش های ریشهیابی متون فارسی در سیستمهای بازیابی اطلاعات
شناسه ملی مقاله: AIHE10_197
منتشر شده در سومین کنفرانس ملی توسعه علوم مهندسی در سال 1395
مشخصات نویسندگان مقاله:

فاطمه مومنی پورمقدم - کارشناس ارشد نرم افزار
سونا مرجب - عضو هیات علمی موسسه آموزش عالی آیندگان. تنکابن

خلاصه مقاله:
در بازیابی اطلاعات و ریخت شناسی زبانی، ریشه یابی کلمه به معنای کاهش گونههای مختلف دستوری کلمه همانند فعل، صفت، اسم جمع و غیره به فرمی یکسان به نام ریشه است که منجر به افزایش کارایی سیستمهای بازیابی اطلاعات میشود.ریشهیابی کلمات، استخراج ریشههای اصلی یک کلمه است. بررسی فنی ایدههای مورد استفاده در ریشهیابهای موجود، نشانگر آن است که می توان رویکردهای موجود را به سه گروه طبقه بندی نمود. ریشهیاب های ساختارگرا ، ریشهیاب های مبتنی بر لغت نامه و ریشهیابهای آماری . در این مقاله به مطالعه و بررسی چالشهای موجود در ریشهیابی کلمات فارسی پرداخته و مشکلات موجود در ریشهیابی کلمات در هر یک از سه دسته را به طور کامل تشریح نمودهایم

کلمات کلیدی:
بازیابی اطلاعات، ریشهیابی، واژههای فارسی، چالش

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/543768/