CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه یک ریشهیاب جدید فارسی مبتنیبر تنوع جانشینی

عنوان مقاله: ارائه یک ریشهیاب جدید فارسی مبتنیبر تنوع جانشینی
شناسه ملی مقاله: RSTCONF01_454
منتشر شده در کنفرانس بین المللی پژوهش در مهندسی، علوم و تکنولوژی در سال 1394
مشخصات نویسندگان مقاله:

سحر ارهفت - کارشناسی ارشد هوش مصنوعی، گروه کامپیوتر، دانشکده مهندسی، دانشگاه شهید چمران
بیتا شادگار - استادیار، دکترای نرمافزار، گروه کامپیوتر، دانشکده مهندسی، دانشگاه شهید چمران
منوچهر تشکری - استادیار، دکترای زبان و ادبیات فارسی،گروه ادبیات، دانشکده ادبیات، دانشگاه شهید چمران

خلاصه مقاله:
ریشهیابی، تبدیل شکل های گوناگون کلمه به یک جوهره مشترک است که آن جوهره را ریشه نامند. ریشهیابی یکی از مباحث مهم در پردازش زبان طبیعی است که بهطور گسترده در سیستمهای بازیابی اطلاعات، ترجمه ماشین، دستهبندی متن، خلاصهنویسی متن، شاخصگذاری، متنکاوی و غیره استفاده میشود. در این مقاله یک ریشهیاب جدید مبتنی بر الگوریتم تنوع جانشینی برای زبان فارسی ارائه میشود. این ریشهیاب دقت تکنیکهای آماری را با استفاده از یک فرهنگ لغت افزایش داده است. کارایی مدلپیشنهادی با مقایسه چند ریشهیاب فارسی دیگر روی یک مجموعه داده ارزیابی میشود. نتایج حاکی از افزایش دقت روش آماری پیشنهادی نسبت به ریشه یابهای دیگر است

کلمات کلیدی:
ریشهیابی، پردازش زبان طبیعی، تنوع جانشینی، زبان فارسی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/398522/