ارائه روشی جهت ریشه یابی کلمات در زبان فارسی
محل انتشار: همایش ملی مهندسی کامپیوتر و فناوری اطلاعات
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,832
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCCEB01_097
تاریخ نمایه سازی: 18 خرداد 1393
چکیده مقاله:
یکی از پیشنیازهای ضروری رسیدن به نرمافزارهای پردازش متن، الگوریتمهای ریشهیابی هستند که به بررسی ساخت واژه لغات میپردازند. هدف نهایی الگوریتمهای ریشهیابی حذف پیشوندها و پسوندهای کلمه و رسیدن به ریشه لغت است. در روشهای پیشین مانند ریشهیاب جدولی، الگوریتم ریشهیاب تشکری و الگوریتم کراوتز برای زبان فارسی یک دیکشنری شامل ریشه لغات وجود دارد و در هر مرحله پس از حذف پیشوند و یا پسوند، رشته باقیمانده در دیکشنری جستجو میشود اما در روش ارائه شده در این مقاله نیازی به نگهداری دیکشنری از اسامی جامد نیست و تنها وندهای کلمات به سیستم معرفی میگردند. از سوی دیگر در بسیاری از موارد عمل ریشهیابی کلمات بدون درنظر گرفتن نوع کلمه انجام میشود که منجر به نتایج نادرست میشوند. جهت غلبه بر مشکلات مطرح شده، در این مقاله مدلی جهت ریشهیابی کلمات در زبان فارسی با درنظر نوع کلمه معرفی خواهد گردید. نتایج حاصل از آزمایشات انجام شده، نشاندهنده افزایش درصد درستی در ریشهیابی لغات در زبان فارسی با استفاده از روش پیشنهادی در مقایسه با سایر روشهای ریشهیابی میباشد.
نویسندگان
دانیا تمدن
دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد علوم و تحقیقات خوزستان،گروه مهندسی کامپیوتر،اهواز
محمدحسین یکتایی
استادیار،دانشگاه آزاد اسلامی واحد آبادان،گروه مهندسی کامپیوتر،اهواز
ماشالله عباسی دزفولی
دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد علوم و تحقیقات خوزستان،گروه مهندسی کامپیوتر،اهواز
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :