بهبود تصحیح غلط املایی در زبان کردی با تغییر وزندهی در کمترین فاصله ویرایشی
محل انتشار: دومین کنفرانس ملی محاسبات نرم
سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,080
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSCG02_012
تاریخ نمایه سازی: 7 اسفند 1396
چکیده مقاله:
دراین مقاله روشی برای تصحیح خودکارغلط های املایی زبان کردی ارایه شده است درروش پیشنهادی ازSoundex برای کدگذاری کلمات وپیشنهادکلمات کاندید برای تصحیح غلط املایی استفاده شده است برای اولویت دادن به کلمات پیشنهادی نخست فاصله ویرایشی لونشتاین به کارگرفته شد سپس با تغییر درهزینه ی جایگزینی حروف ویژه ی زبان کردی نرخ تصحیح خطا و کارایی سیستم افزایش داده شد برای آزمودن الگوریتم ارایه شده یک مجموعه آزمون با تعداد 399 کلمه دارای خطای املایی جمع اوری گردیده است برای ایجادفرهنگ لغات کردی گزینش کلمات براساس تعداد تکرار وقواعد زبانی انجام گرفته تا ازقرارگیری واژه نامعتبر درفرهنگ لغات جلوگیری شود درروش پیشنهادی نسبت به روشهای عمومی برای دیگرزبانها مانند لونشتاین درنرخ تصحیح خطا 3.76 درصد بهبود داشته و وجود کلمه ی درست دراولین پیشنهاد 10.03 درصد بهبود یافته است
کلیدواژه ها:
نویسندگان
آرش امانی
دانشجوی کارشناسی ارشد، دانشگاه آزاد واحد علوم و تحقیقات تهران، تهران
عباس کوچاری
استادیار، دانشگاه آزاد واحد علوم و تحقیقات تهران، تهران