کاهش فضای جستجو برای بازشناسی زیرکلمات تایپی فارسی با استفاده از ویژگی های ساده، کوانتیزاسیون ویژگی و ترکیب طبقه بندها
سال انتشار: 1399
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 78
فایل این مقاله در 14 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JSCIT-9-2_005
تاریخ نمایه سازی: 25 مهر 1403
چکیده مقاله:
در این مقاله روشی برای کاهش فضای جستجو در بازشناسی زیرکلمات چاپی فارسی ارائه می شود. ابتدا ۱۰ ویژگی ساده از زیرکلمه استخراج می شود. با استفاده از مفهوم کوانتیزاسیون و با توجه به بازه تغییرات هر ویژگی روی همه داده های آموزشی ویژگی ها کوانتیزه شده و به اعداد صحیحی تبدیل می شوند. با استفاده از هر ویژگی و فاصله آن تا ویژگی متناظر هر کدام از نمونه های آموزشی، به هر کلاس امتیازی داده می شود. با اعمال همه ویژگی ها، هر کلاس به ازای هر ویژگی یک امتیاز دارد که با ترکیب این امتیازات با اعمال جبری یک امتیاز نهایی برای هر زیرکلمه بدست می آید که با مرتب کردن آنها و انتخاب تعدادی از آنها که امتیاز بیشتری دارند، فضای جستجو محدود می شود. از اعمال جبری جمع، ضرب، بیشینه، کمینه و جمع وزن دار برای ترکیب امتیازات استفاده شده است. روش جمع وزن دار، که وزن های بهینه با الگوریتم بهینه سازی جمعیت ذرات تعیین شده اند، بهترین پاسخ را داده است.
کلیدواژه ها:
Farsi Subwords Recognition ، Particle Swarm Optimization (PSO) ، Fusion of Classifiers ، Search space reduction ، Feature Quantization
نویسندگان
esmail miri
Faculty of Electrical and Computer Engineering, University of Birjand, Birjand, Iran
Seyyed Mohmad Razavi
Faculty of Electrical and Computer Engineering, University of Birjand, Birjand, Iran
naser mehrshad
Faculty of Electrical and Computer Engineering, University of Birjand, Birjand, Iran
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :