بازشناسی زیرحروف فارسی
سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 204
فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NREAS03_181
تاریخ نمایه سازی: 16 آبان 1400
چکیده مقاله:
بازشناسی اسناد فارسی همیشه با چالش پیوستگی نوشتار فارسی روبرو بوده است. وجود پیوستگی در ساختار نوشتار فارسی باعث شده است که سیستم های بازشناسی با خطای زیادی در مرحله بخش بندی کلمات روبرو باشند. در این پژوهش به جای بازشناسی حروف یا زیر کلمات فارسی، زیر حروف فارسی بازشناسی شده اند. استخراج زیرحروف براساس یک روش بی نیاز از تشخیص محل اتصال حروف انجام شده است. زیرحروف متناسب با جایگاهشان در بدنه زیر کلمه به چهار دسته زیرحروف ابتدایی، زیر حروف میانی، زیر حروف انتهایی و زیر حروف مجزا تقسیم شده اند. سپس زیر حروف استخراج شده به وسیله شبکه عصبی RBF سلسه مراتبی از یکدیگر تشخیص داده شده اند. برای این منظور ابتدا برخی از زیر حروف شاخص به وسیله ویژگی های شکلی شناسایی شده و از روند تشخیص زیر حروف خارج شده اند. برخی از زیرحروف ادغام شده و به صورت یک کلاس مشترک بررسی شده اند، در نتیجه تعداد کلاس ها کاهش پیدا کرده اند. زیرحروف ادغام شده به وسیله یک شبکه عصبی مجزا از هم تفکیک شده اند. نتایج ارائه شده کارایی بالای این روش را نشان میدهد.
کلیدواژه ها:
نویسندگان
زهرا بهمنی
عضو هیات علمی دانشگاه صنعتی خاتم الانبیاء بهبهان.