بازشناسی زیرحروف فارسی

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 137

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

NREAS03_181

تاریخ نمایه سازی: 16 آبان 1400

چکیده مقاله:

بازشناسی اسناد فارسی همیشه با چالش پیوستگی نوشتار فارسی روبرو بوده است. وجود پیوستگی در ساختار نوشتار فارسی باعث شده است که سیستم های بازشناسی با خطای زیادی در مرحله بخش بندی کلمات روبرو باشند. در این پژوهش به جای بازشناسی حروف یا زیر کلمات فارسی، زیر حروف فارسی بازشناسی شده اند. استخراج زیرحروف براساس یک روش بی نیاز از تشخیص محل اتصال حروف انجام شده است. زیرحروف متناسب با جایگاهشان در بدنه زیر کلمه به چهار دسته زیرحروف ابتدایی، زیر حروف میانی، زیر حروف انتهایی و زیر حروف مجزا تقسیم شده اند. سپس زیر حروف استخراج شده به وسیله شبکه عصبی RBF سلسه مراتبی از یکدیگر تشخیص داده شده اند. برای این منظور ابتدا برخی از زیر حروف شاخص به وسیله ویژگی های شکلی شناسایی شده و از روند تشخیص زیر حروف خارج شده اند. برخی از زیرحروف ادغام شده و به صورت یک کلاس مشترک بررسی شده اند، در نتیجه تعداد کلاس ها کاهش پیدا کرده اند. زیرحروف ادغام شده به وسیله یک شبکه عصبی مجزا از هم تفکیک شده اند. نتایج ارائه شده کارایی بالای این روش را نشان میدهد.

کلیدواژه ها:

بخش بندی بدنه زیر کلمات ، بازشناسی زیر حروف ، شبکه های عصبی

نویسندگان

زهرا بهمنی

عضو هیات علمی دانشگاه صنعتی خاتم الانبیاء بهبهان.