بازشناسی زیرحروف فارسی

سال انتشار: 1400
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 329

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICTBC04_008

تاریخ نمایه سازی: 5 شهریور 1400

چکیده مقاله:

بازشناسی اسناد فارسی همیشه یا چالش پیوستگی نوشتار فارسی روبرو بوده است. وجود پیوستگی در ساختار نوشتارفارسی باعث شده است که سیستم های بازشناسی با خطای زیادی در مرحله بخش بندی کلمات روبرو باشند. در این پژوهشبه جای بازشناسی حروف یا زیرکلمات فارسی، زیرحروف فارسی بازشناسی شده اند. استخراج زیرحروف براساس یک روشبی نیاز از تشخیص محل اتصال حروف انجام شده است. زیرحروف متناسب با جایگاهشان در بدنه زیرکلمه به چهار دستهزیرحروف ابتدایی، زیرحروف میانی، زیرحروف انتهایی و زیرحروف مجزا تقسیم شده اند. سپس زیرحروف استخراج شده بهوسیله شبکه عصبی RBF از یکدیگر تشخیص داده شده اند. نتایج نشان داده شده کارایی بالای این روش را نشان می دهد.

نویسندگان

زهرا بهمنی

عضو هیات علمی دانشگاه صنعتی خاتم الانبیاء بهبهان