تشخیص فونت حروف و کلمات چاپی فارسی

سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,006

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ISCEE16_425

تاریخ نمایه سازی: 21 تیر 1393

چکیده مقاله:

در این مقاله به بیان پیاده سازی الگوریتم تشخیص فونت در بازشناسی متون چاپی فارسی، با درجه تفکیک 300 نقطه بر اینچ پرداخته می شود. لازمه ی انجام این کار تشخیص قسمت های متنی تصویر ورودی از سایر قسمت ها می باشد. این روش مبتنی بر جداسازی خطوط متن بوده و با زیرکلمات نیز قابل تعمیم است و فرایند بازشناسی در چندین مرحله، با استفاده شبکه عصبی تقویت شده انجام می گیرد. پیش پردازش هایی نظیر رفع نویز و برطرف کردن کجی تصویر، انجام می شود. قسمت های متنی تصویر ورودی پس از اصلاح چرخش و رفع نویز با استفاده از شبکه ی عصبی تشخیص متن از غیرمتتن، مشخص و نواحی متن دار تصویر اولیه بازسازی می شود. شبکه ی عصبی استفاده شده در تشخیص نوع فونت به خوبی می تواند نوع فونت سند را تشخیص دهد که این مرحله در مراحل بعدی شناسایی کاراکتر تاثیر به سزایی دارد. این روش روی 8 نوع فونت فارسی با درجه تفکیک 300 نقطه بر اینچ آزمایش شده و دقت بازشناسی بالایی برای هر کدام حاصل شده است.

کلیدواژه ها:

تشخیص فونت ، تشخیص متن از غیرمتن ، سیستم نوری بازشناسی حروف ، شبکه ی عصبی ، متون فارسی

نویسندگان

عطیه محمدخانی

دانشجوی مهندسی کامپیوتر دانشگاه فنی و حرفه ای دانشکده شریعتی

فائزه مرواری

دانشجوی مهندسی کامپیوتر دانشگاه فنی و حرفه ای دانشکده شریعتی

محسن مشکی

مدرس گروه مهندسی کامپیوتر دانشگاه فنی و حرفه ای دانشکده شریعتی

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • A.I. Al-Shoshan Arabic OCR Based on Image Invariants. Proc. of ...
  • Trends, p. 150-154. 200. ...
  • R.Plamondon&N Srihari 2000 ...
  • نمایش کامل مراجع