تشخیص فونت حروف و کلمات چاپی فارسی
محل انتشار: شانزدهمین کنفرانس دانشجویی مهندسی برق ایران
سال انتشار: 1392
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,006
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ISCEE16_425
تاریخ نمایه سازی: 21 تیر 1393
چکیده مقاله:
در این مقاله به بیان پیاده سازی الگوریتم تشخیص فونت در بازشناسی متون چاپی فارسی، با درجه تفکیک 300 نقطه بر اینچ پرداخته می شود. لازمه ی انجام این کار تشخیص قسمت های متنی تصویر ورودی از سایر قسمت ها می باشد. این روش مبتنی بر جداسازی خطوط متن بوده و با زیرکلمات نیز قابل تعمیم است و فرایند بازشناسی در چندین مرحله، با استفاده شبکه عصبی تقویت شده انجام می گیرد. پیش پردازش هایی نظیر رفع نویز و برطرف کردن کجی تصویر، انجام می شود. قسمت های متنی تصویر ورودی پس از اصلاح چرخش و رفع نویز با استفاده از شبکه ی عصبی تشخیص متن از غیرمتتن، مشخص و نواحی متن دار تصویر اولیه بازسازی می شود. شبکه ی عصبی استفاده شده در تشخیص نوع فونت به خوبی می تواند نوع فونت سند را تشخیص دهد که این مرحله در مراحل بعدی شناسایی کاراکتر تاثیر به سزایی دارد. این روش روی 8 نوع فونت فارسی با درجه تفکیک 300 نقطه بر اینچ آزمایش شده و دقت بازشناسی بالایی برای هر کدام حاصل شده است.
کلیدواژه ها:
نویسندگان
عطیه محمدخانی
دانشجوی مهندسی کامپیوتر دانشگاه فنی و حرفه ای دانشکده شریعتی
فائزه مرواری
دانشجوی مهندسی کامپیوتر دانشگاه فنی و حرفه ای دانشکده شریعتی
محسن مشکی
مدرس گروه مهندسی کامپیوتر دانشگاه فنی و حرفه ای دانشکده شریعتی
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :