CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تشخیص فونت حروف و کلمات چاپی فارسی

عنوان مقاله: تشخیص فونت حروف و کلمات چاپی فارسی
شناسه ملی مقاله: ISCEE16_425
منتشر شده در شانزدهمین کنفرانس دانشجویی مهندسی برق ایران در سال 1392
مشخصات نویسندگان مقاله:

عطیه محمدخانی - دانشجوی مهندسی کامپیوتر دانشگاه فنی و حرفه ای دانشکده شریعتی
فائزه مرواری - دانشجوی مهندسی کامپیوتر دانشگاه فنی و حرفه ای دانشکده شریعتی
محسن مشکی - مدرس گروه مهندسی کامپیوتر دانشگاه فنی و حرفه ای دانشکده شریعتی

خلاصه مقاله:
در این مقاله به بیان پیاده سازی الگوریتم تشخیص فونت در بازشناسی متون چاپی فارسی، با درجه تفکیک 300 نقطه بر اینچ پرداخته می شود. لازمه ی انجام این کار تشخیص قسمت های متنی تصویر ورودی از سایر قسمت ها می باشد. این روش مبتنی بر جداسازی خطوط متن بوده و با زیرکلمات نیز قابل تعمیم است و فرایند بازشناسی در چندین مرحله، با استفاده شبکه عصبی تقویت شده انجام می گیرد. پیش پردازش هایی نظیر رفع نویز و برطرف کردن کجی تصویر، انجام می شود. قسمت های متنی تصویر ورودی پس از اصلاح چرخش و رفع نویز با استفاده از شبکه ی عصبی تشخیص متن از غیرمتتن، مشخص و نواحی متن دار تصویر اولیه بازسازی می شود. شبکه ی عصبی استفاده شده در تشخیص نوع فونت به خوبی می تواند نوع فونت سند را تشخیص دهد که این مرحله در مراحل بعدی شناسایی کاراکتر تاثیر به سزایی دارد. این روش روی 8 نوع فونت فارسی با درجه تفکیک 300 نقطه بر اینچ آزمایش شده و دقت بازشناسی بالایی برای هر کدام حاصل شده است.

کلمات کلیدی:
تشخیص فونت، تشخیص متن از غیرمتن، سیستم نوری بازشناسی حروف، شبکه ی عصبی، متون فارسی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/265475/