تشخیص حروف چاپی فارسی با استفاده از روش ترکیبی
سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 2,721
فایل این مقاله در 12 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
DOROUDIT01_097
تاریخ نمایه سازی: 7 آذر 1391
چکیده مقاله:
در تشخیص حروف بتن مبتنی بر الفبای عربی به دلیل متصل بودن حروف، مشکلات عمدهای در مراحل جداسازی و تشخیص وجود دارد. زیرا به علت اتصال حروف فارسی به یکدیگر، امکان تنظیم دقیق نقاط جداسازی حروف وجود ندارد. برای غلبه بر این مشکلات در این مقاله، روشی ترکیبی برای تشخیص حروف فارسی ارائه شده است که در آن جداسازی حروف (که منبع اصلی خطا در سیستمهای تشخیص حروف فارسی کنونی است) به صورت کامل انجام نشده و فقط حرف اول هر زیر کلمه جدا شده و تشخیص داده میشود . سپس این حرف اول، معیاری برای دسته بندی زیر کلمات قرار میگیرد و هر زیر کلمه فقط در دست مربوط تشخیص داده نمیشود . این روش روشی انعطافپذیر و قدرتمند است که میتواند بهآسانی توسعه داده شود و برای فونت های ختلف به کار برده شود. همچنین با استفاده از روشهای پیش پردازش و پس پردازش مناسب، چارچوب ساده و صمیمی کامل پیشنهاد میدهد . نتایج آزمایش روی متون مختلف، دقت بالای این روش را نشان میدهد که OCR برای توسعه سیستم برای استفاده صفات تجاری مناسب میباشد .
کلیدواژه ها:
نویسندگان
محسن زند
عضو هیئت علمی گروه کامپیوتر دانشگاه آزاد اسلامی واحد دورود
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :