مروری بر نویز و روش های حذف نویز در صفحات اسکن شده
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 963
فایل این مقاله در 19 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ITCC01_173
تاریخ نمایه سازی: 9 فروردین 1395
چکیده مقاله:
امروزه کامپیوتر در بسیاری از جنبه های زندگی بشر دخیل شده است یکی از نتایج این مورد سند های دیجیتال میباشد.کامپیوتر درکی از سندهای نوشته شده ندارد ، بنابراین ما نیاز به تبدیل سند های دستنوشته به سند های دیجیتال داریم به اینمنظور که بتوانیم آنها را با کامپیوتر پردازش کنیم . یکی از مشهورترین روش ها برای این کار سیستم تشخیص متن می باشد (OCR)کاربردهای زیادی در زمینه سیستم تشخیص متن انگلیسی انجام گرفته است اما در زمینه زبان فارسی / عربی هنوز در حال توسعه است.یکی از اصلی ترین مشکلات در مورد زبان های فارسی / عربی حذف نویز است . به این خاطر که نقطه ها در زبان عربی و فارسینقش اساسی دارند و این موارد به سادگی به عنوان نویز شناخته می شوند ، بنابراین قضیه حذف نویز ها از یک سند فارسی بسیارسخت تر از حذف نویز یک متن معادل در زبان انگلیسی است . در این مقاله به مرور و معرفی خصوصیات و انواع نویز ، خصوصیاتزیان عربی . فارسی ، روش های متداول حذف نویز)همراه بامعرفی تابع های آن در متلب( ، بررسی یک روش جدید که به عنوانبخشی از قطعه بندی صفحه در نظر گرفته شده است خواهیم پرداخت.
کلیدواژه ها:
نویسندگان
بهزاد صادقی
دانشجو،کارشناسی ارشد،کامپیوتر،دانشکده برق وکامپیوتر دانشگاه آزاد ،واحد زنجان
رسول بابایی
دانشجو،کارشناسی ارشد،کامپیوتر،دانشکده برق وکامپیوتر دانشگاه آزاد ،واحد زنجان
مهدی حریری
استادیار و عضو هیئت علمی ، دانشکده برق و کامپیوتر دانشگاه آزاد اسلامی واحد زنجان
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :