CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تفکیک خطوط در اسناد و دست نوشته های زبان فارسی به روش همپوشانی و لبه یابی

عنوان مقاله: تفکیک خطوط در اسناد و دست نوشته های زبان فارسی به روش همپوشانی و لبه یابی
شناسه ملی مقاله: TDCONF01_200
منتشر شده در اولین همایش ملی الکترونیکی پیشرفت های تکنولوژی در مهندسی برق، الکترونیک و کامپیوتر در سال 1393
مشخصات نویسندگان مقاله:

حمید رضا حدادی - دانشگاه آزاد اسلامی واحد علوم و تحقیقات خمین
وحیده السادات صادقی - دانشکده فنی و مهندسی گلپایگان

خلاصه مقاله:
با توجه به اینکه رشد و پیشرفت دانش بشر بسیار مدیون پیدایش خط و امکان ثبت و نگهداری اطلاعات بصورت نوشته می باشد. به مرور زمان کتاب ها و بایگانی روزنامه ها بصورت منابع عظیمی از اطلاعات نوشته بر روی کاغذ می باشند. در عصر کنونی با توجه به رشد سریع فناوری اطلاعات سه موضوع امکان جستجو در منابع اطلاعاتی، دسترسی سریع به منابع اطلاعاتی و بایگانی آسان جزو موارد لاینفک سیستم های اطلاع رسانی گشته است. بنابراین نیاز به تبدیل متون چاپی به اسناد الکترونیکی احساس می گردد. تفکیک خطوط دست نوشته ها هنوز یک بحث چالش انگیز در محدوده آنالیز کردن متن تصویری است. این به دلیل متغیر بودن دست نوشتهها که از فردی به فرد دیگر متفاوت است. و این موضوع سبب مشکلات زیادی از قبیل چند انحنای، همپوشانی و برخورد خطوط میباشد. در این مقاله ما یک تکنیک بهبود یافته برای تفکیک دست نوشته های خطی در نظر گرفته ایم روش پیشنهادی از سه مرحله اصلی تشکیل شده است که عبارتند از : الگوریتم رنگ آمیزی تکه ای(PPA) ، تخمین انحراف و فرآیند تشخیص لبه یابی. ما شیوه طرح ریزی شده را در اسناد انگلیسی و فارسی تست نموده ایم. میزان موفقیت این تکنیک که به طور آزمایشی مشاهده شد به ترتیب عبارت از 99/08% و 95/95% است. این پروژه به صورت قابل توجهی در توسعه برنامه های کاربردی مرتبط با OCR راهگشا می باشد.

کلمات کلیدی:
نویسه خوان نوری، تفکیک خط، همپوشانی، لبه یابی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/362562/