تفکیک خطوط در اسناد و دست نوشته های زبان فارسی به روش همپوشانی و لبه یابی
- سال انتشار: 1393
- محل انتشار: اولین همایش ملی الکترونیکی پیشرفت های تکنولوژی در مهندسی برق، الکترونیک و کامپیوتر
- کد COI اختصاصی: TDCONF01_200
- زبان مقاله: فارسی
- تعداد مشاهده: 743
نویسندگان
دانشگاه آزاد اسلامی واحد علوم و تحقیقات خمین
دانشکده فنی و مهندسی گلپایگان
چکیده
با توجه به اینکه رشد و پیشرفت دانش بشر بسیار مدیون پیدایش خط و امکان ثبت و نگهداری اطلاعات بصورت نوشته می باشد. به مرور زمان کتاب ها و بایگانی روزنامه ها بصورت منابع عظیمی از اطلاعات نوشته بر روی کاغذ می باشند. در عصر کنونی با توجه به رشد سریع فناوری اطلاعات سه موضوع امکان جستجو در منابع اطلاعاتی، دسترسی سریع به منابع اطلاعاتی و بایگانی آسان جزو موارد لاینفک سیستم های اطلاع رسانی گشته است. بنابراین نیاز به تبدیل متون چاپی به اسناد الکترونیکی احساس می گردد. تفکیک خطوط دست نوشته ها هنوز یک بحث چالش انگیز در محدوده آنالیز کردن متن تصویری است. این به دلیل متغیر بودن دست نوشتهها که از فردی به فرد دیگر متفاوت است. و این موضوع سبب مشکلات زیادی از قبیل چند انحنای، همپوشانی و برخورد خطوط میباشد. در این مقاله ما یک تکنیک بهبود یافته برای تفکیک دست نوشته های خطی در نظر گرفته ایم روش پیشنهادی از سه مرحله اصلی تشکیل شده است که عبارتند از : الگوریتم رنگ آمیزی تکه ای(PPA) ، تخمین انحراف و فرآیند تشخیص لبه یابی. ما شیوه طرح ریزی شده را در اسناد انگلیسی و فارسی تست نموده ایم. میزان موفقیت این تکنیک که به طور آزمایشی مشاهده شد به ترتیب عبارت از 99/08% و 95/95% است. این پروژه به صورت قابل توجهی در توسعه برنامه های کاربردی مرتبط با OCR راهگشا می باشد.کلیدواژه ها
نویسه خوان نوری، تفکیک خط، همپوشانی، لبه یابیمقالات مرتبط جدید
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.