الگوریتم اصلاح شده جداسازی حروف متون چاپی با برچسب زدن به کانتور بالایی کلمات

  • سال انتشار: 1383
  • محل انتشار: دوفصلنامه روشهای عددی در مهندسی، دوره: 23، شماره: 1
  • کد COI اختصاصی: JR_JCME-23-1_003
  • زبان مقاله: فارسی
  • تعداد مشاهده: 204
دانلود فایل این مقاله

نویسندگان

حسین نظام آبادی پور

احسان اله کبیر و رضا عزمی

چکیده

در این مقاله با اصلاح الگوریتم عزمی که مبتنی بر کانتور بالایی کلمات است، الگوریتم جداسازی مناسبی برای متون با کیفیت چاپی پایین ارائه شده است. برای حل مشکل نایکنواختی نوار زمینه خط،روش مناسبی برای تعیین نوار زمینه محلی پیشنهاد شده و با اصلاح روش بر چسب زنی کانتور بالایی وتکمیل قواعد جداسازی، دقت الگوریتم افزایش داده شده است. نرخ جداسازی درست حروف ۹۷% است. بر اساس نتایج به دست آمده، بررسی دقیقی درباره علل خطاها ارائه شده است که می تواند راهگشای تحقیقات بعدی در این زمینه باشد

کلیدواژه ها

Character Segmentation, Farsi Printed text, Local baseline, Upper contour, Histogram, Segmental code, Labeling, جداسازی حروف، متون چاپی فارسی، نوار زمینه محلی، کانتور بالایی، هیستوگرام،کد زنجیره ای، برچسب زنی

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.