اصلاح گسستگی های ناخواسته در متون چاپی فارسی با گسترش مورفولوژی

  • سال انتشار: 1385
  • محل انتشار: دوازدهمین کنفرانس سالانه انجمن کامپیوتر ایران
  • کد COI اختصاصی: ACCSI12_027
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1485
دانلود فایل این مقاله

نویسندگان

هادی گرایلو

دانشگاه تربیت مدرس، بخش مهندسی برق

احسان اله کبیر

دانشگاه تربیت مدرس، بخش مهندسی برق

چکیده

در بازشناسی متون عموما فرض بر این است که آنها خراب یا آسیب دیده نیستند. با پایین آمدن کیفیت تصاویر دقت الگوریتمهای تشخیص متون تا حد قابل توجهی پایین می آید. لذا اصلاح گسستگی متون زمینه مهمی از تحقیقات شده است. در این مقاله تصاویر دو دویی متون را بر حسب نوع گسستگی در آنها به پنج دسته تقسیم می کنیم و از عملگر گسترش مورفولوژی برای اصلااح گسستگی ها استفاده می کنیم. شکل و ابعاد ماسک در میزان موفقیت یک عملگر بسیار مهم است. ما در این کار مناسبترین شکل و ابعاد ماسک را طوری که تا حد امکان بیشترین تعداد گسستگی ها را اصلاح کند و در عین حال اتصال ناخواسته بوجود نیاورد، به کمک تصاویر تمرین و ازمایش پیدا و ارزیابی می کنیم.

کلیدواژه ها

اصلاح گسستگی متون ، عملگر گسترش ، مورفولوژی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.