بازشناسی قلمهای فارسی به کمک ضرایب خودهمبستگی

  • سال انتشار: 1385
  • محل انتشار: چهارمین کنفرانس ماشین بینایی و پردازش تصویر
  • کد COI اختصاصی: ICMVIP04_007
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1758
دانلود فایل این مقاله

نویسندگان

عصمت راشدی

دانشگاه شهید باهنر کرمان

حسین نظام آبادی پور

دانشگاه شهید باهنر کرمان

سعید سریزدی

دانشگاه شهید باهنر کرمان

چکیده

در این تحقیق ویژگی جدید ضرایب خود همبستگی برای استخراج از اسناد متنی به منظور بازشناسی قلم های فارسی معرفی شده است. در این روش، تصویر سند مستقل از محتوای متن به عنوان یک تصویر بافت دار در نظر گرفته می شود که بافت متن، وابسته به نوع قلم می باشد. سپس ضرایب خود همبستگی به عنوان ویژگیهای مناسب برای طبقه بندی قلمهای مختلف استخراج می شود . روش پیشنهادی روی مجموعه ای شامل 1000 زیرتصویر از 20 نوع قلم متداول فارسی آزمایش شده است . نرخ بازش ناسی 95.7 به کمک همسایه نزدیکتر، مناسب بودن روش پیشنهاد شده k طبقه بند را نشان می دهد . در این مقاله همچنین استفاده از الگوریتم وراثتی برای کاهش بعد بردار ویژگی پیشنهاد شده است که علاوه بر کاهش میزان ویژگیهای استخراجی به کمتر از نصف، افزایش دقت طبقه بندی به نرخ بازشناسی 96.9 نیز حاصل شده است.

کلیدواژه ها

بازشناسی متون چاپی، بازشناسی قلم، ضرایب خود همبستگی، الگوریتم وراثتی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.