مقایسه کارآیی الگوریتم های تشخیص کجی در تصاویر اسناد متنی

  • سال انتشار: 1392
  • محل انتشار: اولین کنفرانس ملی نوآوری در مهندسی کامپیوتر و فنآوری اطلاعات
  • کد COI اختصاصی: CEIT01_186
  • زبان مقاله: فارسی
  • تعداد مشاهده: 593
دانلود فایل این مقاله

نویسندگان

فاطمه شیری

دانشجوی کارشناسی ارشد، کامپیوتر نرم افزار دانشگاه پیام نور مرکز تهران واحد شهر ری

سید علی رضوی ابراهیمی

استادیار بخش مهندسی کامپیوتر و فناوری اطلاعات دانشگاه پیام نور تهران

چکیده

تشخیص کجی تصاویر اسناد از اهمیت زیادی در سیستم شناسایی و آنالیز اسناد برخودار است، بسیاری از روش های آنالیز تصویر سند از قبیل قطعه بندی، شناسایی سند و آنالیز طرح منطقی و هندسی به زاویه انحراف سند حساس هستند وحتی اگر زاویه انحراف کوچک باشد با افت شدید کارآیی مواجه میشوند. بنابر این فرایند تشخیص و تصحیح کجی سند به عنوان یک قدم پیش پردازشی مهم در اکثر روش های آنالیز اسناد مطرح است. مطالعه بر روی تحقیقات انجام شده در این زمینه، نشان می دهد که با توجه به پیچیدگی درونی اسناد، بعضی از روش ها، تنها اسناد دارای زاویه انحراف کوچک و یا دارای محتوا یا طرح خاصی را پردازش می کنند واز هزینه محاسبات بالایی بر خور دارند. علاوه بر این، اکثر الگوریتم های ارائه شده در این زمینه، برای تشخیص کجی تصویر در اسناد لاتین به کار رفته اند، با اینکه مشکل کجی برای اسناد لاتین تا حدودی مرتفع شده است، ولی به دلیل ساختار متفاوت متون در اسناد فارسی، نتایج خوبی برای اسناد فارسی ارائه نمی دهند. هدف این مقاله این است که ، ضمن بررسی جدیدترین الگوریتم های موجود در این زمینه، روش های موجود برای تشخیص کجی در تصاویر اسناد فارسی به طور جداگانه مورد مطالعه قرار گیرد و ضمن بررسی نقاط ضعف و قوت هر یک ، به مقایسه کارآیی آن ها پرداخته و پس از آن کارآیی روش های موجود برای اسناد لاتین نیز به طور جداگانه مورد مطالعه و مقایسه قرار گیرد.

کلیدواژه ها

تشخیص زاویه کجی، آنالیز تصویر سند، تبدیل هاف، مستندات چند زبانه، مستندات پیچیده

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.