روش جدید استخراج متون فارسی از تصاویر پیچیده مکان‌های تجاری بر پایه تکنیک‌های پردازش تصویر

  • سال انتشار: 1392
  • محل انتشار: هشتمین کنفرانس ماشین بینایی و پردازش تصویر ایران
  • کد COI اختصاصی: ICMVIP08_122
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1152
دانلود فایل این مقاله

نویسندگان

حسین محمدی خواجه

گروه مهندسی الکترونیک - دانشکده مهندسی برق و کامپیوتر - دانشگاه بیرجند

جواد صدری

استادیار گروه کامپیوتر و فناوری اطلاعات - دانشکده مهندسی برق و کامپیوتر - دانشگاه بیرجند

محمد رضوی

استادیار گروه مهندسی الکترونیک - دانشکده مهندسی برق و کامپیوتر - دانشگاه بیرجند

چکیده

در این مقاله روشی جدید برای استخراج متون فارسی از تصاویر تجاری با استفاده از اپراتور لب یاب کنی و اعمال عملیات مورفولوژیکی بر روی لبه‌های به‌دست‌آمده ارائه می‌شود که با حذف نواهی دین متن توسط ویژگی‌های ذاتی متون، نواحی کاندید متن تشخیص داده می‌شوند. در واقع تصویر رنگی داده‌شده به الگوریتم، ابتدا طی تکنیک‌های پردازش تصویر حذف نویز شده و یا تحلیل هیستوگرام و تنظیم آن، مرز نواحی متن و زمینه آن برجسته‌تر می‌شود سپس با استفاده از اپراتور حایل لبه یاب، لبه‌های تصویر کشف و با اعمال عملیات مورفولوژیکی گسترش می‌یابند. نواحی کانی به متن با توجه به خواص ذاتی و پیوستگی فاصله آن‌ها، به هم اتصال یافته و نواهی دین متن با در نظر گرفتن برخی ویژگی‌های هندسی حذف خواهند شد در نهایت نواحی کاندید متن حاصل به طور محلی پردازش می‌شود و خروجی الگوریتم یک تصویر باینری شامل موتور سیاه در پس زمینه سفید خواهد بود. آزمایش‌های تجربی گویای عملکرد خوب و سریع این الگوریتم و برتری آن بر روش‌های دیگر در شرایط چالشی است.

کلیدواژه ها

استخراج متن، تشخیص لب، پردازش تصویر، بینایی ماشین، بازشناسی الگو، عملیات مورفولوژی ، ویژگی‌های هندسی

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.