روش جدید استخراج متون فارسی از تصاویر پیچیده مکانهای تجاری بر پایه تکنیکهای پردازش تصویر
- سال انتشار: 1392
- محل انتشار: هشتمین کنفرانس ماشین بینایی و پردازش تصویر ایران
- کد COI اختصاصی: ICMVIP08_122
- زبان مقاله: فارسی
- تعداد مشاهده: 1152
نویسندگان
گروه مهندسی الکترونیک - دانشکده مهندسی برق و کامپیوتر - دانشگاه بیرجند
استادیار گروه کامپیوتر و فناوری اطلاعات - دانشکده مهندسی برق و کامپیوتر - دانشگاه بیرجند
استادیار گروه مهندسی الکترونیک - دانشکده مهندسی برق و کامپیوتر - دانشگاه بیرجند
چکیده
در این مقاله روشی جدید برای استخراج متون فارسی از تصاویر تجاری با استفاده از اپراتور لب یاب کنی و اعمال عملیات مورفولوژیکی بر روی لبههای بهدستآمده ارائه میشود که با حذف نواهی دین متن توسط ویژگیهای ذاتی متون، نواحی کاندید متن تشخیص داده میشوند. در واقع تصویر رنگی دادهشده به الگوریتم، ابتدا طی تکنیکهای پردازش تصویر حذف نویز شده و یا تحلیل هیستوگرام و تنظیم آن، مرز نواحی متن و زمینه آن برجستهتر میشود سپس با استفاده از اپراتور حایل لبه یاب، لبههای تصویر کشف و با اعمال عملیات مورفولوژیکی گسترش مییابند. نواحی کانی به متن با توجه به خواص ذاتی و پیوستگی فاصله آنها، به هم اتصال یافته و نواهی دین متن با در نظر گرفتن برخی ویژگیهای هندسی حذف خواهند شد در نهایت نواحی کاندید متن حاصل به طور محلی پردازش میشود و خروجی الگوریتم یک تصویر باینری شامل موتور سیاه در پس زمینه سفید خواهد بود. آزمایشهای تجربی گویای عملکرد خوب و سریع این الگوریتم و برتری آن بر روشهای دیگر در شرایط چالشی است.کلیدواژه ها
استخراج متن، تشخیص لب، پردازش تصویر، بینایی ماشین، بازشناسی الگو، عملیات مورفولوژی ، ویژگیهای هندسیاطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.