روش های شناسایی متن در صحنه تصاویر واقعی در بازیابی اطلاعات

  • سال انتشار: 1397
  • محل انتشار: سومین کنفرانس ملی در مهندسی کامپیوتر، فناوری اطلاعات و پردازش داده ها
  • کد COI اختصاصی: CITCOMP03_015
  • زبان مقاله: فارسی
  • تعداد مشاهده: 648
دانلود فایل این مقاله

نویسندگان

شیدا عنبری

دانشکده فنی و مهندسی، دانشگاه بین المللی امام خمینی(ره)

نجیب اله رضایی

دانشکده فنی و مهندسی، دانشگاه بین المللی امام خمینی(ره)

مرتضی محمدی زنجیره

استادیار گروه مهندسی کامپیوتر، دانشگاه بین المللی امام خمینی(ره)

چکیده

شناسایی متن در تصاویر صحنه طبیعی یکی از مهم ترین ملزومات برای فهم اکثر اپلیکیشن های چند رسانه ای مبتنی بر محتوا می باشد. در این مقاله ابتدا یک روش ساده و موثر برای شناسایی متن در تصاویر صحنه طبیعی ارایه شده است که MSERs توسط الگوریتم V-MSER از کانال های G,H,S,O1,O2 به عنوان مولفه های کاندید استخراج می شود. از آنجا که متن شامل کاراکترهای کاندید است یک مدل مبتنی بر فیلد تصادفی مارکوف برای استفاده از ارتباط بین کاراکترها طراحی شده است. سپس برای فیلتر کردن مولفه های غیرمتنی یک مجموعه شامل یک شمای فیلترکردن دو لایه ای طراحی شده است. اکثر مولفه های غیرمتنی می توانند توسط لایه اول شمای فیلترکردن فیلتر شوند. لایه دوم شمای فیلترکردن، یک طبقه بند ادابوست است که با ویژگی های فشردگی، واریانس افقی، واریانس عمودی و نسبت ابعاد آموزش داده شده است. سپس تنها چهار ویژگی ساده برای تولید جفت های مولفه اتخاذ می شوند. و در آخر طبق شباهت جهت جفت های مولفه، آن جفت هایی که جهت یکسان دارند در یک خط متن ادغام می شوند.در روش دوم نیز یک روش برای طبقه بندی و بازیابی تصاویر صحنه طبیعی ارایه شده است که روی طبقه بندی مکان های تجاری و بازیابی لوگو تمرکز می کند. این روش از محتوای متنی در تصاویر برای طبقه بندی دانه ای مکان های تجاری و بازیابی لوگو استفاده می کند. برخلاف روش بالا از اهمیت کلمه [به جای کاراکتر] استفاده می کند و نشان داده می شود که سرنخ های متنی سطح کلمه، کاراتر از سرنخ های متنی سطح کاراکتر است و سرنخ های متنی سطح کلمه ارایه شده، بهتر از سرنخ های متنی سطح کاراکتر پیاده سازی دنیای واقعی انجام می شود. از یک روش جعبه کلمه های پیشنهادی بدون نظارت استفاده می شود که بهrecall شناسایی پیاده سازی دنیای واقعی کلمه می رسد

کلیدواژه ها

شناسایی متن در تصاویر صحنه طبیعی، نواحی حداکثر پایدار خارجی، الگوریتمV-MSER،طبقه بندی مکان های تجاری، بازیابی لوگو، سرنخ های متنی سطح کلمه، جعبه کلمه های پیشنهادی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.