آشکارسازی و بازشناسی یکپارچه متن از تصاویر طبیعی با به کارگیری فرهنگ لغت

  • سال انتشار: 1399
  • محل انتشار: دوفصلنامه پردازش سیگنال پیشرفته، دوره: 4، شماره: 1
  • کد COI اختصاصی: JR_JASP-4-1_012
  • زبان مقاله: فارسی
  • تعداد مشاهده: 238
دانلود فایل این مقاله

نویسندگان

فاطمه نعیمی

دانشگاه آزاد اسلامی سمنان، گروه مهندسی برق

وحید قدس

باشگاه پژوهشگران جوان و نخبگان، واحد سمنان، دانشگاه آزاد اسلامی، سمنان، ایران

حسن خالصی

گروه مهندسی برق، واحد گرمسار، دانشگاه آزاد اسلامی، گرمسار، ایران.

چکیده

 در سال های اخیرآشکارسازی و بازشناسی متن در تصاویر طبیعی به طور گسترده مورد مطالعه قرار گرفته است. در این پژوهش، یک سیستم مکان یابی متن در صحنه چندجهته مقاوم برای به دست آوردن بازدهی بالا در آشکارسازی متن بر اساس شبکه عصبی پیچشی(CNN) ارائه شده است. روش پیشنهادی شامل سه لایه استخراج ویژگی، ادغام ویژگی و خروجی می باشد. در لایه استخراج ویژگی، یک لایه ReLU بهبود یافته(i.ReLU)  معرفی شده است. همچنین به منظورآشکارسازی متون با ابعاد متنوع، یک لایه inception بهبود یافته (i.inception)  ارائه شده است. سپس، برای بهبود استخراج ویژگی از یک لایه اضافی استفاده شده است که ساختار پیشنهادی را قادر می سازد متون چندجهته حتی منحنی و عمودی را آشکارسازی نماید. همچنین، یک چارچوب خط لوله برای بازشناسی کاراکتر پیشنهاد نموده ایم. چارچوب خط لوله پیشنهادی شامل دو خط لوله موازی است که به طور هم زمان پردازش می شوند. خط لوله اول، متشکل از کلمات برش یافته و خط لوله دوم شامل زوایای متن می باشد. سپس، یک فرهنگ لغت جهت اصلاح خطای احتمالی کلمات بازشناسی شده استفاده نمودیم. آزمایش ها بر روی مجموعه داده های ICDAR ۲۰۱۳، ICDAR ۲۰۱۵ وICDAR ۲۰۱۹، نشان از برتری بارز سیستم پیشنهادی نسبت به کارهای پیشین دارد.

کلیدواژه ها

مکان یابی متن در صحنه, آشکارسازی تصویر متن, چندجهته, شبکه عصبی پیچشی, بازشناسی متن, بازشناسی یکپارچه متن, فرهنگ لغت

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.