مروری بر روش های یادگیری ژرف در بازشناسی نوری نویسه ها با تاکید بر رسم الخط های فارسی، عربی و اردو

  • سال انتشار: 1400
  • محل انتشار: مجله ماشین بینایی و پردازش تصویر، دوره: 8، شماره: 4
  • کد COI اختصاصی: JR_JMVIP-8-4_004
  • زبان مقاله: فارسی
  • تعداد مشاهده: 459
دانلود فایل این مقاله

نویسندگان

شیما کاشف

گروه پژوهشی سیستم های هوشمند واژه، کرمان، ایران

حسین نظام آبادی پور

دانشگاه شهید باهنر کرمان، بخش مهندسی برق

الهام شعبانی نیا

دانشکده مهندسی کامپیوتر، دانشگاه صنعتی سیرجان، سیرجان، ایران

چکیده

در سال های اخیر موفقیت شبکه های عصبی کانولوشنی ژرف در تشخیص و بازشناسی اشیا سبب جلب توجه بسیاری از حوزه های مختلف یادگیری ماشین، از جمله حوزه بازشناسی نوری نویسه ­ها، به این مقوله شده است. یکی از چالش های مهم این حوزه، استخراج ویژگی های متمایزکننده و حاوی اطلاعات است. غالب روش هایی که در سال های گذشته در بازشناسی نوری حروف مطرح شدند، مبتنی بر ویژگی های دستی هستند که توانایی تعمیم پذیری محدودی دارند. امروزه به کمک شبکه های کانولوشنی می توان استخراج ویژگی را به صورت خودکار و با کارایی فوق العاده ای به ماشین سپرد و بازشناسی حروف جدا، ارقام و لیگاتورها را بادقت بالایی انجام داد.  همچنین، ساختارهایی بر مبنای ترکیب شبکه های کانولوشنی و بازگشتی  پیشنهاد شده اند، که می توانند بدون نیاز به جداسازی حروف، بازشناسی را انجام دهند. این رویکرد در سال های اخیر مورد توجه زیاد محققان بینایی ماشین قرار گرفته است؛ چرا که به کمک این شبکه ها می توان به شکل مستقل از زبان، بازشناسی را تنها با توجه به مجموعه آموزشی انجام داد. هدف از این مقاله، مروری بر کارهای انجام شده با  این رویکرد نوین در حوزه بازشناسی نوری نویسه ها است. در ادامه، پس از بیان مسئله و مروری مختصر بر روش های قبل، روش های مبتنی بر الگوریتم های ژرف و ویژگی های آن ها با تفصیل بیشتری ارزیابی می­شوند. از آنجا که تاکید این مقاله روی تحقیقات بازشناسی نوری حروف در رسم الخط های پیوسته، نظیر فارسی، عربی و اردو است، کارهای انجام شده در این حوزه ها نیز در بخشی جداگانه مرور می شوند. همچنین، ضمن معرفی مجموعه­ های داده معروف برای کاربردهای مختلف و مروری بر معیارهای ارزیابی روش های بازشناسی نوری حروف، مهم ترین نرم افزارهای اختصاصی و بسته های نرم افزاری متن بازی که برای بازشناسی حروف استفاده می­شوند، معرفی خواهند شد.

کلیدواژه ها

بازشناسی نوری نویسه ها, الگوریتم های یادگیری ژرف, پایگاه های داده, رسم الخط فارسی, عربی و اردو

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.