نویسه خوانی نوری (OCR) در خط های شکسته با استفاده از شبکه های تشخیص شیء

سال انتشار: 1404
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 51

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_TJEE-55-1_008

تاریخ نمایه سازی: 1 تیر 1404

چکیده مقاله:

نویسه خوانی نوری (OCR) در خط های شکسته، که در آن حروف یک کلمه به هم چسبیده هستند و در جهت های افقی و عمودی با هم همپوشانی دارند، با چالش های زیادی در هنگام جداسازی نویسه های تشخیص داده نشده و تشخیص نویسه های جدا نشده روبه رو می شود. در این مقاله، ما استفاده از مدل های تشخیص شیء را برای تشخیص نویسه ها در خط های شکسته پیشنهاد می کنیم. سادگی اجرا و کارایی این روش در شناخت قلم های سبک دست نویس بررسی خواهد شد. در این پژوهش از شبکه یولو برای جداسازی و طبقه بندی نویسه های کلمات دلخواه سه حرفی در خط فارسی به عنوان مطالعه موردی استفاده شده است. در ابتدا مجموعه داده مناسب برای شبکه یولو را از قلم های فارسی با سبک دست نویس مانند مانلی و ایران نستعلیلق تولید کردیم. با استفاده از شبکه یولو به دقت بالای ۹۸.۵٪ در تشخیص نویسه های قلم مانلی و ۹۷.۶٪ برای ترکیب کلمات در قلم های مانلی و ایران نستعلیق دست یافتیم. سپس، آستانه دقت مدل پیشنهادی را با اضافه کردن نویز، تاری و چولگی به نمونه ها به چالش کشیدیم. علاوه بر این، ما از یک مدل پرسپترون چند لایه (MLP) برای پیش بینی کلمات از نویسه های شناسایی شده و مکان یابی شده توسط یولو با دقت بیش از ۹۷.۷٪ استفاده کردیم. این رویکرد ما را قادر می سازد تا بدون استفاده از لغت نامه فارسی، کلمات کامل با قلم های پیچیده به سبک دست نویس را به طور دقیق تشخیص دهیم.

کلیدواژه ها:

نویسه خوانی نوری (OCR) ، تشخیص شیء ، شبکه یولو ، شبکه عصبی پرسپترون چند لایه (MLP) ، خط فارسی ، قلم های سبک دست نویس

نویسندگان

Mojtaba Gandomkar

دانشگاه صنعتی جندی شاپور دزفول، دزفول، ایران.

Sahar Khoramipour

دانشگاه صنعتی جندی شاپور دزفول، دزفول، ایران