نویسه خوانی نوری (OCR) در خط های شکسته با استفاده از شبکه های تشخیص شیء
سال انتشار: 1404
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 51
فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_TJEE-55-1_008
تاریخ نمایه سازی: 1 تیر 1404
چکیده مقاله:
نویسه خوانی نوری (OCR) در خط های شکسته، که در آن حروف یک کلمه به هم چسبیده هستند و در جهت های افقی و عمودی با هم همپوشانی دارند، با چالش های زیادی در هنگام جداسازی نویسه های تشخیص داده نشده و تشخیص نویسه های جدا نشده روبه رو می شود. در این مقاله، ما استفاده از مدل های تشخیص شیء را برای تشخیص نویسه ها در خط های شکسته پیشنهاد می کنیم. سادگی اجرا و کارایی این روش در شناخت قلم های سبک دست نویس بررسی خواهد شد. در این پژوهش از شبکه یولو برای جداسازی و طبقه بندی نویسه های کلمات دلخواه سه حرفی در خط فارسی به عنوان مطالعه موردی استفاده شده است. در ابتدا مجموعه داده مناسب برای شبکه یولو را از قلم های فارسی با سبک دست نویس مانند مانلی و ایران نستعلیلق تولید کردیم. با استفاده از شبکه یولو به دقت بالای ۹۸.۵٪ در تشخیص نویسه های قلم مانلی و ۹۷.۶٪ برای ترکیب کلمات در قلم های مانلی و ایران نستعلیق دست یافتیم. سپس، آستانه دقت مدل پیشنهادی را با اضافه کردن نویز، تاری و چولگی به نمونه ها به چالش کشیدیم. علاوه بر این، ما از یک مدل پرسپترون چند لایه (MLP) برای پیش بینی کلمات از نویسه های شناسایی شده و مکان یابی شده توسط یولو با دقت بیش از ۹۷.۷٪ استفاده کردیم. این رویکرد ما را قادر می سازد تا بدون استفاده از لغت نامه فارسی، کلمات کامل با قلم های پیچیده به سبک دست نویس را به طور دقیق تشخیص دهیم.
کلیدواژه ها:
نویسندگان
Mojtaba Gandomkar
دانشگاه صنعتی جندی شاپور دزفول، دزفول، ایران.
Sahar Khoramipour
دانشگاه صنعتی جندی شاپور دزفول، دزفول، ایران