مروری بر سیستم های OCR به منظور شناسایی متون فارسی- عربی- اردو
سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 697
فایل این مقاله در 13 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICSEE02_026
تاریخ نمایه سازی: 8 تیر 1398
چکیده مقاله:
شناسایی کاراکترهای زبانهای فارسی- عربی- اردو به دلیل پیوستگی حروف به مراتب سختتر از تشخیص کاراکترهای سایر زبانها میباشند. اگر کاراکترهای این زبانها با فونت نستعلیق نگارش شوند پیچیدگی شناسایی دو چندان میشود، چرا که شناسایی خط نستعلیق به دلیل ساختار پیچیده اش کار دشواری میباشد. در مقاله ی جاری، به معرفی جنبه های مختلف طراحی یک سیستم OCR (سیستم های بازشناسی نوری نویسه) میپردازیم و در ادامه به بررسی سیستمهای OCR1 ارائه شده به منظور تشخیص کاراکترهای زبانهای فارسی- عربی- اردو میپردازیم. زیرا کاراکترهای این زبانها از نظر ساختار بسیار شبیه به هم میباشند. به منظور بررسی دقیق سیستمهای ارائه شده در گذشته، از دو معیار اصلی و فرعی استفاده نمودیم. معیارهای اصلی عبارتند از: الگوی ورودی، نوع زبان، هدف از تشخیص و نوع نوشتار. این معیارها باعث تمایز سیستمهای بازشناسی نوری نویسه از یکدیگر میشوند. میزان فرآوانی پژوهشها بر اساس این چهار معیار توسط نرم افزار SPSS مورد بررسی قرار گرفته است. نتایج بدست آمده نشان میدهد بیشترین میزان فرآوانی در زمینه ی شناسایی تصاویر حروف دست نویس فارسی میباشد. معیارهای فرعی که با هدف عمیق شدن بررسی ها و به منظور دقت بیشتر در نظر گرفته شده اند عبارتند از؛ سال انتشار، عنوان پژوهش، نوع فونت، روشهای حل، مجموعه داده و میزان دقت. در ادامه نتایج مقایسه ی پژوهشها با کمک معیارهای فرعی و دو معیار اصلی، در قالب جدول مطرح شده است. تحقیقات گستردهای در حوزه OCR انجام شده است اما با نگاه ریز بینانه ای میتوان خلاءهای تحقیقاتی موجود را یافت و یک منبع پژوهشی کامل از تحقیقات بروز در این حوزه را جمع آوری نمود و به هدف نهایی که تسهیل در روند اجرایی شدن پژوهش دیگر محققین است رسید. لازمه ی این امر شناسایی، گردآوری، مطالعه و نتیجه گیری از تحقیقات صورت گرفته ی پیشین است.
کلیدواژه ها:
نویسندگان
مهسا شکوهی
دانشجوی دوره کارشناسی ارشد فناوری اطلاعات موسسه آموزش عالی ادیبان
حامد شیدائیان
دانشجوی دوره دکتری مهندسی کامپیوتر دانشگاه تهران