تشخیص نوری کاراکتر (OCR) و بینایی ماشین

رضا جفره

تشخیص نوری کاراکتر (OCR) و بینایی ماشین

محل انتشار: اولین همایش بین المللی دستاوردهای نوین علمی پژوهشی در آموزش و پرورش و علوم انسانی با رویکرد آسیب شناسی تربیتی، دینی و فرهنگی در ایران و جهان

سال انتشار: 1404

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 25

فایل این مقاله در 19 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/2639741

شناسه ملی سند علمی:

SREDCONF01_4890

تاریخ نمایه سازی: 30 خرداد 1405

چکیده مقاله:

یکی از چالش های اساسی در تصحیح خودکار، پردازش پاسخ های دستنویس است که در اکثر آزمون های سنتی رایج است. فناوری تشخیص نوری کاراکتر (OCR) این چالش را با تبدیل متون دستنویس اسکن شده به متن قابل پردازش رایانه ای برطرف می کند. پژوهشی که در پایگاه پری پرینتس (۲۰۲۵) منتشر شده، چارچوبی هوش مصنوعی محور برای تصحیح پاسخ های کوتاه دستنویس ریاضی ارائه می دهد که OCR را با مدل های تصحیح معنایی مبتنی بر ترنسفورمر ترکیب می کند. در این سیستم، ابتدا دستنویسدانش آموز توسط OCR به متن تبدیل می شود، سپس مدل ترنسفورمر مقایسه معنایی میان پاسخ دانش آموز و راه حل استاندارد انجام می دهد. آزمایش بر روی مجموعه ای از ۳۰۰۰ پاسخ دستنویس دانشجویان نشان داد که این سیستم همبستگی بالای ۹۰ درصد با ارزیابان انسانی داشته و زمان تصحیح را حدود ۶۰ درصد کاهش داده است.پژوهشی که در مجله بین المللی سیستم های هوش محاسباتی اسپرینگر (۲۰۲۵) منتشر شده، رویکرد ترکیبی دیگری را معرفی می کند که از Google Cloud Vision API برای استخراج و تبدیل پاسخ های دستنویس به متن قابل خواندن توسط ماشین استفاده می کند و سپس از مدل DeepSeek-R۱ برای ارزیابی محتوای متنی بهره می برد. این پژوهش نشان می دهد که ترکیب OCR با مدل های زبانی بزرگ می تواند نقاط ضعف هر دو فناوری را به تنهایی جبران کند.

نویسندگان

رضا جفره

دبیر