تشخیص نوری کاراکتر (OCR) و بینایی ماشین
سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 25
فایل این مقاله در 19 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
SREDCONF01_4890
تاریخ نمایه سازی: 30 خرداد 1405
چکیده مقاله:
یکی از چالش های اساسی در تصحیح خودکار، پردازش پاسخ های دستنویس است که در اکثر آزمون های سنتی رایج است. فناوری تشخیص نوری کاراکتر (OCR) این چالش را با تبدیل متون دستنویس اسکن شده به متن قابل پردازش رایانه ای برطرف می کند. پژوهشی که در پایگاه پری پرینتس (۲۰۲۵) منتشر شده، چارچوبی هوش مصنوعی محور برای تصحیح پاسخ های کوتاه دستنویس ریاضی ارائه می دهد که OCR را با مدل های تصحیح معنایی مبتنی بر ترنسفورمر ترکیب می کند. در این سیستم، ابتدا دستنویسدانش آموز توسط OCR به متن تبدیل می شود، سپس مدل ترنسفورمر مقایسه معنایی میان پاسخ دانش آموز و راه حل استاندارد انجام می دهد. آزمایش بر روی مجموعه ای از ۳۰۰۰ پاسخ دستنویس دانشجویان نشان داد که این سیستم همبستگی بالای ۹۰ درصد با ارزیابان انسانی داشته و زمان تصحیح را حدود ۶۰ درصد کاهش داده است.پژوهشی که در مجله بین المللی سیستم های هوش محاسباتی اسپرینگر (۲۰۲۵) منتشر شده، رویکرد ترکیبی دیگری را معرفی می کند که از Google Cloud Vision API برای استخراج و تبدیل پاسخ های دستنویس به متن قابل خواندن توسط ماشین استفاده می کند و سپس از مدل DeepSeek-R۱ برای ارزیابی محتوای متنی بهره می برد. این پژوهش نشان می دهد که ترکیب OCR با مدل های زبانی بزرگ می تواند نقاط ضعف هر دو فناوری را به تنهایی جبران کند.
نویسندگان
رضا جفره
دبیر