شناسایی اطلاعات شخصی در فرم های دست نویس فارسی و تبدیل به فرمت قابل پردازش در کامپیوتر
سال انتشار: 1404
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 13
فایل این مقاله در 18 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSIEM04_852
تاریخ نمایه سازی: 17 خرداد 1405
چکیده مقاله:
نوشتن یکی از پیچیده ترین فرآیندهای ذهنی انسان است که بازتابی از ادراک و ارتباط او با دنیای بیرون محسوب می شود. با وجود گسترش فناوری های دیجیتال، دست نویسی همچنان به دلیل سادگی و در دسترس بودن روش رایجی برای ثبت اطلاعات است؛ از این رو نیاز به سامانه هایی جهت تبدیل دست نوشته ها به شکل دیجیتال برای افزایش سرعت دسترسی و کاهش فضای ذخیره سازی احساس می شود. در این پژوهش روش جدیدی برای شناسایی کلمات دست نویس فارسی بر اساس ویژگی های ظاهری زیرکلمات بدون علامت ارائه شده است. در مرحله ی استخراج، ویژگی از بسته تبدیل موجک برای آماده سازی داده ها و حذف زیر باندهای غیرضروری استفاده شده و سپس ویژگی جدید کد زنجیره ای فریمن مبتنی بر دنباله ی مرکز جرم معرفی گردیده است که توصیف دقیقی از ساختار زیرکلمات دست نویس ارائه می دهد. علاوه بر آن از ویژگی های ساختاری زیرکلمات و پایگاه داده ای از موقعیت زیرکلمات اصلی بدون علامت جهت کاهش پیچیدگی محاسباتی و افزایش دقت و سرعت بازشناسی بهره گرفته شده است. در بخش طبقه بندی، نیز ماشین بردار پشتیبان (SVM) با استفاده از الگوریتم ترکیبی PSOGSA شامل بهینه سازی هم زمان الگوریتم های PSO و GSA برای تنظیم پارامترهای کنترلی و بهبود عملکرد به کار رفته است. نتایج آزمایش ها بر روی پایگاه داده های هدا و صدری نشان داد که دقت شناسایی به ترتیب برابر ۹۲.۴۵ و ۹۳.۳۴ در سطح ارقام و بر روی پایگاه داده های ایرانشهر ۸۹ در سطح کلمات نام شهر است. همچنین در پایگاه داده های شامل صد نام و نام خانوادگی تهیه شده از فرم دست نویس نرخ دقت به ترتیب ۹۸.۷۸٪ و ۹۷.۷۴ به دست آمد. به طور کلی یافته ها بیانگر دقت بالا در شناسایی اعداد دست نویس فارسی هستند؛ با این حال برای بهبود عملکرد در بازشناسی کلمات و کاهش خطا استفاده از تکنیک های پردازش و فهم زبان طبیعی پیشنهاد می شود.
کلیدواژه ها:
شناسایی کلمات دست نویس ، الگوریتم بهینه سازی PSOGSA ، کد زنجیره ای فریمن ، دنباله مرکز جرم (CSFCC) ، ماشین بردار پشتیبان (SVM)
نویسندگان
سارا خسروی
عضو علمی گروه کامپیوتر دانشکده فنی و مهندسی دانشگاه پیام نور تهران ایران