تشخیص نداده چند قدمی دست‌نویس فارسی با طبق بند ماشین بردار پشتیبان

  • سال انتشار: 1392
  • محل انتشار: هشتمین کنفرانس ماشین بینایی و پردازش تصویر ایران
  • کد COI اختصاصی: ICMVIP08_066
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1547
دانلود فایل این مقاله

نویسندگان

آزاده توفیقی

دانشگاه آزاد اسلامی واحد الکترونیک تهران

قاسم توفیقی

دانشگاه رایرسون

مهدی نیامنش

دانشگاه بین المللی امام رضا علیه السلام

چکیده

تشخیص نداده دست‌نویس فارسی یکی از مسائل چالش برانگیز در پردازش تصویر و تشخیص الگو … در این پژوهش سیستمی برای تشخیص نداده چند رقمی فارسی طراحی گردیده است. نوآوری این سیستم در ارائه روش جدیدی برای استخراج سریع ویژگی‌ها از اجداد دست‌نویس فارسی و طراحی یک سیستم کاربردی است. این سیستم دارای دو بخش اصلی آموزش و کاربردی است. بخش آموزش این سیستم شامل مرحله اصلی پیش پردازش، استخراج ویژگی‌ها و آموزش و آزمون طبق بند است. بخش کاربردی سیستم نیز شامل مرحله اصلی پیش پردازش، تشخیص خطوط و کاراکترها و تبدیل اعداد چند رقمی دست‌نویس به عدد تایپ شده می‌باشد. در بخش آموزش از 2٬000 نمونه از هر یک از اعداد دست‌نویس فارسی صفر تا نه دیتاست هدی استفاده شده است. پس از نرمال سازی این نمونه‌ها، بردار ویژگی‌های استخراج شده از آن‌ها به طبق بندهای ماشین بردار پشتیبان SVM با هسته های RBF خطی و سیگموید k-NN آموزش داده شده‌اند . جهت آزمون کارایی از 6٬000 نمونه دیگر از اجداد دست‌نویس فارسی دیتاست هدی استفاده شده است. آزمایش‌ها نشان می‌دهند که در این مسئله بهترین حالت ممکن استفاده از SVM با هسته خطی است. در این روش بدعت تشخیص نداد در هنگام استفاده در حالت تک رقمی در حدود 98% بوده است. در بخش کاربردی، تصویری اسکن شده از عدد چند رقمی دست‌نویس به سیستم وارد می‌شود. این بخش قادر است تعداد خطوط و تعداد ارقام هر یک از اعداد در حرفت را تشخیص داد و یک فایل تایپ شده معادله تحویل دهد. جهت آزمون کارایی این بخش عدد چهار رقمی در نظر گرفته شده‌اند. نتایج آزمایش 2٬000 عدد چهار رقمی تصادفی نشان می‌دهد که سیستم حدود 92% از این عدد چهار رقمی را درست تشخیص می‌دهد.

کلیدواژه ها

تشخیص نداده دست‌نویس فارسی، تشخیص نداده چند رقمی فارسی، طبقه بند SVM ، طبقه بند k-NN

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.