Recognition of Handwritten Persian Two-digit Numerals Using a Novel Hybrid SVM/HMM algorithm

  • سال انتشار: 1395
  • محل انتشار: مجله مهندسی برق مجلسی، دوره: 10، شماره: 3
  • کد COI اختصاصی: JR_MJEE-10-3_002
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 76
دانلود فایل این مقاله

نویسندگان

Vahid Moradi

Electrical and Computer Engineering Department, Science and Research Branch,Islamic Azad University, Tehran, Iran.

Farbod Razzazi

Alireza Behrad

چکیده

There is a vast range of potential applications for recognition of handwritten Persian / Arabic digits (e.g. banking transactions, business registration forms and postal code recognition to name a few). In this paper, a new method is presented for automatic recognition of joint two-digit Persian numerals. The proposed method is composed of a combinational structure of Support Vector Machines (SVM) and a Hidden Markov Models (HMM). In this approach, we used SVM and HMM for classification and segmentation goals respectively. Due to the higher performance of SVM in classification with respect to HMM, the main core of recognition is an SVM classifier. In contrast, we used HMM to detect the location of the boundary for two-digit numerals. To evaluate the method, we employed a selection of HADAF Persian isolated characters corpus. We employed a ۴ scale Gabor filter bank (۲۴, ۱۲, ۶ and ۳ scales) in ۶ directions (۰, ۳۰, ۶۰, ۹۰, ۱۲۰, ۱۵۰ degrees) for feature extraction. The results showed the digit recognition rate of about ۹۸.۷۵ percent for the proposed algorithm on Persian two-digit numerals, while the recognition rates were ۹۸.۵۸ and ۹۵.۹۳ for separate SVM and HMM engines on isolated characters respectively.

کلیدواژه ها

handwritten numeral recognition, en, SVM/HMM combining classifier

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.