A Lexicon Reduction Method Based on Clustering Word Images inOffline Farsi Handwritten Word Recognition Systems

  • سال انتشار: 1390
  • محل انتشار: هفتمین کنفرانس ماشین بینایی و پردازش تصویر ایران
  • کد COI اختصاصی: ICMVIP07_019
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 2044
دانلود فایل این مقاله

نویسندگان

Elham bayesteh

Department Electrical, Electronic& Robotic Engineering, ShahroodUniversity of Technology,Shahrood ,Iran

Alireza ahmadifard

Department Electrical, Electronic& Robotic Engineering, ShahroodUniversity of Technology,Shahrood ,Iran

Hossein khosravi

Department Electrical, Electronic& Robotic Engineering, ShahroodUniversity of Technology,Shahrood ,Iran

چکیده

In this paper a novel approach for lexiconreduction of Farsi words is proposed. For this purpose weextract upper and lower profiles, vertical projection profileand black/white transition from word images. Using DTWsimilarity between words in the database is measured.The Isoclus algorithm is used to cluster handwritten wordimages of training dataset. The initial center of clusters isdetermined from agglomerative hierarchical clusteringalgorithm.Experimental results on IRANSHAHR dataset show apromising result. It yields a lexicon reduction of 77% withaccuracy of 94%. We also evaluate the proposed systemwhen combination of statistical features and different typeof distance measures are used.

کلیدواژه ها

Farsi Handwritten recognition; Isoclus algorithm;agglomerative hierarchical clustering; dynamic time warping andwavelet transform

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.