A Lexicon Reduction Method Based on Clustering Word Images inOffline Farsi Handwritten Word Recognition Systems
- سال انتشار: 1390
- محل انتشار: هفتمین کنفرانس ماشین بینایی و پردازش تصویر ایران
- کد COI اختصاصی: ICMVIP07_019
- زبان مقاله: انگلیسی
- تعداد مشاهده: 2044
نویسندگان
Department Electrical, Electronic& Robotic Engineering, ShahroodUniversity of Technology,Shahrood ,Iran
Department Electrical, Electronic& Robotic Engineering, ShahroodUniversity of Technology,Shahrood ,Iran
Department Electrical, Electronic& Robotic Engineering, ShahroodUniversity of Technology,Shahrood ,Iran
چکیده
In this paper a novel approach for lexiconreduction of Farsi words is proposed. For this purpose weextract upper and lower profiles, vertical projection profileand black/white transition from word images. Using DTWsimilarity between words in the database is measured.The Isoclus algorithm is used to cluster handwritten wordimages of training dataset. The initial center of clusters isdetermined from agglomerative hierarchical clusteringalgorithm.Experimental results on IRANSHAHR dataset show apromising result. It yields a lexicon reduction of 77% withaccuracy of 94%. We also evaluate the proposed systemwhen combination of statistical features and different typeof distance measures are used.کلیدواژه ها
Farsi Handwritten recognition; Isoclus algorithm;agglomerative hierarchical clustering; dynamic time warping andwavelet transformمقالات مرتبط جدید
- تحلیل مقایسه ای معیارهای ارزیابی نظریه ذهن: پل زدن بین شناخت انسانی و مصنوعی
- تولید محتوا با قدرت هوش مصنوعی: تحول بازاریابی دیجیتال
- دوخت تصاویر تهیه شده توسط پهپاد با استفاده از یادگیری عمیق بدون نظارت
- Stitching of drone images using unsupervised deep learning
- بررسی کاربردهایی از منطق فازی در حل مسائل مهندسی عمران
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.