A stroke-level wordnet for Farsi handwriting recognition

  • سال انتشار: 1394
  • محل انتشار: نهمین کنفرانس ماشین بینایی و پردازش تصویر ایران
  • کد COI اختصاصی: ICMVIP09_092
  • زبان مقاله: انگلیسی
  • تعداد مشاهده: 707
دانلود فایل این مقاله

نویسندگان

Ali Esfahani

Department of Computer Science, Faculty of Mathematical Sciences,Shahid Beheshti University, G.C., Tehran, Iran 198396–3113

Farhood Farahnak

Department of Computer Science, Faculty of Mathematical Sciences,Shahid Beheshti University, G.C., Tehran, Iran 198396–3113

Ali Katanforoush

Department of Computer Science, Faculty of Mathematical Sciences,Shahid Beheshti University, G.C., Tehran, Iran 198396–3113

چکیده

Language grammars and lexicons are essential tools for the post-processing word inference task in Handwriting Recognition Systems (HRS). In stroke-based HRS, input handwritten samples are recognized as members of standard written stroke categories. A stoke-level grammar is required to translate the classified strokes to words of a vocabulary. A wordnet is a tool to perform the word translation task at the least possible computational steps. In this paper, we develop a stroke-level wordnet for Farsi word recognition systems. The wordnet is obtained by parsing the vocabulary words through the Farsi stroke grammar rules. The wordnet, hence, includes lexical and grammar information, simultaneously; that reduces the cost of computation at the post-processing word recognition step. To handle the problem of infinitely many possible combinations of strokes in Farsi writing system and Persian language, we include multiple production rules per each stroke in the stroke grammar producing ambiguous explanations for out-of-dictionary words.

کلیدواژه ها

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.