تشخیص کلمات دست نوشته فارسی به کمک ویژگی های مبتىی بر بدنه و علائم

  • سال انتشار: 1391
  • محل انتشار: یازدهمین کنفرانس سراسری سیستم های هوشمند
  • کد COI اختصاصی: ICS11_130
  • زبان مقاله: فارسی
  • تعداد مشاهده: 856
دانلود فایل این مقاله

نویسندگان

محمد علیپور سراجی

دانشکده برق و روباتیک دانشگاه صنعتی شاهرود

علی رضا احمدی فرد

دانشکده برق و روباتیک دانشگاه صنعتی شاهرود

زهرا ایمانی

دانشکده برق و روباتیک دانشگاه صنعتی شاهرود

چکیده

این تحقیق روشی جدید در زمینه بازشناسی کلمات دست نوشته فارسی بر اساس شکل کلی آنها ارائه می دهد. در مرحله پیش پردازش روشی جدید برای تخمین خط کرسی ارائه می شود. تشخیص خط کرسی به منظور جداسازی نقاط از بدنه اصلی و هم چنین برای نرمال سازی اجزاء بدنه اصلی ضروری است. در مرحله آموزش تصاویر کلمات با استفاده از الگوریتم Isodata به چند خوشه تقسیم می شوند. در مرحله آزمایش پس از به دست آوردن خوشه های نزدیک به نمونه ورودی، از تصویر هر کلمه دو تصویر، یکی تصویر بدنه اصلی و دیگری تصویر و علائم حاصل می شود. برای استخراج ویژگی های کلمه در تصویر بدنه اصلی، از بلوک بندی تطبیقی و از تصویر نقاط و علائم بلوک بندی یکنواخت استفاده می کنیم. هر بلوک در تصاویر فوق توسط اندازه گرادیان در 32 جهت توصیف می شود

کلیدواژه ها

بازشناسی کلمات دست نوشته فارسی، بلوک بندی تطبیقی، تخمین خط کرسی، جداسازی نقاط از کلمه، گرادیان محلی

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.