شناسی اسامی دست نوشته فارسی استان های ایران با استفاده از روشهای یادگیری ماشین

  • سال انتشار: 1394
  • محل انتشار: سومین همایش ملی کامپیوتر
  • کد COI اختصاصی: NCCOS03_057
  • زبان مقاله: فارسی
  • تعداد مشاهده: 544
دانلود فایل این مقاله

نویسندگان

میترا تقوائی

دانشجو کارشناسی ارشد دانشگاه آزاد اسلامی واحد آشتیان

پیمان بیات

عضو هیات علمی دانشگاه آزاد اسلامی واحد تفرش

چکیده

دراین مقاله یک سامانه بازشناسی برون خط کلمات و مستقل ازتفکیک برای شناسایی دست نوشته نام های استان های ایران ارایه شده است سامانه شامل مراحل اخذ تصاویر ورودی پیش پردازش استخراج ویژگی و طبقه بندی می باشد درروش پیشنهادی ابعادتصاویر را یکسان سازی میکنیم سپس بصورت یک ماتریس سه بعدی درMATLAB بارگذاری می کنیم پردازش تصویر شامل مراحل دودویی سازی حذف نویزهای پس زمینه اسکلت سازی است درمرحله بعد نواحی اضافی عکس حذف میشود هدف یکسان بودن مکان ویژپیهای استخراج شده ازعکس می باشد روشی که دراینجا مورداستفاده قرارگرفته حاصل ترکیب استخراج ویژگی کاهش ویژگی و کلاسه بندی میباشد جهت کاهش ویژگی ازترکیب الگوریتم ژنتیک و تحلیل تفکیک خطی استفاده شد ازماشین بردارپشتیبان باتوابع کرنل مختلف استفاده شد و نتایج آن گزارش شد نتایج نشان میدهد که بااستفاده ازروش کاهش ویژگی مذکور و استفاده ازماشین بردارپشتیبان حداقل مربعات میتوان هم حجم محاسبات را کاهش داد و هم به دقت قابل قبولی رسید این سیستم برروی پایگاه داده تهیه شده ازاسامی 31 استان ایران متشکل از1240نمونه کلمه دست نویس می باشد 1040 نمونه آموزش، 200نمونه آزمون که به نرخ بازشناسی 97درصد رسیده ایم

کلیدواژه ها

بازشناسی نوری ، کلمات دست نویس فارسی ، برون خط ، ماشین بردارپشتیبان ، استخراج ویژگی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.