بازشناسی کلمات تایپی فارسی با استفاده از شبکه عصبی

  • سال انتشار: 1394
  • محل انتشار: کنفرانس بین المللی پژوهش های کاربردی در فناوری اطلاعات، کامپیوتر ومخابرات
  • کد COI اختصاصی: ITCC01_427
  • زبان مقاله: فارسی
  • تعداد مشاهده: 832
دانلود فایل این مقاله

نویسندگان

ساره مهاجر اورسجی

چکیده

بازشناسی متن می تواند متون اسکن شده یا عکس متون را به صورت متن تایپی درآورد و از کاربردهای آن شناساییپلاک های اتومبیل های مختلف، تبدیل متون کتب یا روزنامه های قدیمی به صورت متن تایپ شده و ... است.هدف از این تحقیق ارائه طبقه بندی در سامانه بازشناسی زیرکلمات برای تشخیص کلمات می باشد . برای تشخیصزیرکلمه ما از روش اول بر مبنای شکل کلی کلمه استفاده کردیم . مراحل کلی بازشناسی به این صورت است که ابتدامرحله پیش پردازش و سپس جداسازی و استخراج ویژگی و شناسایی و به هم پیوستن قطعات مجاور می باشد.برای طبقهبندی می توان از شبکه های عصبی مصنوعی که عموما MLP استفاده می شود . در قسمت استخراج ویژگی ، ویژگی هایدنباله خطوط در یک حرف یا زیر کلمه به کمک تبدیل هاف و مکان مشخصه و ناحیه بندی و جایگاه بخش های اضافی وتعداد نقاط و دنباله کد زنجیرهای و نسبت ارتفاع به پهنا استفاده شده است.دقت به دست آمده در این روش برای 1000داده با 5 فونت میترا،لوتوس،زر،یاقوت و نازنین برابر 97٪ شد.

کلیدواژه ها

روشهای بازشناسی، شبکه عصبی مصنوعی، استخراج ویژگی، تبدیل هاف

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.