داده کاوی با استفاده از تکنیکهای محاسبات نرم برای تشخیص کاراکترها

  • سال انتشار: 1386
  • محل انتشار: اولین کنفرانس داده کاوی ایران
  • کد COI اختصاصی: IDMC01_080
  • زبان مقاله: فارسی
  • تعداد مشاهده: 2488
دانلود فایل این مقاله

نویسندگان

سعید ستایشی

شهاب الدین شمشیربند

چکیده

یک سیستم تشخیص کاراکتر ، تکنیک محاسبه نرم ای را که در این مقاله بیان شده است ، استفاده می کند . ما بر روی تبدیل)Hough شخصی به همین نام) هر الگوی پیکسلی از کاراکترها ، یک مجموعه ی فازی تعریف می کنیم.و مجموعه فازی اضافه شده را توسط یکt-norm تعیین می نماییم . ارتفاعهای این t-norm ها یک بردار ویژگی n - بعدی برای کارا کتر تشکیل می دهد . سپس یک بردارn بعدی از بردار ویژگی -n -3 بعدی بوسیله تعریف مجموعه فازی سه زبانی (یعنی ضعیف ، میانه رو و قوی ) برای هر بعدی برای تمام الگوهای کاراکتر، یک ورودی چند لایه ای n عنصر ویژگی تولید می گردد . این بردار(mlp) -3 برای یادگیری بوسیله پس انتشار خطاها، تشکیل می ده د. پس از انجام یک تحلیل حساسیت از خروجی های چند لایه ای پرسپترون به ویژگی های ورودی بوس یله الگوریتم ژنتیک ، مجموعه ویژگی فازی ، انتخاب شده است . خروجی هایmlp مجموعه فازی ای را نمایش می دهند که بر تعلق هر الگوی ورودی به تعدادی کلاس الگوی فازی ، دلالت دارد.در طول این بازشناسی ، خروجی های با مقدار عضویت بالای مجموعه فازی برای جستجوی مبتنی بر لغتنامه بررسی می شوند که کاراکترهای مبهم را بر اساس دانش کلمه ای مشخص نماین د. این سیستم برای تشخیص کاراکتر ها درون اسناد انگلیسی چاپی پیاده سازی شده است.

کلیدواژه ها

تبدیل Hough ،پرسپترون ، مجموعه های فازی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.