قطعه بندی کلمات فارسی به کمک یک تابع جدید ویولت

  • سال انتشار: 1383
  • محل انتشار: دهمین کنفرانس سالانه انجمن کامپیوتر ایران
  • کد COI اختصاصی: ACCSI10_079
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1630
دانلود فایل این مقاله

نویسندگان

علی برومندنیا

دانشگاه آزاد اسلامی واحد علوم و تحقیقات گروه کامپیوتر

جمشید شنبه زاده

دانشگاه تربیت معلم

چکیده

در قطعه بندی کلمات فارسی تصویر یک کلمه به مجموعه ای از حروف مجزا تقسیم بندی می گردد قطعه بندی کلمات در شناسایی مستندات فارسی کاربرد دارد این مقاله یک روش جدید قطعه بندی کلمات فارسی را با استفاده از تابع ویولت بیان می کند از ویژگیهای الگوریتم جدید استقلال از اندازه سطح خاکستری توانایی در قسیم بندی لبه های کلمات و مقاومت در مقابل نویز است توانایی روش جدید در قطعه بندی اندازه گیری شده و دارای دقت 98 % است که نسبت به روشهای مشابه کار شده دقت بالاتر می باشد از نظر سرعت سیستم دارای سرعت قطعه بندی 40 کاراکتر در ثانیه است.

کلیدواژه ها

تبدیل ویولت، قطعه بندی کلمات فارسی، لبه های زیرین، نقاط قطعه بندی، مستندات فارسی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.