تعیین نواحی کاندید براساس رده بندی مبتنی ب خصیصه جهت جستجوی کلمه مستقل از قطعه بندی در اسناد تصویری دست نویس فارسی

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 551

فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CSCG03_301

تاریخ نمایه سازی: 14 فروردین 1399

چکیده مقاله:

جهت اندیس گذاری، جستجو و بازیابی اسناد تصویری از روش های جستجوی کلمه (Word Spotting) استفاده می شود که هدف تعیین موقعیت رخدادهای کلمه پرسشی موردنظر کاربر در اسناد دست نویس فارسی است. دو دسته روش اصلی براساس قطعه بندی و مستقل از آن جهت انجام این کار وجود دارد. با توجه به میزان خطای بالای قطعه بندی در اسناد دست نویس، روش های مستقل از قطعه بندی کارآیی بهتری را نشان می دهند. در این مقاله روشی جهت تعیین کاندید در اسناد دست نویس فارسی مبتنی بر اجزاء متصل معرفی شده است که به جستجوی بسیار زمان بر مبتنی بر پنجره گذاری نیاز ندارد. این روش با استفاده از رده بندی مبتنی بر خصیصه توانایی تعیین نواحی کاندید کلمات دیده نشده را نیز دارد. آزمایشات تجربی انجام شده روی مجموعه داده FHT دقت 94/46 را نشان می دهد.

کلیدواژه ها:

تعیین ناحیه کاندید ، جستجوی کلمه مستقل از قطعه بندی ، رده بندی مبتنی بر خصیصه ، اسناد دست نویس فارسی

نویسندگان

مجید ایرانپور مبارکه

اسادیار ، دانشکده مهندسی کامیپوتر و فناوری اطلاعات، دانشگاه پیام نور

علیرضا احمدی فرد

دانشیار، دانشکده مهندسی برق و رباتیک، دانشگاه صنعتی شاهرود

هادی یار محمدی

دکتری، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی شاهرود

احسان اله کوزه گر

استادیار، دانشکده فنی و مهندسی شرق گیلان، دانشگاه گیلان