تعیین نواحی کاندید براساس رده بندی مبتنی ب خصیصه جهت جستجوی کلمه مستقل از قطعه بندی در اسناد تصویری دست نویس فارسی
- سال انتشار: 1398
- محل انتشار: سومین کنفرانس بین المللی محاسبات نرم
- کد COI اختصاصی: CSCG03_301
- زبان مقاله: فارسی
- تعداد مشاهده: 642
نویسندگان
اسادیار ، دانشکده مهندسی کامیپوتر و فناوری اطلاعات، دانشگاه پیام نور
دانشیار، دانشکده مهندسی برق و رباتیک، دانشگاه صنعتی شاهرود
دکتری، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی شاهرود
استادیار، دانشکده فنی و مهندسی شرق گیلان، دانشگاه گیلان
چکیده
جهت اندیس گذاری، جستجو و بازیابی اسناد تصویری از روش های جستجوی کلمه (Word Spotting) استفاده می شود که هدف تعیین موقعیت رخدادهای کلمه پرسشی موردنظر کاربر در اسناد دست نویس فارسی است. دو دسته روش اصلی براساس قطعه بندی و مستقل از آن جهت انجام این کار وجود دارد. با توجه به میزان خطای بالای قطعه بندی در اسناد دست نویس، روش های مستقل از قطعه بندی کارآیی بهتری را نشان می دهند. در این مقاله روشی جهت تعیین کاندید در اسناد دست نویس فارسی مبتنی بر اجزاء متصل معرفی شده است که به جستجوی بسیار زمان بر مبتنی بر پنجره گذاری نیاز ندارد. این روش با استفاده از رده بندی مبتنی بر خصیصه توانایی تعیین نواحی کاندید کلمات دیده نشده را نیز دارد. آزمایشات تجربی انجام شده روی مجموعه داده FHT دقت 94/46 را نشان می دهد.کلیدواژه ها
تعیین ناحیه کاندید، جستجوی کلمه مستقل از قطعه بندی، رده بندی مبتنی بر خصیصه، اسناد دست نویس فارسیمقالات مرتبط جدید
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.