جستجوی کلمات در یک تصویر دست نوشته فارسی بااستفاده از روش تعبیه مشخصها

  • سال انتشار: 1394
  • محل انتشار: سومین کنفرانس بین المللی پژوهشهای کاربردی در مهندسی کامپیوتر و فن آوری اطلاعات
  • کد COI اختصاصی: CITCONF03_346
  • زبان مقاله: فارسی
  • تعداد مشاهده: 564
دانلود فایل این مقاله

نویسندگان

بهاره اسدی

گروه مهندسی برق دانشگاه شاهرود ایران

علیرضا احمدی فرد

گروه مهندسی برق دانشگاه شاهرود ایران

مجید ایرانپور

گروه مهندسی کامپیوتر و فناوری اطلاعات دانشگاه شاهرود ایران

چکیده

تشخیص کلمه ی کلیدی روشی برای استخراج اطلاعات متنی در اسناد تصویری است در این روش کلمه ی پرسشی موردنظر کاربر دراسناد تصویری جستجو شده و مکان نمونه های آن کلمه در داخل اسناد مشخص می شود بیشتر تحقیقات انجام شده در این زمینه بر روی متن و زبان لاتین ارائه شده است. این مقاله روشی برای جستجوی کلمات در تصویر دست نوشته فارسی بااستفادهاز روش تعبیه مشخصه ها ارائه دادهاست در این روش ابتدا خطوط متن از یکدیگر جدا شده سپس تصاویر کلماات داخل متن استخراج می شوند. د راین فضا تصویر و رشته ی متنی کلمه ی پرسشی وتصاویری از کلمات استخراج شده ی داخل متن که کلمه ی یکسانی را نشان می دهند نزدیک به یکدیگر قرار می گیرند با روش طبقه بندی نزدیکترین همسایگی عملیات تشخیص انجام می شود این روش روی پایگاه داده ای شامل 80 سند دست نوشته فارسی ارزیابی شده هاست درصد وقت و فراخوانی به ترتیب برای پرسش با تصویر 79/9 و 69/8 و برای پرسش با رشته ی متنی 81/4 و 70/8 می باشد.

کلیدواژه ها

جستجوی کلمه ی کلیدی؛ اسناد دست نوشته ی فارسی؛ مشخصه ها

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.