کاهش فضای جستجو در بازشناسی زیر کلمات تایپی فارسی با استفاده از ویژگی های زیست سنجه مینوشیا

  • سال انتشار: 1401
  • محل انتشار: فصلنامه مهندسی برق و الکترونیک ایران، دوره: 19، شماره: 2
  • کد COI اختصاصی: JR_JIAE-19-2_021
  • زبان مقاله: فارسی
  • تعداد مشاهده: 262
دانلود فایل این مقاله

نویسندگان

امین تیمورپور

University of Birjand

مهران تقی پور گرجی کلایی

University of Birjand

سیدمحمد رضوی

University of Birjand

چکیده

با توجه به گسترده بودن زیرکلمات تایپ شده فارسی، یافتن یک زیرکلمه و به تبع آن یک کلمه در یک متن چاپ شده کار بسیار زمانبری خواهد بود. در این مقاله روشی مبتنی بر نقاط زیست سنجه مینوشیا ارائه شده است که فضای جستجوی زیرکلمات تایپ شده فارسی را به صورت قابل توجهی کاهش می دهد. لذا تعداد نقاط و مختصات مینوشیای انشعابی و انتهایی که دو ویژگی مطرح در حوزه زیست سنجه می باشند، بعنوان ویژگی هایی برای کاهش فضای جستجو در قالب یک روش دومرحله ای استفاده شده اند. در گام نخست نقاط مینوشیا از تصویر زیرکلمه استخراج شده و در چهارخوشه که از لحاظ تعداد نقاط به یکدیگر نزدیک هستند دسته بندی می شوند، به این ترتیب فضای جستجو تقریبا نصف خواهد شد. در گام دوم با ایجاد یک مخزن از فواصل اولین تا آخرین نقطه انتهایی برای هر زیرکلمه در هر خوشه و تطبیق فاصله مذکور در تصویر آزمایشی با مخزن، فضای جستجو به مقدار قابل توجهی کاهش می یابد. نتایج بدست آمده از اعمال روش پیشنهادی بر روی تصاویر زیرکلمه موجود در پایگاه داده نشان می دهد، فضای جستجو از ۱۲۷۰۰ زیرکلمه به حدود ۵۰۰ زیرکلمه با دقت تقریبی ۹۰ درصد کاهش یافته است.

کلیدواژه ها

Farsi sub-word, Biometric, Search space, Minutia feature, زیرکلمات فارسی, زیست سنجه, فضای جستجو, ویژگی مینوشیا.

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.