کاهش فضای جستجو در بازشناسی زیر کلمات تایپی فارسی با استفاده از ویژگی های زیست سنجه مینوشیا
سال انتشار: 1401
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 258
فایل این مقاله در 11 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JIAE-19-2_021
تاریخ نمایه سازی: 4 تیر 1401
چکیده مقاله:
با توجه به گسترده بودن زیرکلمات تایپ شده فارسی، یافتن یک زیرکلمه و به تبع آن یک کلمه در یک متن چاپ شده کار بسیار زمانبری خواهد بود. در این مقاله روشی مبتنی بر نقاط زیست سنجه مینوشیا ارائه شده است که فضای جستجوی زیرکلمات تایپ شده فارسی را به صورت قابل توجهی کاهش می دهد. لذا تعداد نقاط و مختصات مینوشیای انشعابی و انتهایی که دو ویژگی مطرح در حوزه زیست سنجه می باشند، بعنوان ویژگی هایی برای کاهش فضای جستجو در قالب یک روش دومرحله ای استفاده شده اند. در گام نخست نقاط مینوشیا از تصویر زیرکلمه استخراج شده و در چهارخوشه که از لحاظ تعداد نقاط به یکدیگر نزدیک هستند دسته بندی می شوند، به این ترتیب فضای جستجو تقریبا نصف خواهد شد. در گام دوم با ایجاد یک مخزن از فواصل اولین تا آخرین نقطه انتهایی برای هر زیرکلمه در هر خوشه و تطبیق فاصله مذکور در تصویر آزمایشی با مخزن، فضای جستجو به مقدار قابل توجهی کاهش می یابد. نتایج بدست آمده از اعمال روش پیشنهادی بر روی تصاویر زیرکلمه موجود در پایگاه داده نشان می دهد، فضای جستجو از ۱۲۷۰۰ زیرکلمه به حدود ۵۰۰ زیرکلمه با دقت تقریبی ۹۰ درصد کاهش یافته است.
کلیدواژه ها:
نویسندگان
امین تیمورپور
University of Birjand
مهران تقی پور گرجی کلایی
University of Birjand
سیدمحمد رضوی
University of Birjand
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :