CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بازیابی تصویر زیرکلمات فارسی تایپی به کمک روش سلسله مراتبی دوسطحی

عنوان مقاله: بازیابی تصویر زیرکلمات فارسی تایپی به کمک روش سلسله مراتبی دوسطحی
شناسه ملی مقاله: ICEE19_499
منتشر شده در نوزدهمین کنفرانس مهندسی برق ایران در سال 1390
مشخصات نویسندگان مقاله:

نگار براهوئی - دانشکده مهندسی برق و کامپیوتر، دانشگاه آزاد اسلامی قزوین
سعید مظفری - دانشکده مهندسی برق و کامپیوتر، دانشگاه سمنان

خلاصه مقاله:
در این مقاله یک روش سلسله مراتبی برای بازیابی تصاویر زیرکلمات فارسی تایپی معرفی میشود. ورودی این سیستم، زیرکلمه ای است که بعنوان مورد پرس و جو به سیستم داده میشود و خروجی آن تصاویر موجود در فرهنگ زیرکلمات است که بر اساس میزان شباهت به زیرکلمه ورودی مرتب شده اند. در روش پیشنهادی، تصاویر زیرکلمات تا سطح چهارم تقطیع شده و با توجه به فراوانی زیرتصاویر، قالبهای پایه برای هر سطح طراحی میشوند. قالبهای پایه با زیرتصاویر سطح 3 و 4 مقایسه شده و بردارهای ویژگی از این دو سطح استخراج میشوند. با ورود زیرکلمه پرس و جو، بردارهای ویژگی سطح سه با بردار ویژگی زیرکلمه ورودی مقایسه میشوند. با استفاده از سطح 3 تعداد زیادی از زیرکلمات به منظور بالا بردن سرعت و به بهای از دست دادن کمی دقت هرس میشوند. پس از مرحله هرس، بردارهای ویژگی سطح چهار با بردار ویژگی زیرکلمه ورودی مقایسه شده و زیرکلمات بازیابی میشوند. آزمایشها بر روی فرهنگ کلمات شامل 6888 زیرکلمه فارسی که با سه اندازه و چهار فونت مختلف تایپ شده اند اجرا شده است. نتایج بازیابی نشان میدهد که روش پیشنهادی، با سرعت و دقت قابل قبولی قادر به بازیابی تصاویر زیرکلمات فارسی است

کلمات کلیدی:
بازیابی، متون تایپی، فارسی و عربی، روش سلسله مراتبی، تقطیع زیرکلمه، قالب پایه، زیرکلمه کلیدی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/154072/