بازیابی تصویر زیرکلمات فارسی تایپی به کمک روش سلسله مراتبی دوسطحی

  • سال انتشار: 1390
  • محل انتشار: نوزدهمین کنفرانس مهندسی برق ایران
  • کد COI اختصاصی: ICEE19_499
  • زبان مقاله: فارسی
  • تعداد مشاهده: 848
دانلود فایل این مقاله

نویسندگان

نگار براهوئی

دانشکده مهندسی برق و کامپیوتر، دانشگاه آزاد اسلامی قزوین

سعید مظفری

دانشکده مهندسی برق و کامپیوتر، دانشگاه سمنان

چکیده

در این مقاله یک روش سلسله مراتبی برای بازیابی تصاویر زیرکلمات فارسی تایپی معرفی میشود. ورودی این سیستم، زیرکلمه ای است که بعنوان مورد پرس و جو به سیستم داده میشود و خروجی آن تصاویر موجود در فرهنگ زیرکلمات است که بر اساس میزان شباهت به زیرکلمه ورودی مرتب شده اند. در روش پیشنهادی، تصاویر زیرکلمات تا سطح چهارم تقطیع شده و با توجه به فراوانی زیرتصاویر، قالبهای پایه برای هر سطح طراحی میشوند. قالبهای پایه با زیرتصاویر سطح 3 و 4 مقایسه شده و بردارهای ویژگی از این دو سطح استخراج میشوند. با ورود زیرکلمه پرس و جو، بردارهای ویژگی سطح سه با بردار ویژگی زیرکلمه ورودی مقایسه میشوند. با استفاده از سطح 3 تعداد زیادی از زیرکلمات به منظور بالا بردن سرعت و به بهای از دست دادن کمی دقت هرس میشوند. پس از مرحله هرس، بردارهای ویژگی سطح چهار با بردار ویژگی زیرکلمه ورودی مقایسه شده و زیرکلمات بازیابی میشوند. آزمایشها بر روی فرهنگ کلمات شامل 6888 زیرکلمه فارسی که با سه اندازه و چهار فونت مختلف تایپ شده اند اجرا شده است. نتایج بازیابی نشان میدهد که روش پیشنهادی، با سرعت و دقت قابل قبولی قادر به بازیابی تصاویر زیرکلمات فارسی است

کلیدواژه ها

بازیابی، متون تایپی، فارسی و عربی، روش سلسله مراتبی، تقطیع زیرکلمه، قالب پایه، زیرکلمه کلیدی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.