شاخص گذاری و بازیابی اطلاعات از پایگاه تصاویر اسناد
محل انتشار: چهاردهمین کنفرانس مهندسی برق ایران
سال انتشار: 1385
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,988
فایل این مقاله در 9 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICEE14_167
تاریخ نمایه سازی: 25 تیر 1387
چکیده مقاله:
در این مقاله، یک روش برای بازیابی اطلاعات از تصاویر اسناد فارسی بدون استفاده از بازشناسی نوری حروف معرفی کرده ایم. ابتدا برای ریز کلمات سند یک ویژگی به نام برچسب کانتور بالایی استخراج شده سپس بر مبنای این ویژگی یک دیکشنری تصویری برای ریز کلمات ایجاد شده است. به کمک این روش برای دو مسئله مختلف در بازیابی اسناد با استفاده از جستجوی کلمات کلیدی و بازیابی بر اساس شباهت اسناد راه حل ارائه شد. روشهای ارائه شده بر روی یک پایگاه تصاویر اسناد فارسی ارزیابی شد. نتایج بدست آمده توانایی این روش ها در بازیابی اطلاعات از تصاویر اسناد را تایید کرده است.
کلیدواژه ها:
نویسندگان
محمد اکبری
دانشکده ریاضی و علوم کامپیوتر، دانشگاه صنعتی امیرکبیر
رضا عرمی
دانشکده فنی و مهندسی، دانشگاه الزهرا
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :