ارائه روشی جدید برای شاخص گذاری و بازیابی متون چاپی فارسی مبتنی بر کشف کبمه کلیدی

  • سال انتشار: 1393
  • محل انتشار: دومین همایش ملی پژوهش های کاربردی در علوم کامپیوتر و فناوری اطلاعات
  • کد COI اختصاصی: CITCONF02_047
  • زبان مقاله: فارسی
  • تعداد مشاهده: 620
دانلود فایل این مقاله

نویسندگان

رضا طاولی

عضو هیات علمی تمام وقت دیپارتمان ریاضی دانشگاه آزاد اسلامی واحد چالوس

زینب سام

عضو هیات علمی تمام وقت دیپارتمان ریاضی دانشگاه آزاد اسلامی واحد چالوس

مهدی رجب زاده

عضو هیات علمی تمام وقت دیپارتمان ریاضی دانشگاه آزاد اسلامی واحد چالوس

چکیده

در این تحقیق ما مسئله کشف کلمه کلیدی را در بازیابی تصاویر اسناد فارسی حل می کنیم. به عنوان ضرورت اصلی این مسئله ما یک نمایش جدید برای کلمات فارسی پیشنهاد دادیم. در روش پیشنهادی، ما برای هر کلمه فارسی یک امضا بر اساس چیدمان مؤلفه ی همبند کلمه تأکید نمودیم. سپس براساس این چیدمان، یک توصیف گر جدید ارائه گردید. از این روش به صورت جداگانه می توان برای موتون دست نویس و موتون چاپی استفاده نمود. برای تست این سیستم از یک ذیتاست با حروف دست نویس برای ارزیابی ساعت سیستم پیشنهادی استفاده شده است. همچنین ما روش مان را روی یک ذیتاست با 87867 کلمه چاپی تست نموده ایم. نتایج آزمایش نشان می دهند این نوع نمایش بدهد و فراخوانی و سرعت مناسبی را دارا است.

کلیدواژه ها

بازیابی تصویر سند،کشف کلمات کلیدی،متون چاپی ،مولفه همبند

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.