سیستم خلاصه ساز چند سندی فارسی، جهت بهبود خوانایی و پیوستگی از طریق ایجاد گراف متقاطع اسناد

  • سال انتشار: 1395
  • محل انتشار: اولین همایش ملی فناوری اطلاعات، ارتباطات و محاسبات نرم
  • کد COI اختصاصی: ITCSC01_022
  • زبان مقاله: فارسی
  • تعداد مشاهده: 912
دانلود فایل این مقاله

نویسندگان

جواد حسینخانی

استادیار دانشکده فنی و مهندسی، دانشگاه آزاد اسلامی خوراسگان (اصفهان) ایران

مهدی یزدانی

کارشناسی ارشد دانشکده فنی و مهندسی، دانشگاه آزاد اسلامی خوراسگان اصفهان ایران

چکیده

در عصر حاضر با رشد سریع و نفوذ وسیع شبکه اینترنت، شبکه های اجتماعی و سایر شبکه های ارتباطی، روزانه حجم بسیار زیادی از متن در حال جابه جایی است و کاربران با متون بسیار بیشتری مواجه هستند و بدیهی است مطالعه این حجم زیاد متن برای تمامی کاربران مقدور نمی باشد.، سیستمهای خلاصه ساز خودکار متن، به عنوان یکی از پرکاربردترین سیستمهای پردازش زبان طبیعی این توانایی را دارند تا یک متن را دریافت نموده و آن را به یک متن کوچکتر خلاصه کند این سیستمهخا با در نظر گرفتن شرایطی، سعی در تولید یک خلاصه پیوسته و خوانا دارند. پژوهش حاضر یک سیستم خلاصه ساز چند سندی جهت خلاصه سازی متون فارسی پیشنهاد نموده است سیستم پیشنهادی با ایجاد گراف متقاطع اسناد، یک خلاصه خوانا و پیوسته استخراج می کند. خلاصه استخراج شده با استفاده از روشی مشابه با روشی ارزیابی استاندارد ROUGE مورد ارزیابی قرار گرفته است.

کلیدواژه ها

خلاصه سازی متن، گراف متقاطع اسناد، خوانایی خلاصه، پیوستگی خلاصه

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.