ارائه یک روش خلاصه سازی خودکار متون تک و چند سندی بر پایه روش گراف

  • سال انتشار: 1397
  • محل انتشار: پنجمین کنفرانس مهندسی دانش بنیان و نوآوری
  • کد COI اختصاصی: KBEI05_009
  • زبان مقاله: فارسی
  • تعداد مشاهده: 592
دانلود فایل این مقاله

نویسندگان

زینب رودباری مونجی

موسسه آموزش عالی پویندگان دانش شهرستان چالوس چالوس، ایران

رضا طاولی

عضو هیئت علمی تمام وقت دانشگاه آزاد چالوس واحد کامپیوتر چالوس، ایران

چکیده

با توجه به نیاز بشر به اطلاعات مفید و مناسب متون باید بهصورت خودکار پردازش و خلاصه شوند که برای این مهم در طول سال هایاخیر روش های گوناگونی پیشنهاد شده که کمابیش تاثیر گذارند. در اینپروژه یک روش جدید خلاصه سازی مبتنی بر گراف را پیاده سازی میکنیم. در این مقاله سعی بر آن داشتیم تا متون را بررسی و خلاصه کنیم.برای خلاصه کردن در ابتدا متون را پیش پردازش می کنیم. کلمات اضافی راحذف می کنیم و ریشه یابی انجام می دهیم و جایگاه کلمات را مشخص میکنیم. برای یافتن ویژگی ها و به دست آوردن ماتریس کلمات ما از روشTF-ISF بهره مند شدیم و وزن دهی انجام دادیم. برای بدست آوردن جملات هم از گراف استفاده می کنیم برای جملات بر اساس شباهت کلماتمشترکی که دارند امتیاز قائل می شویم و بر اساس آن امتیازات نود هایگراف ما رسم شدند، که نود هایی که بیشترین یال را دارا بودند همانجملات منتخب اند.

کلیدواژه ها

خلاصه سازی استخراجی، پیش پردازش، روش فراوانی بر معکوس سند، روش گراف

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.