خلاصه سازی چند سندی اخبار بر خط مبتنی بر توابع زیرپیمانه با قابلیت یادگیری

  • سال انتشار: 1399
  • محل انتشار: ششمین کنفرانس بین المللی وب پژوهی
  • کد COI اختصاصی: IRANWEB06_018
  • زبان مقاله: فارسی
  • تعداد مشاهده: 702
دانلود فایل این مقاله

نویسندگان

علیرضا قدیمی

پژوهشکده فناوری اطلاعات و ارتباطات جهاد دانشگاهی، تهران، ایران

حمید بیگی

دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف، تهران، ایران

چکیده

با افزایش انتشار بر خط اطلاعات و گسترش کاربران اینترنت، نیاز به خلاصه سازی خودکار متن ضرورت بیشتری یافته است. در این مقاله، یک روش خلاصه سازی چند سندی مبتنی بر توابع زیرپیمانه قابل یادگیری ارایه می شود. با استفاده از زیرپیمانگی، امکان تضمین کیفیت راه حل وجود دارد. در روش ارایه شده ، سندهای متنی ورودی با استفاده از گراف های وزن دار مدل سازی می شوند که راس ها، بازنمایی کننده ی جملات و یال ها نشان دهنده ی شباهت بین جملات است. با استفاده از تین گراف، ویژگی هایی که نشان دهنده ی اهمیت و تاثیر هر جمله است، استخراج می شوند. ویژگی های اهمیت، ارزش هر جمله را مستقل از جملات دیگر در نظر می گیرند. برای مدل سازی این ویژگی ها، از توابع پیمانه ای استفاده می شود. ویژگی های تاثیر، ارزش هر جمله را با توجه به ارتباط آن با جملات دیگر در نظر می گیرند. برای مدل سازی این ویژگی ها از توابع زیرپیمانه ای استفاده می گردد. این ویژگی ها اجزای سازنده ی تابع هدف را تشکیل می دهند که معادل با یک شبکه ی عصبی متعارف است. از همین رو، از یک مجموعه ی آموزشی جهت آموزش شبکه استفاده می شود. پس از اجزای فرایند یادگیری، از این تابع به منظور خلاصه سازی استخراجی چند سندی استفاده می شود. این خلاصه ساز با استفاده از پیکره ی پاسخ و DUC 2004 آزمایش شده، و نتایج حاصل از آن ارایه گردیده است.

کلیدواژه ها

خلاصه سازی چند سندی، زیرپیمانگی، شبکه عصبی، گراف وزن دار

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.