اراﺋﻪ روﺷﯽ ﺟﻬﺖ ﺧﻼﺻﻪﺳﺎزی خودکار چندسندی ﺑﺎ ﮐﻤﮏ ﺗﮑﻨﯿﮏ فاکتور گیری ﻣﺎﺗﺮﯾﺲ ﻧﺎﻣﻨﻔﯽ (NMF)

  • سال انتشار: 1393
  • محل انتشار: اولین کنفرانس ملی برق و کامپیوتر سیستم های محاسباتی توزیع شده و شبکه های هوشمند
  • کد COI اختصاصی: ELECONFK01_019
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1480
دانلود فایل این مقاله

نویسندگان

اعظم مسعودی کیا

دانشجوی کارشناسی ارشد نرم افزار

مهدی اسماعیلی

عضوهئیت علمی دانشگاه آزاد اسلامی واحد کاشان

سیدمحمدرضا لاجوردی

عضو هیئت علمی دانشگاه آزاد اسلامی واحد کاشان

چکیده

با گسترش روز افزون حجم داده ها و اطلاعات، خلاصه سازی خودکار متن نیز با استقبال چشمگیر محققین روبرو شده است. در سالهای اخیر خلاصه سازی چندسندی با اقبال بیشتری مواجه بوده است. یک سیستم خلاصه سازی چندسندی استخراجی، لاصهسازی است که چندین سند به عنوان ورودی دریافت کرده و گزیدهای از جملات سناد اولیه را تولید مینماید. خلاصه خوب باید بیانگر زمینه کلی بوده و ضمن بیان دیدگاه های مختلف وجود در متن ازخوانایی و پیوستگی بالایی برخوردار باشد. در این مقاله با تمرکز به مشکلات اصلی خلاصه سازی چندسندی، یعنی پوشش کامل مطالب اصلی وعدم وجود افزونگی، روشی برای خلاصه سازی ارائه شده است. در مدل پیشنهادی، ابتدا کلمات متن استخراج شده و ماتریس کلمه-سند ساخته میشود. سپس آنها را خوشه بندی کرده و تکنیک nmf روی آن اعمال شده است. سپس جملات مهم استخراج شده و رتبه بندی میشوند. در نهایت خلاصه نهایی تولید میشود. ارزیابی سیستم پیشنهادی بر روی داده های کنفرانس DUC و با استفاده از معیار ارزیابیROUGE صورت گرفته است. نتایج این روش نسبت به میانگین 32 سیستم قدرتمند دنیا که کار خلاصه سازی را انجام دادهاند، بهبود داشته است.

کلیدواژه ها

خلاصه سازی چندسندی LSA ،NMF خوشه بندی

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.