اراﺋﻪ روﺷﯽ ﺟﻬﺖ ﺧﻼﺻﻪﺳﺎزی خودکار چندسندی ﺑﺎ ﮐﻤﮏ ﺗﮑﻨﯿﮏ فاکتور گیری ﻣﺎﺗﺮﯾﺲ ﻧﺎﻣﻨﻔﯽ (NMF)
- سال انتشار: 1393
- محل انتشار: اولین کنفرانس ملی برق و کامپیوتر سیستم های محاسباتی توزیع شده و شبکه های هوشمند
- کد COI اختصاصی: ELECONFK01_019
- زبان مقاله: فارسی
- تعداد مشاهده: 1480
نویسندگان
دانشجوی کارشناسی ارشد نرم افزار
عضوهئیت علمی دانشگاه آزاد اسلامی واحد کاشان
عضو هیئت علمی دانشگاه آزاد اسلامی واحد کاشان
چکیده
با گسترش روز افزون حجم داده ها و اطلاعات، خلاصه سازی خودکار متن نیز با استقبال چشمگیر محققین روبرو شده است. در سالهای اخیر خلاصه سازی چندسندی با اقبال بیشتری مواجه بوده است. یک سیستم خلاصه سازی چندسندی استخراجی، لاصهسازی است که چندین سند به عنوان ورودی دریافت کرده و گزیدهای از جملات سناد اولیه را تولید مینماید. خلاصه خوب باید بیانگر زمینه کلی بوده و ضمن بیان دیدگاه های مختلف وجود در متن ازخوانایی و پیوستگی بالایی برخوردار باشد. در این مقاله با تمرکز به مشکلات اصلی خلاصه سازی چندسندی، یعنی پوشش کامل مطالب اصلی وعدم وجود افزونگی، روشی برای خلاصه سازی ارائه شده است. در مدل پیشنهادی، ابتدا کلمات متن استخراج شده و ماتریس کلمه-سند ساخته میشود. سپس آنها را خوشه بندی کرده و تکنیک nmf روی آن اعمال شده است. سپس جملات مهم استخراج شده و رتبه بندی میشوند. در نهایت خلاصه نهایی تولید میشود. ارزیابی سیستم پیشنهادی بر روی داده های کنفرانس DUC و با استفاده از معیار ارزیابیROUGE صورت گرفته است. نتایج این روش نسبت به میانگین 32 سیستم قدرتمند دنیا که کار خلاصه سازی را انجام دادهاند، بهبود داشته است.کلیدواژه ها
خلاصه سازی چندسندی LSA ،NMF خوشه بندیمقالات مرتبط جدید
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.