ارائه یک مدل جدید مبتنی بر گراف جهت خلاصه سازی چند سندی متون
- سال انتشار: 1394
- محل انتشار: کنفرانس بین المللی یافته های نوین پژوهشی درمهندسی برق و علوم کامپیوتر
- کد COI اختصاصی: COMCONF01_081
- زبان مقاله: فارسی
- تعداد مشاهده: 1113
نویسندگان
دانشجوی کارشناسی ارشد مهندسی نرم افزار بخش علوم و مهندسی کامپیوتر و فناوری اطلاعات دانشگاه شیراز ایران
استادیار بخش علوم و مهندسی کامپیوتر و فناوری اطلاعات دانشگاه شیراز ایران
چکیده
با توجه به رشد روزافزون مستندات و منابع اینترنتی، نیاز به سیستمهای خلاصهساز بیشتر احساس میشود. سیستمهای خلاصه ساز چندسندی سیستم هایی هستند که مفاهیم اصلی اسناد ورودی را در چندین جمله بیان میکنند. افزونگی، پوشش محتوا و پیوستگی بین جملات، سه چالش اصلی این سیستم ها محسوب میشود .بررسی سیستمهای امروزی نشان میدهد که این چالشها هنوز رفع نشده اند .در این مقاله یک معماری جدید سه لایه مبتنی بر گراف معرفی میشود .هر جمله نشاندهنده ی یک راس در گراف میباشد و شباهت بین جملات، یال های این گراف را تشکیل میدهد. در مرحلهی اول با استفاده از استخراج ویژگیها، برای هر جمله ارزشی تعیین میشود .در مرحلهی دوم یک الگوریتم خوشه بندی معرفی میشود .با استفاده از این الگوریتم، جملاتی که باعث افزونگی میشوند، حذف میشود .در مرحله ی سوم با استفاده از الگوریتم رتبه بندی و تابع هدف، پوشش و پیوستگی جملات خلاصه افزایش مییابد .مهمترین مزیت این مقاله این است که هر سه چالش بیان شده را با هم بهبود میدهد .برای ارزیابی سیستم ارائه شده از مجموعه دادهای DUC استفاده میگردد .بر اساس معیار استاندارد 2002 F ، بهبود قابل توجه سیستم پیشنهادی در مقایسه با سایر سیستم ها مشهود میباشدکلیدواژه ها
خلاصه سازی چندسندی ، مبتنی برگراف ، خوشه بندی ، استخراج جملات ، رتبه بندی ، پردازش زبان طبیعیمقالات مرتبط جدید
- سیستم تشخیص نفوذ در محیط رایانش ابری با استفاده از یادگیری ویژ گی
- کاهش هزینه تعمیراتی ماشین های سنگین از طریق بهبود الگوریتم درخت تصمیم با الگوریتم های انتخاب ویژگی Information Gain ،Correlation و SVM
- پردازش کوانتومی تصاویر پزشکی و تشخیص لبه آن با استفاده از الگوریتم QHED
- بررسی و مقایسه روشهای تشخیص اکانت های جعلی در شبکه های اجتماعی
- مکان یابی و مقدار بهینه منابع تولید پراکنده به منظورکاهش تلفات و بهبود انحراف ولتاژ شبکه نامتعادل توزیع
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.