خلاصه سازی متون با استفاده از یک معماری مبتنی بر خوشه بندی گراف

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,339

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IPRIA03_013

تاریخ نمایه سازی: 13 شهریور 1396

چکیده مقاله:

امروزه با رشد سریع حجم اطلاعات در شکل رسانه های دیجیتال در فضای اینترنت، نیازمند به یافتن روشی مناسب برای گزینش وفشرده کردن مطالب هستیم. خلاصه سازی متن، فرآیند ایجاد اتوماتیک یک نسخه کوتاه تر از یک یا چند سند متنی است. در این مقاله، یک رویکرد بدون ناظر برای خلاصه سازی استخراجی اتوماتیک متن پیشنهاد می شود. در رویکرد پیشنهاد شده، خلاصه سازی متن به صورت یک مسیله خوشه بندی گراف مدل می شود، که گره ها بیانگر جملات در اسناد هستند و سپس یک سری روش های ترکیبی برای تعیین اهمیت هرگره پیاده سازی و امتیاز هر گره حاصل می شود. برای محاسبه اهمیت هرگره نیاز به محاسبه شباهت بین جملات است که نقطه عطف این کار این است که شباهت جمله را از طریق روابط لغوی که از هستی شناسی و ردنت بهره می گیرد. روابط نحوی بین جملات و ترکیبی از شباهت لغوی و نحوی محاسبه می کند، در حالی که در اغلب کارها از شباهت کسینوسی استفاده شده است. از مزایای این رویکرد آن است که می تواند جملاتی را از اسناد ورودی استخراج کند که مفاهیم اصلی نهفته در اسناد را پوشش دهند وهمچنین محدودیت طولی و نبود اطلاعات تکراری در خلاصه نهایی را تضمین می کند. نتایج آزمایشات انجام شده روی مجموعه داده استاندارد، موثر بودن روش پیشنهادی را در بهبود کارایی خلاصه سازی سند نشان داده است.

نویسندگان

هاجر ترابی

دانشجوی کارشناسی ارشد، مهندسی کامپیوتر، دانشگاه گیلان، رشت

سیدابوالقاسم میرروشندل

استادیار، مهندسی کامپیوتر، دانشگاه گیلان، رشت

حمیدرضا احمدی فر

استادیار، مهندسی کامپیوتر، دانشگاه گیلان، رشت