راهکاری نوین برای خلاصه سازی استخراجی چند سندی متون فارسی
سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,060
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NSOECE01_017
تاریخ نمایه سازی: 1 مهر 1394
چکیده مقاله:
به فرایند فشرده سازی یک منبع که حاصل حاوی اطلاعات مهم آن باشد خلاصه سازی گویند. خلاصه سازی متون منجر به استفاده از منابع بیشتر با سرعت بالاتر و در نتیجه حاصل شدن اطلاعات غنی تر میشود. هدف از ارائه این مقاله ارائه الگوریتمی نوین برای خلاصه سازی متون چند سندی فارسی با استفاده از تکنیک های آماری و تئوری است.در این مقاله با استفاده از روش های پیش پردازش متن و ساخت ماتریس کلمه-سند و تعیین اهمیت جملات ،زمینه اصلی متن استخراج می شود سپس جملات بر اساس معیار ضریب کسینوسی بجای در سطح سند در سطح جمله مقایسه می گردند و در نهایت جملات شبیه به هم حذف می گردند.نتایج آزمایش ها بر روی داده های مجموعه همشهری دو، دقت و کارایی الگوریتم پیشنهادی را نشان می دهد
کلیدواژه ها:
خلاصه سازی متن فارسی ، خلاصه سازی استخراجی چند سندی ، ماتریس کلمه-سند ، شباهت معنایی جملات ، حذف افزونگی
نویسندگان
سمیرا بابااحمدی میلانی
دانشگاه آزاد اسلامی واحد زنجان
نسیم نورافزا
دانشگاه آزاد اسلامی واحد زنجان
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :