خلاصه سازی متون اخبار مبتنی بر استخراج کلمات کلیدی با استفاده از مدل ترکیبی گاوسی
سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 851
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
COMCO04_033
تاریخ نمایه سازی: 17 آبان 1396
چکیده مقاله:
خلاصه سازی متون اخبار، روند کاهش متون اخبار است که نتیجه آن ایجاد خلاصه ای با حفظ مهم ترین نکات اصلی اخبار می باشد. استخراج خلاصه از متون داده شده، استخراج جملاتی است که پیام اصلی متن را می رساند. بیشتر تکنیک های خلاصه سازی شامل مفاهیمی مثل یافتن کلمات کلیدی و استخراج جملاتی است که دارای بیشترین کلمات کلیدی هستند. استخراج کلمات کلیدی معمولا به بیشترین تکرار کلمه با توجه به میزان اهمیت آن کلمه وابسته است. در این مدل نیاز به حاشیه نویسی توسط انسان وجود دارد تا الگوریتم پیشنهادی را آموزش داده و اسناد را تجزیه و تحلیل کرده و کلمات کلیدی احتمالی را انتخاب کنند. این کلمات کلیدی به برچسب زن POS برای تحلیل اطلاعات داده می شود و مقادیر توزیع احتمال به عنوان مقدار احتمال تشخیص کلمات کلیدی محاسبه می شوند و نمره هر متن محاسبه شده و تعدادی از پر امتیازترین متون به عنوان یک کلمه کلیدی انتخاب می شود. در این مقاله از مدل ترکیبی گاوسی برای برچسب زنی POS استفاده می شود. عملکرد روش پیشنهادی در مقایسه با روش های پایه بهبود قابل توجهی داشته است.
کلیدواژه ها:
نویسندگان
سینا دامی
استادیار، دانشگاه آزاد اسلامی واحد تهران غرب، گروه کامپیوتر، تهران، ایران
المیرا کریمی
دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی، واحد تهران غرب، گروه کامپیوتر، تهران، ایران