خلاصه سازی متون فارسی با استفاده از هستی شناسی و خوشه بندی

  • سال انتشار: 1391
  • محل انتشار: یازدهمین کنفرانس سراسری سیستم های هوشمند
  • کد COI اختصاصی: ICS11_012
  • زبان مقاله: فارسی
  • تعداد مشاهده: 1747
دانلود فایل این مقاله

نویسندگان

مهدخت غفاری ها

آزمایشگاه پردازش تصویر و سیستمهای هوشمند، گروه مهندسی کامپیوتر، دانشگاه بوعلی سینا، همدان

حسن ختن لو

آزمایشگاه پردازش تصویر و سیستمهای هوشمند، گروه مهندسی کامپیوتر، دانشگاه بوعلی سینا، همدان

چکیده

یکی از مشکلات اصلی در تحقیق روی خلاصه سازی خودکار، تفسیر معنایی نادرست از سند است. استفاده از دامنه دانش منحصر بفرد می تواند این مشکل را به طور قابل توجهی کم کند. در این مقاله ما یک روش استخراجی مبتنی بر هستی شناسی برای خلاصه سازی متون فارسی معرفی می کنیم. این روش بر پایه نگاشت متن به مفاهیم و نمایش سند و جملات آن به صورت گراف است. ما روش خودمان را برای خلاصه سازی یک مجموعه از مطبوعات مربوط به فوتبال داخلی به کار می گیریم و از مزیتهای منابع دانش خارجی مانند هستی شناسی نیز استفاده می کنیم. مقایسه این روش با روشهای دیگر خلاصه سازی با معیار سودمندی نشان می دهد کیفیت خلاصه سازی در این روش بهبهود یافته است

کلیدواژه ها

خلاصه سازی، هستی شناسی، خوشه بندی، گراف

مقالات مرتبط جدید

اطلاعات بیشتر در مورد COI

COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.

کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.