خلاصه سازی متون فارسی با استفاده از هستی شناسی و خوشه بندی
- سال انتشار: 1391
- محل انتشار: یازدهمین کنفرانس سراسری سیستم های هوشمند
- کد COI اختصاصی: ICS11_012
- زبان مقاله: فارسی
- تعداد مشاهده: 1747
نویسندگان
آزمایشگاه پردازش تصویر و سیستمهای هوشمند، گروه مهندسی کامپیوتر، دانشگاه بوعلی سینا، همدان
آزمایشگاه پردازش تصویر و سیستمهای هوشمند، گروه مهندسی کامپیوتر، دانشگاه بوعلی سینا، همدان
چکیده
یکی از مشکلات اصلی در تحقیق روی خلاصه سازی خودکار، تفسیر معنایی نادرست از سند است. استفاده از دامنه دانش منحصر بفرد می تواند این مشکل را به طور قابل توجهی کم کند. در این مقاله ما یک روش استخراجی مبتنی بر هستی شناسی برای خلاصه سازی متون فارسی معرفی می کنیم. این روش بر پایه نگاشت متن به مفاهیم و نمایش سند و جملات آن به صورت گراف است. ما روش خودمان را برای خلاصه سازی یک مجموعه از مطبوعات مربوط به فوتبال داخلی به کار می گیریم و از مزیتهای منابع دانش خارجی مانند هستی شناسی نیز استفاده می کنیم. مقایسه این روش با روشهای دیگر خلاصه سازی با معیار سودمندی نشان می دهد کیفیت خلاصه سازی در این روش بهبهود یافته استکلیدواژه ها
خلاصه سازی، هستی شناسی، خوشه بندی، گرافمقالات مرتبط جدید
اطلاعات بیشتر در مورد COI
COI مخفف عبارت CIVILICA Object Identifier به معنی شناسه سیویلیکا برای اسناد است. COI کدی است که مطابق محل انتشار، به مقالات کنفرانسها و ژورنالهای داخل کشور به هنگام نمایه سازی بر روی پایگاه استنادی سیویلیکا اختصاص می یابد.
کد COI به مفهوم کد ملی اسناد نمایه شده در سیویلیکا است و کدی یکتا و ثابت است و به همین دلیل همواره قابلیت استناد و پیگیری دارد.