رهیافتی جدید برای خوشهبندی جریان متن
محل انتشار: دومین کنفرانس بین المللی تحقیق در عملیات ایران
سال انتشار: 1388
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,268
متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICIORS02_076
تاریخ نمایه سازی: 11 اسفند 1387
چکیده مقاله:
خوشهبندی جریان متن مسئله مهمی در دادهکاوی است و کاربردهای بسیار از جمله فیلترسازی گروههای خبری، خزش متن و سازماندهی متنها دارد. بیشتر روشهای خوشهبندی جریان متن، رهیافت مبتنی بر مشابهت را بکار میبرند. این روشها از طرح TF-IDF استفاده میکنند و کیفیت ضعیفی ارائه میدهند. در مقابل، مدل هموارساز مفهومی، کیفیت خوشهبندی را بهبود می بخشد ولی هنوز در تشخیص و نادیده گرفتن کلمات کلی موفق نیست. در این پروژه، مدل هموارساز مفهومی موجود را بهبود بخشیدهایم. همچنین روشی برای تخمین احتمال ترجمه کلمات و عبارات چند کلمهای جدید ارائه کردهایم. به این ترتیب کیفیت خوشهبندی جریان متن بهبود یافته است.
کلیدواژه ها:
مراجع و منابع این مقاله:
لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :