رهیافتی جدید برای خوشه‌بندی جریان متن

سال انتشار: 1388
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,268

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICIORS02_076

تاریخ نمایه سازی: 11 اسفند 1387

چکیده مقاله:

خوشه‌بندی جریان متن مسئله مهمی در داده‌کاوی است و کاربردهای بسیار از جمله فیلترسازی گروه‌های خبری، خزش متن و سازمان‌دهی متن‌ها دارد. بیشتر روش‌های خوشه‌بندی جریان متن، رهیافت مبتنی بر مشابهت‌ را بکار می‌برند. این روش‌ها از طرح TF-IDF استفاده می‌کنند و کیفیت ضعیفی ارائه می‌دهند. در مقابل، مدل هموارساز مفهومی، کیفیت خوشه‌بندی را بهبود می بخشد ولی هنوز در تشخیص و نادیده گرفتن کلمات کلی موفق نیست. در این پروژه، مدل هموارساز مفهومی موجود را بهبود بخشیده‌ایم. همچنین روشی برای تخمین احتمال ترجمه کلمات و عبارات چند کلمه‌ای جدید ارائه کرده‌ایم. به این ترتیب کیفیت خوشه‌بندی جریان متن بهبود یافته است.

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Joel W.Reed, Yu Jiao , Thomas E.Potok J TF-ICF: A ...
  • Shi Zhong, Efficient streaming text clustering. Neural Networks , (2005). ...
  • Yubao Liu, Jiarong Cai , Jian Yin, An Improved Semantic ...
  • Yubao Liu, Jiarong Cai , Jian Yin _ and Wai-chee ...
  • Zhou, X., xiaodan, Z., Lin, X., Song, Co ntext- sensitive ...
  • Zhou, X., Zhang, X., and Hu, X., The Dragon Toolkit, ...
  • نمایش کامل مراجع