خوشه بندی متن کوتاه با استفاده از شبکه عصبی کانولوشن
محل انتشار: پنجمین کنفرانس مهندسی دانش بنیان و نوآوری
سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 581
فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
این مقاله در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
KBEI05_051
تاریخ نمایه سازی: 27 بهمن 1398
چکیده مقاله:
سرعت گسترس اطلاعات، به طور روز افزون در حالگسترس است. عمدهای از این اطلاعات به صورت متن، هر روزه در حالتولید است، توان پردازشی برای دسته بندی خودکار از موضوعات بسیار مهمروز دنیا است، زیرا پردازش این متن ها با استفاده از روش های دستی کاریمشکل و وقت گیر است. به همین منظور پردازش متن به صورت خودکار، ازچالش های موضوعات علمی متنوع در دنیای دانش است. در این مقاله یکروش برای بهبود خوشه بندی متن کوتاه با استفاده از شبکه عصبی کانولوشنبدون نظارت پیشنهاد شده است. برای نمایش برداری کلمات از روشword2vec استفاده شده است. در ابتدا gram 2 و gram 3 را برای کلدیتاست محاسبه کرده و سپس بردار احتمال که برای هر جمله بدست آمدهاست را در بردارهای نمایش هر جمله کانولوشن می کنیم. در ادامه کوواریانسکل داده ها را محاسبه کرده و سپس بر روی کل داده ها عمل کانولوشن راانجام میدهیم. روش پیشنهادی در مجموعه داده Biomedical دقت 64.98و در مجموعه داده SearchSnippets دقت 82.63 بدست آورده است. نتایجارزیابی نشان دهنده دقت بیشتری نسبت به الگوریتم های پیشین دارد.بنابراین روش پیشنهادی، عملکرد بهتری نسبت به روشهای پایه در خوشه-بندی متن کوتاه به دست آورده است.
کلیدواژه ها:
نویسندگان
رحیم حسینی
دانشکده فنی و مهندسی بخش کامپیوتر، دانشگاه شهید باهنر کرمان، کرمان، ایران
حمید میروزیری
دانشکده فنی و مهندسی، بخش کامپیوتر، دانشگاه شهید باهنر کرمان، کرمان، ایران
حسین قاسمعلی زاده
دانشکده فنی و مهندسی، بخش کامپیوتر، دانشگاه شهید باهنر کرمان، کرمان، ایران