خوشه بندی متن کوتاه با استفاده از شبکه عصبی کانولوشن

سال انتشار: 1397
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 581

فایل این مقاله در 6 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

KBEI05_051

تاریخ نمایه سازی: 27 بهمن 1398

چکیده مقاله:

سرعت گسترس اطلاعات، به طور روز افزون در حالگسترس است. عمدهای از این اطلاعات به صورت متن، هر روزه در حالتولید است، توان پردازشی برای دسته بندی خودکار از موضوعات بسیار مهمروز دنیا است، زیرا پردازش این متن ها با استفاده از روش های دستی کاریمشکل و وقت گیر است. به همین منظور پردازش متن به صورت خودکار، ازچالش های موضوعات علمی متنوع در دنیای دانش است. در این مقاله یکروش برای بهبود خوشه بندی متن کوتاه با استفاده از شبکه عصبی کانولوشنبدون نظارت پیشنهاد شده است. برای نمایش برداری کلمات از روشword2vec استفاده شده است. در ابتدا gram 2 و gram 3 را برای کلدیتاست محاسبه کرده و سپس بردار احتمال که برای هر جمله بدست آمدهاست را در بردارهای نمایش هر جمله کانولوشن می کنیم. در ادامه کوواریانسکل داده ها را محاسبه کرده و سپس بر روی کل داده ها عمل کانولوشن راانجام میدهیم. روش پیشنهادی در مجموعه داده Biomedical دقت 64.98و در مجموعه داده SearchSnippets دقت 82.63 بدست آورده است. نتایجارزیابی نشان دهنده دقت بیشتری نسبت به الگوریتم های پیشین دارد.بنابراین روش پیشنهادی، عملکرد بهتری نسبت به روشهای پایه در خوشه-بندی متن کوتاه به دست آورده است.

نویسندگان

رحیم حسینی

دانشکده فنی و مهندسی بخش کامپیوتر، دانشگاه شهید باهنر کرمان، کرمان، ایران

حمید میروزیری

دانشکده فنی و مهندسی، بخش کامپیوتر، دانشگاه شهید باهنر کرمان، کرمان، ایران

حسین قاسمعلی زاده

دانشکده فنی و مهندسی، بخش کامپیوتر، دانشگاه شهید باهنر کرمان، کرمان، ایران