خوشه بندی متون علمی با استفاده از یک روش هیبرید مبتنی بر وزن دهی اصطلاحات و خلاصه سازی متن

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 607

متن کامل این مقاله منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل مقاله (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICIKT07_196

تاریخ نمایه سازی: 22 مهر 1394

چکیده مقاله:

این مقاله روشی جدید برای خوشه بندی متون موضوعی مختلف بر اساس خلاصه سازی متن ارایه می دهد. علت استفاده از خلاصه سازی در خوشه بندی متن حذف کلمات غیرمهم و غیرضروری است که در خوشه بندی متن باعث افزایش بعد داده ها و در نتیجه افزایش چشمگیر زمان اجرا و پیچیدگی محاسباتی فرایند خوشه بندی می شوند. روش پیشنهادی دارای سه فاز اجرایی پیش پردازش شامل حذف کلمات پرتکرار و غیرمهم در کل متن و وزن دهی اصطلاحات هر سند، خلاصه سازی با استفاده از فرمول BM25 در سطح جمله برای هر سند و در انگلیسی برگرفته از منابع علمی در حوزه 11 موضوع مختلف روش پیشنهادی با روش های CSSA، SMTC و MaxCapture مقایسه گردید که این نتایج بیانگر این موضوع بوده است که علاوه بر برتری نسبی بازدهی روش پیشنهادی نسبت به سایر روش های مذکور(با توجه به فرمول) F-measure، سرعت اجرای الگوریتم پیشنهادی بمراتب بیشتر ازسایر روش ها می باشد.

نویسندگان

امید سجودی شیجانی

دانشگاه آزاد اسلامی واحد قزوین، گروه رایانه و کامپیوتر، قزوین، ایران

پدرام وحدانی آملی

دانشگاه آزاد اسلامی واحد قزوین، گروه رایانه و کامپیوتر، قزوین، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • H. P. Edmundson., ? New methos in automatic extracting", Journal ...
  • Karel Jezek and Josef Steinberger, "Automatic Text summarization ", Vaclav ...
  • Farshad Kyoomarsi, Hamid Khosravi, Esfandiar Eslami and Pooya Khosravyan Dehkordy, ...
  • Joel larocca Neto, Alex A. Freitas and Celso A.A.Kaestner, "Automatic ...
  • Weiguo Fan, Linda Wallace, Stephanie Rich, and Zhongju Zhang, "Tapping ...
  • Fang Chen, Kesong Han and Guilin Chen, "An Approach to ...
  • Mohamed Abdel Fattah and Fuji Ren, "Automatic Text Summarization ", ...
  • H. P. Luhn, "The Automatic Creation of Literature Abstracts", Presented ...
  • Ronald Brandow, Karl Mitze, and Lisa F. Rau. "9Automatic condensation ...
  • Ledeneva, Y., Gelbukh, A., Garcia, H.R.: Terms Derived from Frequent ...
  • K. Raja, C. Prakash Narayanan, "Clustering Technique with Feature Selection ...
  • Rene Arnulfo Garci a-Herandez and Yulia Ledeneva, "Word Sequence Models ...
  • Chuang, W. T., & Yang, J. (2000, July). Extracting sentence ...
  • Jagadeesh, J., Pingali, P., & Varma, V. (2005). Sentence Documcent ...
  • Gagnon, Michel et Lyne Da Sylva. 2005. Text Summarization by ...
  • Sakhare DY, Kumar R, Syntactic and Sentence Feature Based Hybrid ...
  • Zhang W, T Yoshida, X Tang, Q Wang, Text clustering ...
  • Porter, M. F. (n.d.), An algorithm for suffix stripping, in ...
  • Saurabh Sharma and Vishal Gupta, Punjabi text clustering by sentence ...
  • Yuan L, An Effective Chinese Short Message Texts Clustering Algorithm ...
  • نمایش کامل مراجع