ارائه یک روش ترکیبی برای دسته بندی متون فارسی بوسیله تکنیک رای گیری موازی

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 953

فایل این مقاله در 7 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

SENACONF02_096

تاریخ نمایه سازی: 30 آبان 1394

چکیده مقاله:

بررسی ها و مطالعات نشان میدهند که روشهای دسته بندی متون مانند بیز ساده و ماشین بردار پشتیبان نمی توانند کیفیت دسته بندی را از یک حدی بیشتر افزایش دهند اما با بهره گیری از روش های ترکیبی، می توان کیفیت دسته بندی را ارتقا داد. روش های بیز ساده و الگوریتم درخت تصمیم در متون لاتین کارایی خوبی را از خود نشان داده اند. با توجه به پایگاه های اطلاعاتی و همچنین سایت های ثبت اسناد کشور این روشها در متون فارسی انجام نشده اند. در این پژوهش سعی خواهد شد تا یک مدل دسته بندی خودکار را با استفاده از ترکیبی از الگوریتم ها و تکنیک های متن کاوی بیز ساده و الگوریتم درخت تصمیم برای متون فارسی فراهم کنیم که بتوان با استفاده از این مدل، متون فارسی را به صورت خودکار باکار آیی و دقت بالا دسته بندی کرد. جهت بالا بردن کارایی نهایی دسته بندی اسناد متنی، هدف در این پژوهش استفاده از ترکیبی از دسته بندها بجای استفاده از یک دسته بند منفرد میباشد. نتایج نشان میدهد که استفاده از دسته بند ترکیبی عملکرد بهتری نسبت به دسته بندهای منفرد خواهد داشت.

نویسندگان

عارف سیاحی

آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران

سید محسن هاشمی

آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران

سعید مزرعه

آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Azam, N., Yao, J. T., 2012. Comparison of Term Frequency ...
  • Baoli, L., Shiwen, Y., Qin, L, 2003. An improved k-nearest ...
  • Bell, D. A., Guan, J. W., Bi, Y. X., 2005. ...
  • Bryll, R., Osuna, R. G., Quek, F., 2003. Attribute Bagging: ...
  • Klinkenberg, R., Joachims, T., 2000. Detecting concept drift with support ...
  • Uguz, H., 2011. A Two-Stage Feature Selection Method for Text ...
  • Larkey, L. S., Croft, W. B., 1996. Combining classifiers in ...
  • Sebastiani, F., 2002. Machine Learning in Automated Text C ategorization, ...
  • Arturo, M. R., 2006. Automatic Text Categorization of documens in ...
  • Peng, F., Schuurmans, D., Wang, S., 2003. Language and Task ...
  • Lan, M., Tan, C. L., 2007. Supervised and Traditional Term ...
  • نمایش کامل مراجع