دسته بندی متون لاتین با روش های انتخاب ویژگی فیلتری، پوششی و الگوریتم های بیزساده

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 338

فایل این مقاله در 7 صفحه با فرمت PDF و WORD قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

CEITS01_026

تاریخ نمایه سازی: 22 دی 1396

چکیده مقاله:

رشد سریع اینترنت و به وجود آمدن صفحات وب متعدد با مطالب و موضوعات گوناگون، نیاز به روش هایی برای دسته بندی هرچه بهتر صفحات وب را فراهم کرده است. به دلیل اینکه حجم عمده صفحات وب را متون تشکیل می دهند ما در این پژوهش به توسعه دسته بندی متون در صفحات وب با برخی از روش های متن کاوی و یادگیری ماشین پرداخته ایم. ما در این پژوهش پس از یک پیش پردازش مناسب بر روی متون در قسمت انتخاب ویژگی یک روش ترکیبی که مبتنی بر ترکیب الگوریتم های فیلتری و پوششی می باشد را استفاده کرده ایم. در مرحله یادگیری نیز از الگوریتم های خانواده بیز ساده استفاده شده است. در طی ارزیابی روش پیشنهادی استفاده از روش شاخص بندی 3 گرم در مرحله پیش پردازش، و روش فیلتری بهره اطلاعاتی و سپس استفاده از روش پوششی با دسته بند MNB در مرحله انتخاب ویژگی، و همچنین استفاده از الگوریتم دسته بندی MNB در مرحله یادگیری بهینه ترین روش در این پژوهش ارزیابی شده است. روش پیشنهادی در مقایسه با کارهای گذشته در این زمینه بهبود بسیار خوبی داشته است.

نویسندگان

حدیث پورعباسی

دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر، واحد اهواز، دانشگاه آزاد اسلامی، اهواز، ایران

ماشالله عباسی دزفولی

استادیار، گروه مهندسی کامپیوتر، واحد اهواز، دانشگاه آزاد اسلامی، اهواز، ایران