دسته بندی متون لاتین با روش های انتخاب ویژگی فیلتری، پوششی و الگوریتم های بیزساده
محل انتشار: اولین کنفرانس ملی کامپیوتر و فناوری اطلاعات
سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 338
فایل این مقاله در 7 صفحه با فرمت PDF و WORD قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CEITS01_026
تاریخ نمایه سازی: 22 دی 1396
چکیده مقاله:
رشد سریع اینترنت و به وجود آمدن صفحات وب متعدد با مطالب و موضوعات گوناگون، نیاز به روش هایی برای دسته بندی هرچه بهتر صفحات وب را فراهم کرده است. به دلیل اینکه حجم عمده صفحات وب را متون تشکیل می دهند ما در این پژوهش به توسعه دسته بندی متون در صفحات وب با برخی از روش های متن کاوی و یادگیری ماشین پرداخته ایم. ما در این پژوهش پس از یک پیش پردازش مناسب بر روی متون در قسمت انتخاب ویژگی یک روش ترکیبی که مبتنی بر ترکیب الگوریتم های فیلتری و پوششی می باشد را استفاده کرده ایم. در مرحله یادگیری نیز از الگوریتم های خانواده بیز ساده استفاده شده است. در طی ارزیابی روش پیشنهادی استفاده از روش شاخص بندی 3 گرم در مرحله پیش پردازش، و روش فیلتری بهره اطلاعاتی و سپس استفاده از روش پوششی با دسته بند MNB در مرحله انتخاب ویژگی، و همچنین استفاده از الگوریتم دسته بندی MNB در مرحله یادگیری بهینه ترین روش در این پژوهش ارزیابی شده است. روش پیشنهادی در مقایسه با کارهای گذشته در این زمینه بهبود بسیار خوبی داشته است.
کلیدواژه ها:
نویسندگان
حدیث پورعباسی
دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر، واحد اهواز، دانشگاه آزاد اسلامی، اهواز، ایران
ماشالله عباسی دزفولی
استادیار، گروه مهندسی کامپیوتر، واحد اهواز، دانشگاه آزاد اسلامی، اهواز، ایران