طبقه بندی متن بر اساس رویکرد ترکیبی از تجزیه مقادیر منفرد و ماشین برادر پشتیبان

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 303

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ETECH05_005

تاریخ نمایه سازی: 11 اردیبهشت 1400

چکیده مقاله:

در طبقه بندی متن هدف این است که سندهایی را که دراختیار داریم بتوانیم برچسب گذاری موضوعی کنیم. در واقع این موضوعصرفا یک مسئله باناظر است، یعنی مجموعه ای از اسناد متنی که گروه بندیموضوعی شده اند به عنوان داده ی آموزشی در اختیار سامانه قرار می گیرد تابتواند با یادگیری از این مجموعه، اسناد جدید ورودی را به یکی از اینگروه های موضوعی ملحق نماید. در طبقه بندی متن معمولا از کلمات متن بهعنوان ویژگی های آن متن استفاده می شود در نتیجه مسئله طبقه بندی متنبا تعداد بالایی از ویژگی ها مواجه می باشند. در این پژوهش از روش ماشینبرادر پشتیبان برای طبقه بندی متنها و تجزیه مقادیر منفرد برای انتخابویژگی های متن استفاده شده تا بتوان طبقه بندی متن را با کیفیت بالاتری بهانجام رساند. برای سنجش نتایج حاصله از مقایسه روش ما با دو روش دیگرمبتنی بر KNN و Naive Bayes استفاده شده است. در نتایجآزمایشگاهی مشاهده شد که روش پیشنهادی به طور میانگین از هر دو روشبهتر است.

نویسندگان

سینا دامی

استادیار گروه مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران

نجمه فرقانی

دانشجوی کارشناسی ارشد IT ، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران